Matt O'Brien y Hannah Fingerhutt

El costo de construir un producto de inteligencia artificial como ChatGPT puede ser difícil de medir.

Pero una cosa que OpenAI respaldada por Microsoft necesitaba para su tecnología era mucha agua, extraída de las cuencas de los ríos Raccoon y Des Moines en el centro de Iowa, para enfriar una supercomputadora potente mientras ayudaba a enseñar a sus sistemas de IA a imitar la escritura humana.

A Microsoft data center is seen near Interstate 35, Tuesday, Sept. 5, 2023, in West Des Moines. Microsoft has been amassing a cluster of data centers to power its cloud computing services for more than a decade. Its fourth and fifth data centers in the city are due to open later this year.

Mientras compiten por capitalizar la locura por la IA generativa, los principales desarrolladores tecnológicos, incluyendo Microsoft, OpenAI y Google, han reconocido que la creciente demanda de sus herramientas de IA conlleva costos significativos, desde costosos semiconductores hasta un aumento en el consumo de agua.

Pero a menudo son discretos sobre los detalles. Pocas personas en Iowa sabían sobre su estado como lugar de nacimiento del modelo de lenguaje GPT-4 más avanzado de OpenAI, antes de que un alto ejecutivo de Microsoft mencionara en un discurso que "literalmente se hizo junto a los campos de maíz al oeste de Des Moines".

Construir un modelo de lenguaje grande requiere analizar patrones en una gran cantidad de texto escrito por humanos. Todo eso requiere mucha electricidad y genera mucho calor. Para mantenerlo fresco en días calurosos, los centros de datos necesitan bombear agua, a menudo hacia una torre de enfriamiento ubicada fuera de sus edificios del tamaño de un almacén.

En su último informe ambiental, Microsoft reveló que su consumo de agua a nivel mundial aumentó un 34% entre 2021 y 2022 (hasta casi 1.700 millones de galones, o más de 2.500 piscinas olímpicas), un aumento notable en comparación con años anteriores que investigadores externos relacionan con su investigación en IA.

"Es justo decir que la mayor parte del crecimiento se debe a la IA", incluyendo "su gran inversión en IA generativa y asociación con OpenAI", dijo Shaolei Ren, investigador de la Universidad de California, Riverside, quien ha estado tratando de calcular el impacto ambiental de productos de IA generativa como ChatGPT.

En un artículo que se publicará más adelante este año, el equipo de Ren estima que ChatGPT consume 500 mililitros de agua (aproximadamente lo que hay en una botella de agua de 16 onzas) cada vez que se le hace una serie de entre 5 y 50 indicaciones o preguntas. El rango varía según la ubicación de sus servidores y la estación del año. La estimación incluye el uso indirecto de agua que las empresas no miden, como enfriar las plantas de energía que suministran electricidad a los centros de datos.

"La mayoría de las personas no son conscientes del consumo de recursos subyacente de ChatGPT", dijo Ren. "Si no eres consciente del consumo de recursos, entonces no hay forma de que podamos ayudar a conservarlos".

Google informó de un aumento del 20% en el uso de agua en el mismo período, que Ren también atribuye en gran medida a su trabajo en IA. El aumento de Google no fue uniforme: fue constante en Oregón, donde su uso de agua ha llamado la atención pública, mientras que se duplicó fuera de Las Vegas. También fue sediento en Iowa, consumiendo más agua potable en sus centros de datos en Council Bluffs que en cualquier otro lugar.

En respuesta a las preguntas de The Associated Press, Microsoft afirmó en un comunicado esta semana que está invirtiendo en investigación para medir la huella energética y de carbono de la inteligencia artificial "mientras trabaja en formas de hacer que los sistemas grandes sean más eficientes, tanto en el entrenamiento como en la aplicación".

"Nuestro objetivo es monitorear continuamente nuestras emisiones, acelerar el progreso al aumentar nuestro uso de energía limpia para alimentar los centros de datos, adquirir energía renovable y llevar a cabo otros esfuerzos para cumplir nuestros objetivos de sostenibilidad de ser carbono negativo, positivo en agua y sin residuos para 2030", dijo la declaración de la compañía.

OpenAI hizo eco de esos comentarios en su propio comunicado el viernes, diciendo que está "reflexionando considerablemente" sobre el mejor uso de la potencia informática.

"Reconocemos que el entrenamiento de modelos grandes puede consumir mucha energía y agua" y trabajamos para mejorar la eficiencia, dijo.

Microsoft hizo su primera inversión de mil millones de dólares en OpenAI, con sede en San Francisco, en 2019, más de dos años antes de que la startup presentara ChatGPT y despertara el interés mundial en los avances de la inteligencia artificial. Como parte del acuerdo, el gigante del software proporcionaría la potencia informática necesaria para entrenar los modelos de IA.

Para realizar al menos parte de ese trabajo, las dos compañías recurrieron a West Des Moines, Iowa, una ciudad de 68,000 habitantes donde Microsoft ha estado acumulando centros de datos para alimentar sus servicios de computación en la nube durante más de una década. Sus cuarto y quinto centros de datos están programados para abrir allí más adelante este año.

"Los están construyendo tan rápido como pueden", dijo Steve Gaer, quien era el alcalde de la ciudad cuando Microsoft llegó. Gaer dijo que la compañía se sintió atraída por el compromiso de la ciudad de construir infraestructura pública y contribuyó con una suma "asombrosa" de dinero a través de pagos de impuestos que respaldan esa inversión.

"Pero, ya sabes, fueron bastante secretos sobre lo que estaban haciendo allí", agregó.

Microsoft dijo por primera vez que estaba desarrollando uno de los supercomputadoras más potentes del mundo para OpenAI en 2020, pero se negó a revelar su ubicación en ese momento, aunque lo describió como un "sistema único" con más de 285,000 núcleos de semiconductores convencionales y 10,000 procesadores gráficos: una especie de chip que se ha vuelto crucial para las cargas de trabajo de IA.

Los expertos han dicho que tiene sentido "preentrenar" un modelo de IA en un solo lugar debido a la gran cantidad de datos que deben transferirse entre los núcleos informáticos.

No fue hasta finales de mayo que el presidente de Microsoft, Brad Smith, reveló que habían construido su "centro de datos de supercomputación de IA avanzada" en Iowa, exclusivamente para permitir que OpenAI entrenara lo que se ha convertido en su modelo de cuarta generación, GPT-4. El modelo ahora impulsa versiones premium de ChatGPT y algunos de los propios productos de Microsoft, y ha acelerado el debate sobre la contención de los riesgos sociales de la IA.

"Fue creado por estos ingenieros extraordinarios en California, pero realmente fue creado en Iowa", dijo Smith.

En ciertos aspectos, West Des Moines es un lugar relativamente eficiente para entrenar un sistema poderoso de IA, especialmente en comparación con los centros de datos de Microsoft en Arizona, que consumen mucha más agua para la misma demanda informática.

"Así que si estás desarrollando modelos de IA dentro de Microsoft, deberías programar tu entrenamiento en Iowa en lugar de en Arizona", dijo Ren. "En cuanto al entrenamiento, no hay diferencia. En términos de consumo de agua o energía, hay una gran diferencia".

Durante gran parte del año, el clima de Iowa es lo suficientemente fresco como para que Microsoft utilice el aire exterior para mantener el supercomputador funcionando correctamente y expulsar el calor fuera del edificio. Solo cuando la temperatura supera los 29.3 grados Celsius (aproximadamente 85 grados Fahrenheit) es necesario utilizar agua, según ha dicho la compañía en una divulgación pública.

Sin embargo, esto aún puede requerir cantidades significativas de agua, especialmente en el verano. En julio de 2022, el mes anterior a que OpenAI afirmara que había completado el entrenamiento de GPT-4, Microsoft bombeó aproximadamente 11.5 millones de galones de agua a su conjunto de centros de datos en Iowa, según informó el Departamento de Aguas de West Des Moines. Esto equivale a aproximadamente el 6% de toda el agua utilizada en el distrito, que también suministra agua potable a los residentes de la ciudad.

En un documento del Departamento de Aguas de West Des Moines se afirma que, a partir de 2022, tanto el departamento como el gobierno de la ciudad "solamente considerarán futuros proyectos de centros de datos" de Microsoft si estos proyectos pueden "demostrar e implementar tecnología para reducir significativamente el consumo pico de agua a niveles actuales" con el fin de preservar el suministro de agua para las necesidades residenciales y comerciales.

Microsoft anunció el jueves que está trabajando directamente con el Departamento de Aguas para abordar sus comentarios. En un comunicado por escrito, el Departamento de Aguas afirmó que la compañía ha sido un buen socio y ha estado trabajando con las autoridades locales para reducir su impacto hídrico al mismo tiempo que satisface sus necesidades.

O'Brien informó desde Providence, Rhode Island.

The Associated Press y OpenAI tienen un acuerdo de licencia que permite que parte de los archivos de texto de AP se utilicen para entrenar el modelo de lenguaje de la empresa tecnológica. AP recibe una tarifa no revelada por el uso de su contenido.