A través de la amplificación de la inteligencia humana, la inteligencia artificial (IA) puede causar un nuevo Renacimiento, tal vez una nueva fase de la Ilustración", sugirió Yann LeCun, uno de los padrinos de la inteligencia artificial moderna, a principios de este año. La IA ya puede hacer que algunos procesos científicos existentes sean más rápidos y eficientes, pero ¿puede hacer más, transformando la forma en que se realiza la ciencia misma?

Estas transformaciones ya han ocurrido antes. Con la aparición del método científico en el siglo XVII, los investigadores comenzaron a confiar en las observaciones experimentales y en las teorías derivadas de ellas, en lugar de seguir la sabiduría recibida de la antigüedad. Este proceso fue, crucialmente, respaldado por el surgimiento de revistas científicas, que permitían a los investigadores compartir sus hallazgos, tanto para reclamar prioridad como para fomentar que otros replicaran y construyeran sobre sus resultados. Las revistas crearon una comunidad científica internacional en torno a un cuerpo compartido de conocimiento, lo que provocó un aumento en los descubrimientos conocidos hoy en día como la revolución científica.

Una transformación adicional comenzó a fines del siglo XIX, con el establecimiento de laboratorios de investigación, fábricas de innovación donde las ideas, las personas y los materiales podían combinarse a gran escala. Esto condujo a una mayor eficiencia en la investigación, desde sustancias químicas y semiconductores hasta productos farmacéuticos. Estos cambios no solo aumentaron la productividad científica, sino que también transformaron la ciencia misma, abriendo nuevas áreas de investigación y descubrimiento. ¿Cómo podría la IA hacer algo similar, no solo generando nuevos resultados, sino nuevas formas de generar nuevos resultados?

Estamos cargando nuestra batería

Un enfoque prometedor es el "descubrimiento basado en la literatura" (LBD), que como su nombre lo indica, tiene como objetivo hacer nuevos descubrimientos mediante el análisis de la literatura científica. El primer sistema LBD, construido por Don Swanson en la Universidad de Chicago en la década de 1980, buscaba conexiones novedosas en MEDLINE, una base de datos de artículos de revistas médicas. En un éxito temprano, el sistema identificó dos observaciones separadas: que la enfermedad de Raynaud, un trastorno circulatorio, estaba relacionada con la viscosidad de la sangre, y que el aceite de pescado reducía la viscosidad de la sangre; y sugirió que el aceite de pescado podría ser un tratamiento útil. Esta hipótesis fue verificada experimentalmente.

En ese entonces, el método no logró ganar popularidad fuera de la comunidad de IA. Sin embargo, hoy en día los sistemas de IA son mucho más capaces de procesar el lenguaje natural y tienen un corpus mucho más amplio de literatura científica para analizar. El interés en enfoques similares al LBD está creciendo en otros campos, especialmente en ciencia de materiales.

En 2019, por ejemplo, un grupo de investigadores liderado por Vahe Tshitoyan, en ese momento en el Lawrence Berkeley National Laboratory en Estados Unidos, utilizó una técnica de IA llamada aprendizaje no supervisado para analizar los resúmenes de artículos de ciencia de materiales y extraer información sobre las propiedades de diferentes materiales en representaciones matemáticas llamadas "embeddings de palabras". Estos conceptos se ubican en un espacio multidimensional donde los conceptos similares se agrupan juntos. Así, el sistema adquirió una "intuición química" que le permitía, por ejemplo, sugerir materiales con propiedades similares a otro material. Luego se le pidió a la IA que sugiriera materiales que podrían tener propiedades termoeléctricas, incluso si no se identificaban como tales en la literatura. Se seleccionaron los diez materiales candidatos más prometedores, y las pruebas experimentales encontraron que los diez realmente mostraban propiedades termoeléctricas excepcionalmente fuertes.

Los investigadores luego volvieron a entrenar su sistema, omitiendo documentos de años más recientes, y le pidieron que pronosticara qué nuevos materiales termoeléctricos se descubrirían en esos años posteriores. El sistema fue ocho veces más preciso al predecir tales descubrimientos de lo que se esperaría por azar. También pudo hacer predicciones precisas de descubrimientos utilizando otros términos, como "fotovoltaico". Los investigadores concluyeron que "tales métodos de inferencia basados en el lenguaje pueden convertirse en un campo de investigación completamente nuevo en la intersección entre el procesamiento del lenguaje natural y la ciencia".

Un artículo de Jamshid Sourati y James Evans, ambos sociólogos de la Universidad de Chicago, publicado este año en Nature Human Behaviour, amplía este enfoque de una manera novedosa. Parte de la observación de que los sistemas LBD tienden a centrarse en conceptos dentro de los documentos y pasan por alto a sus autores. Así que entrenaron a un sistema LBD para tener en cuenta ambos. El sistema resultante fue dos veces mejor al predecir nuevos descubrimientos en ciencia de materiales que el construido por el equipo del Dr. Tshitoyan, y también pudo predecir a los descubridores reales con más del 40% de precisión. Pero los investigadores fueron un paso más allá. En lugar de seguir a la multitud y predecir dónde los investigadores harían nuevos descubrimientos, le pidieron a su modelo que evitara a la multitud e identificara hipótesis "extrañas" que sean científicamente plausibles, pero poco probables en el curso normal de las cosas, de ser descubiertas en el futuro cercano. El sistema puede, por lo tanto, acelerar los descubrimientos a corto plazo y explorar "puntos ciegos" donde esperan nuevos descubrimientos.

Además de sugerir nuevas hipótesis para investigar, los sistemas LBD que tienen en cuenta la autoría también pueden sugerir posibles colaboradores que pueden no conocerse entre sí. Este enfoque podría ser particularmente efectivo al identificar científicos que trabajan en diferentes campos, estableciendo puentes entre áreas complementarias de investigación. Las colaboraciones de investigación interdisciplinaria "dejarán de ser rarezas y se volverán más comunes" cuando sean mediadas por la inteligencia artificial, dice Yolanda Gil, científica de la computación en la Universidad de Southern California. Y a medida que los sistemas LBD se expandan para poder manejar tablas, gráficos y datos como secuencias de genes y código de programación, se volverán más capaces. En el futuro, los investigadores podrían depender de dichos sistemas para monitorear la avalancha de nuevos artículos científicos, resaltar resultados relevantes, sugerir nuevas hipótesis para investigar e incluso vincularlos con posibles socios de investigación, como un servicio de emparejamiento científico. Las herramientas de inteligencia artificial podrían así ampliar y transformar la infraestructura existente de publicación científica, que tiene siglos de antigüedad.

Estamos llenos de energía

Si el sistema LBD promete potenciar la revista con IA, los llamados "científicos robots" o "laboratorios autónomos" prometen hacer lo mismo para el laboratorio. Estas máquinas van más allá de las formas existentes de automatización de laboratorio, como las plataformas de cribado de medicamentos. En su lugar, se les proporciona conocimientos previos sobre un área de investigación en particular, en forma de datos, documentos de investigación y patentes. Luego utilizan IA para formular hipótesis, realizar experimentos utilizando robots, evaluar los resultados, modificar sus hipótesis y repetir el ciclo. Adam, una máquina construida en la Universidad de Aberystwyth en Gales en 2009, hizo experimentos sobre la relación entre genes y enzimas en el metabolismo de la levadura, y fue la primera máquina en descubrir conocimiento científico de forma autónoma.

El sucesor de Adam, llamado Eve, realiza experimentos de descubrimiento de medicamentos y cuenta con un software más sofisticado. Al planificar y analizar experimentos, utiliza el aprendizaje automático para crear "relaciones cuantitativas de estructura-actividad" (QSAR, por sus siglas en inglés), modelos matemáticos que relacionan las estructuras químicas con los efectos biológicos. Eve ha descubierto, por ejemplo, que el triclosán, un compuesto antimicrobiano utilizado en la pasta de dientes, puede inhibir un mecanismo esencial en los parásitos que causan la malaria.

Ross King, un investigador de IA en la Universidad de Cambridge que creó Adam, establece una analogía entre los científicos robots del futuro y los sistemas de IA diseñados para jugar ajedrez y Go. La perspectiva de que las máquinas superaran a los mejores jugadores humanos parecía décadas lejos, pero la tecnología mejoró más rápido de lo esperado. Además, los sistemas de IA desarrollaron estrategias para estos juegos que los jugadores humanos no habían considerado. Algo similar podría ocurrir con los científicos robots a medida que se vuelven más capaces. "Si la IA puede explorar todo el espacio hipotético, e incluso ampliarlo, entonces podría mostrar que los humanos solo han estado explorando áreas pequeñas de dicho espacio, tal vez como resultado de sus propios sesgos científicos", afirma el Dr. King.

Los científicos robots también podrían transformar la ciencia de otra manera: al ayudar a resolver algunos de los problemas que afectan a la empresa científica. Uno de ellos es la idea de que la ciencia, según varias medidas, está siendo menos productiva, y avanzar en los límites del conocimiento se está volviendo más difícil y costoso. Hay varias teorías sobre por qué esto podría ser así: por ejemplo, ya se han hecho los descubrimientos más fáciles y ahora los científicos necesitan más entrenamiento para llegar al límite. Los sistemas impulsados por IA podrían ayudar al realizar trabajos de laboratorio de manera más rápida, económica y precisa que los humanos. A diferencia de las personas, los robots pueden trabajar las 24 horas del día. Y al igual que las computadoras y los robots han permitido proyectos a gran escala en astronomía (como grandes estudios del cielo o la búsqueda automatizada de exoplanetas), los científicos robots podrían abordar grandes problemas en biología de sistemas, por ejemplo, que de otra manera serían impracticables debido a su escala. "No necesitamos una ciencia radicalmente nueva para hacer eso, solo necesitamos hacer mucha ciencia", dice el Dr. King.

A flask breaking up into digital distortion

La automatización también podría ayudar a abordar otro problema: la crisis de reproducibilidad. En teoría, cuando los científicos publican sus resultados, otros pueden replicar y verificar su trabajo. Pero hay poco reconocimiento en la replicación, lo que la hace rara. Cuando ocurre, muchos intentos fallan, lo que sugiere que el trabajo original era inválido, o incluso fraudulento. Los científicos tienen poco incentivo para repetir el trabajo de otros y están bajo presión para publicar nuevos resultados, no para verificar los existentes. Una vez más, los científicos robots podrían ayudar en algunas áreas de investigación, como la biología molecular. Un estudio publicado en 2022 por Katherine Roper, de la Universidad de Manchester, analizó más de 12,000 artículos sobre cáncer de mama y seleccionó 74 resultados biomédicos para su verificación utilizando el robot Eve, que pudo reproducir 43 de ellos. Los investigadores concluyeron que la automatización "tiene el potencial de mitigar la crisis de reproducibilidad" y que "evita los desincentivos sociológicos y de carrera para la replicación". A las máquinas no les importa publicar verificaciones de resultados anteriores. Además, a diferencia de los científicos humanos, no se avergüenzan de publicar resultados negativos, por ejemplo, si una molécula en particular no logra interactuar con un objetivo dado. Publicar resultados negativos reduciría el esfuerzo desperdiciado al informar a futuros investigadores qué no hacer. Y los científicos robots registran de manera confiable todos los detalles de su trabajo, lo que facilita un análisis posterior de sus resultados. "Las innovaciones en IA pueden mejorar la empresa científica en todas esas áreas", dice el Dr. Gil.

¿Automatización funcional?

Existen numerosos obstáculos. Además de mejores hardware y software, y una integración más estrecha entre ambos, se necesita una mayor interoperabilidad entre los sistemas de automatización de laboratorio, así como estándares comunes que permitan a los algoritmos de IA intercambiar e interpretar información semántica.

La introducción de placas microestandarizadas, que contienen cientos de pequeños tubos de ensayo que permiten procesar muestras de laboratorio por lotes, aumentó la productividad varias veces para ciertos tipos de análisis. Ahora es necesario que suceda lo mismo con los datos; una gran cantidad de datos obtenidos de las matrices de placas microestandarizadas en los laboratorios de biología terminan en hojas de cálculo o tablas en documentos, por ejemplo, donde no pueden ser leídos por máquinas.

Otra barrera es la falta de familiaridad con herramientas basadas en IA entre los científicos. Y algunos investigadores, al igual que la mayoría de los trabajadores, se preocupan de que la automatización amenace sus empleos. Pero las cosas están cambiando, afirma la Dra. Gil. Ella encuestó las actitudes hacia la IA en la ciencia en 2014 y encontró que en la mayoría de los campos, "el interés en la IA parece ser relativamente limitado". La mayoría de los esfuerzos para incorporar la IA en la investigación científica provienen de investigadores en IA, quienes a menudo se encontraban con escepticismo u hostilidad. Pero el impacto de la IA ahora es "profundo y generalizado", dice la Dra. Gil. Muchos científicos, dice ella, ahora "buscan activamente colaboradores en IA". El reconocimiento del potencial de la IA está creciendo, especialmente en ciencia de materiales y descubrimiento de medicamentos, donde los profesionales están construyendo sus propios sistemas impulsados por IA. "Si pudiéramos lograr que las máquinas fueran tan buenas en ciencia como los seres humanos, eso sería un cambio radical, porque se pueden crear muchas de ellas", dice el Dr. King.

Las revistas científicas cambiaron la forma en que los científicos descubrían información y se basaban en el trabajo de los demás. Los laboratorios de investigación ampliaron y industrializaron la experimentación. Al extender y combinar estas dos transformaciones anteriores, la IA podría cambiar de hecho la forma en que se realiza la ciencia. ■