Ex investigadores del Meta que desarrollaron un modelo de lenguaje de inteligencia artificial para la biología han recaudado 40 millones de dólares para construir nuevos LLMs biológicos que pueden ayudar a desarrollar desde células programables para combatir el cáncer hasta organismos capaces de limpiar desechos tóxicos.
Según ha podido confirmar Forbes, antiguos investigadores del Meta que desarrollaron un modelo de lenguaje de inteligencia artificial para la biología han lanzado una nueva startup y han recaudado al menos 40 millones de dólares.
EvolutionaryScale está liderada por Alexander Rives, quien dirigió el equipo de plegado de proteínas de Meta AI hasta que el gigante tecnológico cerró el proyecto en abril. El equipo fundador, compuesto por ocho personas, proviene de la misma unidad, donde crearon un modelo basado en transformers en la línea de GPT-4 de OpenAI o Bard de Google, pero entrenado con datos sobre moléculas de proteínas para predecir las estructuras de otras proteínas desconocidas. Lo utilizaron para crear una base de datos que hoy contiene 700 millones de posibles estructuras en 3D, piezas clave para el desarrollo de medicamentos que puedan curar enfermedades, microorganismos que puedan limpiar la contaminación o formas alternativas de fabricar productos químicos industriales.
En junio, la startup se presentó a los inversores de capital riesgo para obtener financiación inicial para avanzar en sus investigaciones mediante el escalado drástico del tamaño de su modelo de IA, según un documento de presentación obtenido por Forbes. Lux Capital lideró la ronda de financiación de unos 40 millones de dólares, según cuatro personas familiarizadas con el acuerdo. Dos fuentes dijeron que la financiación valoró a EvolutionaryScale en 200 millones de dólares y que los destacados inversores de IA Nat Friedman y Daniel Gross participaron en ella.
Rives se negó a hacer comentarios, mientras que Lux, Friedman y Gross no respondieron a las solicitudes de comentarios.
Las proteínas son moléculas grandes formadas por cadenas plegadas de aminoácidos y son los componentes básicos de las bacterias, los microbios y las células humanas. Sus funciones específicas suelen estar determinadas por su forma y esa forma puede cambiar cuando interactúa con otros productos químicos o proteínas en el cuerpo. En consecuencia, a menudo se buscan partes específicas de una proteína como objetivos para los fármacos destinados a tratar enfermedades. Sin embargo, predecir la forma de una proteína es complicado, ya que está gobernada por complicadas interacciones entre los miles de átomos que la componen. (Por ejemplo, el cabello rizado está causado por la interacción de átomos de azufre contenidos en un aminoácido en particular). Estas predicciones son cruciales para permitir a los científicos comprender las funciones de las proteínas a fin de diseñar un fármaco que se una adecuadamente a su estructura tridimensional. Por tanto, la capacidad de cartografiar la estructura de tantas proteínas ayuda a los científicos a reducir sus opciones y decidir en cuáles vale la pena invertir recursos.
La filial de Google DeepMind causó un gran impacto en el campo en 2020 con el lanzamiento en código abierto de AlphaFold, su sistema de IA para predecir estructuras de proteínas. El premio Nobel Venki Ramakrishnan elogió el trabajo de DeepMind como un "avance sorprendente" que "cambiaría fundamentalmente la investigación biológica", en una publicación de blog de la compañía en 2020. Incluso poder predecir la estructura de los 200 millones de proteínas sigue siendo un gran desafío para los científicos a la hora de determinar cómo interactuarían los fármacos con estas moléculas. Más tarde, esa investigación se publicó en Nature y el CEO de DeepMind, Demis Hassabis, y el investigador principal John Jumper recibieron el premio Breakthrough de 3 millones de dólares. [Enlace a: https://www.forbes.com/sites/alexknapp/2022/09/22/2023-breakthrough-prizes-announced-deepminds-protein-folders-awarded-3-million/?sh=32265bdf4fcb]
En noviembre pasado, el grupo liderado por Rives destacó su modelo en un artículo publicado en la revista Science, proclamándolo capaz de hacer predicciones 60 veces más rápido que AlphaFold, aunque en promedio las predicciones son menos precisas. Hasta la fecha, la inteligencia artificial ha proporcionado principalmente mejoras incrementales en la eficiencia del desarrollo de fármacos. El momento eureka para la inteligencia artificial generativa basada en texto, donde las capacidades técnicas mejoraron de manera tan repentina y marcada que desencadenaron un auge comercial, aún no ha ocurrido en biología, y algunas empresas farmacéuticas tradicionales no están convencidas de que alguna vez sucederá.
En abril, con la carrera para comercializar la inteligencia artificial generativa impulsada por ChatGPT en pleno apogeo, el equipo de Rives abandonó Meta. Mientras que la gran empresa tecnológica estableció su brazo de IA para desarrollar una amplia gama de investigaciones, su enfoque se ha estrechado a medida que ciertos proyectos mostraban viabilidad comercial; de manera similar, OpenAI disolvió su equipo de robótica en 2021. The Financial Times, que informó por primera vez sobre la desaparición del equipo de proteínas, lo describió como parte de una serie de despidos y un cambio de estrategia en la empresa matriz para centrarse en esfuerzos comerciales, como una variedad de chatbots basados en IA. En el corto plazo, la IA para la biología tiene pocas probabilidades de generar retornos comerciales lucrativos. Jugadores comerciales como Schrodinger, que actualmente cotiza públicamente con una capitalización de mercado inferior a los 3 mil millones de dólares, venden productos basados en métodos de modelado molecular más antiguos.
EvolutionaryScale es la última empresa que ha recaudado capital para la investigación de IA basada en transformadores a una enorme valuación. Entre las empresas de desarrollo de modelos unicornio se encuentran Inflection AI, que recaudó 1.3 mil millones de dólares en junio; Cohere, que anunció 270 millones de dólares en mayo; y Adept, que cerró una inversión de 350 millones de dólares en marzo. Esta semana, Hugging Face, un proveedor de infraestructura de IA emocionante, anunció una inyección de 235 millones de dólares a una valuación de 4.5 mil millones de dólares (Forbes fue el primero en informar el mes pasado que la empresa estaba recaudando fondos). Muchos de los acuerdos representan apuestas de que los ingresos insignificantes finalmente aumentarán. Stability AI, que recaudó 100 millones de dólares con una valuación de 1 mil millones de dólares el año pasado, está luchando por generar ingresos, entre otros desafíos, según informó Forbes en una investigación de junio.
Los avances técnicos adicionales en la inteligencia artificial para el plegamiento de proteínas también requerirán una inversión sustancial. DeepMind estableció un nuevo brazo de descubrimiento de medicamentos llamado Isomorphic Labs en diciembre de 2022, mientras que los competidores Insitro y Recursion, cotizados en NASDAQ, han recaudado más de 1.000 millones de dólares de inversores privados y públicos (en el documento de presentación, EvolutionaryScale describió a estas empresas como "posibles socios" a los que podría ayudar a través de sus modelos). Aun con esa inversión, el tiempo promedio para llevar un medicamento desde el descubrimiento hasta la aprobación de la FDA es de aproximadamente 7-10 años.
El equipo de Rives parece darse cuenta de su estatus de proyecto ambicioso. EvolutionaryScale proyecta que gastará 38 millones de dólares en su primer año, con 16 millones destinados a la potencia informática, según el documento de presentación. Los costos se multiplican a partir de ahí, llegando a 161 millones de dólares en el segundo año y 278 millones de dólares en el tercer año (con 100 y 200 millones de dólares invertidos en computación, respectivamente). Sin embargo, a lo largo del documento, la empresa enfatiza repetidamente que podrían pasar diez años antes de que los modelos de IA en biología ayuden a diseñar productos y terapias.
Esto es, si su hipótesis es precisa en primer lugar. El presupuesto intensivo de cómputo (y el nombre de la empresa) hacen alusión a la gran apuesta de EvolutionaryScale: escalar el modelo de IA, proporcionándole más datos y aumentando su tamaño, producirá un "avance en capacidad en la IA para la biología", afirma el memorando de presentación, comparando el estado actual con el procesamiento del lenguaje natural en 2018. "Actualmente no vemos ningún otro esfuerzo creíble centrado en la hipótesis de escalamiento en biología", dice el documento.
Según el memo, EvolutionaryScale tiene como objetivo construir un nuevo modelo cada año. Para el tercer año, su ambición es ir más allá de la predicción de estructuras de proteínas e integrar otros datos biológicos, como secuencias de ADN, expresión génica y estados epigenéticos. Su visión a largo plazo implica vender un modelo de IA de propósito general para biología, no específico para un caso de uso particular. Teoriza que el modelo podría utilizarse en medicina, como el desarrollo de "células programables que buscan y destruyen el cáncer u otras enfermedades", pero también en otras aplicaciones biotecnológicas, como el diseño de "máquinas moleculares" para limpiar residuos tóxicos o capturar carbono (aunque este es otro mercado desafiante: esta idea se asemeja a la tesis de Ginkgo Bioworks, que actualmente cotiza en bolsa un 84% por debajo del precio de su OPV).
Para lograrlo, EvolutionaryScale debe demostrar su ventaja sobre AlphaFold, que sigue siendo el líder indiscutible en el sector. Otras empresas emergen para abordar objetivos similares, como Inceptive, que pretende aplicar modelos de lenguaje amplios para diseñar terapias farmacéuticas basadas en ARN. La startup fue cofundada por Jakob Uszkoreit, coautor del artículo de investigación emblemático que inventó el transformador, el avance técnico detrás de la fiebre actual de financiamiento de IA generativa. Un inversor biotecnológico que habló con Forbes, de manera anónima, especuló que las futuras versiones de modelos de lenguaje amplios más generalizados, como la serie GPT de OpenAI, podrían llegar a ser lo suficientemente habilidosas como para aplicarse en biología.
Estas batallas competitivas probablemente no serán una preocupación a tiempo completo para Rives, quien es descrito en el documento como "CEO interino". Según el documento de presentación, tiene una oferta para unirse al profesorado del MIT y el Broad Institute de Harvard el próximo año y establecer un "laboratorio de diseño biológico".
Alex Konrad contribuyó a la investigación.