Google DeepMind ha utilizado su revolucionaria IA de predicción de estructura de proteínas en la búsqueda de mutaciones genéticas que causan enfermedades.

Una nueva herramienta basada en la red AlphaFold puede predecir con precisión qué mutaciones en las proteínas tienen probabilidades de causar condiciones de salud, un desafío que limita el uso de la genómica en la atención médica.

La red de IA, llamada AlphaMissense, es un avance, según los investigadores que están desarrollando herramientas similares, pero no necesariamente un cambio radical. Es una de las muchas técnicas en desarrollo que tienen como objetivo ayudar a los investigadores y, en última instancia, a los médicos a 'interpretar' los genomas de las personas para encontrar la causa de una enfermedad. Sin embargo, herramientas como AlphaMissense, que se describe en un artículo del 19 de septiembre en Science, deberán someterse a pruebas exhaustivas antes de ser utilizadas en la clínica.

Muchas de las mutaciones genéticas que causan directamente una condición, como las responsables de la fibrosis quística y la enfermedad de células falciformes, tienden a cambiar la secuencia de aminoácidos de la proteína que codifican. Pero los investigadores solo han observado algunas millones de estas mutaciones de 'cambio de letras'. De las más de 70 millones de posibles en el genoma humano, solo una pequeña fracción se ha relacionado concluyentemente con enfermedades y la mayoría parece no tener efectos perjudiciales para la salud.

Por lo tanto, cuando los investigadores y los médicos encuentran una mutación de cambio de letras que nunca han visto antes, puede ser difícil saber qué hacer con ella. Para ayudar a interpretar tales 'variantes de significado desconocido', los investigadores han desarrollado docenas de herramientas computacionales diferentes que pueden predecir si una variante es probable que cause enfermedades. AlphaMissense incorpora enfoques existentes para el problema, que cada vez se abordan más con aprendizaje automático.

Localización de mutaciones

La red se basa en AlphaFold, que predice la estructura de una proteína a partir de una secuencia de aminoácidos. Pero en lugar de determinar los efectos estructurales de una mutación, un desafío abierto en biología, AlphaMissense utiliza la 'intuición' de AlphaFold sobre la estructura para identificar dónde es probable que ocurran mutaciones que causan enfermedades dentro de una proteína, según Pushmeet Kohli, vicepresidente de Investigación de DeepMind y autor del estudio, en una conferencia de prensa.

AlphaMissense también incorpora un tipo de red neuronal inspirada en los modelos de lenguaje grandes como ChatGPT, que ha sido entrenada en millones de secuencias de proteínas en lugar de palabras, llamada modelo de lenguaje proteínico. Estos han demostrado habilidad para predecir estructuras de proteínas y diseñar nuevas proteínas. Son útiles para la predicción de variantes porque han aprendido qué secuencias son plausibles y cuáles no, según Žiga Avsec, científico investigador de DeepMind y coautor del estudio, en declaraciones a los periodistas.

La red de DeepMind parece superar a otras herramientas computacionales al discernir variantes conocidas por causar enfermedades de aquellas que no lo hacen. También tiene buenos resultados al detectar variantes problemáticas identificadas en experimentos de laboratorio que miden los efectos de miles de mutaciones a la vez. Los investigadores también utilizaron AlphaMissense para crear un catálogo de todas las posibles mutaciones de cambio de letras en el genoma humano, determinando que el 57% es probable que sean benignas y que el 32% pueden causar enfermedad.

Soporte clínico

AlphaMissense es un avance respecto a las herramientas existentes para predecir los efectos de las mutaciones, pero "no es un salto gigantesco", según Arne Elofsson, biólogo computacional de la Universidad de Estocolmo.

Su impacto no será tan significativo como el de AlphaFold, que marcó el comienzo de una nueva era en la biología computacional, coincide Joseph Marsh, biólogo computacional de la Unidad de Genética Humana del MRC en Edimburgo, Reino Unido. "Es emocionante. Probablemente sea el mejor predictor que tenemos en este momento. Pero, ¿será el mejor predictor dentro de dos o tres años? Existe una buena posibilidad de que no lo sea".

Las predicciones computacionales tienen actualmente un papel mínimo en el diagnóstico de enfermedades genéticas, afirma Marsh, y las recomendaciones de los grupos de médicos indican que estas herramientas deberían proporcionar solo evidencia de apoyo para vincular una mutación a una enfermedad.

AlphaMissense clasificó confiadamente una proporción mucho mayor de mutaciones no sin sentido que los métodos anteriores, dice Avsec. "A medida que estos modelos mejoren, creo que las personas estarán más inclinadas a confiar en ellos".

Yana Bromberg, bioinformática de la Universidad Emory en Atlanta, Georgia, enfatiza que herramientas como AlphaMissense deben evaluarse rigurosamente, utilizando buenos indicadores de rendimiento, antes de ser aplicadas en el mundo real.

Por ejemplo, un ejercicio llamado Evaluación Crítica de la Interpretación del Genoma (CAGI) ha evaluado el rendimiento de estos métodos de predicción durante años utilizando datos experimentales que aún no se han publicado. "Es mi peor pesadilla pensar en un médico que tome una predicción y la acepte como algo real sin la evaluación de entidades como CAGI", agrega Bromberg.

Este artículo se reproduce con permiso y se publicó por primera vez el 19 de septiembre de 2023. Puedes consultarlo en este enlace: primer artículo.