Dirigir un programa de detección de drogas es como organizar un enorme cóctel y escuchar lo que sucede. En las fiestas hay mucho diálogo sin importancia, pero solo unas pocas conversaciones significativas. De manera similar, en los programas de detección de drogas, las interacciones débiles entre medicamentos y objetivos superan con creces las instancias de unión de alta afinidad.
Imagina si tuvieras que escuchar cada palabra en una fiesta. Seguramente sería tedioso. Ahora, considera lo mucho peor que sería evaluar cada interacción entre medicamentos y objetivos en un típico escaneo de drogas. Eso agotaría incluso al oyente más paciente, el sistema típico de inteligencia artificial (IA).
Desafortunadamente, los sistemas de IA convencionales tardan mucho tiempo en clasificar los datos sobre las interacciones entre candidatos a medicamentos y objetivos de proteínas. La mayoría de los sistemas de IA calculan la estructura tridimensional de cada proteína objetivo a partir de su secuencia de aminoácidos y luego utilizan esas estructuras para predecir con qué moléculas de medicamentos interactuará. El enfoque es exhaustivo pero lento.
Para agilizar las cosas, los investigadores del MIT y la Universidad de Tufts han ideado un enfoque computacional alternativo basado en un tipo de algoritmo de IA conocido como un gran modelo de lenguaje. Estos modelos, un ejemplo bien conocido es ChatGPT, pueden analizar grandes cantidades de texto y determinar cuáles palabras (o, en este caso, aminoácidos) son las más probables de aparecer juntas. El gran modelo de lenguaje desarrollado por el equipo de MIT/Tufts se conoce como ConPLex. Puede asociar proteínas objetivo con moléculas potenciales de medicamentos sin tener que realizar el paso intensivo en computación de calcular las estructuras de las moléculas.
Los detalles sobre ConPLex aparecieron el 8 de junio en PNAS, en un artículo titulado: "Contrastive learning in protein language space predicts interactions between drugs and protein targets." ConPLex puede aprovechar los avances en los modelos de lenguaje proteico preentrenados ("PLex") y emplear un acoplamiento de contraste de anclaje proteico ("Con") para superar los enfoques de vanguardia.
"ConPLex logra una alta precisión, amplia adaptabilidad a datos invisibles y especificidad contra compuestos engañosos", escribieron los autores del artículo. "Realiza predicciones de unión en función de la distancia entre las representaciones aprendidas, lo que permite hacer predicciones a la escala de bibliotecas masivas de compuestos y del proteoma humano".
Los investigadores probaron entonces su modelo al escanear una biblioteca de aproximadamente 4,700 moléculas de medicamentos candidatos por su capacidad para unirse a un conjunto de 51 enzimas conocidas como quinasas proteicas.
De los mejores resultados, los investigadores eligieron 19 pares droga-proteína para probar experimentalmente. Los experimentos revelaron que de los 19 pares, 12 tenían una fuerte afinidad de unión (en el rango de nanomolares), mientras que casi todos los demás posibles pares de drogas y proteínas no tendrían afinidad. Cuatro de estos pares se unieron con una afinidad extremadamente alta, sub-nanomolar (tan fuerte que una pequeña concentración de droga, en el orden de partes por millón, inhibiría la proteína).
Si bien los investigadores se centraron principalmente en escanear drogas de molécula pequeña en este estudio, ahora trabajan en la aplicación de este enfoque a otros tipos de drogas, como anticuerpos terapéuticos. Este tipo de modelamiento también podría ser útil para realizar pruebas de toxicidad de compuestos de drogas potenciales, para asegurarse de que no tengan efectos secundarios no deseados antes de probarlos en modelos animales.
"Este trabajo aborda la necesidad de una detección in silico eficiente y precisa de posibles candidatos a medicamentos", dijo Bonnie Berger, investigadora del MIT y una de las autoras principales del nuevo estudio. "[Nuestro modelo] permite realizar detecciones a gran escala para evaluar efectos fuera del objetivo, reutilización de drogas y determinar el impacto de las mutaciones en la unión de drogas".
"Parte de la razón por la cual el descubrimiento de medicamentos es tan costoso es por su alto índice de fallas", señaló Rohit Singh, investigador del MIT y uno de los autores principales del estudio. "Si podemos reducir esas tasas de fallas al decir de antemano que es improbable que esta droga funcione, podría ser una gran ayuda para reducir el costo del descubrimiento de medicamentos".