Si bien los investigadores de la Universidad de West Virginia ven potencial en entornos educativos para el nuevo complemento oficial ChatGPT, llamado Code Interpreter, han encontrado limitaciones en su uso para científicos que trabajan con datos biológicos utilizando métodos computacionales para priorizar el tratamiento dirigido contra el cáncer y trastornos genéticos.
"Code Interpreter es algo bueno y útil en un entorno educativo, ya que facilita el aprendizaje de la programación en los campos de STEM para los estudiantes", dijo Gangqing "Michael" Hu, profesor asistente en el Departamento de Microbiología, Inmunología y Biología Celular de la Escuela de Medicina de la Universidad de West Virginia y director del Bioinformatics Core. "Sin embargo, no tiene las características necesarias para la bioinformática. Estos son problemas técnicos que se pueden superar. Es probable que los futuros desarrollos de Code Interpreter amplíen su uso en muchos campos, como la bioinformática, las finanzas y la economía".
Desde su lanzamiento en diciembre de 2022, el popular chatbot de inteligencia artificial, ChatGPT, ha captado la atención de empresas, educadores y el público en general. Sin embargo, no respondió del todo a las necesidades de las personas que trabajan en investigación biomédica, incluida la bioinformática, el campo donde se encuentran la informática y la biología, y que esperaban ansiosamente el complemento Code Interpreter de OpenAI esperando que llenara los vacíos.
Hu y su equipo pusieron a prueba Code Interpreter en una variedad de tareas para evaluar sus características. Sus hallazgos, publicados en la revista Annals of Biomedical Engineering, demuestran que el complemento ayuda a superar algunas barreras, aunque no todas.
Por ejemplo, las personas sin formación científica podrán acceder fácilmente a la programación informática con Code Interpreter. Hu afirmó que además es rentable y despierta la curiosidad de los estudiantes por explorar el análisis de datos y aumenta su interés por el aprendizaje. Sin embargo, señala que los usuarios deberán comprender cómo interpretar los datos y reconocer si los resultados son precisos, así como saber cómo interactuar con el chatbot.
Los bioinformáticos confían en la programación precisa, los programas informáticos y el acceso a Internet para almacenar, analizar e interpretar datos biológicos, como el ADN y el genoma humano, utilizados para avances en la medicina moderna.
A pesar de la necesidad de mejoras específicas para la bioinformática, Hu afirmó que Code Interpreter ayuda a los usuarios a determinar si una respuesta es precisa o si se trata de una respuesta ficticia presentada con confianza, conocida como una alucinación.
"La gente sabe que ChatGPT puede hacer muchas cosas impresionantes, pero no es bueno proporcionando una cita o referencia para respaldar su respuesta. Si se le pregunta sobre la fuente que respalda la afirmación de una respuesta, es posible que comience a inventar referencias", explicó Hu. "Code Interpreter proporciona una solución para minimizar las alucinaciones. Para preguntas que se pueden abordar mediante programación, el propio código sirve como fuente o referencia. Eso es un avance significativo".
Trabajando con Hu estaban Lei Wang, investigador postdoctoral en el Departamento de Microbiología, Inmunología y Biología Celular de la Universidad de West Virginia; Xijin Ge, de la Universidad Estatal de Dakota del Sur; y Li Liu, de la Universidad Estatal de Arizona.
El equipo encontró resultados positivos en la capacidad de Code Interpreter para convertir datos en gráficos.
Las sugerencias para mejorar Code Interpreter incluyen el acceso a Internet para descargar datos del genoma, la instalación de software específico para bioinformática, la expansión de la capacidad de almacenamiento y el soporte para otros lenguajes de programación adicionales. Además, los investigadores encontraron la necesidad de aplicaciones de privacidad y seguridad para cumplir con regulaciones como HIPAA.
En la prueba de análisis de datos, descubrieron varias limitaciones. El complemento solo es compatible con un programa informático, Python, y pocos de sus paquetes de software están dedicados a la bioinformática. Además, no permite el acceso a datos de Internet y carece de capacidad para trabajar con archivos grandes.
"Permite alrededor de 100 megabytes más o menos, pero los archivos con los que trabajamos están en el nivel de gigabytes", dijo Hu. "Además, no soporta el procesamiento paralelo necesario para conjuntos de datos grandes, lo que resulta en un rendimiento lento".
Hu dijo que si bien espera más mejoras para el Code Interpreter, planea ayudar a los estudiantes a aprender más sobre las ventajas del complemento actual.
"En mi clase el próximo semestre, planeo presentar este complemento para ayudar a los estudiantes a aprender sobre visualización de datos", dijo Hu. "La inteligencia artificial es un campo en constante evolución. Espero que para ese momento, OpenAI pueda superar algunas de las limitaciones para que pueda ser utilizado en un amplio rango de codificación bioinformática".
A principios de este año, Hu lideró otro estudio para preparar a estudiantes de secundaria y universidad a aprovechar el poder de ChatGPT mediante el aprendizaje sobre codificación. El proceso empleó OPTIMAL - Optimización de Indicaciones a través de Mentoría y Evaluación Iterativa - para mejorar la comunicación con un chatbot.
A largo plazo, Hu dijo que continuará monitoreando y probando nuevas programaciones y características de inteligencia artificial.
"A medida que se desarrollen nuevos productos, simplemente seguiré adelante", dijo Hu. "Ciertamente hay muchos otros usos innovadores por descubrir".