Según un estudio reciente de IBV, el 64% de los CEOs encuestados se enfrentan a presiones para acelerar la adopción de la inteligencia artificial generativa, y el 60% carece de un método consistente y global para implementarla. Una plataforma de IA y datos, como watsonx, puede ayudar a potenciar a las empresas para aprovechar los modelos base y acelerar el ritmo de adopción de la IA generativa en toda su organización.
Las nuevas funciones y capacidades lanzadas de watsonx.ai, una capacidad dentro de watsonx, incluyen nuevos modelos base de propósito general y generación de código, una mayor variedad de opciones de modelos de código abierto y opciones adicionales de datos y capacidades de ajuste que pueden ampliar el impacto potencial en los negocios de la IA generativa. Estas mejoras han sido guiadas por las consideraciones estratégicas fundamentales de IBM de que la IA debe ser abierta, confiable, dirigida y empoderadora.
Modelos base desarrollados por IBM orientados a los negocios, construidos a partir de datos confiables
Los líderes empresariales encargados de adoptar la IA generativa necesitan flexibilidad y opciones en los modelos. También necesitan acceso seguro a modelos relevantes para los negocios que puedan ayudar a acelerar el tiempo de valor y los conocimientos. Reconociendo que una talla única no sirve para todos, el estudio watsonx.ai de IBM proporciona una familia de modelos base de lenguaje y código de diferentes tamaños y arquitecturas para ayudar a los clientes a lograr rendimiento, velocidad y eficiencia."En un entorno en el que la integración con nuestros sistemas y la interconexión fluida con varios programas es primordial, watsonx.ai se presenta como una solución convincente", dice Atsushi Hasegawa, Ingeniero Jefe de Honda R&D. "Su flexibilidad inherente y sus capacidades de implementación ágil, junto con un sólido compromiso con la seguridad de la información, resaltan su atractivo".
El lanzamiento inicial de watsonx.ai incluyó la familia Slate de modelos que solo codifican, útiles para tareas de procesamiento del lenguaje natural en la empresa. Nos complace presentar ahora la primera iteración de nuestros modelos base generativos desarrollados por IBM, Granite. La serie de modelos Granite está construida sobre una arquitectura que solo descodifica y es adecuada para tareas generativas como la resumenización, la generación de contenido, la generación mejorada por recuperación, la clasificación y la extracción de conocimientos.
Todos los modelos base Granite han sido entrenados con conjuntos de datos orientados a la empresa y seleccionados por IBM. Para proporcionar una mayor experiencia en dominios específicos, la familia de modelos Granite fue entrenada en conjuntos de datos relevantes para la empresa en cinco dominios: internet, académico, código, legal y financiero, todos ellos examinados minuciosamente para eliminar contenido objetable y comparados con modelos internos y externos. Este proceso está diseñado para ayudar a mitigar riesgos para que las salidas de los modelos se puedan implementar de manera responsable con la ayuda de watsonx.data y watsonx.governance (próximamente).
Basándose en las evaluaciones y pruebas iniciales de investigaciones y pruebas de IBM, en 11 tareas financieras diferentes, los resultados muestran que al entrenar los modelos Granite-13B con datos financieros de alta calidad, son algunos de los modelos de mejor rendimiento en tareas financieras, y tienen el potencial de lograr un rendimiento similar o incluso mejor que modelos mucho más grandes.
Tareas financieras evaluadas incluyen: proporcionar puntuaciones de sentimiento para las transcripciones de acciones y llamadas de ganancias, clasificar titulares de noticias, extraer evaluaciones de riesgo crediticio, resumir textos financieros extensos y responder preguntas relacionadas con finanzas o seguros.
Construyendo transparencia en los modelos de IA desarrollados por IBM
Hasta la fecha, muchos de los modelos de IA disponibles carecen de información sobre procedencia de datos, pruebas, seguridad o parámetros de rendimiento. Para muchas empresas y organizaciones, esto puede generar incertidumbres que ralentizan la adopción de la IA generativa, especialmente en industrias altamente reguladas.
Hoy, IBM comparte las siguientes fuentes de datos utilizadas en el entrenamiento de los modelos Granite (obtén más información sobre cómo se entrenan estos modelos y las fuentes de datos utilizadas):
1. Common Crawl
2. Webhose
3. GitHub Clean
4. Arxiv
5. USPTO
6. Pub Med Central
7. SEC Filings
8. Free Law
9. Wikimedia
10. Stack Exchange
11. DeepMind Mathematics
12. Project Gutenberg (PG-19)
13. OpenWeb Text
14. HackerNews
El enfoque de IBM para el desarrollo de la IA se guía por principios fundamentales basados en el compromiso con la confianza y la transparencia. Como testimonio del rigor que IBM aplica en el desarrollo y las pruebas de sus modelos fundamentales, IBM indemnizará a los clientes contra reclamos de propiedad intelectual de terceros relacionados con los modelos fundamentales desarrollados por IBM. A diferencia de otros proveedores de Grandes Modelos de Lenguaje y en línea con el enfoque estándar de IBM respecto a la indemnización, IBM no requiere que sus clientes indemnicen a IBM por el uso de modelos desarrollados por IBM. Además, en concordancia con su enfoque de obligaciones de indemnización, IBM no limita su responsabilidad por indemnización por propiedad intelectual en relación a los modelos desarrollados por IBM.
A medida que los clientes busquen utilizar nuestros modelos desarrollados por IBM para crear activos de IA diferenciados, los alentamos a personalizar aún más los modelos de IBM para adaptarlos a tareas específicas posteriores. A través de técnicas rápidas de ingeniería y ajuste en curso, los clientes pueden usar de manera responsable sus propios datos empresariales para lograr una mayor precisión en los resultados del modelo y crear una ventaja competitiva.
Ayudando a las organizaciones a utilizar modelos de terceros de manera responsable
Dado que existen miles de modelos de lenguaje de código abierto para trabajar, es difícil saber por dónde empezar y cómo elegir el modelo adecuado para la tarea adecuada. Sin embargo, elegir el LLM "correcto" de una colección de miles de modelos de código abierto no es una tarea fácil y requiere un examen cuidadoso de los compromisos entre costo y rendimiento. Y considerando la impredecibilidad de muchos LLM, también es importante tener en cuenta la ética y la gobernanza de la IA en la construcción, entrenamiento, ajuste, pruebas y resultados del modelo.
Sabiendo que un solo modelo no será suficiente, hemos creado una biblioteca de modelos fundamentales en watsonx.ai para que los clientes y socios trabajen con ellos.
Comenzando con 5 modelos de código abierto seleccionados de Hugging Face, elegimos estos modelos en base a rigurosas revisiones técnicas, de licencias y rendimiento, e incluimos la comprensión del rango de casos de uso para los cuales los modelos son más adecuados. El último modelo de código abierto de LLM que agregamos este mes incluye el modelo Llama 2-chat de 70 mil millones de parámetros de Meta dentro del estudio de watsonx.ai. Llama 2 es útil para la generación de chat y código. Está preentrenado con datos disponibles en línea de manera pública y ajustado mediante aprendizaje por refuerzo a partir de retroalimentación humana. Útil para mejorar aplicaciones de agentes virtuales y chat, Llama 2 está destinado a escenarios comerciales e investigativos.
El StarCoder LLM de BigCode ahora también está disponible en watsonx.ai. Entrenado con datos de GitHub con licencias permisivas, el modelo se puede utilizar como asistente técnico, para explicar y responder preguntas generales sobre código en lenguaje natural. También puede ayudar con el autocompletado de código, modificar código y explicar fragmentos de código en lenguaje natural.
Los usuarios de modelos de terceros en watsonx.ai también pueden activar una función de protección de IA para eliminar automáticamente el lenguaje ofensivo tanto de las indicaciones de entrada como de la salida generada.
Reduciendo el riesgo del entrenamiento del modelo con datos sintéticos
En el proceso convencional de anonimización de datos, pueden introducirse errores que comprometan gravemente los resultados y las predicciones. Sin embargo, Facilitando casos de uso centrados en el negocio mediante la personalización de indicacionesLa versión oficial de Tuning Studio en watsonx.ai permite a los usuarios comerciales personalizar modelos base para satisfacer las necesidades específicas de su negocio en una variedad de casos de uso, que incluyen preguntas y respuestas, generación de contenido, reconocimiento de entidades nombradas, extracción de información, resumen y clasificación.La primera versión de Tuning Studio admitirá la personalización de indicaciones. Mediante el uso avanzado de la personalización de indicaciones dentro de watsonx.ai (con tan solo 100 a 1.000 ejemplos), las organizaciones pueden adaptar modelos base existentes a sus datos patentados. La personalización de indicaciones permite que una empresa con datos limitados ajuste un modelo masivo a una tarea específica, lo que podría reducir el uso de computación y energía sin necesidad de volver a entrenar un modelo de IA.
Avanzando y apoyando la IA para los negocios
La plataforma de IA y datos watsonx de IBM está construida para empresas y diseñada para ayudar a más personas en su organización a escalar y acelerar el impacto de la IA con datos confiables. A medida que las tecnologías de IA avanzan, la arquitectura de watsonx está diseñada para integrar de manera fluida nuevos modelos base dirigidos a los negocios, como los desarrollados por IBM Research, y para acomodar modelos de terceros, como los ofrecidos en la plataforma de código abierto Hugging Face, al tiempo que proporciona salvaguardas críticas de gobernanza con el futuro lanzamiento de watsonx.governance.La plataforma watsonx es solo una parte de las soluciones generativas de IA de IBM.
Con IBM Consulting, los clientes pueden obtener ayuda para ajustar y operativizar modelos para casos de uso empresarial específicos, con acceso a la experiencia especializada en inteligencia artificial generativa de más de 1,000 consultores.
Prueba watsonx.ai con nuestra experiencia de prueba de watsonx