Imagen de navegación de código abierto

GettyEl Inteligencia Artificial (IA) de código abierto se define como la colaboración de los ingenieros de software en diversos proyectos de IA que están abiertos al público para su desarrollo. El objetivo es integrar mejor la informática con la humanidad.

A principios de marzo, la comunidad de código abierto logró adquirir la LLaMA de Meta, que se filtró al público. En apenas un mes, hay variantes de modelos de IA de código abierto muy innovadores con afinación de instrucciones, cuantificación, mejoras de calidad, evaluaciones humanas, multimodalidad, RLHF, etc.

Los modelos de código abierto son más rápidos, personalizables, privados y capaces. Están haciendo cosas con $100 y 13B parámetros con las que incluso los líderes del mercado están luchando. Una solución de código abierto, Vicuna, es un Chatbot de código abierto que impresiona a GPT-4 con un 90% de calidad de ChatGPT.

¿Quién querrá pagar premios importantes por OpenAI Chat GPT4 si hay opciones de código abierto que funcionan al 90% de comparación cuando son gratuitas?

La IA de código abierto está avanzando en Google y ChatGPT, según un nuevo informe de The Information. El informe encontró que los modelos de IA de código abierto están ahora "razonablemente cerca" en rendimiento a los modelos propietarios de Google y el creador de ChatGPT, OpenAI.

Los hallazgos del informe son significativos porque sugieren que la IA de código abierto está siendo una alternativa viable a los modelos de IA propietarios. Esto podría tener un gran impacto en la industria de la IA, ya que podría llevar a una mayor competencia e innovación.

El autor del informe, Ion Stoica, profesor de ciencias de la computación en la Universidad de California, Berkeley, dijo que el aumento de la IA de código abierto se debe a diversos factores, incluida la creciente disponibilidad de recursos de datos y de computación.

Stoica también dijo que la IA de código abierto es más accesible para los desarrolladores, lo que está llevando a un amplio rango de aplicaciones que se están desarrollando.

Los hallazgos del informe son buenas noticias para las empresas y los desarrolladores que buscan soluciones de IA baratas, éticas y accesibles. Los modelos de IA de código abierto ofrecen una alternativa viable a los modelos propietarios, y es probable que se vuelvan aún más populares en el futuro.

Aquí hay algunos detalles adicionales del artículo:

Los modelos de IA de código abierto son desarrollados por una comunidad de desarrolladores, en lugar de una sola empresa. Esto significa que son más transparentes y responsables. Los modelos de IA de código abierto son a menudo más asequibles que los modelos propietarios. Esto se debe a que no están sujetos a las mismas tarifas de licencia. Los modelos de IA de código abierto son más flexibles y personalizables que los modelos propietarios. Esto se debe a que no están bloqueados en una plataforma o marco específico.

El aumento de la IA de código abierto es un desarrollo positivo para la industria de la IA. Está haciendo que la IA sea más accesible, asequible y transparente. Esto está llevando al desarrollo de un amplio rango de aplicaciones, lo que beneficia a empresas y consumidores.

Dicho esto, un gran artículo del escritor del MIT, Will Douglas Heaven, advirtió que aunque existe una gran colaboración entre la comunidad de código abierto, con los riesgos legales y las preocupaciones en torno a la inteligencia artificial, quizás se necesiten cambios. Según su artículo de investigación en el que cita a Dave Willner, jefe de los equipos de confianza y seguridad de OpenAI: "Lo que estamos intentando es reconciliar la transparencia con la seguridad. Y a medida que estas tecnologías se vuelven más poderosas, hay cierta cantidad de tensión entre esas cosas en la práctica" .... "Muchas normas y pensamientos en IA han sido formados por comunidades de investigación académica, que valoran la colaboración y la transparencia para que las personas puedan basarse en el trabajo de otros", dice Willner.

Mientras trabajamos en reconciliar un equilibrio más fuerte, el código abierto sigue aportando un valor tremendo para las empresas para aprovechar los métodos de IA que son más rentables y permiten el acceso, clave en este mundo rápido y más inteligente en el que vivimos.

Valor del código abierto en la IA para las empresas

He aquí algunos ejemplos de cómo se está utilizando la IA de código abierto para beneficiar a las empresas y a los consumidores:

    Salud: La IA se está utilizando para desarrollar nuevas herramientas de diagnóstico y tratamientos para enfermedades. Por ejemplo, se está utilizando IA para desarrollar nuevas herramientas de detección de cáncer que pueden identificar tumores antes que los métodos tradicionales. También se está utilizando la IA para desarrollar nuevos tratamientos para enfermedades, como terapias personalizadas contra el cáncer. Finanzas: La IA se está utilizando para mejorar la detección de fraudes y la evaluación de riesgos. Por ejemplo, se está utilizando la IA para identificar transacciones fraudulentas en tiempo real. También se está utilizando la IA para evaluar el riesgo de prestar dinero a empresas y consumidores. Servicio al cliente: La IA se está utilizando para automatizar tareas de servicio al cliente, como responder preguntas y resolver problemas. Por ejemplo, se está utilizando la IA para crear chatbots que puedan responder a las preguntas de los clientes las 24 horas del día, los 7 días de la semana. También se está utilizando la IA para desarrollar nuevas herramientas que puedan ayudar a los representantes de servicio al cliente a resolver los problemas más rápidamente. Desarrollo de productos: La IA se está utilizando para desarrollar nuevos productos y servicios que sean más personalizados y eficientes. Por ejemplo, se está utilizando la IA para desarrollar nuevos motores de recomendación que puedan sugerir productos en los que los clientes probablemente estén interesados. También se está utilizando la IA para desarrollar nuevos procesos de fabricación que puedan producir productos de manera más eficiente.

    Conclusión

    Estos son solo algunos ejemplos de cómo se está utilizando la IA de código abierto para beneficiar a las empresas y a los consumidores. La IA es una tecnología poderosa que tiene el potencial de revolucionar muchas industrias. A medida que la IA siga desarrollándose, podemos esperar ver incluso más aplicaciones innovadoras que mejoren nuestras vidas. Cómo Google, OpenAI, ahora una organización con fines de lucro y Meta abrazarán estas dinámicas del mercado en rápido ascenso, está por verse.

    Notas de investigación:

    • Un agradecimiento especial a Rehmat Orakzai por sus contribuciones de investigación en defensa del valor de la IA de código abierto y sus fuertes contribuciones a este artículo de investigación.
    • Referencias:

    Afzal, A. y Patel, D. A. "No tenemos foso, ni lo tiene OpenAI" El documento interno filtrado de Google afirma que la IA de código abierto superará a Google y a OpenAI, 4 de mayo de 2023.

    "Ten Top Open AI Platforms to Try."

    La explosión de inteligencia artificial de código abierto se basa en las subvenciones de las grandes empresas tecnológicas. ¿Cuánto tiempo durará? MIT Review.

    Ejemplos de otras fuentes de modelos de OpenAI

    Muchos de los modelos de OpenAI se construyen sobre LLaMA, un modelo de lenguaje de gran tamaño de código abierto lanzado por Meta AI. Otros utilizan un conjunto de datos públicos masivo llamado The Pile, que fue creado por la organización sin fines de lucro de código abierto EleutherAI.

    Hugging Face, una startup que defiende el acceso libre y abierto a la inteligencia artificial, su chatbot, HuggingChat, se basa en un modelo de lenguaje de gran tamaño de código abierto afinado para la conversación, llamado Open Assistant, que fue entrenado con la ayuda de alrededor de 13,000 voluntarios y lanzado en marzo del 2023. También se basa en Llama de Meta.

    StableLM es un modelo de lenguaje de gran tamaño de código abierto lanzado también en marzo de 2023 por Stability AI, la compañía detrás del exitoso modelo de texto a imagen Stable Diffusion. Stability AI lanzó StableVicuna, una versión de StableLM que, al igual que Open Assistant o HuggingChat, está optimizado para la conversación. (Nota: StableLM es la respuesta de Stability a GPT-4 y StableVicuna es su respuesta a ChatGPT.)

    Y sí, hay más:

    Alpaca (de un equipo de la Universidad de Stanford)

    Cerebras-GPT (de la empresa de IA Cerebras). La mayoría de estos modelos se basan en LLaMA o en conjuntos de datos y modelos de EleutherAI; Cerebras-GPT sigue una plantilla establecida por DeepMind.

    Dolly (de la empresa de software Databricks)

    LoRA es una técnica poderosa ya que representa las actualizaciones del modelo como factorizaciones de baja graduación, lo que reduce el tamaño de las matrices de actualización en varios miles tamaños, lo que permite el ajuste fino del modelo a una fracción del costo y del tiempo. Poder personalizar un modelo de lenguaje en unas pocas horas en hardware de consumidor es una innovación revolucionaria, especialmente para aspiraciones que involucren la incorporación de nuevos y diversos conocimientos en tiempo real.

    Definición de términos:

    La inteligencia artificial es una rama de la informática que desarrolla programas y algoritmos (procesos paso a paso diseñados para resolver un problema o responder a una pregunta) que ayudan a diversas máquinas a operar de manera más similar a los humanos. Hay varios subcampos en esta ciencia, incluyendo:

      Procesamiento del lenguaje natural (NLP), que desarrolla interacciones naturales entre humanos y computadoras. NLP es software que ayuda a las máquinas a procesar el lenguaje humano, crear palabras comprensibles y interactuar con los humanos a través del lenguaje. El aprendizaje automático (ML) prioriza la capacidad de una máquina para analizar información y hacer recomendaciones o decisiones basadas en los conjuntos de datos proporcionados y la visión por computadora es sobre la creación de máquinas que pueden comprender e interpretar información visual (imágenes, fotos, etc.) y la robótica implica el rendimiento físico de tareas sin micro gestión humana, incluyendo la interacción con humanos. Los robots son ideales para tareas altamente rutinarias y repetitivas.