Mantenerse al día con una industria tan vertiginosa como la IA es una tarea difícil. Por lo tanto, hasta que una IA pueda hacerlo por ti, aquí está un resumen práctico de las noticias de la última semana en el mundo del aprendizaje automático, junto con investigaciones y experimentos notables que no hemos cubierto por Separado.

Podría decirse que la semana pasada, Apple lanzó su sombrero de modo muy visible e intencionadamente hacia la ultra competitiva carrera de IA. No es que la empresa no hubiera señalado previamente sus inversiones y priorización de la IA. Pero en su evento WWDC, Apple dejó en claro que la IA estaba detrás de muchas de las características tanto de su próximo hardware como de software.

Por ejemplo, iOS 17, que llegará más tarde este año, puede sugerir recetas para platos similares a partir de una foto del iPhone utilizando visión por computadora. La IA también alimenta Journal, un diario interactivo que ofrece sugerencias personalizadas basadas en actividades en otras aplicaciones.

iOS 17 también incluirá una corrección automática actualizada impulsada por un modelo de IA que puede predecir con mayor precisión las próximas palabras y frases que un usuario podría usar. Con el tiempo, se adaptará, aprendiendo las palabras más frecuentemente utilizadas por el usuario, incluyendo palabrotas, de manera entretenida.

La IA es también fundamental para el auricular de realidad aumentada Vision Pro de Apple, específicamente FaceTime en Vision Pro. Usando el aprendizaje automático, Vision Pro puede crear un avatar virtual de quien lo utiliza, interpolando toda una variedad de contorsiones faciales, incluso la tensión de la piel y el trabajo muscular.

facial scan for digital persona for Vision Pro

Créditos de imagen: Apple

Puede que no sea la IA generativa, que es sin duda la subcategoría más caliente de IA en la actualidad. Pero la intención de Apple, me parece, fue montar una especie de regreso para demostrar que no es una empresa subestimada después de años de proyectos de aprendizaje automático fallidos, desde el decepcionante Siri hasta el automóvil sin conductor en el infierno de la producción.

Proyectar fortaleza no es solo una estratagema de marketing. La histórica bajo rendimiento de Apple en IA ha llevado a una fuga seria de talentos, según informes, con The Information informando que científicos talentosos de aprendizaje automático, incluido un equipo que había estado trabajando en la tecnología subyacente de ChatGPT de OpenAI, dejaron Apple por pastos más verdes.

Mostrando que es serio acerca de la IA, al enviar productos imbuidos de IA, parece ser un paso necesario y un punto de referencia que algunos competidores de Apple han fallado en cumplir en el pasado reciente. (Aquí te estamos mirando, Meta). Por todas las apariencias, Apple logró avances la semana pasada, aunque no fuera particularmente ruidoso al respecto.

Aquí están los otros titulares de IA notables de los últimos días:

    Meta crea un generador de música: No contento con ser superado por Google, Meta ha lanzado su propio generador de música impulsado por IA, y, a diferencia de Google, lo puso a disposición del público. Llamada MusicGen, la herramienta genera alrededor de 12 segundos de música a partir de una descripción de texto.

    Los reguladores examinan la seguridad de la inteligencia artificial: después del anuncio del gobierno del Reino Unido la semana pasada, en el que se planea celebrar una cumbre global en otoño sobre la seguridad de la inteligencia artificial, OpenAI, Google DeepMind y Anthropic se han comprometido a proporcionar "acceso temprano o prioritario" a sus modelos de inteligencia artificial para apoyar la investigación en cuanto a la evaluación y seguridad.

    La nube se encuentra con la inteligencia artificial: Salesforce está lanzando una nueva suite de productos para reforzar su posición en el espacio ultra-competitivo de la inteligencia artificial. Llamada AI Cloud, la suite, que incluye herramientas diseñadas para proporcionar inteligencia artificial "lista para la empresa", es el último intento multidisciplinario de Salesforce para mejorar su cartera de productos con capacidades de IA.

    Probando el AI de texto a video: TechCrunch ha probado Gen-2, el AI de Runway que genera clips de video cortos a partir de textos. ¿El veredicto? Queda un largo camino por recorrer antes de que la tecnología se acerque a la generación de materiales de calidad.

    Más dinero para el AI empresarial: En señal de que hay mucho dinero disponible para las startups de generación de inteligencia artificial, Cohere, que está desarrollando un ecosistema de modelos de AI para la empresa, anunció la semana pasada que recaudó 270 millones de dólares como parte de su ronda de la Serie C.

    No habrá GPT-5 para ti: El director ejecutivo de OpenAI, Sam Altman, aseguró en una conferencia reciente organizada por Economic Times que todavía no están entrenando GPT-5, meses después de que la startup respaldada por Microsoft se comprometiera a no trabajar en el sucesor de GPT-4 "durante un tiempo" después de que muchos ejecutivos y académicos de la industria expresaran sus preocupaciones sobre el rápido ritmo de avance que los modelos de lenguaje de gran tamaño de Altman estaban teniendo.

    Asistente de escritura de AI para WordPress: Automattic, la compañía detrás de WordPress.com y principal contribuidor del proyecto WordPress de código abierto, lanzó un asistente de AI para el popular sistema de gestión de contenido el pasado martes.

    Instagram implementa un chatbot AI: Según reveló el investigador de aplicaciones Alessandro Paluzzi, Instagram podría estar trabajando en un chatbot AI. Según las filtraciones, que reflejan desarrollos de aplicaciones en curso que pueden o no ser lanzados, estos agentes de IA pueden responder preguntas o dar consejos.

    Otros aprendizajes de máquinas

    Si te interesa estar al tanto de cómo la IA puede afectar la ciencia y la investigación en los próximos años, un equipo de seis laboratorios nacionales ha preparado un informe basado en talleres realizados el año pasado que trata justamente este tema. Aunque uno podría estar tentado de decir que, al estar basado en las tendencias del año pasado y no en este, en el que las cosas han evolucionado tan rápido, el informe podría estar obsoleto. Pero mientras que ChatGPT ha creado grandes olas en la tecnología y la conciencia del consumidor, la verdad es que no es especialmente relevante para la investigación seria. Las tendencias a gran escala sí lo son, y se mueven a un ritmo diferente. El informe de 200 páginas definitivamente no es una lectura ligera, pero cada sección está dividida de manera útil en piezas digeribles.

    En otros lugares del ecosistema de laboratorios nacionales, los investigadores de Los Álamos están trabajando arduamente en avanzar en el campo de los memristores, que combinan el almacenamiento de datos y el procesamiento, al igual que nuestros propios neuronas. Es un enfoque fundamentalmente diferente para la computación, aunque todavía no ha dado frutos fuera del laboratorio, pero este nuevo enfoque parece avanzar, al menos.

    La capacidad de la IA con el análisis de lenguaje se muestra en este informe sobre las interacciones policiales con las personas detenidas. El procesamiento de lenguaje natural se utilizó como uno de los varios factores para identificar los patrones lingüísticos que predicen la escalada de las paradas, especialmente con los hombres negros. Los métodos de aprendizaje humano y de máquina se refuerzan mutuamente. (Lee el artículo aquí).

    Créditos de imagen: Cyrille Verdon / Renaud Defrancesco BUREAU 141 / EPFL

    DeepBreath es un modelo entrenado en grabaciones de respiración tomadas de pacientes en Suiza y Brasil, que sus creadores en EPFL afirman que pueden ayudar a identificar condiciones respiratorias tempranas. El plan es lanzarlo en un dispositivo llamado Pneumoscope, bajo la compañía de derivación Onescope. Probablemente haremos seguimiento con ellos para obtener más información sobre cómo está funcionando la compañía.

    Otro avance de salud de la IA proviene de Purdue, donde los investigadores han creado un software que aproxima la imagen hiperspectral con la cámara de un smartphone, rastreando con éxito la hemoglobina sanguínea y otras métricas. Es una técnica interesante: utilizando el modo súper cámara lenta del teléfono, obtiene mucha información sobre cada píxel de la imagen, lo que le da al modelo suficiente información para extrapolar. Podría ser una excelente manera de obtener este tipo de información de salud sin hardware especial.

    Créditos de imagen: MIT

    Todavía no confiaría en un piloto automático para tomar maniobras evasivas, pero MIT está acercando la tecnología con la investigación que ayuda a la IA a evitar obstáculos y mantener una trayectoria de vuelo deseable. Cualquier algoritmo antiguo puede proponer cambios salvajes de dirección para no chocar, pero hacerlo manteniendo la estabilidad y sin hacer puré de nada adentro es más difícil. El equipo logró hacer que un jet simulado realizará maniobras como Top Gun de manera autónoma y sin perder estabilidad. Es más difícil de lo que suena.

    Por último esta semana, está Disney Research, que siempre se puede contar para mostrar algo interesante que también sucede aplicarse a la producción cinematográfica o operaciones de parques temáticos. En CVPR presentaron una red de "detección de hitos faciales" poderosa y versátil que puede rastrear movimientos faciales de manera continua y usando puntos de referencia más arbitrarios. La captura de movimiento ya funciona sin los pequeños puntos de captura, pero esto debería hacerlo aún más de alta calidad y más digno para los actores.