Se pueden ver miniaturas de parques infantiles frente al logotipo de Meta en exhibición en esta ilustración tomada el 4 de abril de 2023. REUTERS/Dado Ruvic/Illustration/Fotografía de archivo Adquirir derechos de licencia

NUEVA YORK, 22 de agosto (Reuters) - Meta Platforms, la empresa matriz de Facebook (META.O), lanzó el martes un modelo de inteligencia artificial capaz de traducir y transcribir el habla en docenas de idiomas, un posible bloque de construcción para herramientas que facilitan la comunicación en tiempo real entre diferentes idiomas.
La compañía dijo en una publicación de blog que su modelo SeamlessM4T podría realizar traducciones entre texto y habla en casi 100 idiomas, así como traducción de habla a habla para 35 idiomas, combinando tecnología que anteriormente solo estaba disponible en modelos separados.
El CEO Mark Zuckerberg ha dicho que imagina que estas herramientas facilitarán las interacciones entre usuarios de todo el mundo en el metaverso, el conjunto de mundos virtuales interconectados en los que la empresa apuesta por su futuro.
Según la publicación del blog, Meta está poniendo el modelo a disposición del público para uso no comercial.
La compañía de redes sociales más grande del mundo ha lanzado una serie de modelos de inteligencia artificial, en su mayoría gratuitos, este año, incluido un modelo de lenguaje denominado Llama que plantea un desafío serio para los modelos propietarios vendidos por OpenAI, respaldado por Microsoft (MSFT.O), y Google de Alphabet (GOOGL.O).
Zuckerberg dice que un ecosistema de inteligencia artificial abierto funciona a favor de Meta, ya que la empresa tiene más que ganar al crear herramientas orientadas al consumidor para sus plataformas sociales mediante la colaboración masiva, en lugar de cobrar por el acceso a los modelos.
Sin embargo, Meta enfrenta preguntas legales similares al resto de la industria con respecto a los datos de entrenamiento utilizados para crear sus modelos.
En julio, la comediante Sarah Silverman y otros dos autores presentaron demandas por infracción de derechos de autor contra Meta y OpenAI, acusando a las empresas de utilizar sus libros como datos de entrenamiento sin permiso.
Para el modelo SeamlessM4T, los investigadores de Meta dijeron en un artículo de investigación que recopilaron datos de entrenamiento de audio de "4 millones de horas de audio sin procesar proveniente de un repositorio disponible públicamente de datos web rastreados", sin especificar qué repositorio.
Un portavoz de Meta no respondió a preguntas sobre la procedencia de los datos de audio.
Según el informe de investigación, los datos de texto provienen de conjuntos de datos creados el año pasado que extrajeron contenido de Wikipedia y sitios web asociados.
Información de Katie Paul; edición de Rosalba O'Brien.
Nuestros estándares: Los Principios de Confianza de Thomson Reuters.