Meta ha presentado un nuevo modelo de inteligencia artificial capaz de traducir y transcribir voz en casi 100 idiomas, llamado SeamlessM4T. El gigante tecnológico presenta este modelo como una especie de traductor universal de idiomas en tiempo real que supera las limitaciones de los sistemas existentes, restringidos a determinados idiomas y formas de comunicación.
SeamlessM4T
SeamlessM4T puede realizar traducciones de voz a texto, de voz a voz, de texto a voz y de texto a texto en varias docenas de idiomas. Otros sistemas de traducción de voz sólo han funcionado para una fracción de los aproximadamente 7.000 idiomas del mundo, pero Meta afirma que SeamlessM4T está en el camino hacia un traductor universal porque condensa casi 100 idiomas de entrada y salida en un solo modelo. Al combinar las capacidades de un solo modelo, SeamlessM4T supera los problemas que aquejan a las cadenas que dividen la traducción de voz en múltiples subsistemas. Su diseño unificado supone un gran avance en la comunicación multilingüe de voz y texto. Puedes verlo en acción en el siguiente vídeo.
El sistema detecta implícitamente las lenguas de origen sin necesidad de un modelo de identificador independiente. Mejora notablemente el rendimiento en las lenguas con menos recursos y mantiene la precisión en las de más recursos, como el inglés y el español. Meta ha hecho público el modelo para fomentar la investigación y el desarrollo por parte de los desarrolladores de IA, junto con un conjunto de datos multimodales de 270.000 horas llamado SeamlessAlign y una serie de bibliotecas y herramientas de apoyo.
“Hoy lanzamos SeamlessM4T, un nuevo modelo de IA multimodal que permite a las personas que hablan diferentes idiomas comunicarse de forma más eficaz”, escribió Mark Zuckerberg, CEO de Meta, en un post de Facebook sobre el nuevo modelo. “Con el tiempo, integraremos estos avances de IA en traducción y transcripción en Facebook, Instagram, WhatsApp, Messenger y Threads”.
El nuevo modelo continúa el trabajo de Meta en el aprovechamiento de la IA para traducir idiomas. El pasado mes de julio, la empresa compartió un modelo que afirmaba realizar traducciones de especial calidad entre 200 idiomas, denominado NLLB-200 por sus raíces en el proyecto No Language Left Behind (NLLB) de Meta. El modelo NLLB-200 llegó sólo un par de años después de un modelo de traducción de 100 idiomas, el primero que funcionaba sin requerir el inglés como lengua intermedia entre ninguna de las otras lenguas. Y el otoño pasado, Meta lanzó un modelo de traducción sólo oral para IA dirigido a lenguas con forma escrita limitada o inexistente. Todos ellos tienen su origen en los dos gigantescos conjuntos de datos de IA conversacional que Meta publicó en 2021.
Fuente aquí.