Skip to main content

Meta ha desarrollado un traductor de voz simultáneo multilingüe con IA

Meta ha diseñado SeamlessM4T, un modelo de IA que puede cambiar la forma en la que nos comunicamos las personas en distintos idiomas hasta ahora. Presentado en la revista científica ‘Nature‘, el sistema es capaz de traducir voz y texto en más de 100 idiomas, tiene como finalidad facilitar la conexión entre culturas mediante una tecnología que se define por ser rápida, precisa y capaz de adaptarse. A parte de distinguirse por su capacidad técnica, tiene el potencial para acabar con las barreras lingüísticas y culturales en un mundo tan globalizado como este.

Más allá de la traducción tradicional

A diferencia de otros sistemas, SeamlessM4T combina varias tecnologías en una sola y traduce directamente de voz a voz en 35 idiomas y genera texto traducido en 96 lenguas. Integra funciones avanzadas como: traducción de voz a voz (S2ST), de voz a texto (S2TT), de texto a voz (T2ST) y de texto a texto (T2TT), ofreciendo una solución completa y multimodal para la comunicación multilingüe. Se crea una experiencia fluida para las usuarios, mejorando aspectos como la expresividad, el ritmo y la naturalidad del habla traducida. Según Meta, el modelo es capaz de ofrecer traducciones en dos segundos, como si fueran interacciones en tiempo real.

El desarrollo de SeamlessM4T también incluye lenguas menos usadas, como el maltés o el suajili, que normalmente son excluidas de los avances tecnológicos dentro de este campo. Esto se lleva a cabo gracias la creación de un corpus masivo que combina datos etiquetados manualmente con información generada automáticamente, ampliando la precisión y el alcance del sistema.

Un sistema inclusivo

Uno de los puntos que más destaca del modelo es como lo han enfocado hacia la inclusión y la reducción de sesgos. SeamlessM4T incorpora estrategias para disminuir el sesgo de género y minimizar la toxicidad en las traducciones (por ejemplo, que no se traduzca directamente al masculino, como en muchos casos), algo que los expertos consideran crucial para garantizar la seguridad y el respeto cultural en las comunicaciones multilingües. Se refleja el compromiso de una tecnología más justa y representativa.

Además, Meta ha puesto a disposición de la comunidad científica los recursos empleados para desarrollar su sistema, permitiendo que otros investigadores utilicen y mejoren las herramientas en contextos no comerciales. Se fomenta una red de innovación colaborativa, especialmente valioso para avanzar en el ámbito de las lenguas menos representadas.

Desafíos y limitaciones del modelo

A pesar de los grandes avances, SeamlessM4T tiene varios obstáculos que superar. Su dependencia del inglés como idioma puente en muchas traducciones plantea problemas de acumulación de errores y reduce la precisión en muchos de los casos. También, aunque logra manejar diferentes acentos y ruidos ambientales, aún tiene dificultades para procesar nombres propios, jerga y expresiones coloquiales.

Otro punto problemático es que, si bien el sistema está disponible para demostraciones, solo se puede utilizar a través de la API de Meta, lo que impide el acceso pleno al código y trae complicaciones en su reproducibilidad por parte de la comunidad científica. Esto va en contra de los principios de la ciencia abierta, que promueve el acceso sin restricciones a las tecnologías para su uso, estudio y mejora.

El futuro de la traducción automática

SeamlessM4T es un paso enorme hacia un traductor universal que nos permita superar las barreras lingüísticas en contextos cotidianos y profesionales. Comunicación en eventos internacionales, asistencia médica o educativa… las aplicaciones potenciales del sistema son infinitas. Aún así, los desarrolladores insisten en que estos sistemas deben entenderse como herramientas complementarias, y no como sustituto completo del aprendizaje de idiomas o de intérpretes humanos, especialmente en escenarios delicados como el legal o el médico.

El modelo de Meta, todavía en desarrollo, apunta a un futuro donde las diferencias de idioma no son un problema, sino una oportunidad para conectar y entendernos mejor, sin importar en qué parte del mundo estemos.

Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.