Te Hiku Media, una organización de radiodifusión de Nueva Zelanda, ha logrado un avance significativo en la preservación y promoción del idioma indígena Māori, conocido como te reo Māori, mediante el desarrollo de un modelo de inteligencia artificial (IA) para el reconocimiento automático del habla (ASR). Este modelo, que utiliza la herramienta de código abierto NVIDIA NeMo y las GPU NVIDIA A100 Tensor Core, ha alcanzado una precisión impresionante del 92% en la transcripción del te reo Māori.
El proyecto de Te Hiku Media es parte de un movimiento más amplio para proteger los idiomas indígenas, muchos de los cuales están en peligro de extinción. Utilizando métodos éticos y transparentes de recolección y análisis de datos de voz, el equipo de Te Hiku Media ha desarrollado modelos ASR para el te reo Māori, un idioma polinesio, con el objetivo de preservar y revitalizar la lengua.
Te Hiku Media desarrolla un modelo de reconocimiento automático del habla para el te reo Māori con un 92% de precisión, utilizando IA confiable y la herramienta NVIDIA NeMo.
El modelo de ASR de Te Hiku Media es una herramienta crucial desarrollada por y para el pueblo Māori, ayudando a preservar y amplificar sus historias. Keoni Mahelona, director de tecnología de Te Hiku Media, destacó el valor de utilizar las tecnologías de código abierto de NVIDIA para lograr su misión de preservar, promover y revitalizar el te reo Māori.
Te Hiku Media comenzó como una estación de radio hace más de tres décadas con el objetivo de asegurar un espacio para el te reo en las ondas de radio. Con el tiempo, la organización incorporó la radiodifusión televisiva y, con el auge de internet, desarrolló una estrategia para compartir contenido en la era digital. En lugar de cargar sus fuentes de video y audio en plataformas globales populares, Te Hiku Media decidió construir su propia plataforma de distribución de contenido, llamada Whare Kōrero, que significa «casa del habla«.
Whare Kōrero ahora alberga más de 30 años de material de archivo digitalizado, con aproximadamente 1,000 horas de hablantes nativos de te reo Māori, así como contenido más reciente de aprendices de segundo idioma y personas bilingües Māori. Alrededor de 20 estaciones de radio Māori utilizan y cargan su contenido en Whare Kōrero, y los miembros de la comunidad pueden acceder al contenido a través de una aplicación.
Para recopilar datos de voz de manera transparente, ética y orientada a la comunidad, Te Hiku Media comenzó explicando su causa a los ancianos, obteniendo su apoyo y pidiéndoles que vinieran a la estación a leer frases en voz alta. Posteriormente, la organización llevó a cabo una campaña de crowdsourcing, Kōrero Māori, para recopilar muestras de voz altamente etiquetadas según la licencia Kaitiakitanga, que garantiza que Te Hiku Media utilice los datos solo para el beneficio del pueblo Māori.
En solo 10 días, más de 2.500 personas se inscribieron para leer más de 200.000 frases, proporcionando más de 300 horas de datos de voz etiquetados, que se utilizaron para construir y entrenar los modelos ASR de te reo Māori.
En solo 10 días, más de 2.500 personas se inscribieron para leer más de 200.000 frases, proporcionando más de 300 horas de datos de voz etiquetados, que se utilizaron para construir y entrenar los modelos ASR de te reo Māori. Además de otras herramientas de IA confiables de código abierto, Te Hiku Media ahora utiliza el módulo ASR del kit de herramientas NVIDIA NeMo para IA de voz en todo su proceso. El kit de herramientas NeMo incluye bloques de construcción llamados módulos neuronales y modelos preentrenados para el desarrollo de modelos de lenguaje.
Los modelos ASR de Te Hiku Media son los motores detrás de Kaituhi, un servicio de transcripción en te reo Māori ahora disponible en línea. Los esfuerzos han impulsado proyectos similares de ASR ahora en marcha por nativos hawaianos y el pueblo Mohawk en el sureste de Canadá.
Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.