Skip to main content

Este modelo de síntesis de voz busca competir con otras startups más establecidas

Google ha anunciado la integración de su modelo de voz Chirp 3 en la plataforma Vertex AI, con el objetivo de consolidarse y diferenciarse en el mercado de la inteligencia artificial de voz. Se enfrenta directamente con empresas como ElevenLabs, que han liderado el sector con soluciones avanzadas en síntesis de voz.

El modelo Chirp 3 es compatible con 31 idiomas y añade ocho nuevas voces, lo que permite a los desarrolladores crear experiencias más naturales e inmersivas. Entre sus características más destacadas, Chirp 3 ofrece mejoras en entonación, fluidez y precisión lingüística, lo que lo hace ideal para generar voz en tiempo real con una calidad cercana a la humana.

Sus principales aplicaciones incluyen la creación de asistentes de voz, audiolibros, agentes de soporte y narraciones para videos. Prácticamente todas ellas son líneas de negocio de ElevenLabs, quienes hasta ahora ostentan el liderazgo en calidad como una de las mejores suites de generación de voz.

Un mercado en plena expansión

El lanzamiento de Chirp 3 se produce en un contexto donde el interés por la IA de voz sigue creciendo. Startups como Sesame, conocida por los modelos «Maya» y «Miles», han desarrollado sistemas de síntesis extremadamente realistas. También, ElevenLabs ha recaudado cientos de millones de dólares para mejorar su tecnología, alcanzando una precisión del 81,97% en la pronunciación, superior al 77,30% de Google TTS, según un análisis de Cartesia AI.

Medidas de seguridad y uso responsable

Ante la preocupación por el uso indebido de la IA de voz, Google ha anunciado que implementará restricciones de uso para Chirp 3. Thomas Kurian, CEO de Google Cloud, afirmó que están trabajando junto a su equipo de seguridad para garantizar un uso ético y responsable de la tecnología.

Google amplía su ecosistema de IA

La integración de Chirp 3 en Vertex AI refuerza la oferta de Google en IA, junto con otros modelos como Gemini (su LLM de última generación), Imagen 2 (generación de imágenes por IA) y Veo 2 (creación de video con IA). Con esta estrategia, Google busca consolidarse en el mercado del desarrollo de modelos de IA y competir con los demás gigantes tecnológicos.

La evolución de los modelos de voz generativa está permitiendo la creación de voces con una entonación y naturalidad cada vez más humanas, lo que abre nuevas posibilidades en múltiples industrias. La competencia entre Google y empresas como ElevenLabs está acelerando la innovación en el sector, con el potencial de mejorar la accesibilidad y personalización de los sistemas basados en IA.

Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.

Laia Herranz

Comunicadora apasionada por la tecnología y la IA.

Dejar un comentario