OpenAI, la organización detrás de innovaciones disruptivas como ChatGPT, Dall-E, y Sora, ha presentado su última creación: Voice Engine. Esta herramienta de inteligencia artificial promete replicar cualquier voz humana con una fidelidad asombrosa, utilizando tan solo una muestra de 15 segundos. Aunque el potencial de Voice Engine es vasto, desde asistir a personas con discapacidades hasta revolucionar la industria del entretenimiento, no está disponible para los usuarios del chatbot de OpenAI y su capacidad para clonar voces también plantea importantes cuestiones éticas y de seguridad.
Voice Engine, que actualmente se encuentra en una fase de prueba limitada a un selecto grupo de empresas, es una expansión de la API de texto a voz de OpenAI. Este desarrollo, que lleva aproximadamente dos años en proceso, podría cambiar radicalmente la forma en que interactuamos con la tecnología, permitiendo una personalización sin precedentes en aplicaciones de asistencia de lectura, traducción de contenidos, y más.
OpenAI desvela Voice Engine, una herramienta capaz de clonar cualquier voz humana con solo 15 segundos de muestra, abriendo un mundo de posibilidades y desafíos éticos, aún no está disponible para los usuarios de GPT.
Sin embargo, la facilidad con la que Voice Engine puede clonar voces humanas también abre la puerta a posibles abusos, como la creación de deepfakes de voz para difundir desinformación o realizar estafas. OpenAI es plenamente consciente de estos riesgos y ha implementado medidas preventivas, como políticas de uso que prohíben la suplantación sin consentimiento y la experimentación con marcas de agua digitales para rastrear el origen de cualquier audio generado.
La colaboración de OpenAI con Microsoft en la construcción de ‘Stargate‘, un supercomputador enfocado en IA, junto con su solicitud de marca registrada y asociación con The Associated Press, señalan la ambición de la empresa de adentrarse en el mercado del reconocimiento de voz y los asistentes digitales. A medida que OpenAI explora este nuevo territorio, también se compromete a colaborar con socios de la industria para desarrollar mecanismos de detección de voces falsas y listas de voces prohibidas para figuras prominentes, en un esfuerzo por prevenir el mal uso de la tecnología.
A pesar de las precauciones, la posibilidad de que Voice Engine sea utilizado para fines nefastos no puede ser ignorada. La reciente acción del gobierno de EE.UU. para prohibir las llamadas robóticas generadas por IA es un ejemplo de los pasos legislativos que pueden ser necesarios para mitigar los riesgos asociados con las voces sintéticas.
En este contexto de innovación y desafío, OpenAI se encuentra en una encrucijada. Por un lado, Voice Engine representa un avance significativo en la síntesis de voz, con aplicaciones que podrían beneficiar a millones de personas en todo el mundo. Por otro, la tecnología plantea preguntas fundamentales sobre la autenticidad, la privacidad y la seguridad en la era digital. A medida que OpenAI navega por estas aguas turbulentas, el futuro de Voice Engine y su impacto en la sociedad permanecen en un delicado equilibrio entre el potencial transformador y los imperativos éticos.
Toda revolución necesita sus cronistas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.