Repasamos el estado de la IA audiovisual a cierre del 2024
El terreno de la inteligencia artificial aplicada a la generación de video vive un momento de ebullición. Durante los últimos meses, diversas plataformas, como Kling, Runway, Hailuo o Luma, han pugnado por ser la opción estrella para crear escenas espectaculares a partir de texto o de imágenes estáticas. Sin embargo, Sora, presentada hace dos semanas durante el evento “12 días de OpenAI”, se ha convertido en la gran protagonista de las conversaciones. Su lanzamiento mediático despertó un interés sin precedentes, aunque, tras el entusiasmo inicial, empiezan a alzarse voces que cuestionan si realmente ofrece tanto como promete.
La gran promesa (y el “hype”) de Sora
OpenAI lanzó definitivamente Sora al público el día 9 de diciembre, inicialmente disponible para usuarios de ChatGPT Plus y Pro. Sin embargo, Sora no estaba disponible en todas las regiones, dejando a Europa fuera de su alcance en este primer momento, con una disponibilidad esperada para algún momento de 2025.
Las demos iniciales mostraban escenas de acción, paisajes realistas y transiciones cinematográficas que muchos calificaron de “revolucionarias”. La integración con el ecosistema de ChatGPT prometía un flujo de trabajo simplificado para creadores, influencers y pequeños estudios de producción. Sin embargo, la euforia inicial fue atemperada por los primeros análisis que constataron ciertos avances en la consistencia y los movimientos de cámara y perspectiva, pero que apuntaron también incoherencias y deformaciones, objetos que desaparecen, dejando un regusto de decepción entre algunos usuarios.
No obstante, los análisis más recientes han destacado que, aunque Sora sigue ofreciendo un rendimiento irregular, su interfaz operativa ha sido elogiada por ser intuitiva y por permitir la adición de múltiples keyframes. La división del prompt textual a lo largo del timeline es otra característica que mejora el control sobre el output final, la gran asignatura pendiente de la IA de Video.
Aunque Sora no ha resultado ser lo aplastante que muchos esperaban, estas funcionalidades la convierten en una herramienta puntera dentro del panorama de la IA generativa de video, merecedora de ser explorada y observada de cerca por su potencial de desarrollo.
El lanzamiento de Sora, aunque algo decepcionante, deja claro que la competencia en la IA de video sigue abierta, con Google y su prometedor Veo2 en camino, y Kling 1.6 como favorita de los profesionales.
Google contraataca con Veo2
El 17 de diciembre de 2024, 7 días después del lanzamiento de Sora, Google anunció el Veo2. Aunque todavía no está disponible para el gran público, un reducido grupo de desarrolladores ya lo ha probado y afirma que el modelo incorpora un realismo superior en partículas, luces y movimiento. Además, ofrecerá herramientas de edición en tiempo real que podrían poner en jaque a cualquier rival, incluida Sora.
Pese a que no hay fecha concreta para el acceso masivo a Veo2, los especialistas aseguran que si Google cumple sus promesas, podría establecer un nuevo estándar en la generación de video asistida por IA. En definitiva, un duro contrincante para la herramienta OpenAI.
Kling 1.6: el “caballo ganador” de los profesionales
Entre tanto, Kling, desarrollada por la empresa china Kuaishou, sigue su propio ritmo de crecimiento sostenido. Llegó la versión 1.6 el pasado 19 de diciembre de 2024, marcando otro avance significativo en la tecnología de generación de video por IA. La comunidad de creadores profesionales aplaude especialmente:
- Realismo en escenas de acción: Explosiones, luchas, movimientos de cámara y física de partículas mucho más refinados.
- Lip-sync y modelos faciales personalizados: Ideales para spots publicitarios, videoclips e incluso prototipos cinematográficos.
- Estabilidad y coherencia: Los entornos multitudinarios, ciudades futuristas, templos submarinos, muestran menos deformaciones y transiciones más fluidas que en versiones anteriores.
Esa combinación de rendimiento y fiabilidad ha hecho que muchos estudios y agencias sigan apostando por Kling, por encima de otros competidores como Hailuo, Runway o Luma.
La guerra silenciosa de las IAs
Hasta hace poco, la batalla más visible se libraba en el terreno del texto, con modelos como ChatGPT, Gemini, Llama, Grok, o Claude disputándose la supremacía. Sin embargo, la generación audiovisual también genera atención. Ya no se trata solo de crear imágenes estáticas, donde Midjourney, Flux o DALL·E siguen brillado, sino de generar secuencias cinematográficas completas: cortometrajes, anuncios, videoclips, incluso teasers de grandes producciones que ya están suponiendo una revolución para la industria.
Un futuro en disputa: ¿Quién se quedará con el trono?
El año 2025 se perfila como un momento crucial. Sora ha logrado un lanzamiento mediático impresionante, pero las críticas y la llegada de rivales fuertes como Veo2 le plantean un desafío real. Mientras tanto, Kling 1.6 parece ser la plataforma preferida por muchos profesionales, gracias a la solidez de sus modelos y a la agilidad con que responde a las exigencias del mercado.
¿Podrá OpenAI mantener a Sora en el candelero cuando Google abra las puertas de Veo2 para todos? ¿Se impondrá Kling en los circuitos profesionales gracias a la madurez de su tecnología? La única certeza es que la carrera de la IA generativa en video está lejos de decidirse. Quedan por venir meses intensos donde cada actualización puede suponer un salto cualitativo que redefina, una vez más, el modo en que concebimos y producimos contenido audiovisual. Seguiremos informando.