Skip to main content

La rivalidad entre OpenAI y Google en el ámbito de la IA generativa aumenta con cada nuevo lanzamiento. Después de que OpenAI sorprendiera al mercado con Sora, un modelo integrado en ChatGPT capaz de generar vídeos cortos a partir de texto, Google ha presentado Veo 2, una herramienta desarrollada por DeepMind que promete llevar esta tecnología un paso más allá. Este anuncio llega en un momento crucial, donde la demanda por herramientas creativas impulsadas por IA está en pleno auge, atrayendo tanto a creadores de contenido como a profesionales del sector audiovisual.

Aunque Google no ha hecho afirmaciones directas en comparación con Sora, el contexto competitivo es evidente, y las características técnicas de Veo 2 lo posicionan como un contendiente a tener en cuenta con grandes ambiciones en el campo de la creación de vídeos generativos.

Comparaciones entre Veo 2 y Sora

Las diferencias técnicas entre ambas herramientas son evidentes. Veo 2 permite generar vídeos con una resolución de hasta 4K y una duración máxima de dos minutos, características que lo sitúan un paso adelante frente a Sora, cuyo límite actual es de 20 segundos en 1080p. Este salto en calidad y duración amplía significativamente las posibilidades para proyectos audiovisuales más elaborados, especialmente para quienes buscan resultados de nivel profesional.

Estas diferencias no solo afectan a los resultados finales, sino también al público objetivo. Mientras Sora ha encontrado su lugar entre usuarios que buscan clips rápidos y funcionales, Veo 2 parece estar diseñado para satisfacer las necesidades de creadores y profesionales que requieren mayor duración y calidad. Como comentó un usuario en X tras probar ambas herramientas, «Siento que es como comparar una bicicleta con una nave espacial». La frase, acompañada de capturas comparativas, ha reforzado la percepción de que Veo 2 apunta a un nivel más avanzado en cuanto a capacidades técnicas.

¿Cómo funciona Veo 2?

El funcionamiento de Veo 2 sigue un enfoque basado en descripciones textuales detalladas. Los usuarios introducen un texto que especifica aspectos clave como el escenario, los personajes, las acciones, la iluminación o el estilo visual deseado. El sistema analiza la información proporcionada y genera un vídeo alineado con esas indicaciones.

Por ejemplo, Google ha mostrado cómo el sistema genera el siguiente prompt: «Plano medio, estilo de dibujo animado, una niña en una cocina con estética de los años ochenta, pelo castaño y expresión alegre mientras gesticula». El resultado es un clip coherente y ajustado a las especificaciones, demostrando el potencial de Veo 2 para interpretar descripciones complejas y producir vídeos detallados. Para garantizar la autenticidad de los contenidos generados, Google ha integrado SynthID, una tecnología de marca de agua invisible que certifica el origen artificial de los vídeos

El lanzamiento de Veo 2

Por el momento, Veo 2 estará disponible únicamente en versión beta a través de Google Labs, permitiendo a un grupo reducido de probadores iniciales experimentar con la herramienta. Este enfoque permite a Google recopilar comentarios y ajustar el sistema antes de un lanzamiento más amplio, cuya fecha aún no ha sido anunciada.

La llegada de Veo 2 y Sora marca un antes y un después en el campo de la IA generativa aplicada a la creación audiovisual. Más allá de las comparaciones técnicas, la competencia está acelerando la evolución de las capacidades de la IA, planteando a su vez importantes preguntas sobre los usos éticos de estas tecnologías y su impacto en la industria creativa. Mientras Sora gana terreno entre usuarios generales por su accesibilidad, Veo 2 apunta a un segmento más especializado, donde la calidad y la flexibilidad son clave. Este enfrentamiento entre gigantes no solo define el presente, sino que promete moldear el futuro de la creatividad impulsada por IA.

Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.