El nuevo modelo Gemini Omni de Google permite crear y editar vídeos en segundos
Google presentó Gemini Omni, su nuevo modelo de inteligencia artificial diseñado para la creación y edición avanzada de vídeos con generación de audio nativa.
La carrera por dominar la generación de contenidos multimedia con inteligencia artificial sumó un nuevo competidor que promete cambiar las reglas del juego. El editor de Xataka Basics, Yúbal Fernández, detalló el funcionamiento de Gemini Omni, la nueva apuesta de Google para la creación de vídeos hiperrealistas que llega para jubilar a "Veo", el anterior modelo de la compañía.
Esta herramienta busca simplificar la producción audiovisual, permitiendo que creadores de contenido, publicistas y entusiastas generen piezas de alta calidad en pocos segundos.
¿Qué es Gemini Omni y qué tiene de nuevo?
A diferencia de los modelos tradicionales de texto a vídeo, Gemini Omni nace bajo el concepto multimodal avanzado. Su primera versión oficial llega bajo el nombre de Gemini Omni Flash y su principal fortaleza es la flexibilidad a la hora de recibir instrucciones (prompts).
Las características más destacadas de la plataforma incluyen:
- Entradas combinadas: Podés mezclar texto, imágenes fijas, clips de vídeo y archivos de audio en un mismo pedido para que la IA entienda exactamente qué querés lograr.
- Clips con audio nativo: El sistema genera piezas de hasta 10 segundos de duración, pero con la ventaja de incluir sonido realista generado de forma simultánea y coherentemente con la escena.
- De foto a vídeo: Permite cargar hasta 5 fotografías en cadena para transformarlas en una secuencia animada con transiciones fluidas.
Edición por instrucciones encadenadas
Uno de los puntos más revolucionarios de Omni es que no se limita a crear material desde cero. Google diseñó este modelo con la capacidad de editar escenas existentes. A través de comandos de texto sucesivos, podés pedirle a la IA que modifique solo un elemento específico de la toma (como cambiar el color de una remera o el clima del fondo) o bien que transforme por completo la estética del clip manteniendo la coherencia de los movimientos reales.
¿Cómo impacta esto en el día a día?
Para quienes trabajan en redes sociales, marketing digital o diseño en nuestro país, herramientas como Gemini Omni Flash significan un ahorro brutal de tiempo en la fase de prototipado y edición rápida. Al procesar las solicitudes usando su conocimiento del entorno físico real, la IA reduce drásticamente los errores de animación comunes del sector.
Google planea expandir esta familia de modelos en el futuro, pero esta primera probada deja en claro que la producción de vídeo digital ya no dependerá exclusivamente de complejos softwares de renderizado, sino de la capacidad de saber guiar a la inteligencia artificial.
