Buscar
Tecnología

Lectura 3:00 min

Gemini Omni: Todo lo que debes saber antes de usar el nuevo modelo de IA de Google para hacer videos

Promete crear cualquier cosa a partir de cualquier entrada, además de que las escenas se pueden editar a través de conversaciones.

La nueva IA crea escenas que parecen reales.Foto: Captura de pantalla YT

En 2025, Nano Banana, el modelo de inteligencia artificial de Google para crear y editar imágenes, incorporó a Gemini, cuyo diseño fue multimodal desde sus comienzos, pero ahora, presentan Gemini Omni, con la novedad de que su razonamiento se fusiona con su habilidad de crear. 

Asimismo, lanzan Gemini Omni Flash, el primer modelo de la familia Omni que se aplica para la aplicación de Gemini, Google Flow y YouTube Shorts, y en un futuro habrá compatibilidad con modalidades de resultados como imágenes y audio. 

Descubre a Omni

Su principal característica es que puedes editar tus videos por medio de conversaciones, usando un lenguaje natural, respetando la coherencia y las leyes físicas de cada escena anterior, ya que recuerda lo que sucedió antes, además de:

  • Transformar elementos físicos o todo el contenido
  • Cambiar lo que sucede en un video que ya hayas tomado
  • Editar las acciones. 
  • Agregar personajes u objetos nuevos
  • Cambiar una situación. 
  • Mejora los videos en múltiples tomas. 
  • Hacer cambios de ambiente, ángulo, estilo o detalles específicos.

Conocimientos y combinación

Además de que Gemini Omni crea escenas que parecen reales, cuenta con el razonamiento de lo que debería suceder a continuación de cada escena tras combinar la comprensión intuitiva de la física con los conocimientos de historia, ciencia y el contexto cultural de Gemini.

Omni puede crear imágenes más realistas gracias a sus conocimientos de gravedad, energía cinética y dinámica de fluidos; todo ello lo combina con la creatividad y la conexión con el lenguaje, imágenes y el significado de maneras más allá de la coincidencia de patrones. Con instrucciones cortas es capaz de desarrollar explicaciones atractivas que desglosan ideas complejas.

Convierte cualquier referencia, ya sea de video, imágenes o audios en un resultado con coherencia. En las referencias de entrada se pueden usar imágenes de personajes, escenas o dibujos y determinar el lenguaje visual con referencias de entrada o lenguaje natural. En un principio, Omni sólo admitirá referencias de voz para audio, pero después lo hará con otros tipos.

Seguridad en IA

Para utilizar tu propia voz en los videos existen los avatares, que son una versión digital de ti mismo; se decidió que fuera así como una forma de proteger a los usuarios y regular el uso de las herramientas de IA.

Aunque todavía trabajan en cambiar el audio y la voz en la edición de videos, éstos tienen una marca de agua imperceptible de SynthID que puede verificarse por medio de la aplicación Gemini, Gemini en Chrome y la Búsqueda de Google. 

Últimas noticias

Noticias Recomendadas