Una nueva oleada tecnológica acaba de aterrizar para los usuarios pagos de Gemini, el asistente de inteligencia artificial de Google. Ahora, una simple imagen ahora puede convertirse en un videoclip animado en segundos.
La herramienta, respaldada por el modelo Veo 3, transforma una foto y una descripción en clips de 8 segundos con sonido, generados en formato MP4, resolución de 720p y relación de aspecto 16:9. Esta capacidad está disponible desde esta semana en la versión web de Gemini y se extenderá gradualmente a su app móvil. “La generación de videos es una experiencia adecuada”, declaró Google, destacando que ha tomado medidas para evitar la creación de clips con figuras públicas o contenido violento.
Aunque los resultados aún enfrentan limitaciones, como la distorsión de rasgos faciales o cambios de raza en los sujetos de las imágenes, el sistema logró con éxito animar escenas naturales y objetos inanimados. En una de las pruebas realizadas por Bloomberg News, al solicitar que una persona bailara breakdance, la herramienta sólo produjo un saludo a cámara.
Google aseguró que la herramienta no está diseñada para alterar la apariencia de individuos, y reconoció que la tecnología “podría basarse en una sola imagen de maneras que no son representativas de la original”. Sin embargo, promete mejoras en futuras versiones, especialmente en animación facial.
Con esta actualización, Gemini entra en una competencia feroz con gigantes como OpenAI y Runway AI Inc., además de enfrentar presión de desarrolladores en China como Alibaba y Kuaishou Technology, que también avanzan en herramientas de video generativo.
Mantente al día en la actualidad financiera conectándote a la señal en vivo de Comercio TV aquí.