Este jueves OpenAI ha anunciado el desarrollo de un modelo de inteligencia artificial capaz de crear videos a partir de consignas de texto. El sistema es conocido como Sora y por el momento es capaz de generar cortos de gran realismo y hasta un minuto de duración. Aunque lo más destacado es que puede producir el material con instrucciones en lenguaje natural, Sora también puede crear video basado en una imagen o extender otros videos.
Además de producir imagen de gran calidad, las escenas que construye Sora pueden tener varios personajes y ser captadas a través de interesantes movimientos de cámara.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Sora en acceso anticipado
OpenAI ha señalado que la herramienta ha sido puesta a disposición de los equipos de evaluación de riesgo con el objetivo de identificar áreas críticas en las que el uso pudiera provocar daños a las personas. También será accesible a una cantidad limitada de artistas, diseñadores y productores audiovisuales con el objetivo de conseguir sus opiniones sobre el desarrollo.
Este es uno de los pasos previos que se tomarán antes de lanzar la herramienta al público en general.
Las consignas y el mundo
En cada uno de los ejemplos que ha publicado OpenAI se han agregado las consignas utilizadas. En el segundo a continuación se ha pedido:
Un trailer que muestre las aventuras de un hombre del espacio de 30 años vistiendo un gorro de motociclista tejido con lana roja, un cielo azul, un desierto de sal, en estilo cinemático, con una toma en un film de 35 milímetros y colores vívidos.
Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024
Otro de los videos de ejemplos que nos han gustado muestra una mujer paseando por las calles de Tokio. Fue creado con 5 líneas de instrucciones en la consigna para obtener detalles específicos.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
OpenAi explica que el modelo no solo hace lo que se le pide, sino que entiende como coexisten los elementos en el mundo físico que simula.