LUN, 7 / OCT / 2024

Meta presenta Movie Gen

Este nuevo modelo de IA tiene la capacidad de generar video y audio de alta calidad. Todavía está en una etapa temprana de desarrollo.

Meta ha presentado Movie Gen, un modelo de inteligencia artificial capaz de producir videos y audios a partir de las consignas ofrecidas por los usuarios. La herramienta está todavía en una etapa de investigación, por lo que podría pasar un buen tiempo hasta que esté disponible al público.

La compañía explica que la idea es seguir compartiendo con la comunidad el devenir de su investigación en en campo.

El video de demostración es breve y ofrece varios cortos de unos pocos segundos. La calidad es buena y parece dar crédito a las afirmaciones de la compañía de que está desarrollando un modelo capaz de competir con los mejores del mercado. Más ejemplos pueden encontrarse en el anunció en el blog de Meta.

Funciones

Movie Gen es la tercera generación de herramientas desarrolladas para la producción de imagen y video. Tiene cuatro funciones principales: generación de video, generación personalizada de video, edición de video y generación de audio.

Los modelos fueron entrenados con una combinación de datos por licencia y material públicamente disponible. Como ya hemos notado anteriormente, públicamente disponible no siempre quiere decir libre para uso comercial, como muchas empresas pretenden. Esperemos que no estemos ante otro caso de falta de permiso.

Generación de videos

Actualmente la IA produce videos de hasta 16 segundos a unos 16 cuadros por segundo. Puede entender el movimiento de los objetos, como interactúan los elementos, el movimiento de la cámara y maneja varios conceptos relacionados con el movimiento. En el caso de los videos personalizados una imagen puede ser combinada con una consigna. El resultado es un corto en el que se preserva la imagen-identidad del protagonista. En la edición personalizada se toma un video y una consigna. Es posible eliminar elementos, remover fondos, agregar otros elementos y hacer varios cambios similares.

Audio

En lo que se refiere a la generación de audio, el sistema puede tomar video y texto y producir sonido de alta calidad de hasta 45 segundos. Puede ser música, sonido de ambiente o efectos. La pista resultante se sincroniza con el video.

¡Comparte esta noticia!
TAGS