Nvidia ha presentado un nuevo modelo de inteligencia artificial dedicado a la generación de sonido y música. Este producto está dirigido a la industria de la música, el cine y los videojuegos.
Capacidades
El modelo se conoce como Fugatto. No es el único desarrollo capaz de generar sonido a partir de una consigna de texto. Aunque cumple muy bien con esta tarea. En el video publicado por Nvidia pueden verse varios ejemplos de consignas extrañas produciendo interesantes sonidos. Entre los ejemplos citados aparece la idea de hacer ladrar a una trompeta. El sistema también es capaz de separar sonidos particulares.
Pero el rasgo que destaca a Fugatto es que puede tomar pistas de audio y transformarlas de forma precisa. Puede cambiar el acento y el tono de una frase, puede llevar una melodía en piano a una voz.
Nvidia presenta a Fugato como un paso más en la evolución de la industria musical, refiriéndose al impacto que produjeron los sintetizadores hace tiempo. También destaca las posibilidades que le brinda a los artistas. Por ejemplo, la prueba de diferentes instrumentos dentro de una melodía.
Riesgos
A pesar de su funcionamiento, que es destacable, la compañía todavía está evaluando cuando podría hacerlo público, dado que aún le queda por definir como hará para evitar el abuso y las malas prácticas.
Nvidia ha señalado que cualquier tecnología generativa implica riesgos, porque la gente puede utilizarla para producir cosas que sería preferible que no se crearan. Por dicha razón la empresa tiene que ser cautelosa y no tiene planes para un lanzamiento a corto plazo. Una postura similar han adoptado OpenAI y Meta sobre sus propias herramientas.