La Inteligencia Artificial de Google ahora compone música para videos

La nueva versión de DeepMind es capaz de tomar un video y añadirle sonido ambiental y música de manera inteligente utilizando solo las palabras de sus creadores. También están trabajando en una herramienta que agregue diálogos.

La cada vez más tenebrosa carrera por dotar a la inteligencia artificial de la mayor cantidad de habilidades artísticas posibles sigue su rumbo y ahora, gracias a un avance creado por DeepMind, el proyecto de Inteligencia Artificial de Google, podemos sumar una habilidad más a la interminable lista de talentos digitales: la composición música y creación de efectos sonoros.

Esto, según está relatado en la última publicación de la compañía, es una nueva tecnología que lleva por nombre V2A (Video to Audio) y lo que permite hacer es analizar los pixeles de cada video, junto con una descripción por escrito de lo que se quiera, para poder entregar un video que originalmente no tenía sonido en algo mucho más rico, añadiendo no solo música, sino que también efectos sonoros.

Acá van unos ejemplos compartidos por DeepMind, en donde podemos ver que la música se sincroniza con los cortes de cámara y también los efectos de sonido calzan perfecto con lo que está ocurriendo en pantalla.

Y en este caso podemos ver como se le puede aplicar sonido a una imagen y después una música que entrega otro valor a la misma imagen.

Por supuesto, la idea de desarrollar esta tecnología en el futuro puede ir desde la creación de música artificial para cine y series y hasta la generación por completo de audio y video si se logra combinar V2A con Veo, un sistema de creación de videos totalmente hechos por Inteligencia Artificial.

Pero DeepMind no quiere quedarse solo en la música. La última demo presentada muestra los primeros pasos hacia la creación de diálogos basados en un video. La idea es que V2A pueda interpretar el movimiento de los labios y logre insertar los parlamentos en los momentos adecuados, pero como vemos en este video, la intención de la voz no existe y además, aun suena demasiado robótica.

COMPARTIR NOTA