Desarrolladores del MIT han creado una aplicación basada en inteligencia artificial que tiene la capacidad de deducir como luce una pesona luego de escuchar su voz. El trabajo realizado por los investigadores fue presentado recientemente en una publicación titulada: Speech2Face: Learning the Face Behind a Voice (Del discurso al rostro: aprendiendo sobre la cara detrás de la voz).
Para entrenar a la IA se utilizaron millones de videos educativos de YouTube con más de 100 mil personas en ellos. Esto permitió elaborar las correlaciones entre las cualidades de la voz y las características visuales de las personas.
Los datos obtenidos le permiten a la inteligencia artificial realizar predicciones sobre la raza, la edad y el sexo de las personas.
En la publicación los investigadores explican que el objetivo de este desarrollo es ver hasta qué nivel es posible inferir cómo luce una persona por la forma en que habla. Ninguna de las identificaciones suponen una correspondencia particular entre la voz y la apariencia de la persona. No se espera que una predicción exacta, solo descubrir los rasgos predominantes.
A pesar de que el objetivo son las características generales, la investigación también ha permitido descubrir relaciones entre características de la estructura craneal y la voz.
Cautela
Los investigadores han advertido que la IA ha demostrado algunos problemas para establecer ciertas identidades. Esto podría llevar a la producción de resultados en base a prejuicios.
Cuando recibía material de un ciudadano estadounidense de origen asiático hablando en chino lo caracterizaba correctamente como de origen asiático. Sin embargo, cuando la misma persona hablaba en inglés lo etiquetaba como de raza blanca.
La IA también asumía de forma muy general que las voces graves correspondían a los hombres y las más agudas a las mujeres.