Alexa podrá hablarte pronto con la voz de un familiar fallecido

El asistente virtual de Amazon, Alexa, puede hablar con varias voces diferentes pero todas con algo en común: han sido grabadas por actores o actrices reales en un estudio de grabación. Estos profesionales leen varios textos con diferentes entonaciones que se usan luego para aislar los fonemas necesarios que hacen que la voz sintética del asistente se parezca lo más posible a la de un humano.
Los ingenieros de Amazon, sin embargo, están trabajando ahora en una función que permitiría reconstruir la voz de cualquier persona, viva o muerta, a partir de una pequeña grabación de voz o un video.
En la conferencia re:Mars de Las Vegas, un encuentro en el que Amazon está mostrando su últimos avances en aprendizaje máquina e inteligencia artificial, Rohit Prasad, vicepresidente responsable de Alexa, ha mencionado algunas de las aplicaciones de esta tecnología.
En uno de los escenarios para demostrar la nueva capacidad de síntesis, Prasad ha mostrado como Alexa podría leer un cuento a los niños con la voz de una abuela fallecida usando solo una pequeña grabación de voz de apenas un minuto de duración como punto de partida.
Amazon no ha detallado si planea hacer de esta función un producto comercial para sus altavoces y pantallas inteligentes pero la idea de construir una voz sintética a partir de pequeñas grabaciones de una real es perfectamente plausible.
La industria del cine ha «resucitado» en el pasado a actores y actrices muertos para protagonizar un anuncio o una pequeña escena. La idea de crear versiones digitales de personas fallecidas a partir de grabaciones de vídeo y fotos también ha sido explorada con frecuencia en series de ciencia ficción, como Black Mirror.
En un principio este tipo de aplicaciones eran tareas increíblemente complejas que necesitaba de muchas horas de imágenes de archivo para conseguir un resultado convincente, pero los avances en aprendizaje máquina e inteligencia artificial han hecho el proceso sea ahora mucho más sencillo, requiriendo sólo una fotografía o, en este caso, una pequeña grabación de audio.
Amazon, en cualquier caso no está sola en estos esfuerzos. Google también está está investigando cómo recrear voces de forma sintética utilizando sólo pequeñas grabaciones como punto de partida. En enero de 2019, la compañía mostró una nueva técnica que permite generar una voz sintética casi igual a la de cualquier persona partiendo sólo de una grabación de cinco segundos.
EL MUNDO
También podría gustarte