El auge de las voces sintéticas: ¿Podrás distinguir lo real de lo artificial?

"En el pasado, las voces sintéticas se asociaban con un sonido robótico, pero gracias al desarrollo de las redes neuronales, hoy podemos escuchar voces sintéticas mucho más naturales y expresivas", recoge este artículo de Craft.

Cada vez escucharemos más voces sintéticas en nuestro día a día, y es posible que no puedas distinguirlas de las voces humanas. Se han convertido en una herramienta cada vez más popular en distintas plataformas, desde podcasts a videojuegos, hasta asistentes conversacionales, porque permiten generar contenido a gran velocidad y en múltiples formatos e idiomas.

En el pasado, las voces sintéticas se asociaban con un sonido robótico, pero gracias al desarrollo de las redes neuronales, hoy podemos escuchar voces sintéticas mucho más naturales y expresivas. Antes, la forma en que se generaba el audio de la voz sintética parecía ser construida por «trozos» o segmentos de sonido concatenados.

En la actualidad, gracias al machine learning, podemos escuchar voces sintéticas capaces de imitar el sonido del habla humana a partir de unas muestras de ejemplo. Las voces sintéticas son, por tanto, tan expresivas como seamos capaces de entrenar dichos modelos y los datos de entrenamiento permitan.

Ventajas

El uso de voces sintéticas ofrece innumerables ventajas. Permite generar lecturas de alta calidad en poco tiempo y con un coste muy competitivo, facilitando la actualización y modificación del contenido rápidamente. También mejora la accesibilidad para personas con discapacidad visual, así como la experiencia del usuario al ofrecer una opción adicional para consumir el contenido, aumentando el tiempo de permanencia en la página y reduciendo la tasa de rebote.

Además, su uso garantiza una consistencia en la pronunciación y entonación en diferentes idiomas y dialectos, lo que puede mejorar la comprensión de la audiencia y permitir una mayor localización del contenido en cada país o región en el que queramos adaptar los contenidos de una marca. Y sus aplicaciones son múltiples. Las voces sintéticas se pueden utilizar para locutar anuncios en radio y televisión, narraciones de videos promocionales y podcasts, así como para desarrollar asistentes virtuales y contenido para redes sociales para hablar de forma personalizada a múltiples audiencias y mercados de una manera ágil y a una escala nunca vista.

En Craft, llevamos varios años trabajando con voces sintéticas para dar respuesta a las necesidades de nuestros clientes que operan en múltiples mercados, con múltiples productos para acelerar su capacidad de personalizar mensajes para el canal, el momento y la audiencia adecuada con la mayor eficiencia.

Escucha bien, porque cada vez oirías más voces sintéticas, y cada vez será más difícil distinguirlas.

SOMOS CRAFT.

Craft. Donde la creatividad cobra vida.

Craft es una agencia global líder en la industria de producción creativa con más de 1,300 creadores y con presencia en 120 países, especializada en la creación, producción y transcreación de contenido en todos los canales.

El enfoque de Craft en la creación de contenido está informado por datos y potenciado por tecnologías de producción emergentes, impulsado por un valor: producir y crear contenidos inteligentes, valientes de manera responsable que genere resultados comerciales.

El trabajo de Craft ha sido reconocido con premios como Cannes Lions, D&AD, Effie Awards , One Show o los Gerety Awards entre otros.

Para ver más contenidos de la sección ‘Crafting Growth’.