Cómo la IA crea voz sintética

Que las máquinas conviertan el texto en voz no es nada nuevo.

El profesor Stephen Hawking se comunicó con una voz computarizada durante muchos años y, a estas alturas, estamos acostumbrados a que nuestros dispositivos GPS o altavoces inteligentes hagan preguntas y respondan a nuestras consultas.

LOVO , una empresa emergente de voz artificial y voz sintética, utiliza una API de voz en off para convertir texto en voz en tiempo real utilizando más de 200 voces similares a las humanas en 33 idiomas utilizando su «biblioteca de voz». Los usuarios también pueden clonar sus propias voces para crear sus propias máscaras, simplemente leyendo 15 minutos de un guión

LOVO anunció recientemente el cierre de una ronda previa a la Serie A de $ 4.5 millones, dirigida por Kakao Entertainment de Corea del Sur. Vea aquí mi conversación completa con Tom Lee, cofundador y director de operaciones de LOVO (incluida una demostración)

MÁS PARA TI

El multimillonario ‘Backsies’: Texan construye una segunda fortuna a partir de los restos del imperio inmobiliario que había vendido

La advertencia de los científicos: el cambio climático ha empujado a la Tierra a un ‘código rojo’

La defensa de los Milwaukee Bucks tuvo un comienzo abrasador

Qué es la síntesis de voz por IA?

La síntesis del habla es simplemente la producción generada por computadora de palabras humanas audibles.

Las voces robóticas tradicionales de texto a voz que escucha en productos de software o hardware como Amazon Echo, Google Home, su GPS o su lector de libros electrónicos son rápidas y baratas de crear para las empresas, pero también pueden ser poco originales y poco realistas.

La inteligencia artificial o la voz de IA funcionan de manera un poco diferente. AI Voice utiliza el aprendizaje profundo para crear un discurso sintético de mayor calidad que imita con mayor precisión el tono, el tono y el ritmo de una voz humana real.