Google actualiza Text-to-Speech Voices en Android

Google está implementando un conjunto mejorado de modelos para sus servicios de voz de Google para hacer que la aplicación de Android con voces de texto a voz sea más fácil de entender y más humana. La claridad mejorada y las mejoras «humanas» más cualitativas se pueden escuchar en la c

omparación a continuación.

VOCES DE GOOGLE

Los nuevos modelos se utilizarán para las 421 voces en 67 idiomas que se ofrecen a través de Speech Services de Google. La actualización se realizará en el backend, por lo que los desarrolladores que utilicen texto a voz y otros servicios de voz no tendrán que cambiar nada. Google incluirá las nuevas voces automáticamente cuando los usuarios descarguen la última actualización para cualquier dispositivo Android de 64 bits desde Google Play Store. Muchas aplicaciones nativas de Google también implementarán las nuevas voces, incluidos Google Maps y Google Translate.

“Estamos actualizando los servicios de voz del motor de voz de Google a lo grande, brindando una voz más clara y natural”, explicaron el ingeniero de software del personal de Google, Rakesh Iyer, y el gerente de productos del grupo, Leland Rechis, en una publicación de blog. “Hemos visto un aumento significativo en la calidad de lado a lado con este cambio, particularmente en lo que respecta a la claridad y la naturalidad. Con esta actualización, también cambiaremos la voz predeterminada en EE. UU. a una que se cree utilizando datos de altavoces más recientes, lo que junto con nuestra nueva pila da como resultado una mejora drástica”.

CLARIDAD DEL HABLA

Las mejoras continuas de Google en sus modelos de síntesis de voz son cruciales, ya que cada vez más empresas buscan síntesis de voz humana avanzada como parte de su software tanto para consumidores como para clientes empresariales. Las empresas están ansiosas por presumir de mejoras y nuevas funciones, como lo demuestra recientemente el motor de voz sintética Riva actualizado de Nvidia, los modelos de voz actualizados de WellSaid Labs y Neosapience que implementa una herramienta impulsada por IA que permite a los usuarios escribir la emoción que quieren que los actores virtuales utilizar al hablar. Leer sitios web, instrucciones o novelas requiere voces que suenen realistas, y es poco probable que Google lo olvide, ya que lanzará actualizaciones similares a sus servicios de voz en el futuro.