En el comienzo
Los SAAC existen desde finales de los años 70. Durante décadas, estos dispositivos eran muy caros y se usaban principalmente para la comunicación y no para el desarrollo del lenguaje. Por ende, quienes hacían uso de ellos eran principalmente adultos y adolescentes que ya habían adquirido competencias lingüísticas. Al principio, la mayoría de las voces disponibles eran americanas y masculinas, lo que hacía que muchos de los usuarios de Comunicación Aumentativa y Alternativa (CAA) no estuvieran representados. Las voces femeninas llegaron más tarde, junto con otros acentos e idiomas.
El desarrollo de recursos de CAA de bajo coste, como Proloquo2Go en 2009, allanó el camino para facilitar el uso de CAA. A partir de entonces, esta tecnología innovadora se hizo disponible para usuarios que en el pasado podrían haberse considerado una inversión arriesgada para una empresa de CAA, como, por ejemplo, un niño que aún necesita desarrollar sus habilidades lingüísticas antes de empezar a comunicarse.
A pesar de que esta tecnología empezaba a estar al alcance de un público más amplio, aún no incluía a niños menores de 12 años, los cuales de hecho suponen casi la mitad de los usuarios de CAA. Al no tener voces de niños auténticas, los usuarios utilizaban voces de adultos o voces modificadas artificialmente con tonos altos que sonaban como una voz tras inhalar helio. Esto significaba que la mayoría de los usuarios jóvenes de CAA tenían que hablar con una voz con la que no se sentían identificados y que sonaba poco natural y artificiosa a sus interlocutores.
Asumiendo el reto
Con base en las peticiones de los usuarios y en nuestros conocimientos del mundo de CAA, decidimos empezar a ofrecer a nuestros usuarios más jóvenes la mejor experiencia posible de CAA con nuestras auténticas voces infantiles. Como no existían en aquellos momentos, decidimos unirnos a Acapela Group, una de las empresas líderes en síntesis de Texto a voz, para asumir juntos el reto de crear las primeras voces infantiles auténticas para Texto a voz.
¿Cómo funcionan?
Las voces de síntesis vocal están basadas en grabaciones reales de locutores leyendo un extenso guión en un estudio de grabación. Grabar todas las palabras de un idioma nos llevaría una eternidad, por lo que esos guiones se han diseñado con el objetivo de que contengan el mayor número de sonidos y combinaciones de sonidos posible. Esto conlleva una gran labor de investigación, ya que los sonidos requeridos varían en función del idioma. A continuación, el software de Texto a voz sintetiza el discurso y crea palabras a partir de la combinación de sonidos. Una vez que las grabaciones están hechas, aún se necesita una gran labor de tratamiento y análisis de las voces para que suenen lo más natural posible. Con todo esto, la colaboración entre Acapela Group y AssistiveWare tardó alrededor de un año en desarrollar las primeras dos voces de niños.