Natuurlijke kinderstemmen ontwikkelen

We droegen bij aan de ontwikkeling van de eerste natuurlijke tekst-naar-spraakstemmen voor kinderen, zodat ze kunnen praten zoals hun leeftijdsgenoten.

Het begin

In de late jaren '70 kwamen spraaksynthesesystemen in opkomst. Deze apparaten bleven decennialang erg kostbaar. Bovendien werden ze meestal ingezet voor communicatie, niet voor taalontwikkeling. Met als gevolg dat vooral volwassenen en tieners met voldoende ontwikkelde taalvaardigheid de apparatuur gebruikten. In eerste instantie waren er vrijwel alleen mannelijke, Amerikaanse stemmen beschikbaar. Die sloten niet aan bij de diverse gebruikersgroep van ondersteunde communicatie (OC). Vrouwelijke stemmen en variatie in accenten en talen kwamen pas later.

De ontwikkeling van betaalbare OC-oplossingen, zoals Proloquo2Go in 2009, luidde het einde in van de barrières om OC te gebruiken. Nu was deze innovatieve technologie beschikbaar voor iedereen die de riskante investering voorheen niet aandurfde. Denk bijvoorbeeld aan een kind dat nog onvoldoende taalvaardigheid had om te communiceren via dit soort apparatuur.  

Hoewel de technologie nu bereikbaar was voor een breder publiek, had meer dan de helft van de OC-gebruikers onder de 12 er nog weinig aan. Zonder natuurlijke kinderstemmen moesten de jonge gebruikers het doen met volwassen stemmen of gesimuleerde, verhoogde stemmen, waardoor ze klonken alsof ze helium geïnhaleerd hadden. De meeste jonge OC-gebruikers moesten dus noodgedwongen spreken met een stem waarmee ze zich niet konden identificeren, en die onnatuurlijk of ongeloofwaardig overkwam op hun communicatiepartners.

Luister maar eens naar deze kunstmatige stemmen: Kenny Kenny Nelly Nelly

We gingen de uitdaging aan

Op basis van de verzoeken van onze gebruikers en onze kennis van de wereld van OC, besloten we om ook onze jonge gebruikers de beste ervaring te bieden: met natuurlijke kinderstemmen. Omdat die tekst-naar-spraakstemmen nog niet bestonden, gingen we de uitdaging om ze te creëren aan met de Acapela Group, een van de koplopers op het gebied van tekst-naar-spraaktechnologie. 

Zo werkt het

Tekst-naar-spraakstemmen zijn gebaseerd op studio-opnamen van een stemacteur of -actrice, die een lang script voorleest. Het zou veel te veel tijd kosten om alle woorden van een taal op te nemen, dus het script is zodanig geschreven dat het zoveel mogelijk klanken en klankcombinaties bevat. Omdat klanken per taal verschillen, is hier veel en lang onderzoek voor nodig. Vervolgens wordt de spraak gegenereerd door de tekst-naar-spraaksoftware: die bouwt woorden door klanken te combineren. Na de opnamen moeten de stemmen nog uitgebreid bewerkt en getest worden, zodat ze zo natuurlijk mogelijk klinken. Alles bij elkaar duurde het ongeveer een jaar voordat de Acapela Group en AssistiveWare de eerste twee kinderstemmen hadden ontwikkeld.

Stemacteurs

Het succes van deze stemmen ligt in de handen van de stemacteur of -actrice. Kinderstemmen opnemen is met name lastig omdat de acteurs jong moeten klinken, maar tegelijkertijd goed moeten kunnen lezen én de discipline moeten hebben om lange dagen in de studio te maken. In de video's hieronder kun je zien hoe we de Britse en Amerikaanse kinderstemmen hebben opgenomen.

Innovaties voor de toekomst

In 2012 brachten we de eerste Britse kinderstemmen uit. Kort daarna volgden de Amerikaanse kinderstemmen. Omdat we beseften hoe groot de behoefte en de impact op het leven van onze gebruikers was, creëerden we met de Acapela Group kinderstemmen voor nog meer talen: Australisch-Engels en Duits in 2013, tweetalig Amerikaans-Spaans en -Engels in 2014, Frans en Zweeds in 2016, Italiaans en Noors in 2017 en Nederlands in 2018. Omdat we dat onze gebruikers diverse en individuele behoeften hebben, is het een belangrijk project voor AssistiveWare om meer talen, regionale accenten en leeftijdscategorieën aan te bieden.

 

Niet alleen het aantal beschikbare talen is gegroeid, de spraaksynthesetechnologie is ook verbeterd. Bovendien melden we woorden die niet goed klinken of een verkeerde intonatie hebben aan de Acapela Group. Op hun beurt passen ze de verbeteringen toe. 

Het effect van deze stemmen op onze gebruikers is fenomenaal. De stemmen zijn gratis beschikbaar in al onze OC-apps: Proloquo2Go, Pictello en Proloquo4Text. Omdat we ons realiseerden dat deze stemmen ook van waarde konden zijn voor gebruikers van andere apps, zijn we met de Acapela Group overeengekomen dat ze ze ook elders mogen inzetten.  Met als resultaat dat nu meer dan 20 andere bedrijven gebruikmaken van de kinderstemmen die wij mede hebben gecreëerd.

Achter de schermen met Merel en Thijs

Gerelateerde blogartikelen