Onlangs bezocht ik een klant voor spraakherkenning. Zijn stem was opgenomen en opgeslagen voor later. Je eigen stem voor later, voor als je niet goed meer kunt spreken, wanneer je hersenen nog goed functioneren maar de woorden niet meer uit je mond komen. Zoals bij de ziekte ALS.
Je stem verliezen is je identiteit verliezen.
Voor iedereen een stem
Stemmen zeggen veel over de persoon. Is de stem van een man, heeft hij een accent, dialect, wat is zijn leeftijd? Een stem geeft emoties weer.
Een stem is persoonlijk. Een stem is sociaal en verandert door de tijd heen. Woordkeuzes veranderen door sociale gebeurtenissen of leeftijd.
Ik ken niet veel mensen die het fijn vinden om naar hun eigen stem te luisteren. Wanneer je stem het niet meer doet, is je eigen stem wel heel belangrijk. Niet alleen voor jezelf maar ook voor mensen om je heen.
Onderstaand YouTube filmpje: waarom we onszelf niet graag horen
Een computerprogramma leest een tekst meestal voor met een robotachtige standaardstem. Misschien herken je de bekende stem van Claire of Daniël. Zelfs voor kinderboeken worden volwassen stemmen gebruikt. Acapela group brengt daar verandering in.
Acapela group onderzoekt en ontwikkelt oplossingen op het gebied van Text-to-Speech voor veel uiteenlopende talen en dialecten. Zij ontwikkelt o.a. My-own-Voice om een stem op te nemen en te gebruiken in voorleesprogramma's.
Mijn eigen stem, hoe werkt dat?
Wanneer de stem nog goed is of in ieder geval verstaanbaar, moet je een tekst voorlezen. Van deze teksten worden opnames gemaakt. De tekst is speciaal samengesteld zodat de computer daar ook andere woorden en zinnen van kan maken.
Acapela analyseert de geluidsfragmenten en programmeert zo een eigen voorleesstem.
De voorleesstem is te importeren in Text-to-Speech programma's. Je behoudt zoveel mogelijk je eigen identiteit bij het voorlezen of bij het praten met je familieleden via een computer.
Fluency Stemdigitalisering
Een andere organisatie is de spraaktechnologie van Fluency. Zij maakt het mogelijk om met behulp van een aantal vooraf opgenomen woorden en zinnen een nieuwe stem te genereren, die een treffende gelijkenis vertoont met de stem van degene die het materiaal heeft ingesproken.
De spreker spreekt een vaststaand tekstbestand in, dat bestaat uit 387 woorden en 387 zinnen (in totaal 774 items). De stem wordt met behulp van een speciaal programma opgenomen. De opgenomen spraakbestanden worden vervolgens door Fluency verwerkt tot een spraakdatabase.
Door opnames van de stem te maken wanneer dat nog kan, kan men in een later stadium de eigen stem in een communicatiehulpmiddel gebruiken. Dit blijft natuurlijk een computerstem, maar je kunt duidelijk horen dat het uw stem is.
Zelf een synthesizer maken van je eigen stem
Ben je handig? Op YouTube vind je diverse filmpjes waar uitgelegd wordt hoe je je eigen stem kan opnemen en gebruiken in een synthesizer. "How to make Synthesizer of Your Voice | Like Text-to-Speech".
Verdere ontwikkeling
Ontwikkeling van Text-To-Speech gaat gestaag door en goed dat deze niet alleen voor in de auto is, maar juist door ons te gebruiken in thuissituaties.
Is het moeilijk om van je eigen stem een opname te maken, dan is het ook handig om een stem uit een databank te gebruiken. Een kinderstem of juist een senior, een enthousiaste vrouw of een serieuze man. Er zijn diverse mogelijkheden om een passende te vinden in de Voice Banking.