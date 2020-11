Campus Fryslân heeft met Friese schrijvers en Audiofrysk - uitgever van Friese luisterboeken - een samenwerking afgesproken. De audiobestanden van de voorgelezen boeken mogen gebruikt worden als trainingsdata voor de spraaksynthesizer. "Het grote voordeel is dat wij dan veel audio hebben van één stem én er zijn tekstbestanden van."

Met die data gaat Phat Do aan de slag, maar dan heeft hij nog niet genoeg. Volgens hem kunnen ook andere talen die dichtbij het Fries liggen, worden gebruikt als trainingsdata. Hij denkt aan Engels, Nederlands en misschien zelfs het Duits, omdat dat talen uit dezelfde West-Germaanse talenfamilie zijn. Bij zijn onderzoek probeert hij antwoord te krijgen op vragen als: hoeveel andere talen kun je nog gebruiken? In wat voor percentages? Wat bepaalt, welke talen kunnen worden gebruikt?

Met de uitkomsten van het onderzoek kunnen ook van andere kleine talen spraaksynthesizers worden gemaakt. Dat het Fries als eerste kleine taal aan de beurt is, komt door Campus Fryslân. "Ik ben heel blij dat ik hier mijn promotieonderzoek kan doen en ik wil dan ook wat terugdoen voor de regio", zo geeft Phat Do als verklaring.

Commercieel niet interessant

Over drieënhalf jaar moet zijn onderzoek afgerond zijn en moet er een prototype liggen. Volgens Jelske Dijkstra is zo'n spraaksynthesizer heel belangrijk voor een kleine taal. "Ook de kleine talen moeten mee in technische ontwikkelingen. Maar voor grote commerciële bedrijven is het niet interessant omdat het duur is om zoiets te ontwikkelen. Dat kan niet terugverdiend worden. Dus als wij het niet doen, doet niemand het."

Als de Friese taalsynthese af is, komt het gratis beschikbaar. "Je kunt er dan dagelijks gebruik van maken. Bijvoorbeeld in het onderwijs. Of in de zorg: denk aan mensen die door ziekte niet meer kunnen praten. Die kunnen dan door zo'n Friese spraaksynthesizer toch in hun eigen taal communiceren."