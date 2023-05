Yn de gemeenterieden yn Fryslân wurdt Frysk en Nederlânsk praat. Riedsleden skeakelje geregeld tusken de talen hinne en wer, somtiden sels binnen in sprekbeurt. Friezen sels draaie dêr de hân net foar om, mar foar programmatuer om spraak werom te kennen is dat skeakeljen tige yngewikkeld. Yn it ramt fan tagonklikens jildt sûnt septimber 2020 in lanlike ferplichting om opnamen fan riedsgearkomsten te ûndertiteljen. Foar it Frysk waard in tydlike útsûndering makke, mar mei yngong fan dizze simmer moatte Friezen dy’t dôf binne of in min(der) gehoar hawwe of dy’t oaren by it folgjen fan in debat net steure wolle, de opnamen fan gemeenteriedsgearkomsten ek mei ûndertiteling yn harren eigen taal weromsjen kinne.

Efternei taheakke

De helte fan de Fryske gemeenten – Tytsjerksteradiel, Achtkarspelen, Dantumadiel, De Fryske Marren, It Hearrenfean, Noardeast-Fryslân, Ljouwert, Opsterlân en Waadhoeke – slagget dat al. De oare gemeenten, Wetterskip Fryslân en de Provinsje folgje letter. De ûndertiteling wurdt efternei oan de fideo-opnamen fan riedsgearkomsten taheakke. In folgjende stap, live ûndertiteling, is technysk wol mooglik, mar freget om mear data en rekkenkrêft om deselde akkuratesse te realisearjen, seit Domenique van der Niet fan Humain’r. Dy organisaasje wol úteinlik ek safier komme dat wat yn it Frysk sein is nei it Nederlânsk oerset wurde kin en oarsom.

Fakjargon

Goede software om Fryske spraak automatysk om te setten nei skreaune tekst wie noch net beskikber. Earder ûntwikkele de Fryske Akademy yn gearwurking mei ûnder oaren de Radboud Universiteit soks om it radio-argyf fan Omrop Fryslân te ûntsluten. Dy software bliek lykwols net samar geskikt te wêzen om by it ûndertiteljen fan riedsgearkomsten te brûken. Dêr brûke riedsleden te folle fakjargon en ôfkoartingen foar. Spesjaal foar dat jargon is de hjoeddeiske, op keunstmjittige yntelliginsje basearre, spraakwerkenningssoftware ûntwikkele troch de Fryske Akademy, de Radboud Universiteit en Humain’r, in ûntwikkeler fan programmatuer mei in sosjale oanpak.

Frysk skriuwe

Om de besteande keunstmjittige yntelliginsje te learen it jargon fan de Fryske gemeenteriedsleden te ferstean, moasten in soad oeren oan ekstra audiomateriaal út de gemeenterieden letterlik útskreaun wurde. Dêr set Humain’r minsken mei in ôfstân ta de arbeidsmerk foar yn. It wie in toer om dêr genôch minsken foar te finen, want mar achttjin persint fan de Fryskpraters kin ek goed Frysk skriuwe. Geskikte meiwurkers dêrfoar krigen in spesjale training yn Frysk skriuwen foar keunstmjittige yntelliginsje, sadat se yn it projekt behelle wurde koene.

Fernederlânske

It automatysk ûndertiteljen fan riedsgearkomsten dêr’t sawol Frysk as Nederlânsk yn praat wurdt, smyt de nedige útdagingen op. “It Frysk en it Nederlânsk krûpe nei-inoar ta, benammen yn sprektaal”, seit Jelske Dijkstra, taalûndersiker by de Fryske Akademy. “It komt faak foar dat in Nederlânsk wurd dêr’t noch gjin Fryske wjergader foar is, dan mar op syn Frysk útsprutsen wurdt.” It omkearde is ek in bekend ferskynsel. Tink mar oan it frisime ‘uitnaaien’.

Trochûntwikkelje

Bykommende swierrichheden binne dat der ferskillende Fryske dialekten yn de riedseal te hearren binne en dat net elkenien in selde wurd gelikens útsprekt. Dêr moat de software ek ried mei witte. It is dan ek saak om mei it trochûntwikkeljen fan de keunstmjittige yntelliginsje troch te gean. “Spraakwerkenningssoftware moat hieltyd troch ûnderholden wurde, want spraak feroaret yn ’e rin fan de tiid”, seit frou Van der Niet. “Der komme nije wurden by, dy’t ek gauris yn gearkomsten te hearren binne, lykas ‘koroana’. En as de besetting yn de ried wikselet, moat de software oan nije stimmen wenne.”

Boarne: Binnenlands Bestuur