Dansk sprog gør talegenkendelse svært
Talegenkendelse er sprogteknologi, der kan genkende tale og "oversætte" talen til skrift. Der er altså ikke tale om traditionel transskribering, hvor et menneske nedskriver talen, men om automatisk transskribering.
Fordelene er indlysende. Manuel transskribering er en meget tidskrævende proces, så kunne man få en maskine til at gøre arbejdet, er der mange timers hårdt og omstændeligt arbejde sparet.
Men der er et aber dabei. Den måde, vi taler på i Danmark, gør det svært for en maskine af afkode talen korrekt.
Forholdet mellem udtale og stavning er uregelmæssigt på dansk
Dansk er et uregelmæssigt sprog. Det slår igennem på flere niveauer, også på udtaleniveau, hvor dansk i særlig grad kendes på stor afstand mellem udtale og stavemåde. Det ses tydeligt i ord som vende (udtales vænne), hvor (udtales vår) og genert (udtales sjænerd).
Det er derfor svært at basere talegenkendelsen på lydrethed, altså at ordene staves, som de udtales. For det gør de netop ikke på dansk.
En anden udfordring for automatisk transskribering er udtalen af ord. På dansk udtales mange ord kun delvist. Fænomenet kaldes reduktion. Det betyder, at hele ord trækkes sammen til én enkelt stavelse, når de udtales. Et eksempel kunne være sætningen det er svært at transskribere, der mundtligt ville blive reduceret til Det svært at transskribere. Man trækker altså det er sammen til det.
Danskere er generelt sjuskede i udtalen, forstået på den måde, at ord trækkes sammen og endelser forsvinder. Når mange ord ikke udtales eller kun udtrykkes delvist, stiger talens tempo. På dansk udtales i gennemsnit ti stavelser pr. sekund, men det samme antal for svensk og norsk er 6-7 stavelser.
Derfor er automatisk transskription af dansk tale en udfordring
Det er klart, at en velartikuleret og langsom udtale er lettere for en maskine at genkende end talesprog i et højt tempo med mange lydlige reduktioner og halve ord.
Derfor er det svært teknisk at lave talegenkendelse med høj nøjagtighed på dansk.
En anden udfordring for producenter af sprogteknologi er, at dansk er et lille sprogområde. Lad os sige, at det koster 10 millioner at udvikle noget software, der kan transskribere tale. Hvis markedet er en lille befolkning på fem millioner, kan det ikke svare sig at udvikle for 10 millioner kr. Men det kan det godt, hvis man udvikler til et stort sprogområde, fx til engelsk, tysk eller spansk tale.
Så er talegenkendelse på dansk ren utopi?
Jo, det er er det, og der er da også allerede i dag flere virksomheder, der tilbyder talegenkendelse på dansk. Men der vil gå en rum tid, inden den kan erstatte manuel transskription én til én.
Nøjagtigheden af transskriberingen er lav – netop på grund af den store afstand mellem udtale og stavning på dansk. Det er også svært for en maskine at identificere de forskelle talere, sætte tegnene rigtigt, markere uklarheder, markere direkte tale med videre.
Nøjagtigheden vil naturligvis forbedres på sigt, men det drejer sig ikke om få år, men rigtigt mange år, før autotransskription er lige så nøjagtig som en manuel transskription.