Din guide til transskription
Læs om transskriberingens forskellige metoder og de programmer, der kan effektivisere processen og spare dig penge.
Transskription ⇒ metoder, programmer, tips og tricks
Det er tidskrævende at transskribere. Derfor gælder det om at finde en metode, der sparer tid – uden at kompromittere kvaliteten for meget.
Man kan vælge en online-tjeneste til automatisk transskribering. Det er billigt og hurtigt, men prisen afspejles i kvaliteten. Udskriften vil have mange fejl og rumme mange meningsløse passager.
Alternativt må man selv til tasterne. Som lægmand kan man typisk transskribere i forholdet 9:1 – det tager altså 9 timer at transskribere en times optagelse. Så man skal afsætte god tid til arbejdet.
Har man ikke den tid, kan man få Textservice til at udføre transskriptionen. Vi er billigst på markedet, og vi leverer kvalitetsudskrifter til uddannelsesinstitutioner, fagforeninger, virksomheder, private og studerende.
Formålet med denne artikel er at informere om forskellige metoder til transskription, så du – på et oplyst grundlag – kan vurdere, om du vil overlade transskriptionen til en maskine, om du selv vil udføre arbejdet, eller om du vil overlade arbejdet til en professionel transskribent.
Læs om
- Metoder til transskribering
- Programmer til transskribering – betalingsprogrammer og gratis programmer
- Automatisk transskribering
Få et uforpligtende tilbud på transskribering
Anfør lydoptagelsens/optagelsernes længde i cirka antal minutter. Vedhæft evt. et uddrag af en lydoptagelse, så vi kan give en mere præcis pris.
Er du studerende? Skriv til jan@textservice.dk for et godt tilbud på transskribering.
"At opstille et system for transskribering er en gigantisk opgave, da man altid vil skulle opstille konventioner og træffe beslutninger vedr. detaljer, man – hånden på hjertet – aldrig ville have drømt om skulle blive relevante."
1. Metoder til transskribering
Transskribering består i, at man overfører talt sprog til skrift. Så vidt så godt – det lyder jo enkelt nok. Men enhver, der har kastet sig ud i et transskriberingsprojekt, ved godt, at helt så simpelt er det ikke. Transskribering er mere end blot at sætte sig ned, lytte til noget tale og så skrive ned, hvad man hører. Faktisk kan det være en ret kompleks proces.
Det være sagt, så er der bestemt ingen grund til at opfinde den dybe tallerken, når man går i gang med et transskriberingsprojekt. At skulle opstille et system for transskribering er en gigantisk opgave, da man altid vil skulle opstille konventioner og træffe beslutninger vedr. detaljer, man – hånden på hjertet – aldrig ville have drømt om skulle blive relevante.
Derfor er det vores erfaring, at den bedste metode i praksis er at tage udgangspunkt i en specifik transskriberingsmetode eller manual, som derefter tilpasses til de konkrete behov i dit projekt. Læs mere om transskribering af interviews her.
Når man aflytter lydfiler og transskriberer, afkoder man samtidig et indhold. Talt sprog er væsensforskelligt fra skrevet sprog og er pr. definition fyldt med småfejl, rettelser, udtalefejl osv., og man kan ofte tænke: ”Det ville have lydt meget bedre, hvis der var blevet sagt sådan eller sådan, i virkeligheden menes der jo sådan eller sådan.”
Men det er en fortolkning af det sagte, og det er ikke, hvad transskribering går ud på.
Transskribering handler om at afkode meningen med det sagte korrekt og i overensstemmelse med det lydlige forlæg. Så grundreglen for transskribering er, at transskribenten forholder sig tro og loyalt til det talte oplæg.
Men det betyder bestemt ikke, at enhver lydudskrift er ens. Der kan være forskel på, hvor mange detaljer, der skal med i transskriberingen, og detaljeringsgraden afhænger af projektets formål.
Formålet bestemmer metoden
Afhængigt af, hvad transskriberingerne skal bruges til, hvad man transskriberer, og hvordan man transskriberer, kan det være en proces, der kræver stor faglig (sproglig) viden, og afhængigt af, hvilken transskriberingsmetode man anvender, også en del erfaring. Der er nemlig ikke et fælles vedtaget, overordnet system, som kan anvendes til alle projekter med alle formål.
Og hvorfor egentlig ikke?
Årsagen skal bl.a. findes i, at der er himmelvid forskel på talt sprog og skriftsprog. Og de grammatiske og retskrivningsmæssige konventioner, man fx på dansk har for skriftsprog, gælder ikke på samme måde for talt sprog. Derfor er lydfiler fyldt med talesprogsfænomener som fx tøven, pauser, gentagelser, fejl osv.
En anden og lige så vigtig grund til, at der ikke er vedtaget en konvention for transskription, er, at der også er stor forskel på, hvad transskriptionerne skal bruges til – og i sidste ende vil transskriberingsmetoden altid afhænge af og tilpasses til formålet.
Er der tale om en transskribering, der primært skal gengive indholdet – altså, hvad der siges – i en samtale, et interview, et oplæg el.lign., eller er andre fænomener som interaktion, tøven, tonegang, tryk, pauser eller måske sågar udtale centrale for projektet? Disse forskellige overvejelser bestemmer i sidste ende, hvor detaljeret transskriberingen skal være, og dermed hvilken transskriberingsmetode der er den mest hensigtsmæssige.
Nedenfor beskriver vi nogle af de gængse transskriberingsmetoder, vi er vant til at arbejde med. Bemærk, at der er tale om generiske systemer, som sjældent passer 100 % til et specifikt projekt. Hvilken information, der er relevant for dit projekt, er bestemmende for detaljeringsgraden i lydudskriften – og detaljeringsgraden er det, der adskiller de forskellige metoder fra hinanden (og en af de faktorer, der bestemmer tidsforbruget eller prisen).
Så lad os se lidt på de forskellige metoder.
1.1 Verbatim transskribering
Udtrykket ”verbatim” bruges ofte i forbindelse med transskribering og betyder egentlig ”ordret” eller at gengive noget ”ord for ord”. Nogle kalder det da også for ordret eller bogstavelig transskribering. Men det siger ikke så meget i sig selv, da ”verbatim transskribering” i vores erfaring egentlig dækker over en række forskellige metoder med forskellige detaljeringsgrader – altså alt efter, hvilken information man medtager i transskriberingen.
1.2 Fokus på indholdsord
En form for transskribering er, hvor man udelukkende skriver, hvad vi (lidt forenklet) kan kalde indholdsord i lydfilen. Her udelades altså så vidt muligt alle former for talesprogsfænomener (fx fyldord, tøven, udeladelser, pauser, afbrydelser osv.). Fordelen ved den ”rene” transskribering er, dels at det er den mindst tidskrævende transskriberingsmetode, og dels at det giver en meget læsevenlig gengivelse. Fx vil man direkte kunne citere fra transskriberingsfilen, da alle ”læseforstyrrende” talesprogsfænomener er sorteret fra.
Talesprogsfænomener er sjældent forstyrrende i en samtale, men de kan gøre teksten meget svær at forstå, når de overføres til skriftsprog. Sammenlign fx
Jeg synes egentlig, at det er forkert
med
Hmm … altså, jeg synes … øhhh, altså – jeg synes egentlig, at det … at det er forkert, ik’?
Mens den sidste nærmer sig en 1-1-gengivelse af, hvad der bliver sagt (i hvert fald i forhold til talte ord), så er den ikke særlig læsevenlig og tager sig heller ikke nødvendigvis pænt ud i en afhandling eller en rapport, hvor det interessante – lidt forenklet – er, hvad der bliver sagt, og ikke så meget, hvordan det bliver sagt.
Talesprogsfænomenerne giver en slags ”læse-støj”, som det i mange tilfælde er mest hensigtsmæssigt at være foruden. Humlen kan så være, at det ikke altid er ligetil at vurdere, hvad der er ”fyld”, og hvad der er egentlige ”indholdsord” – det stiller krav til transskribentens erfaring og sproglige baggrund og uddannelse.
I nogle tilfælde er en ”ren” transskribering ikke optimal, og der vil være behov for en højere detaljeringsgrad. Det kan enten skyldes, at der stilles visse krav til, hvordan man transskriberer inden for den faglige metode, man arbejder med, eller at projektets formål kræver, at man inddrager andre fænomener, end blot hvad vi har kaldt ”indholdsord”.
En mere verbatim form for transskribering er derfor, hvor teksten nedskrives, som den fremstår i lydformen – altså med gentagelser, tøven, pauser, rettelser osv., jf. eksemplet herover.
1.3 Dansk standard for transskribering
Transskription har alle dage været aktuelt i undervisnings- og forskningssammenhænge, hvor man bruger kvalitative interviews som en del af sin empiri. Af samme grund opstod behovet for en harmonisering af lydudskrifterne, så de blev mere læsbare på tværs af fagområder.
Tilbage i 1980’erne udarbejdede Kirsten Gregersen et forslag til en egentlig udskriftskonvention, Dansk standard for udskrifter og registrering af talesprog 1987, der hurtigt vandt gehør. Standarden er stadig udbredt i forskningsmiljøer, om end der også eksisterer individuelt tilpassede udskrifter.
Det bliver for omfattende her at redegøre for alle normens notationskonventioner, for det er et rigt system, der dækker alle transskriptionsformer fra den enkle, ordrette transskribering til udskrifter med stor fonetisk nøjagtig, hvor alle lyde, herunder latter, host, pauselyde samt trykfordeling i udtalen oversættes til skriftsprog.
Men i grove træk gælder følgende konventioner for en såkaldt minimaludskrift:
- Dansk ortografi i henhold til retskrivningen
- Kun propier staves med stort begyndelsesbogstav
- Ingen kommaer, kun punktum ved ytringsafslutning
- Uforståelige ord og sekvenser noteres med (uf)
- Tvivls-ord markeres med parentes og spørgsmålstegn omkring ordet
- Ny speaker markeres med linjeskift
Standarden beskriver også, hvordan ikke-leksikalske lydfænomener såsom pauser, tøven, selvafbrydelser, selvrettelser, tryk, intonation med videre skal annonteres.
1.4 Jeffersons system og konversationsanalyse
Et af de mest kendte systemer til transskribering er Jeffersons system (opkaldt efter Gail Jefferson, der har udviklet systemet), og det er samtidigt også et de mest detaljerige systemer.
Metoden består bl.a. af en rækker koder/noteringer, som angiver fx mikropauser, længere pauser (med tidskoder), taletempo, intonation, tryk, volumen, tonefald, etc. Der er altså tale om en meget dybdegående transskribering, som særligt anvendes i forbindelse med konversationsanalytiske og lingvistiske studier af mundtligt sprog.
Men det gælder også her, at man i nogle (mange) tilfælde vil vælge en forenklet udgave af systemet, fordi ikke alle fænomener er relevante, eller i andre tilfælde, at man vil tilføje yderligere koder, som er relevante for analysen, men ikke indgår i Jeffersons system. Det kan fx være forskellige nonverbale fænomener som gestik, blikretning m.m., der kan være væsentlige i nogle projekter.
Få et uforpligtende tilbud på transskribering
Anfør lydoptagelsens/optagelsernes længde i cirka antal minutter. Vedhæft evt. et uddrag af en lydoptagelse, så vi kan give en mere præcis pris.
Er du studerende? Skriv til jan@textservice.dk for et godt tilbud på transskribering.
"Jo flere koder, der skal indsættes i udskriften, desto større vil behovet være for et program med indbygget funktionalitet til at smidiggøre og automatisere kodningen fra tale til tekst."
2. Programmer til transskribering
Vi forudsætter her, at optagelserne allerede er i hus. Hvis ikke, så læs vores artikel om gode lydoptagelser her.
Med de rigtige programmer forløber transskriptionen mere smidigt, og man sparer tid. Man kan vælge at købe et program, der er udviklet med transskription for øje, eller bruge de programmer, man i forvejen har liggende på sin maskine.
2.1 Betalingsprogrammer til transskription
Arbejder man professionelt med transskribering, bør man overveje at købe et program til at understøtte transskriptionsprocessen.
Fordelen ved et program til transskribering er, at det typisk integrerer relevant funktionalitet i samme interface: afspiller, mulighed for at springe frem og tilbage i afspilningen, justering af afspilningshastighed, tekst-editor, automatisk indsættelse af tidskoder, genvejstaster med mere.
Programmerne minder på sin vis meget om hinanden, men selvfølgelig er der forskelle, både i udseende, funktionalitet og i pris.
Vi kan ikke her anbefale et program, for vi har ikke en dyb indsigt i de enkelte programmer, og forskellige transskribenter vil have forskellige præferencer. Men vi vil gerne anbefale dig at se nærmere på følgende programmer:
- Inqscribe
- Transcribe
- f4transkript (Windows) og f5transkript (Mac)
- Express Scribe
- Transcrivia
Programmerne kan typisk testes i en gratisversion med begrænset funktionalitet eller i en trial-version med en udløbsdato.
2.2 Gratis programmer til transskription
Med gratisprogrammer mener vi ikke programmer, der er udviklet med transskription for øje, men standardprogrammer, der kan bruges til at transskribere.
Man skal egentligt bare bruge en lydafspiller og et program til at skrive i.
Det er klart, at det forstyrrer transskriptions-flowet, når man ikke har funktionaliteten samlet i ét program, men for de fleste fungerer det dog fint, når begge programmer, afspilleren og tekstbehandlingsprogrammet, er åbne ved siden af hinanden på skærmen – alternativt: er åbne på hver sit digitale skrivebord, som man hurtigt kan swipe rundt mellem.
Man kan bruge en hvilken som helst teksteditor. Word er oplagt, men alle andre tekstbehandlingsprogrammer kan naturligvis også bruges, både klientbaserede- og cloudbaserede programmer.
Som afspiller anbefaler vi VLC Media Player. Programmet er et gratis program til afspilning af video- og lydfiler, og det fås til både Windows og Mac.
I forhold til transskribering har programmet nogle åbenlyse fordele:
- Det understøtter et væld af lyd- og videoformater
- Man kan indstille afspilningshastigheden
- Man kan "springe" frem og tilbage i lydfilen ved hjælp af genvejstaster, man selv definerer. Det kunne oplagt være piletasterne venstre og højre. Man kan tilmed manuelt indstille, hvor "langt" springet skal være.
Man kan selvfølgelig også bruge den lydafspiller, ens maskine er født med, altså Windows Media Player for Windows-maskiner eller Quick Time Player for Macs.
Gratis-programmer som Word og VLC er i sagens natur ikke udviklet til transskription, og derfor bør man overveje et betalingsprogram, hvis man skal udføre en mere detaljeret transskribering med krav om hyppige tidskoder og annotering af ikke-leksikalske elementer, fx grin og fyldord.
Jo flere koder, der skal indsættes i udskriften, desto større vil behovet være for et program med indbygget funktionalitet til at smidiggøre og automatisere kodningen fra tale til tekst.
"Maskinel transskription er både meget hurtigere og meget billigere end manuel transskription, men man får som sagt et produkt, der er meget begrænset og fejlbehæftet."
3. Automatisk transskribering
Flere og flere tjenester tilbyder automatisk transskribering. Automatisk transskribering udføres ikke manuelt af et menneske, men ja, automatisk af en maskine, der er trænet til at genkende talesprog og omsætte det til tekst.
Autotransskribering tilbydes af diverse onlinetjenester, men også programmer som Word har en tale-til-tekst-funktionalitet, ligesom flere af de store kommunikationsplatforme som Teams, Google Meet og Skype tilbyder brugerne funktionalitet til at optage og auto-transskribere de virtuelle samtaler.
Det kræver mange resurser at udvikle sprogteknologi, og her er talegenkendelse – altså tale-til-tekst-teknologi – ingen undtagelse. Det er dyrt maskineri, der skal til, og derfor har sprogteknologiske virksomheder fokuseret på at udvikle software til de store sprog.
Men med tiden vil flere og flere tjenester tilbyde automatisk transskription på dansk, og der er allerede i dag flere tilbud på markedet. Men kvaliteten lader meget tilbage at ønske. De maskinelt transskriberede udskrifter er ganske enkelt mangelfulde.
3.1 Hvordan virker auto-transskribering?
Automatisk transskribering er enkelt at bruge.
Man uploader sin lydfil til en tjeneste, der herefter analyserer lydoptagelsen og omsætter den til tekst. De fleste tjenester giver også mulighed for manuelt at bearbejde transskriptionen, fx at rette grammatiske fejl i udskriften og rette deciderede fejltransskriptioner af ord og sætninger.
Transskriberingen tager typisk den halve tid af lydoptagelsen længde. En optagelse på 100 minutter vil altså tage cirka 50 minutter at transskribere for maskinen. Tidsforbruget ved manuel transskribering vil typisk ligge på 500-600 minutter. Det er med andre ord mindst ti gange så hurtigt at maskintransskribere som at gøre det i hånden.
Hvad man "tjener" på tidsforbruget, må man til gengæld betale på kvaliteten. Maskinudskrifter er ufuldstændige, og de kræver et stort manuelt efterarbejde, der vil udligne forskellen i tidsforbruget.
3.2 Maskintransskription vs. manuel transskription
Du bør overveje maskintransskibering, hvis din lydoptagelse har en meget høj lydkvalitet, samtalen er meget stramt struktureret, og deltagerne taler meget tydeligt.
Kun meget få lydoptagelser har ovennævnte karakteristika. Derfor kan den maskinelle transskription på ingen måde erstatte den manuelle. Teknologien er ganske enkelt ikke moden endnu.
Skemaet herunder sammenfatter den maskinelle og manuelle transskriptions styrker.
Maskinel transskription | Manuel transskription | |
Hastighed | XXX | X |
Pris | XXX | X |
Genkendelse af dialekter og accenter | X | XXX |
Genkendelse af utydelige ord | X | XXX |
Præcision i ordgenkendelse generelt | XX | XXX |
Transskribere taleoverlap | X | XX |
Differentiere enslydende stemmer | X | XXX |
Transskribere fyldord ('hmmm', 'øhhh' m.m.) | X | XXX |
Transskribere grin, hosten med mere | – | XXX |
Sætte spørgsmålstegn, anførselstegn, kolon m.m. korrekt | – | XXX |
Genkende direkte tale | – | XXX |
Korrekt stavning, grammatik og tegnsætning | X | XXX |
3.3 Eksempel på maskintransskription
Hos Textservice har vi testet, hvordan automatisk transskribering klarer to uddrag af autentiske interviews, som vi har transskriberet manuelt for en kunde.
Vi har ikke søgt med lys og lygte efter de mest umulige optagelser for at udstille en tjenestes mangler. Nej, vi er helt bevidst gået efter optagelser, der i sproglig kompleksitet, artikulation og lydkvalitet repræsenterer et gennemsnit for de lydoptagelser, vi transskriberer manuelt.
Vi skal i denne artikel blot bringe et eksempel og i øvrigt henvise til hele testen her.
Herunder ses et eksempel på manuel transskription af et interview om salg af bøger på det færøske marked.
Interviewer: Altså det må virkelig være det, som sælger rigtig meget på færøsk, fordi det er hverken på dansk eller engelsk – de er ikke så brede der.
Respondent: Ja, nej, nej, altså det kan de jo ikke finde ud af.
Interviewer: Nej, nej det er jo klart.
Respondent: Så ja, ja, det er det. Det er færøske småbørnebøger og ja.
Interviewer: Men det er vel også vigtigt sådan, tænker jeg, at få kulturen op, det her med, at det er tilgængeligt på færøsk, altså at der er et udvalg, ikke altså?
Respondent: Ja, ja, og det er jo altid diskussionen, ikke altså? Da jeg var ung, der havde man danske regnebøger og alle de der forskellige ting, ikke?
Og herunder er den samme lydstump blevet automatisk transskriberet af en dominerende tjeneste i Danmark.
Ja, det havde været det, som sælger rigtig meget på færøsk. Det var jo hverken på dansk eller engelsk. Så prøvede det her mig alt igen. Det kan vi nu. Har du et? Ja, da er det fast, at småbørn dør. Og hvad så? Men det var også det vel også vigtigt som en ting. Alle folk kulturer nok. Det der er tilgængeligt på færøsk, altså at der er et udvalg. Ja altså det er jo altid diskussionen af sig. Da jeg er ung, havde man skal fremføre lidt forskelligt til højre. Så jeg kan kun tingene.
I maskintransskriptionen differentieres ikke mellem forskellige speakere, og udskriften er noget nær ulæselig. Det er en udskrift, der kræver massiv efterbearbejdning for at blive læsbar og bare nogenlunde loyal over for det talte forlæg.
Arbejdet kræver, at man går hele optagelsen igennem og retter i udskriften fra a til z.
3.4 Umoden sprogteknologi
Maskinel transskription er både meget hurtigere og meget billigere end manuel transskription, men man får som sagt et produkt, der er meget begrænset og fejlbehæftet.
Det samme gælder for andre former for sprogteknologiske resurser, fx maskinoversættelse, automatisk korrekturlæsning og forskellige læse- og skrivestøttende it-værktøjer. Teknologien findes, men produkterne er mangelfulde.
Automatisk talegenkendelse er også begrænset. Den beror på – ja, genkendelse af det talte ord, der omdannes til tekst ord for ord, men uden opmærksomhed på de mange andre lydfænomener, der indgår i en mundtlig kontekst, fx intonation, pauser, frasering, taletempo, fyldlyde, følelsesudtryk med videre.
Det er lydfænomener, der altid understøtter et menneskes forståelse og fortolkning af talesprog.
En maskine genkender KUN ord, der indgår i dens ordbog. Den kan IKKE fortolke og ræsonnere sig frem til den rette afkodning af et ord, der fx udtales utydeligt. Maskinen kan heller ikke gætte kvalificeret på baggrund af den sproglige kontekst, et utydeligt ord indgår i. Det ville kræve en intuitiv syntaktisk forståelse, som kun et menneske besidder.
I den forstand er en maskine uintelligent.
Et transskribent derimod inkluderer alle talesprogets facetter, herunder ordenes umiddelbare sproglige kontekst, når han/hun transskriberer, og kan derfor gøre det med en præcision og rigtighed, som ingen maskine kan matche – i hvert fald de næste mange år, om nogensinde overhovedet.
Textservice
Textservice skaber værdi gennem professionel korrektur, oversættelse, transskribering og tekstforfatning.
Kontaktinfo
mail@textservice.dk
(+45) 93 90 89 33