Transkripsjonsveiledning


- Skrevet av Janne Bondi Johannesen. I stor grad bygd på Transkripsjonsveiledningen til Gjert Kristoffersen og Ann-Kristin Molde, UiB, og har elementer fra transkripsjonssystemet til Du Bois et al, University of California, Santa Barbara.
- Oppdatert oktober 2001 av Pål Kristian Eriksen
- Oppdatert mars 2002 av Lars Nygaard
- Oppdatert august 2002 av Lars Nygaard

1. Introduksjon


1.1 Formålet med et talemålskorpus

For at man skal kunne forske på norsk språk, er det viktig å ha et godt datagrunnlag. Det er upraktisk og tidkrevende å lage spørreskjemaer og andre typer undersøkelser hver gang man er interessert i å finne ut noe bestemt om et særtrekk ved språket. Derfor er det en utpreget fordel å ha store datamengder lagret elektronisk, slik at de lett kan søkes i - såkalte tekstkorpus. For slike korpus har vi i dag gode søkesystemer og gode systemer for grammatisk merking (tagging). Vi har også skriftspråkskorpus av en viss størrelse, men for talemål har vi knapt noe. Skal man studere lydlige forhold, er selvsagt et talemålskorpus det eneste som nytter, men det er grunn til å tro at talespråket ofte skiller seg fra skriftspråket også på andre plan. Vi ønsker derfor å lage et talespråkskorpus for ikke bare lydlig (fonetisk-fonologisk) analyse, men også for morfologisk, syntaktisk og leksikalsk analyse. Dessuten vil vi at det skal være mulig å studere språklig samhandling (dialog) gjennom korpuset (se f.eks. Svennevig, Sandvik og Vagle 1995). Av sistnevnte grunn tar vi med flere utenom-språklige opplysinger enn Kristoffersen og Molde har gjort - vi inkluderer en del informasjon i tråd med Santa Barbara-transkripsjonen, som er velkjent og mye brukt internasjonalt.

I første rekke vil talespråkskorpuset kun inneholde BigBrother-opptak, men vi håper å utvide repertoaret senere, med opptak fra naturlige situasjoner, og med flere variabler representert, som alder, utdannelse, status og geografisk tilhørighet.

1.2. Hvorfor transkripsjon?
Hensikten med å transkribere innspilt og digitalisert tale er at transkripsjonen i neste omgang kan danne grunnlaget for å lage et raskt og effektivt søkeverktøy som kan identifisere alle eller en vesentlig del av de passasjer i lydmaterialet som inneholder realisasjoner av ett eller flere fonologiske, morfologiske, leksikalske, syntaktiske eller pragmatiske trekk som en ønsker å granske. Den transkriberte teksten vil derved få to funksjoner. Det vil inneholde opplysninger om strukturen i det innspilte materialet, og den vil gjøre det mulig å søke i materialet.

Formålet med transkripsjonen er med andre ord å skape en struktur som består av to sammenkoblete elementer: et talemålsmateriale i form av en innspilling (på lydband eller digitalisert) og en søkbar tekst i form av en transkripsjon av denne innspillingen.

Transkripsjonene må inneholde tilstrekkelig fonologisk og morfologisk informasjon til at en raskt og effektivt kan identifisere alle passasjer i lydmaterialet som inneholder realisasjoner av det trekket en ønsker å granske.

1.3. Ortografisk transkripsjon
Når en har villet overføre innspilt tale til skrift for å gjøre den mer tilgjengelig for vitenskapelig analyse, har det vært vanlig å bruke fonetisk transkripsjon. I forhold til analyse av fonologiske og morfologiske fenomener i teksten, har dette imidlertid klare begrensninger. I tillegg til at fonetisk og fonemisk transkripsjon er tidkrevende, og derved kostbar, er det ikke mulig å lese ut grammatisk informasjon av den, og det er i tillegg en del fonologisk informasjon som kan gå tapt. Transkripsjonen av materialet skal derfor være ortografisk. En ortografisk tekst kan for det første gjøres til gjenstand for automatisk, morfologisk analyse, såkalt tagging. I tillegg kan svært mye segmentalfonologisk struktur avledes fra en ortografisk representasjon. Men for at en i forskningsøyemed skal få maksimalt utbytte av transkripsjonene, må det da legges en del tilleggsbegrensninger på dem som normalt ikke gjelder i vanlig ortografi. Transkripsjonene vil derfor skille seg fra vanlige tekster på enkelte punkter.

Det er disse spesifikasjonene som vi har forsøkt å legge inn i reglene. Det vil likevel sikkert oppstå situasjoner der den som transkriberer vil ha behov for å avvike noe fra reglene, eller legge inn tilleggskonvensjoner. Men skal transkripsjonene få maksimal nytte, bør avvik bare gjøres når det føles strengt nødvendig, og de må aldri gjøres på en måte som gjør at det som da vil skille transkripsjonene fra andre transkripsjoner, ikke lar seg identifisere ved enkle, automatiske søk i teksten.

En ortografisk transkripsjon kan ses på som en middelvei mellom en fonetisk transkripsjon og en oversettelse av et innhold fra tale til skrift. Mens fonetikerens oppgave er å skrive ned de lydene han/ hun faktisk hører uavhengig av hvordan de fungerer som en del av språksystemet, og hvilken betydning de har, så vil en oversettelse styres av innholdet. Når innholdet i en talt tekst skal omformes til en skrevet tekst, kan forskjellen mellom den muntlige teksten som ligger til grunn for oversettelsen, og en opplesning av den skrevne teksten som er resultatet av oversettelsen, bli stor dersom både kravet til rett gjengivelse av innholdet og kravet om formell språkriktighet skal overholdes.

Den type transkripsjon det her dreier seg om, er verken en fonetisk transkripsjon eller en omformulering av informantens talemål til en typisk skriftmålsstil. Transkripsjonen skal gjengi informantens tale så godt det lar seg gjøre innenfor det skriftnormalen tillater. Den skal med andre ord være et best mulig kompromiss mellom krav om nøyaktig gjengivelse av det talte, og skriftmålets normer.


2. Reglene

2.1 Om disse reglene

For at det skal kunne fungere som et slikt søkeredskap, må de som skal bruke det, kunne være sikre på at teksten tilfredsstiller bestemte spesifikasjoner, som er de samme fra tekst til tekst. Enda viktigere blir dette dersom tekster transkribert av ulike personer skal bygges sammen til større korpus.

2.2 Utvalg:

Følgende skal ikke med:
- monologer deltakerne har i "BigBrother"-rommet
- Live-sendingene der deltakerne snakker med programlederen
- scener hvor det er så mye lyd , for eksempel musikk, sang, alle skravler samtidig, at det nesten er umulig å høre hva enkeltpersoner sier.
- scener der det ikke er noen dialog, kun enkeltord/utbrudd (for eksempel ballspill).

2.3 Markering av ekstrainformasjon:

All slags ekstrainformasjon som skal angis i tekstene, må gis i spissklammer. Tre typer informasjon skal gis angis med spissklammer:
1) informasjon om mer enn ett ord: <utenlandsk> We are the world </utenlandsk> (=det som omsluttes av klammene, inneholder et utenlandsk uttrykk)
2) informasjon om ett enkelt ord, eller som utgjør en selvstendig informasjonsenhet uavhengig av ord: Yes <utenlandsk>.
3) Informasjon som står uavhengig av ord: <lyd: hoster> (=lyden av hosting).
Det skal alltid være mellomrom før og etter spissparentesene.


Det er ikke meningen at teksten skal ikke leses alene (altså uten lyd og bilde), så det er ikke nødvendig å ta med "teateraktig" tekst ("snur seg", "går ut", "i stuen" og så videre).

2.4 Språkform

Transkripsjonen skal gjengi informantens tale så godt det lar seg gjøre innenfor det skriftnormalen tillater. Den skal med andre ord være et best mulig kompromiss mellom krav om nøyaktig gjengivelse av det talte, og skriftmålets normer.

Dersom et system som det som presenteres nedenfor overhodet skal ha noen hensikt, må reglene følges, selv om resultatet i enkelte tilfeller skulle stride mot språkfølelse eller det du ellers har lært om hvordan en tekst skal utformes. Husk at resultatet ikke først og fremst skal bli en mest mulig lesbar tekst, men et teknisk søkeredskap i forhold til de digitaliserte innspillingene de er transkripsjoner av.

Man overser instinktivt gjentagelser og grammatisk inkonsekvens i tale, og det krever litt trening å "undertrykke" den impulsen og høre hva informantene faktisk sier. 2.4.1 Norm: Ortografi
Vi skal transkribere med bokmål, og følge Bokmålsordboka (http://www.dokpro.uio.no/ordboksoek.html), med hensyn til både hovedformer og sideformer. Det er altså ikke lov til å skrive "sne", men det er lov å skrive "mjølken", "åssen" og "trur"). Velg alltid den formen som ligger tettest opp til det originalt uttalte ordet, brukfor eksempel a-endelser der det sies.

Når et ord er avbrutt, skal de delene som er uttalt allikevel gjengis i ortografi. Da markerer du det ved hjelp av en bindestrek (-), som skrives uten mellomrom rett etter den siste bokstaven, for eksempel han viss- eller han s-. Det avbrutte ordet skal ikke skrives mer ortofont enn det ville blitt skrevet dersom det ikke hadde blitt avbrutt. Du skal derfor ikke skrive vo-, vo-, hvordan, men hvo-, hvo-, hvordan.

Følg ellers vanlig konvensjoner for norsk. For eksempel skrives tall til og med ti med bokstaver, fra og med 11, med tall.

2.4.2 Norm: Syntaks
De syntaktiske reglene for bokmål tas ikke hensyn til. Ordene skal skrives ned i den orden de blir uttalt:
Ramsy: Hva du sa, jeg skulle skylle ferdig før du pussa det?

2.4.3 Norm: Tegnsetting
Spørsmålstegn og utropstegn brukes som vanlig, semikolon og kolon brukes ikke.

Komma og punktum brukes for å markere pause, der det er grammatisk mulig. Ellers brukes -taggen for å markere opphold (jfr. 2.5.3).

Altså: Monica: Jeg, jeg <pause> tok meg en bolle.

Man følger ikke kommareglene. For eksempel skal det bare være komma foran men hvis det er en pause der. Et annet eksempel: hvis det ikke er noen pauser skriver vi Ja nei ikke jeg , selv om det i skriftspråk skulle stått "Ja, nei, ikke jeg. "

Tegnsetting er ofte svært vanskelig å avgjøre. Man kan trøste seg med at det ikke er det aller viktigste.

2.4.4 Markering av normbrudd: dialekt
Vi er også interessert i uttale, ordbruk og ordvalg som avviker fra ordboksnormalen. Disse avvikene vil vi gjerne ha med, og da i spiss-klammer etter ordet i sin vanlige ortografiske form. For å eksemplifisere: Dersom en deltager bruker et ord som oppafør i stedenfor ovenfor:
Randi: Jeg skulle dra til huset ovenfor <variant: oppafør> veien, for å hente avisa, da jeg så noen kjekke gutter <variant: guttær> nedpå veien.

Dersom flere ord til sammen har en unormert variant, og det er velkjent hvilke ord dette er, er det greit å bare avmerke det etter siste ord. For eksempel:
Per: Nei da, det har ikke <variant: hakke> noe å si.Unntak:
- Systematiske avvik mellom tale og : at "jeg" uttales "jei",
- systematiske normavvik: for eksempel at noen av deltakerne ikke bruker "kj"-lyden (sier "sjærlihet" "sjole" osv.) - For Anne Mona og Ramsy skal vi ikke nedtegne avvik fra normen, siden deres dialekter avviker kraftig fra begge de norske målformene. Deres replikker skal kun gjengis med de bokmålsformene som ligger tettest opp til det originalt sagte. Men særegne leksemer skal gjengis direkte med skrift, men skal markeres med den påfølgende spissklammekoden <dialekt>. (For eksempel når Anne Mona bruker adjektivet "nøden").

2.4.5 Markering av normbrudd: utenlandsk
Dersom det utenlandske uttrykket derimot er brukt i en ellers norsk dialog som et alternativ til norsk tale, skal ordet eller uttrykket avmerkes slik:
Randi: Yes <utenlandsk>. Dette er <utenlandsk> just bullshit </utenlandsk>.

Markeres ikke som utenlandsk:
- terminologi: Utenlandske uttrykk som betegner en term (slik som musikkgenre): PM: Kan noen sette på litt hip hop?
- titler: merkes vi i anførselstegn: Randi: Jeg elsker "Blow with the whistle".

2.5. Annen informasjon

2.5.1 Overlappende passasjer:
Når to av talerne snakker i munnen på hverandre, skal de overlappende passasjene markeres med firkantklammer, som igjen omsluttes av spissklammer (se eksemplene nedenfor). Dersom en annen person bekrefter med et kort, overlappende "ja" eller lignende, mens den første taleren fortsetter å snakke, skal alt den første taleren sier, stå i samme replikk:
Anne: Har dere sett noen gode filmer i det siste?
Randi: Nei, jeg har ikke det. Jo, jeg så da en film på lørdag, hva var det <[> ... <]1> den het? Ja, Grease, ja.
Anne: <[> Grease. <]1>

Spissklammene alltid settes med mellomrom rundt. Sekvenser indekseres, sånn at flere overlappinger er mulig.

Overlappende kommentarer kan forekomme både i en pause hos den første taleren, og samtidig med med ord og uttrykk hos den første taleren. Uansett markeres det bare stedet den overlappende kommentaren begynner.

2.5.2 Lyder
Ikke-språklige lyder som latter, hosting og lignende som er del av en ytring, skal være med i transkripsjonen. Et ukontrollert host skal altså ikke være med, men et host som markerer uenighet skal med. Ta også med bekreftende "mm", sprørrende "hm?" og de nølende "eh"- og "øh"-lydene.
Lyder skal spesifiseres spesielt i spissklammer: <lyd: hoster>, <lyd: gjesper>, <lyd: gledesskrik>, etc..

Ikke-språklige lyder som går sammen med en replikk (f.eks. lattermild stemme, gjespende stemme, etc., skal markeres i omsluttende spissklammer:
Jens: <gjespende stemme> Syns ikke jeg. </gjespende stemme>

Latter markeres med alfakrøller. Som en tommelfingerregel skal antallet alfakrøller gjenspeile styrke og lengde på latteren - jo flere, jo sterkere og lengre.
Randi: @@@ Du verden, for en spilloppmaker han er!
AM: <@> Hver jævla gang. Herregud! </@>

2.5.3 Pauser:
Pauser markeres med <pause>.
LJ: Har du har du drukket <variant: drikki> opp all rødspriten min?

<pause> betyr forskjellig lengde om det er inne i en setning, mellom setninger eller mellom replikker.

2.5.4. Trykk:
Trykk markeres bare der det har en kontrastiv og/eller emfatisk funksjon. Vanlig setningstrykk markeres altså ikke. Det gjøres med spissklammekoden <emfase> etter ordet:
Roy: Jammen, han er <emfase> gæren!

2.5.5 Sitater:
Sitater settes i anførselstegn. Dette gjelder også hypotetiske sitater:
Anne: Da kjørte jeg den: "Jeg? Hæ?" Da juger jeg.

2.5.6 Avbrutte setninger
Dersom en setning er avbrutt, og en annen taler overtar, for eksempel ved avbrytelse o.a., skal den avbrutte setninga avsluttes med tre punktum:
Rodney: Hold den kniven vekk fra...
LJ: Der fikk du den!

Men hvis en setning avbrytes, og samme taler fortsetter ved hjelp av en annen setning, skal de to setningene bare atskilles av et komma (så fremt det ikke er en merkbar pause mellom dem (se avsnittet om pauser)).
Anette: Du har drept, du har, du har drept ham!

Stor bokstav brukes på begynnelsen av hver replikk, selv om den innholdsmessig er en fortsettelse på en tidligere setning som ble avbrutt.

2.5.7 Passasjer som er vanskelige å forstå
Uforståelig: Skulle det, etter at du har lyttet både fonetisk (utfra hvilke lyder som er der), morfologisk (utfra hvilke ord det kan være), syntaktisk (utfra hvilke ord og former man kan forvente utfra syntaksen) og pragmatisk (hva det er sannsynlig at informanten kan ha sagt i den aktuelle situasjonen), fremdeles være lydkombinasjoner som du ikke klarer å forstå, markerer du området slik i transkripsjonen: <uforståelig>
Rodney: Men takk for at du <uforståelig>.

Uklart: Skulle det være passasjer som du tror du forstår, men som du ikke er sikker på, setter du <uklart> foran og </uklart> etter, for eksempel:
Randi: Han sa at <uklart> han visste </uklart> at de skulle komme.

Er du usikker på hvem det er som snakker, setter du et spørsmål etter navnet:
Randi?: Hei!

2.5.8 Replikkgrenser
Det er ikke alltid innlysende hvordan man skal dele inn i replikker. Det er ikke nødvendigvis *en* replikk bare fordi ingen snakker i mellomtiden, men det er ikke nødvendig å snakke om det samme, heller. Man må bruke språkfølelsen sin, og føle seg fram til hvem sin tur det er til å snakke.

3. Referanser

Du Bois, John, Stephan Schuetze-Coburn, Susanna Cumming, and Danae Paolino. 1993. Discourse Transcription. Santa Barbara
Working papers in Linguistics, Vol. 4.

Kristoffersen, Gjert og Ann-Kristin Molde. Norsk Talemålskorpus:
Transkripsjonsveiledning. (http://gandalf.hit.uib.no/vol/ntk/Transkripsjonsveiledning.htm)

Svennevig, Jan, Margareth Sandvik & Wenche Vagle. 1995.
Tilnærminger til tekst. Modeller for språklig tekstanalyse. Oslo: LNU/Cappelen Akademisk Forlag.

Bokmålsordboka og Nynorskordboka. (http://www.dokpro.uio.no/ordboksoek.html)