Nordisk dialektkorpus og database

Innsamling av materiale til dialektkorpuset.

I forbindelse med at Tekstlaboratoriet er aktive samarbeidspartnere i det store nordiske nettverket ScanDiaSyn (Scandianavian Dialect Syntax) og senteret Nordic Centre of Excellence in Microcomparative Syntax (NORMS, finansiert av NOS-HS), har vi fått en stor oppgave. Våre nordiske kolleger har ønsket at vi utvikler et felles nordisk dialektkorpus med en felles database.

Med "nordisk" mener vi de nordiske språkene som har et felles utgangspunkt i det nordgermanske indoeuropeiske fellesspråket, altså de øynordiske språkene islandsk og færøysk og de fastlandsnordiske språkene norsk, svensk (i Sverige og Finland) og dansk. (Forvirrende nok kalles de nordiske språkene ”Scandinavian” på engelsk, men det får ikke affisere oss.)

Det er kanskje ikke alle våre lesere som har tenkt over det, men faktisk er ikke vårt språk så lite når man regner alle de nordiske språkene som varianter av ett språk. Det er nesten 20 millioner talere, noe som faktisk gjør språket vårt ganske stort i verdenssammenheng.

Korpuset bygges opp ved at vi gjør opptak av informanter som snakker først med en intervjuer, og siden med en annen informant. Opptakene, som helst består av både lyd og video, blir transkribert og automatisk tagget med ordklasse og andre grammatiske trekk. Siden blir alt sammen søkbart og klart for videre etterbehandling i vårt generelle korpussøkesystem Glossa. Der kan man søke på all slags kombinasjoner, for eksempel:

• Vis meg bruken av ordet ingen for alle informanter som er bosatt i Sverige og Norge.

• Gi meg alle tilfeller av spørreord med substantiv etter, uansett hvilket skandinavisk språk som er brukt.

Vi lager også en database som innholder informantenes reaksjoner på ulike typer av setninger i et spørreskjema. Denne typen data gir forskere muligheten til å finne dialekttrekk som ikke nødvendigvis finnes i vanlig spontantale.

Les mer om hvordan vi samler inn dialektopptak her.

 

Finansiering av dialektkorpuset og databasen

    På Beinisvørð på Færøyene (Foto: Gunnar Hrafn     Hrafnbjargarson)

Veien til finansiering av dette store forskningsverktøyet har vært tung og er fortsatt lang og mangslungen. Men vi vil rose vårt eget Humanistiske fakultet og UiO, som har forstått viktigheten av dette arbeidet. De har støttet teknisk utvikling, samt innsamling og bearbeiding av norsk materiale, slik at vi nå har sikret finansiering av tre firedeler av korpuset. Innsamling av materiale i de andre landene er finansiert av landenes nasjonale forskningsråd. Norges forskningsråd har dessverre ikke sett seg i stand til å støtte oss så langt. Derimot har vi i tillegg til midlene fra HF og UiO fått noe infrastrukturstøtte fra Nordforsk, i tillegg til at både Nordforsk og NOS-HS har støttet det nordiske samarbeidet med postdok-stillinger og reise- og møtemidler.

Gjesteforelesere og gjesteforskere i skandinavisk dialektforskning
I året som gikk har vi hatt besøk av tre NORMS-postdokstipendiater her i Oslo:  australske Tania Strahan, som er i Reykjavik, vår hjemlige Pål Eriksen, som nå er i Helsingfors, og tyske Eva Engels, som er gjesteforsker her ved UiO i til sammen halvannet år. (Se egen sak her.)  Polske Piotr Garbacz var her her i to måneder (på besøk fra Lunds universitet) i vår for å transkribere den svenske, svært særegne dialekten älvdalsk, som han også skriver doktoravhandling om. Nå er han tilbake for ytterligere to måneder, for å tagge dette materialet grammatisk, samt skrive en artikkel sammen med Janne. I tillegg har vi besøk av Petra Eliasen, som skal transkribere færøysk materiale.

Reiser og nettverksmøter i ScanDiaSyn og NORMS
I forbindelse med dialektsamarbeidet arrangeres det dialektdugnad minst én gang årlig, finansiert av ScanDiaSyn og NORMS. Sommerens dialektdugnad var på Færøyene.

JBJ