Planlagt prosjekt 2: Et talespråkskorpus for norsk


 

Det har lenge vært et uttalt mål å få utarbeidet et større talespråkskorpus for norsk. Det bør inneholde større mengder fra hoveddialektområdene, og bør være søkbart i et enkelt grensesnitt. Samtidig bør det være mulig på en enkel måte å gå fra det transkriberte materialet til lydversjonen av korpuset. Ved UiB er det gjort lovende forsøk med mindre tekstmengder under et piloprosjekt ledet av Gjert Kristoffersen. Nå vil vi i samarbeid søke om penger til et større prosjekt som også vil involvere Universitetet i Oslo, og som ikke minst vil inneholde dialektområdet på det sentrale Østlandet. Nytten av et slikt korpus er vel opplagt for de fleste: Vi vet faktisk ikke så veldig mye om hvordan talespråket egentlig er, hverken grammatisk eller på andre måter, til tross for at det er talespråket som er det "egentlige" språket i bruk. Foreløpig er prosjektet på planleggingsstadiet. Sentrale i arbeidet ved UiO er så langt Hanne Gram Simonsen (ILF) og undertegnede (Tekstlaboratoriet), men vi regner med å utvide samarbeidet til andre institutter også. For øvrig vises det til artikkelen om NorFa-nettverket om talespråkskorpus et annet sted i bulletinen.

Janne Bondi Johannessen

 


[Neste | Inhold | Tekstlab | HF]


2. mai 2001, AN, <anders.noklestad@ilf.uio.no>