Norske talespråkskorpus

Korpusene nedenfor er en samling av ulike norske delkorpus som er helt eller delvis utviklet ved Tekstlaboratoriet - enten av Tekstlaboratoriet alene eller i samarbeid med andre. Korpusene varierer fra å være ferdigutviklet til å være under planlegging.

	NoTa-Oslo Norsk talespråkskorpus-Oslo-delen	Kort info
	TAUS Talemålsundersøkelsen i Oslo	Kort info
	BigBrother	Kort info
	Nordisk dialektkorpus - Scandinavian Dialect Corpus	Kort info
	UPUS Utviklingsprosesser i urbane språkmiljøer	Kort info

NoTa-Oslo [Norsk talespråkskorpus-Oslo-delen] Talemål fra Oslo og Oslo-området 2005 [Hjemmeside] [Søk]
- Ortografisk transkribert korpus med lenker til video- og lydfiler. Korpuset er også grammatisk tagget
- Informantene er representative mht. sosiolingvistiske variabler som kjønn, alder, utdannelse og bosted
- Tidspunkt for opptak: 2005
- Opptakssted: Oslo og kommunene omkring Oslo
- Antall informanter: 166
- Antall ord: 900 000
- Type materiale: Intervjuer og samtaler
- Status for prosjektet: noe arbeid på grensesnittet gjenstår samt litt korrekturlesing av transkripsjoner

TAUS [Talemålsundersøkelsen i Oslo] Talemål fra Oslo fra 1970-tallet [Hjemmeside] [Søk]
- Fonologisk transkribert korpus med lydfiler som ikke er lenket til transkripsjonene. Korpuset er også grammatisk tagget
- Ortografisk transkribert med lenke til lydfiler i 2006 - 2007
- Informantene er representative mht. sosiolingvistiske variabler som kjønn, alder, utdannelse og bosted
- Tidspunkt for opptak: 1970 - 1975
- Opptakssted: Oslo (Frogner og Vålerenga)
- Antall informanter: 59
- Antall ord: ca 212 000
- Type materiale: Intervjuer
- Status for prosjektet: ferdig, men koplingen mellom fonologisk transkribert korpus og ortografisk transkribert korpus er foreløpig ikke søkbar.

Big Brother [TV-show] Talemål fra unge voksne[Hjemmeside] [Søk]
- Ortografisk transkribert korpus delvis lenket til lyd- og videofiler
- Informantene er 10 unge voksne fra flere ulike steder i Norge
- Tidspunkt for opptak: 2001
- Opptakssted: Oslo
- Antall informanter: 10
- Antall ord: ca 550 000
- Type materiale: mange ulike situasjoner i BigBrother-huset
- Status for prosjektet: de siste episodene transkriberes sommeren 2008. Ferdigstilles med nytt grensesnitt i løpet av høsten.

Nordisk dialektkorpus - Scandinavian Dialect Corpus [Hjemmeside] [Søk]
- 2007 - 2008: Tekstlaboratoriet utvikler første del av et korpus og en talespråksdatabase for nordiske dialekter. Vi samler også inn materiale til et norsk dialektkorpus fra ca 50 målepunkter (dvs ca 200 informanter) rundt omkring i Norge. Innsamlingen skjer i samarbeid med våre partnere ved UiT og NTNU.

2008 - 2009: Den norske delen av dialektkorpuset utvides med 25 målepunkter.

Det norske dialektkorpuset vil bestå av intervjuer og samtaler som skal transkriberes og kobles sammen med tilsvarende lyd- og videoopptak. Det vil også bli brukt spørreskjemaer som skal kartlegge ulike syntaktiske forhold i informantenes talemål. Korpuset vil dessuten bestå av eldre transkripsjoner og opptak, for eksempel fra Målførearkivet ved ILN, dels i samarbeid med NO2014. De øvrige nordiske dataene vil leveres av våre samarbeidspartnere i ScanDiaSyn.

Nordisk dialektkorpus og database utvikles i samarbeid med våre partnere i det nordiske nettverket ScanDiaSyn og det nordiske senteret for fremragende forskning, NORMS. Korpuset og databasen vil bli allment tilgjengelig for forskning, og vil være et viktig verktøy for språkforskere nasjonalt og internasjonalt. Den norske delen av dialektkorpuset vil kunne utgjøre en del av en framtidig norsk språkbank.

UPUS [Utviklingsprosesser i urbane språkmiljøer] [Hjemmeside] [Søk]
- Korpus under utvikling ved UPUS-prosjektet ledet av Brit Mæhlum, INL, NTNU

Søkemuligheter i korpusene
De transkriberte korpusene er søkbare og til dels grammatisk tagget. Resultatene av søk blir presentert som konkordanser med påfølgende klikkbare video- og/eller lydfiler. Korpusene er søkbare via ord, deler av ord, grammatiske tagger og ulike typer hendelser (latter, hosting osv).

Fordi korpusene er representert både ved transkripsjon, annen annotasjon, video- og lydfiler, kan de være svært nyttige for mange typer av lingvistisk forskning: syntaks, morfologi, fonologi, fonetikk, semantikk, leksikografi, språkteknologi og datalingvistikk, diskursanalyse, sosiolingvistikk osv. Fordi korpusene har blitt tatt opp i forskjellige talestiusjoner med forskjellige typer mennesker, vil korpusene også være nyttige for flere typer forskning, f.eks. forskning i kunstig intelligens, psykologi og sosiologi.

Tillatelse til å bruke korpusene
Kontakt Tekstlaboratoriet for å få tillatelse til å bruke korpusene. Normalt vil du få tilgang i løpet av 24 timer. Enhver person som ønsker å bruke korpusene til forskning, kan få tillatelse til å bruke dem.

NoTa-Oslo i pressen

Avis:

– Mer -a? Jo'a... (Ullern Avis Akersposten 17. april 2008)
Språklig samling i Oslo (Kommentar i Aften 26. mars 2008. Les papirutgaven)
Oslo-språket smelter sammen (Dagsavisen 25. mars 2008. Les papirutgaven eller nettutgaven)
"Korleis snakkar folk i hovudstaden? 900 000 Oslo-ord klare til å forskast på" (Apollon nr. 1 2008)
"Hun dama der ..." på fremmarsj (Aften 3. april 2007. Se hovedsideoppslaget og artikkelen)
Jakter på hverdagsspråket (Aftenposten 1. nov. 2005)
Jakter på hverdagsspråket (Notiser i Framtid i Nord , Bladet Tromsø , Troms Folkeblad og Harstad Tidende 31. okt. 2005)
Oslo kan miste språket (Aftenposten 29. okt. 2005)
"Bannan" på vei ut (Om NoTa-prosjektet i Aftenposten Aften 10. mai 2005)
Gjøre eller gjørra? (Akers Avis Groruddalen fredag 6. mai 2005)

Radio og TV:

Janne Bondi Johannessen snakker om NoTa ii NRK Østlandssendinga 4. november 2008 (Hør innslaget)
Østkant på begge sider av Akerselva (Janne Bondi Johannessen i NRK Østlandssendingen 10. april 2008. Les omtalen og hør innslaget)
Om språk i Oslo (Janne Bondi Johannessen i NRK P2 Radioselskapet 3. april 2008. Hør innslaget)
Om Språk i Oslo (Janne Bondi Johannessen i That Mina Show fredag 28.03 2008. Hør innslaget)
Om forskningspolitikk (Janne Bondi Johannessen i NRK P2 Kulturnytt 26. mars 2008. Hør innslaget)
Om språk i Oslo (Janne Bondi Johannessen i NRK P2 Kulturnytt 25. mars 2008. Hør innslaget)
Om språk i Oslo (Janne Bondi Johannessen i NRK P2 Dagsnytt 18, 25. mars 2008. Hør innslaget)
Om språket i rocketekster (Janne Bondi Johannessen i NRK Nitimen 13. mars 2008. Hør innslaget)
Om språket i rocketekster - og litt om boka Språk i Oslo (Janne Bondi Johannessen i NRK Frokost-TV 13. mars 2008. Hør innslaget)
Om boka Språk i Oslo (Janne Bondi Johannessen i Lang lunsj i NRK Østlandssendingen 10. mars 2008. Hør innslaget)
Om rockekviss på Åpen dag (Janne Bondi Johannessen i NRK Østlandssendingen 6. mars 2008. Hør innslaget)
Gått Norsk (Janne Bondi Johannessen analyserer språket i tekstene til tre Oslo-band. Radio Tango nov. og des. 2007. Les omtalen og hør innslagene om: Joachim "Jokke" Nielsen og Michael Krohn fra Raga Rockers. (NB: Musikken i innslagene er redigert bort pga rettighetsproblematikk)
Slang i Oslo og i NoTa-materialet (Bente Ailin Svendsen i NRK Østlandssendingen 10. april 2007. Hør innslaget)
Om Oslo-språket ( TVNorge , Oslo-TV 2. mai 2006. Les omtalen )
Om demonstrativene "han" og "hun" (NRK Språkteigen 12. mars. 2006. Hør innslaget )
Sammenlikning av to taleprøver fra TAUS og NoTa ved Unn Røyneland (NRK Språkteigen 15. jan. 2006. Hør innslaget )
Mer fra NoTa (NRK Språkteigen 6. jan. 2006. Hør innslaget )
Om NoTa-prosjektet (NRK Språkteigen 18. des. 2005. Hør innslaget )
Oslo-dialekter viskes ut (NRK Østlandssendingen 31. okt. 2005. Hør innslaget )
Oslo-dialekter viskes ut (NRK Kulturnytt 31. okt. 2005. Les omtalen , hør innslaget )
Om talemål - og grammatikk ( NRK P1 Norgesglasset , 11.mai 2005)

Publikasjoner på Internett:

Enogseksti eller sekstien (forskning.no 4. august 2008)
Tekstlab med rockekviss på Åpen dag (ILNytt nr. 65 - 14. mars 2008)
Oslospråket blir likere (forskning.no 14. mars 2008)
Vellykket Åpen dag-arrangement (HF-aktuelt 12. mars 2008)
Jakter på hverdagsspråket ( forskning.no 31. okt. 2005)

NoTa-seminaret i pressen

Les dette - for faen (iOslo.no 6. des. 2006)
Gult kort mot banning (Aften 5. des. 2006)
Banning ikke stygt lenger (Norgesglasset NRK P1 5. des. 2006. Les omtalen)
Om banning (Radioselskapet NRK P2 5. des. 2006)
Om banning (Kanal 24 4. des. 2006)
- «Faen» ikke stygt lenger (Aften 4. des. 2006. Se nettutgaven, eller hovedsideoppslaget og artikkelen i papirversjonen)
Om uttalen av Oslo og ungdomsspråk (Hanne Gram Simonsen i God morgen Norge, TV2 30. nov. 2006. Se opptaket på web-TV, hør innslaget)
Oslo eller Oschlo? (Hanne Gram Simonsen i NRK Østlandssendingen 28. nov. 2006. Hør innslaget)
«Oschlo» godtas (Aften 28. nov. 2006, se nettutgaven, eller hovedsideoppslaget og artikkelen i papirversjonen)
Oslo eller Oschlo? (Aften 27. nov. 2006, se nettutgaven, eller hovedsideoppslaget og artikkelen i papirversjonen)
Guttene CHILLERN - Jentene får LÆTTIS (Aften 23. nov. 2006, se nettutgaven, eller hovedsideoppslaget og artikkelen i papirversjonen)
Det er stor forskjell på "han kelneren" og "den kelneren"/"Ikke sant"? (Janne Bondi Johannessen og Jan Svennevig i Lang lunsj i NRK Østlandssendingen 20. nov. 2006. Hør innslaget)
Ikke sant? (Aften 16. nov. 2006, se hovedsideoppslaget og artikkelen i papirversjonen)

Big Brother-korpuset i pressen

Avis:

Forsker på språket i "Big Brother" (Aftenposten 20. september 2001)
Forsker på Big Brother (Uniforum 20. september 2001)

Radio og TV

Om talespråkskorpus, spesielt Big Brother (Kanal24, Rett hjem, 3. nov. 2005. Hør innslaget )
Big Brother-korpuset (NRK1 TV, Typisk norsk, 31. mars 2005. Les omtalen , se sendingen )
Om Big Brother (NRK Petre, Pullover, 1. november 2001)
Om Big Brother NRK P2, Språkteigen , 8. november 2001)

UPUS-prosjektet i pressen

Se under prosjektets hjemmeside her.

ScanDiaSyn i pressen