Informanter
Opptak
Transkripsjon
Prosjektinfo
Kontakt


Norsk talespråkskorpus - Oslodelen

NoTa-Oslo er et talespråkskorpus bestående at intervjuer og samtaler med 166 informanter født og oppvokst i Oslo og Oslo-området. Informantene er representative med hensyn til alder, kjønn, bosted og utdannelse. NoTa-Oslo består av drøyt 900 000 ord som er ortografisk transkribert og morfologisk tagget. Korpuset er søkbart i et spesialtilpasset søkegrensesnitt, og transkripsjonene er koblet sammen med lyd- og videofiler.

NoTa-Oslo er laget av Tekstlaboratoriet i perioden 2004 - 2006. Klikk på en av fanene ovenfor for å lese mer om prosjektet.
Korpuset er tilgjengelig for forskning. Ta kontakt med Tekstlaboratoriet dersom du ønsker å bruke korpuset.
MINI-DEMO HER
. (Både brukernavn og passord er "guest".)

 

Språk i Oslo - ny bok med forskning fra NoTa-korpuset:

Janne Bondi Johannessen og Kristin Hagen (red.):
Språk i Oslo. Ny forskning omkring talespråk.

Novus forlag 2008, Oslo. ISBN: 978-82-7099-471-7.
Les mer om boka her


Oslomålet et seminar med forskning fra NoTa-korpuset


Se seminarsiden med blant annet program, presseomtale og bilder fra seminaret her!

 

Referer til korpuset slik:

Norsk talespråkskorpus - Oslodelen, Tekstlaboratoriet, ILN, Universitetet i Oslo. http://www.tekstlab.uio.no/nota/oslo/index.html







 

Informantene i NoTa-Oslo


Oversikt over informantene
Utvalg av informanter
Utvalgsvariabler
Andre variabler
Personvern
Rekruttering av informanter
Informantbrosjyre
Informantmatrise (144 informanter)
Informantmatrise med antall ord per informant (166 informanter)


Oversikt over informantene

NoTa-Oslo består av 166 informanter. 144 av dem er med i utvalget som er representativt med hensyn til kjønn, alder, bosted og utdanning. Tabellene nedenfor viser informantene fordelt på de ulike variablene. Du kan også lese mer om de ulike variablene nedenfor.

Utvalgsvariabler:

Kjønn
Kvinne
Mann
Antall totalt i NoTa-Oslo
82
84
Antall i representativt utvalg
72
72

 

Alder
16 - 25
26 - 50
51 +
Antall totalt i NoTa-Oslo
62
55
49
Antall i representativt utvalg
48
48
48

 

Bosted (bodd lengst)
Oslo vest
Oslo rest
Antall totalt i NoTa-Oslo
84
82
Antall i representativt utvalg
72
72

 

Utdanning
Lav
Høy
Antall totalt i NoTa-Oslo
83
83
Antall i representativt utvalg
72
72

 

 

Andre variabler:

Oppvekststed
Oslo vest
Oslo rest
Antall totalt i NoTa-Oslo
88
78

 

(Nåværende) bosted
Oslo vest
Oslo rest
Antall totalt i NoTa-Oslo
86
80

 

Yrke
Håndverker og yrkesfag
Service
Kontor
Frie yrker
Undervisning/Forskning
Elev/student
Annen/ukjent
Antall totalt i NoTa-Oslo
25
22
31
6
13
60
9

 

Annengenerasjons innvandrer
Ja
Nei
Antall totalt i NoTa-Oslo
16
150
Antall i representativt utvalg
10
134

 

Relasjon til samtalepartner
Venner
Bekjente
Ukjente
Familie
Antall totalt i NoTa-Oslo
118
30
8
10
Antall i representativt utvalg
99
27
8
10

 

 

•  Utvalg av informanter

I følge NoTa-søknaden skulle det være to informantmoduler fra Oslo-området, det vil si 144 informanter. Tabellen nedenfor viser en slik informantmodul. Tallene i parentes er tallene fra søknaden som ble noe endret, se nedenfor.

 

NoTa-Oslo

NoTa-søknaden

Antall aldersgrupper:

3

3

Antall kjønn:

2

2

Antall utdannelsesbakgrunner:

2

3

Informanter pr. celle:

6

4
Samlet antall informanter pr modul:
72
72


Søknaden sa ingenting om hvor i Oslo-området informantene skulle komme fra. Vi kom fram til at en bosted-variabel er helt nødvendig for å få med viktig talemålsvariasjon i Oslo-området. Vi valgte derfor å ha en informantmodul fra Oslo vest og en modul fra Oslo resten av Oslo-området. En mer utfyllende beskrivelse av utvalgsvariablene alder, utdanning og bosted følger nedenfor. I tillegg til utvalgsvariablene registrerte vi informantens nåværende bosted, oppvekststed, yrke, om informanten var annengenerasjons innvandrer samt den relasjonen informanten hadde til den andre informanten han eller hun samtalte med.

Utvalgsvariabler:

- Alder
Vi delte informantene inn i tre aldersklasser: 16 25 , 26 50 og 51 +.

- Utdanning
I NoTa-søknaden var det satt opp tre utdanningsklasser. Vi valgte å redusere antallet til to: utdanning til og med videregående skole og utdanning utover videregående skole. Grunnen til dette er at det viste seg svært vanskelig å fylle opp for eksempel segmentet bare ungdomsskole/mann/2650 år/Oslo vest i informantmatrisen dersom vi opererte med en utdanningsklasse bare ungdomsskole. Tilsvarende viste det seg å være vanskelig å fylle opp et segment som mer enn fire års høyere utdanning/kvinne/50+/Oslo øst dersom vi hadde en utdanningsklasse mer enn fire års høyere utdanning .

Med de to utdanningsklassene vi endte opp med, har vi også funnet det nødvendig å presisere følgende:
•  For ungdom som ikke hadde begynt på noen utdanning ut over videregående skole ennå (aldersklassen 18 25 år), regnet vi et snitt av foreldrenes utdanning og egen planlagt utdanning.
•  For eldre over 70 år i aldersklassen 50+ telte vi handelsgymnasiet og examen artium som høyere utdanning. Grunnen til dette er at det for 50 år siden ikke var på langt nær så vanlig å ta høyere utdanning. Tok man examen artium eller handelsgymnasiet, var man likevel kvalifisert for jobber som i dag ville kreve høyskoleutdanning. Vi har regnet handelsskolen som videregående skole.

- Bosted: bodd lengst
Siden korpuset bare skulle ha 144 informanter, valgte vi å rekruttere informanter som alle hadde det til felles at de bodde eller arbeidet i Oslo og Akershus. Informantene kunne godt være født og oppvokst i andre kommuner omkring Oslo (definert som kommuner i pendleravstand til hovedstaden, for eksempel Drammen, Horten, Gran, Stange), men vi rekrutterte ikke aktivt informanter fra disse kommunene. Selv om dialektene i Oslo-området har mange fellestrekk, er de såpass forskjellige at det ville bli galt å oppsøke bare ett eller to dialektområder fra Oslo-området. Dersom vi skulle plukke bare noen informanter fra hvert område, ville det ikke være mange nok til at de kunne representere flere enn seg selv statistisk.

Det er vanlig å dele Oslo inn i to talemålsområder: Oslo øst og Oslo vest (jf. for eksempel TAUS-undersøkelsen). Denne inndelingen valgte vi å beholde. Når det gjelder Akershus, er det vanlig å operere med tre hovedregioner: Romerike i nord og øst, Follo i sørøst og Asker og Bærum i vest. Vi valgte å regne Akershus-kommunene Asker og Bærum til Oslo vest, de andre Akershus-kommunene til Oslo øst. Var informantene oppvokst i andre kommuner omkring Oslo, grupperte vi dem altså sammen med Oslo øst. Oslo øst-kategorien ble derfor omdøpt til Oslo øst og omland, forkortet Oslo rest.

Vi skulle ha like mange informanter fra Oslo vest som Oslo rest. Problemet var å få informantene til å passe inn i bare en av kategoriene. Mange er oppvokst i rest , men har flyttet til vest. Mange har flyttet fram og tilbake osv. Vi valgte å klassifisere informantene i Oslo vest- og Oslo rest-kategoriene på grunnlag av stedet der informantene hadde bodd lengst fra barneårene til i dag. For de yngste informantene vil dette oftest være oppvekststed, for de eldre vil det kanskje være bosted. I tillegg til har-bodd-lengst- variabelen registrerte vi oppvekststed og bosted på alle informantene. Begge variablene er søkbare. For oppvekststed regnet vi ungdomsårene (1218 år) som viktigst dersom det var vanskelig å avgjøre hvor informanten hadde bodd lengst.

Hver informant ble registrert med oppvekstkommune, bydel (for informanter fra Oslo) og sted. Deretter ble de klassifisert som vest eller rest på grunnlag av bostedskommune eller bydel. Informantene fra Oslo er registrert i henhold til den nye bydelsinndelingen fra 2004:

 

Østre bydeler:

Vestre bydeler:

Alna
Bjerke
Gamle Oslo
Grorud
Grünerløkka
Sagene
Stovner
Søndre Nordstrand
Østensjø

Frogner
Nordre Aker
Nordstrand
St. Hanshaugen
Ullern
Vestre Aker

 

 

 



Kart: Fra NRK Østlandssendingens nettsider: http://www.nrk.no/nyheter/distrikt/nrk_ostlandssendingen/2812734.html

Inndelingen i vest og rest ble gjort med utgangspunkt i kart fra Statistisk sentralbyrå. Kartet er fra 2001 og bruker den gamle bydelsinndelingen.

 

 

Kart: Samfunnsspeilet nr. 2/2001: http://www.ssb.no/samfunnsspeilet/utg/200102/Fig10-1.shtml
Oslo vest består av her av Ytre vest og Indre vest. Oslo rest er Indre øst, Nye drabantbyer og Gamle drabantbyer


Andre variabler

- Bosted: oppvekststed og nåværende bosted
Vi registrerte det stedet personen faktisk bodde på da opptaket fant sted. Dersom en informant nylig hadde flyttet, ble bosted regnet som det stedet informanten hadde bodd lengst.

- Yrke
Vi registrerte hvilket yrke informanten hadde, og klassifiserte det etter følgende oversikt:

1. Håndverker og yrkesfag (Eksempler: kokk, vaktmester, rørlegger, elektriker, fotograf)
2. Service (Eksempler: yrker innen helse- og sosialsektoren, hotell- og restaurant, sjåfør, vekter, tannlege)
3. Kontor (Eksempler: sekretær, saksbehandler)
4. Frie yrker (Eksempler: kunstner, journalist, fotograf)
5. Undervisning/forskning (Eksempler: lektor, professor, stipendiat)
6. Elev/student
7. Annen/ukjent

Yrkene ble forsøkt kategorisert i så få og brede kategorier som mulig slik at det skulle finnes informanter i alle kategoriene. Pensjonister ble registrert med det yrket de hadde da de var yrkesaktive (alderen vil vise at de er pensjonister). Kategorien Annen/ukjent ble brukt der vi ikke hadde fått oppgitt noe yrke, eller der yrket ikke passet inn i noen av de andre kategoriene.

- Annengenerasjons innvandrer
I Oslo-området utgjør innvandrere fra ikke-vestlige land en stor del av befolkningen. Det var derfor viktig å få med innvandrere i korpuset dersom de ellers tilfredsstilte kravene vi hadde til informanter, dvs. at de var født og oppvokst i Oslo-området. Vi mente det ville være rimelig at denne informantgruppen var representert i utvalget i omtrent samme grad som de i 2004 var representert i Oslos befolkning. Dette var imidlertid vanskelig å beregne nøyaktig siden Statistisk sentralbyrå operererer med andre aldersgrupperinger enn NoTa-Oslo. Dette er SSBs tall:

•  15 % av alle barn mellom 10 og 19 år i Oslo er annengenerasjons innvandrere
•  3,5 % av alle mellom 20 og 29 år i Oslo er annengenerasjons innvandrere
•  0,2 % av alle mellom 30 og 39 år Oslo er annengenerasjons innvandrere

Dersom de to første aldersgruppene blir slått sammen, finner vi at 8 % av Oslos innbyggere mellom 10 og 29 år er annen generasjons innvandrere. Dette er såpass mange at vi mente de burde være representert i vår aldersklasse 18 25 år. I de to eldre årsklassene fant vi det ikke rimelig å la annengenerasjonsgruppen være representert.

Vi valgte å plukke ut flest annengenerasjons innvandrere fra Oslo rest. Grunnen til dette er at det viser seg at innvandrere i Oslo stort sett velger å bosette seg i Oslo øst. Det vil si at de er en naturlig del av befolkningen i Oslo øst, men ikke en like naturlig del av befolkningen i Oslo vest. Tall fra Statistisk sentralbyrå viser at 26 % av innbyggerne i bydel Gamle Oslo har bakgrunn fra Asia, Afrika, Sør- og Mellom-Amerika og Tyrkia. Tallene for eksempelvis Grorud og Søndre Nordstrand er henholdsvis 26,6 % og 33 %. I Ullern, Nordre Aker og Vestre Aker er tallene 4,5 %, 5,6 % og 4,0 %.

- Relasjon til samtalepartner:
Vi registrerte hvilket forhold informantene hadde til hverandre:
- Informantene kjenner hverandre godt og omgås på fritiden (venner)
- Informantene kjenner hverandre mindre godt, de er for eksempel kolleger eller går på samme skole (bekjente)
- Informantene kjenner ikke hverandre i det hele tatt (ukjente)
- Informantene er i familie med hverandre, for eksempel ektepar, mor og datter, far og datter osv

• Personvern
Prosjektet NoTa-Oslo er meldt til Personvernombudet for forskning ved NSD, Norsk samfunnsvitenskapelig datatjeneste AS. Prosjektet skal opprettholde kontakten med NSD gjennom rapportering hvert tredje år.
Prosjektet har lagret lyd og bilde fra opptakene samt opplysninger om informantene (kjønn, alder, bosted og utdannelse osv). Lyd, bilde og transkripsjoner er passordbelagt og dermed ikke fritt tilgjengelig.

Ved opptak ble informantene registrert med navn, adresse og telefonnummer. Opplysningene ble registrert fordi vi ville ha muligheten til å kontakte informantene i løpet av prosjektperioden. Alle informanter var dessuten med i trekningen av tre reisegavekort. Alle navn adresser og telefonnummere ble slettet i mars 2006.

Alle informanter måtte skrive under følgende samtykkeerklæring:
Jeg har lest brosjyren om prosjektet Nota-Oslo (Et norsk talespråkskorpus, Oslo-delen), og er innforstått med informasjonen som blir gitt der. Med dette gir jeg også samtykke til at det lyd- og bildematerialet som jeg er med på i forbindelse med prosjektet, samt opplysninger om meg (alder, oppvekststed, bosted, utdannelse og yrke), kan benyttes til forskningsformål slik det framgår i brosjyren.

Rekruttering av informanter
Rekruttering av informanter i Oslo og omegn viste seg raskt å være problematisk. Folk har det travelt og vil nødig bruke fritiden sin på en slik undersøkelse. Det er også lite effektivt å komme hjem til folk på ettermiddagen eller kvelden fordi det ville være vanskelig å rekke mer enn to, høyst fire informanter på en slik hjemmekveld. De fleste informantene ble derfor rekruttert via arbeidsplasser. På noen arbeidsplasser fikk de ansatte lov til å være med på undersøkelsen i arbeidstida. Andre steder tok vi opp intervjuer og samtaler rett etter arbeidstid eller i forbindelse med pauser. I den yngste aldersklassen fikk vi informanter fra videregående skoler, i den eldste besøkte vi seniorsenter. Som belønning for å være med som informant, var alle informanter med i trekningen av tre reisegavekort, hvert kort på 5000 kroner. Alle informanter fikk en informantbrosjyre, se brosjyren her. Vi utarbeidet også en vervebrosjyre.

For å finne fram til informantene brukte vi eget og kollegaers kontaktnett. Når det ikke strakk til, brukte vi telefonkatalogen og ringte rundt til skoler, seniorsentre, sykehjem og andre arbeidsplasser for å høre om de hadde mulige informanter i den kategorien vi manglet. Vi oppfordret også folk til å melde seg som informanter gjennom artikler i flere lokalaviser og gjennom informantbrosjyrer, men responsen her var heller laber i de kategoriene vi var ute etter. Det var lettest å rekruttere informanter blant skoleelever og studenter. Vanskeligst var det å finne informanter uten høyere utdannelse, spesielt fra Oslo vest. I begynnelsen av prosjektperioden var det enklest å finne informanter, rett og slett fordi informantmatrisen var tom og vi kunne si ja til de fleste som hadde lyst. Etter hvert som informantmatrisen ble fyllt opp, ble det vanskeligere og vanskeligere å finne fram til de informantene vi manglet. Spesielt utfordrende var det å sette sammen samtalepar der begge ville fylle et matrisetomrom. Til slutt endte vi derfor opp med 20 informanter for mye. Disse har vi valgt å ta med i NoTa, men de vil bli utelatt i det representative utvalget i søkeskjemaet.

Informantmatrise - representativ
Informantene ble fordelt over to informantmatriser: en for Oslo vest og en for Oslo rest. Matrisen ble satt opp etter hvor informantene hadde bodd lengst. Numrene i matrisen er informantnummer. I tillegg til de 144 informantene i matrisen, har NoTa-Oslo 20 informanter for mange som derfor ikke er med i denne matrisen. (Se her nedenfor eller under "Vis informanter" på NoTa-søkesiden for å se en oversikt over alle informantene.)

Forkortelser som ikke er forklart i matrisene er:
F = familie, V = venner, B = bekjente , U = ukjente

OSLO VEST (OSLO VEST + ASKER/BÆRUM)

  18-25 M 18-25 K 26-50 M 26-50 K 51 + M 51 + K

Vskole

Grått =
ikke-vestlig
innvandrer
2.generasjon

146 V 087 V 098 V 158 V 125 V 051 V
147 B 088 V 111 V 167 V 127 B 057 V
148 B 093 V 112 V 168 V 175 V 059 B
149 V 027 V 153 V 187 B 176 V 060 B
171 V 179 V 154 V 188 B 177 V 131 V
172 V 182 V 155 V 189 B 178 V 132 V

Hskole

Grått =
ikke-vestlig
innvandrer
2.generasjon

015 B 007 V 002 V 003 B 061 V 047 B
016 B 008 V 065 V 004 B 062 V 048 B
019 B 020 B 073 V 106 F 103 V 049 V
139 V 089 V 074 V 116 V 107 V 058 V
145 V 094 V 079 B 130 V 108 V 069 V
150 V 113 F 114 F 157 V 133 B 129 V

 

OSLO REST (OSLO ØST + OMLAND)

  18-25 M 18-25 K 26-50 M 26-50 K 51 + M 51 + K

Vskole

Grått =
ikke-vestlig
innvandrer
2.generasjon

036 V 037 V 071 V 097 V 055 U 045 V
164 B 038 V 083 V 119 U 072 V 046 V
023 U 028 V 099 V 123 V 101 F 053 V
029 U 121 B 100 V 183 V 102 F 054 V
031 V 141 V 104 V 184 V 134 B 056 U
137 V 142 V 169 V 185 V 170 V 120 U

Hskole

Grått =
ikke-vestlig
innvandrer
2.generasjo
n

165 V 030 U 001 V 005 F 067 V 050 V
191 V 166 V 006 F 040 V 068 V 052 V
025 U 034 B 066 V 063 B 070 V 064 B
032 V 039 V 075 F 076 F 081 V 117 V
138 V 105 F 080 B 115 V 126 V 118 V
140 V 162 V 082 V 122 B 128 B 124 V

 

Informantmatrise med alle 166 informanter
Informantmatrisene nedenfor inneholder alle de 166 informantene i NoTa-Oslo.

Forkortelser som ikke er forklart i matrisene er:
F = familie, V = venner, B = bekjente , U = ukjente


OSLO VEST (OSLO VEST + ASKER/BÆRUM)

 
18-25 M
18-25 K
26-50 M
26-50 K
51 + M
51 + K

   Vskole

   Grått =
   ikke-vestlig
   innvandrer
   2.generasjon

146 V

087 V

098 V

158 V

125 V

051 V

147 B

088 V

111 V

167 V

127 B

057 V

148 B

093 V

112 V

168 V

175 V

059 B

149 V

027 V

151 V

152 V

187 B

176 V

060 B

171 V

173 V

179 V

153 V

154 V

188 B

177 V

131 V

172 V

182 V

155 V

189 B

178 V

132 V

   Hskole

   Grått =
   ikke-vestlig
   innvandrer
   2.generasjon

015 B

007 V

002 V

003 B

061 V

047 B

016 B

008 V

065 V

004 B

062 V

048 B

019 B

085 V

020 B

073 V

106 F

103 V

049 V

139 V

086 V

089 V

181 V

074 V

116 V

107 V

058 V

145 V

090 V

094 V

079 B

041 V

130 V

108 V

069 V

150 V

174 V

113 F

180 V

114 F

156 V

157 V

042 V

133 B

129 V


 

OSLO REST (OSLO ØST + OMLAND)

 
18-25 M
18-25 K
26-50 M
26-50 K
51 + M
51 + K

   Vskole

   Grått =
   ikke-vestlig
   innvandrer
   2.generasjon

036 V

035 V

037 V

024 U

071 V

097 V

190 B

055 U

045 V

164 B

161 V

038 V

033 B

083 V

119 U

072 V

046 V

023 U

028 V

026 U

099 V

123 V

101 F

084 V

053 V

186 V

029 U

121 B

100 V

183 V

102 F

054 V

031 V

141 V

104 V

184 V

134 B

056 U

137 V

142 V

169 V

185 V

170 V

120 U

   Hskole

   Grått =
   ikke-vestlig
   innvandrer
   2.generasjon

165 V

030 U

163 B

001 V

005 F

067 V

050 V

191 V

166 V

192 V

006 F

040 V

068 V

052 V

025 U

034 B

066 V

063 B

070 V

064 B

032 V

039 V

075 F

076 F

081 V

117 V

138 V

105 F

080 B

115 V

126 V

118 V

140 V

162 V

082 V

122 B

128 B

124 V

 

 

Opptak og opptakssituasjon

Hovedmålet med NoTa-Oslo var å registrere naturlig talemål i to ulike opptakssituasjoner: et halvformelt intervju og en uformell samtale. For å få opptakssituasjonen så naturlig som mulig, valgte vi å gjøre opptakene utenfor lydstudio - enten på et stille seminarrom på Universitetet eller på et tilsvarende rom på det stedet der prosjektet var på besøk. Vi hadde opptak på skoler, barnehager, seniorsenter, brannstasjoner, sykehus og mange andre arbeidsplasser. Av og til hadde vi også opptak hjemme hos informantene. I alle tilfeller forsøkte vi å gjøre opptaksrommene så hyggelig som mulig med duk på bordet, kaffe eller te og en skål med godteri. Opptaksutstyret forsøkte vi å gjemme så godt det lot seg gjøre.

Intervjuene
Informantene kom til opptak to og to. Først informerte vi litt om prosjektet før den første informanten ble intervjuet. Den andre informanten gikk ut av rommet for å fylle ut nødvendige papirer som informantskjema og samtykkeerklæring. Når det første intervjuet var over, byttet informantene plass. Intervjuet varte cirka ti minutter, og informantene ble stilt spørsmål fra barndom og oppvekst. Alt ble tatt opp på lydfil og video. Siden intervjuet skulle være halvformelt, ble det gjennomført uten godteri og drikke på bordet. Spørsmålene i intervjuet er helt eller delvis hentet fra TAUS-undersøkelsen i Oslo.

Samtalene
Etter at intervjuene var over, satte vi fram kaffe, te og godteri - som regel seigmenn og bamsebums som ikke knaser - før informantene fikk beskjed om å snakke sammen en drøy halvtime. På forhånd hadde de fått beskjed om at de måtte unngå samtaleemner som regnes som sensitive: dvs samtaler om tredjeperson, politisk eller religiøs tilknytning, egen eller andres helse og liknende tema. Intervjueren var til stede under samtalen, både for å passe på at det tekniske fungerte og for å hjelpe informantene videre om de gikk tom for samtaleemner eller begynte å snakke om sensitive emner. Intervjueren forsøkte å gjøre seg så usynlig som mulig, og deltok ikke i samtalen.

Opptaksutstyr
Vi brukte et vanlig videokamera til bildene. Lyden ble tatt opp via trådløse mikrofoner, miksebord, lydkort og pc. Senere ble lyd og bilde redigert sammen, komprimert og streamet.

Noen erfaringer
Mange informanter var spente og litt nervøse før opptak. Vi forsøkte å gjøre stemningen lett og uanstrengt, og opplevde som regel at informantene slappet mer og mer av under intervjuet. I løpet av samtalen ble mange av informantene så avslappet at de glemte at de ikke skulle snakke om sensitive emner. Vi opplevde også at språket til informantene endret seg fra det halvformelle intervjuet til samtalene. I intervjuene er språket for eksempel mer stakkato, det er flere en-endinger og pauser. I samtalene er det flere a-endinger, dessuten flere innslag av slang og banning.

 

 

Transkripsjon og tagging av NoTa-Oslo

Intervjuer og samtaler i NoTa-Oslo er ortografisk transkribert. Prosjektet har laget en detaljert transkripsjonsveiledning som kan leses eller lastes ned i pdf- eller word-format. NoTa-Oslo består av 908 057 transkriberte ord. I tillegg kommer ikke-språklige tagger for latter, snufsing m.v.

Til slutt er materialet tagget med NoTa-taggeren, en statistisk talemålstagger (TreeTagger) som er trent på talemålsmaterialet fra NoTa-Oslo. NoTa-taggeren merker hvert ord i materialet med ordklasse og annen morfologisk informasjon. Resultatet er godt: I en 10-delt kryssvalidering ble prestasjonsnivået til taggeren målt til å være 96,9 %.
Taggerveiledningen kan også lastes ned nedenfor.

 

°Transkripsjonsveiledning pdf
°Transkripsjonsveiledning word

° Taggerveiledning pdf
° Taggerveiledning word

 

 

NoTa-Oslo-prosjektet

NoTa-Oslo-prosjektet ble påbegynt høsten 2004. Det meste av arbeidet ble gjennomført i 2005, og første halvdel av 2006. Prosjektet ble ledet av Tekstlaboratoriet, og fikk støtte fra Norges forskningsråd gjennom programmet "Infrastruktur for humanistisk forskning". Nedenfor kan du lese mer om prosjektet.

Ansatte på NoTa-Oslo
Referansegruppe
Fra prosjektsøknaden
Presentasjoner
Bilder
Vinnere av reisegavekort
• NoTa i pressen, se under Presseomtale på sidene til Norske talespråkskorpus her

 

Ansatte på NoTa-Oslo
Prosjektleder: Janne Bondi Johannessen, Tekstlaboratoriet, UiO
Hanne Gram Simonsen, Institutt for lingvistiske fag, UiO
Daglig leder: Kristin Hagen, Tekstlaboratoriet, UiO
Programmerer: Joel Priestley
Vitenskapelige assistenter: Anne Marit Bødal og Fredrik Jørgensen
Transkribører: Hilde Cathrine Haug, Ingunn Indrebø Ims, Signe Laake, Inger Margrethe Hvenekilde Seim og Åshild Søfteland
Tagging:Anders Nøklestad (programmering) og Åshild Søfteland (treningskorpus og taggeveiledning)

 

Referansegruppe for NoTa-Oslo
Jens Allwood, Lingvistiska Institutionen, Göteborgs Universitet
Tom Brøndsted, Speech and Multimedia Communication Division, Aalborg University
Ruth Vatvedt Fjeld, Seksjon for leksikografi og målføre, Institutt for nordistikk og litteraturvitenskap, UiO
Gjert Kristoffersen, Aksis, UiB
Torbjørn Svendsen, Institutt for teleteknikk, NTNU
Arne Torp, Institutt for nordistikk og litteraturvitenskap, UiO
Tor Åfarli, Institutt for nordistikk og litteraturvitenskap, NTNU

 

Presentasjoner av NoTa-Oslo
Foredrag på MONS11 i Bergen 24. - 26. november 2005:
• Janne Bondi Johannessen, Hanne Gram Simonsen, Kristin Hagen og Lars Nygaard: Transkripsjon i et talespråkskorpus
• Janne Bondi Johannessen, Hanne Gram Simonsen, Anne Marit Bødal og Kristin Hagen: Informantutval og opptakssituasjon: Utfordringar i samband med oppbygginga av eit talespråkskorpus

 

Vinnere av reisegavekort
NoTa-prosjektet har gjort opptak med til sammen 192 informanter, det siste opptaket ble gjort torsdag 2. mars.
Alle informantene var med på trekningen av tre 5000-kroners reisegavekort. 3. mars foretok instituttbestyrer på ILN, Hanne Gram Simonsen, den høytidelige trekningen av vinnerne. Her er resultatet:

Kjærstin Meland Karlsson, Bærum
Eivind Lund, Lørenskog
Elsa Karin Ringkjøb, Oslo

Vi ønsker de tre vinnerne god tur!
Klikk her for å se bilder fra trekningen

 

Kontakt

Kontakt Janne Bondi Johannessen (22 85 68 14) eller Kristin Hagen (22 85 71 10) for mer informasjon.
E-post-adresser: j.b.johannessen , kristin.hagen eller tekstlab-post - alle ved @iln.uio.no

Gå til Norske talespråkskorpus
English
Søk i NoTa-Oslo
Frekvensordlister
ILN