BigBrother-korpuset

BigBrother-korpuset er et talespråkskorpus som består av den første sesongen av BigBrother som ble sendt på norsk tv (våren 2001). Deltakerne i BigBrother er i alderen 23-36 år og snakker ulike dialekter. Klikk på fanen "Informanter" ovenfor for mer informasjon.

BigBrother-korpuset inneholder lyd- og videoopptak av nesten alle de 100 sendingene som ble vist på tv, sirka 440 300 ord. Opptakene er lenket til ortografiske transkripsjoner av det som sies. Transkripsjonene er også tagget morfologisk.

Den første versjonen av BigBrother-korpuset ble laget på Tekstlaboratoriet i 2001 - 2002. Et nytt prosjekt ble satt i gang høsten 2007, og ble ferdigstilt våren 2009. Klikk på fanene ovenfor for mer informasjon om prosjektet.

I 2023 ble BigBrother lagt inn i den nyeste versjon av Glossa, Logg deg inn med Feide eller CLARIN eller ta kontakt med Tekstlaboratoriet.

Søk i Bigbrother
Les brukerveiledningen til BigBrother

Se på eller last ned transkripsjonene fra Github:

Referer til korpuset slik:

BigBrother-korpuset: https://hdl.handle.net/11538/0000-0005-E7C1-C

Deltagerne i BigBrother

Oversikt over informantene
Kort presentasjon av deltagerne

Oversikt over informantene

I alt 12 personer var med i BigBrother 2001. De fleste var med over en lengre periode, mens den som var med kortest, kun var inne i huset i tre dager. Tabellen nedenfor gir en oversikt over deltagerne.

Navn	Alder	Fødested
Grønkvist, Roy	32 år	ukjent
Hansen, Anne Mona	24 år	Flekkefjord
Karlsen, Rodney Omdal	26 år	Skien
Ringom, Lars Joakim	22 år	Lillehammer
Sundt, Anita E.	25 år	Oslo
Strand, Natalie	23 år	Russland
Suleiman, Ramsy	23 år	Ålesund
Syvertsen, Trond	35 år	Greåker
Sørensen, Monica	28 år	Oslo
Witzøe, Per Morten	36 år	Oslo
Young, Anette	24 år	ukjent
Østby, Rebekka	27 år	Moss

I korpuset refereres deltagerne til med fornavn.

Kort presentasjon av deltakerne

Informasjonen i denne uformelle presentasjonen av deltagerne er bl.a. hentet fra Big Brothers norske hjemmesider, www.bigbrother.no (siden er ikke lenger tilgjengelig). Ikke alle deltagerne er med i presentasjonen. På Wikipedia finnes diverse sider med informasjon om Big Brother og de ulike deltagerne, se https://no.wikipedia.org/wiki/Big_Brother_Norge_(2001).

Anette Young
En skravlesjuk apotektekniker som lyser opp når hun får servert semulepudding. Tror selv hun kommer til å være den i Big Brother som snakker mest. Glad 24-åring som sier hva hun mener og tåler å få kritikk. Det er mulig vi får høre henne synge andre steder enn i dusjen, og en av hennes drømmer her i livet inkluderer David Attenborough og Galapagosøyene.
Anita E. Sundt
25-årig Oslo-jente, bosatt i Fredrikstad. De som ikke kjenner henne sier at hun er litt spesiell og underlig. De som kjenner henne sier det samme. Hun vet mye om astrologi og kan både sluke sverd og sprute ild. Liker ikke fordomsfulle og intolerante mennesker, samtidig som hun ser seg selv som bevisst og diplomatisk. Ikke redd for å ta nye utfordringer og anser seg selv som den perfekte Big Brother-deltageren.
Anne Mona Hansen
Hvis du tar en del arbeidsnarkoman, to deler hund, en samboer og egen restaurant, så får du Anne Mona. Hun driver egen veikro i Flekkefjord, noe som krever mye, og det lille hun får av fritid utnyttes derfor maksimalt. Tror at Big Brother kommer til å vise hennes sanne jeg og at vi kommer til å få se en arbeidsmaur i huset. Hater folk som ikke klarer å løse enkle oppgaver. Drømmer om å starte dyreklinikk og ha muligheten til å reise jorden rundt. En smart 24-åring med mange drømmer og med evnen til å gjennomføre dem.
Lars Joakim Ringom
Blir ofte spurt om hasj på grunn av håret og er overbevist om at hvis han ikke vinner Big Brother, skyldes det mangel på store pupper... Kreativ og musikalsk 22-åring fra Lillehammer, med en liten fløyte rundt halsen i tilfelle han skulle gå seg vill. Det spørs hvor lenge de andre holder ut med at alt skal avgjøres ved kortspill. Går ikke av veien for å spille de andre deltagerne et puss og tar dagen som den kommer med en positiv innstilling.
Monica Sørensen
Sporty og glad 28-årig IT-konsulent fra Oslo, som gjerne hiver seg i helsestudioet når hun ikke sitter foran datamaskinen. Omsorg for både mennesker og dyr, er utrustet med sterk rettferdighetssans. Tar ting som det kommer og mener å gi 100 prosent av seg selv. Skulle gjerne bodd i et varmere land, men nyter indisk eller mexikansk mat i påvente av at drømmen skal gå i oppfyllelse, og det vil hun skal skje lenge før hun er 80!
Per Morten Witzøe
Denne 36-årige mannemannen har et lengre forhold bak seg, men er nå singel. Han er senior salgsingeniør fra Oslo; han liker å drive sport og kjøre motorsykkel, og i platesamlingen hans hører bl.a. Lou Reed, Tom Waits og Limp Bizkit til favorittene. Han prøver gjerne nye ting. Hater bedrevitere og kan i blant irritere andre med "det ordner seg alltid"-innstillingen sin.
Ramsy Suleiman
Denne 23 år gamle ingeniørstudenten fra Ålesund er en tøffing med basehopping som hobby. Til tross for høy selvtillit byr han på seg selv med en selvironisk mine. Drømmer om et liv i luksus og håper at Big Brother skal gi ham større drag på damene, selv om han egentlig ikke trenger det. Misliker mindre intelligente og trangsynte mennesker. Er overbevist om at sjansen for å bli en million rikere er store – hvis seerne bare lærer å kjenne ham på riktig måte.
Rebekka Østby
Sprudlende 27-åring fra Moss, jobber i reklamebyrå, og er alltid full av vanvittige idéer og nye påfunn. Kreativ og singel med sporty image. Ser ikke på et problem som et hinder men som en utfordring! Har sterke meninger og er klar for å diskutere. Hater folk som baksnakker eller ikke går rett på sak. Er overbevist om at hun vil vinne med hjelp av sin sprudlende energi og gode humør!
Rodney Omdal Karlsen
Med gitaren under armen, et smil om munnen og med tindrende øyne får denne boredekksoperatøren fra Skien de fleste jenter på gli. Machofaktoren er høy hos denne mannen som utfører en av verdens farligste jobber i turnus to uker av gangen. Han er overbevist om at han er valgt ut på grunn av sin karisma og fordi han helst har Fleetwood Mac i cd-spilleren. Populær 26-åring med glimt i øynene, alltid på jakt etter den rette.
Roy Grønkvist
Kjekkasen Roy er en mann i sin beste alder, 32, med glimt i øyet. Salgskonsulenten liker å fleipe og kverulere, men er allikevel avslappet og rett frem. Roy ser seg selv som et friluftsmenneske og han spiller fotball i 3.divisjon. Han kommer nok til å bli den største mannen i huset, med sine 95 kilo fordelt på 191cm. Han lover at med ham i huset kommer det aldri til å bli kjedelig... Roy drømmer om et behagelig liv og ser Big Brother som et steg i riktig retning.
Trond Syvertsen
På tross av sine 100 kilo og sitt harde ytre skjuler det seg både en menneskekjenner og en omsorgsfull farsskikkelse bak fasaden. Den 35-åringe tekniske rådgiveren og salgsmannen er far til to prinsesser som betyr alt for ham. Anser seg selv for å være beregnende og med et stort konkurranseinstinkt, men uten å være slem eller ufin. Han frykter ingenting, men bekymrer seg for hendelser som kan ødelegge livet. Trond har et stort hjerte og en analyserende hjerne.

Om BigBrother som talespråkskorpus

Talespråkskorpus med spontantale er uvurderlige i språkforskning. Opptak av talespråk har tradisjonelt vært gjort i intervjuer mellom forsker og informant, eller ved opptak av fri samtale mellom to informanter. Dette har vi bl.a. gjort i NoTa-Oslo og i Nordisk dialektkorpus. BigBrother-korpuset er derfor i unikt i forskningssammenheng fordi det representerer tilgjengelig spontantale som ikke er tatt opp i forskningsøyemed.

Av åpenbare etiske og juridiske årsaker kan man ikke gjøre opptak av personer uten deres viten og vilje. I intervjuer med og samtaler mellom informanter er det mulig, men svært vanskelig, å dokumentere en helt naturlig tale. I en opptakssituasjon vil informantene alltid være seg bevisst at det gjøres lyd- og eventuelt videoopptak av dem. Tilstedeværelsen av opptaksutstyr og forskere vil nesten alltid ha en eller annen innvirkning enten på informantens språk, væremåte, eller begge deler. I BigBrother-materialet finnes ikke disse begrensningene, selv om deltagerne naturligvis er seg veldig bevisst den situasjonen de befinner seg i, med konstant overvåkning av alt de sier og gjør. Dette påvirker helt sikkert informantenes generelle atferd, men i vesentlig mindre grad deres språklige atferd, særlig siden informantene ikke er klar over at språket deres er gjenstand for forskningsmessig interesse.

Informantene er etter hvert vant til å omgås hverandre og diskuterer, krangler, småprater osv. som om de var en vanlig vennegjeng. I motsetning til kontrollerte opptak som er begrenset til intervju og dialog, består dermed BigBrother-materialet av mange samtaler om alle mulige emner og innenfor ulike genre. Det er ingen begrensning til kun to informanter i en samtale, og det er tidvis sterke følelser i sving, noe som også kan tenkes å ha innvirkning på språket. Dette er naturligvis ikke tilfellet for vanlige talespråkskorpora.

Det er dyrt og tidkrevende å få utviklet talespråkskorpus, og vi er derfor takknemlige for å kunne bruke Big Brother-sendingene til dette. Tusen takk til Nordic Entertainment og Lasse Hallberg som har gitt oss lov til å bruke materialet.

Transkripsjon og tagging av BigBrother-korpuset

Prosjektet er transkribert ortografisk etter samme standard som i NoTa-prosjektet. Transkripsjonene er tagget med en statistisk talemålstagger utviklet for NoTa-prosjektet. Denne taggeren er trent på talemålsmaterialet fra NoTa-Oslo. Taggeren merker hvert ord i materialet med ordklasse og annen morfologisk informasjon. Resultatet er godt: I en 10-delt kryssvalidering ble prestasjonsnivået til taggeren målt til å være 96,9 %.

Transkripsjonsveiledning og taggerveiledning med beskrivelse av fremgangsmåte for transkripsjon og tagging kan lastes ned fra lenkene under i henholdsvis pdf- og MS Word-format

Dataene i BigBrother er vesentlig mindre strukturert enn NoTa-materialet, så vi har inført noen ekstra tagger for å ta hånd om dette:

taggen <klipp> settes inn der det er et brudd i tidslinja, dvs når det er klippet i en samtale
taggen <handling> settes inn der en taler utfører en handling som påvirker samtalen
[prating] settes inn der informantene prater i munnen på hverandre og det ikke er mulig/hensiktsmessig å skille ut hvem som sier hva

BigBrother-prosjektet

Første del av BigBrother-prosjektet ble gjennomført i 2001 og 2002. Da ble 40 av de 100 sendingene ortografisk transkribert etter standarden som er beskrevet på denne siden.

For perioden august 2007 til og med desember 2007 fikk vi støtte til prosjektet Developing and completing language resources: The Big Brother show as a modern speech corpus fra Norges forskningsråd gjennom KUNSTI-programmet (Kunnskapsutvikling for norsk språkteknologi). Gjennom prosjektet fikk vi fullført transkripsjonen av hele BigBrother-materialet, tagget det morfologisk og gjort det tilgjengelig for forskning via et enkelt web-grensesnitt, der transkripsjonene er integrert med lyd og video.

Følgende personer er involvert i BigBrother-prosjektet høsten 2007:

Prosjektleder: Janne Bondi Johannessen
Daglig leder: Kristin Hagen
Forsker: Arne Martinus Lindstad
Transkribører: Andreas Wærholm og Karine Stjernholm
Digitalisering av lyd og video: Andreas Wærholm
Grensesnitt: Joel Priestley

Det første BigBrother-prosjektet i 2001 og 2002 involverte følgende personer:

Prosjektleder: Janne Bondi Johannessen
Teknisk koordinator: Anders Nøklestad
Teknisk utvikling, video og tidskoding: Lars Nygaard
Transkripsjon: Lars Nygaard, Pål Kristian Eriksen, Janne von Koss Torkildsen, Turid Wangen.
Grensesnitt: Først utviklet av Diana Santos med regulære uttrykk (for Tekstlaboratoriets bosniskkorpus). Klikk og skriv-grensesnittet videreutviklet fra dette av Sigurd Schiøth og Anders Nøklestad (for Oslo-korpuset av taggede, norske tekster).