Prorektor ved UiO: Haakon Breien Benestad:
Hilsen ved utgivelsen ”Språk i Oslo” 5. mars 2008

Utdrag fra innlegget på bokslippet.

Hovedstaden rommer et stadig større kulturelt mangfold. Det avspeiler seg i språket, og det er naturligvis en utvikling som bør registreres og analyseres vitenskapelig.

Hvordan klarer man å hamle opp med et materiale som består av 900 000 Oslo-ord? Vi trenger utstyr!
Og det finnes allerede muligheter til å fange opp bruken av ord og setninger gjennom video, lyd og dataprogrammer som kan kode tale og samtale i datamaskinens to-talls-system.


Det er lett å skjønne at det blir kolossale databaser ut av det, og at slike databaser må bygges møysommelig opp fra bunnen av. Dette koster tid og penger og blir en utfordring hvis Forskningsrådet bare bevilger penger til kjøp av kommersielt tilgjengelige databaser.

I det faget jeg kommer fra, medisin, betyr korpus legeme, og et av vår sivilisasjons store problemer er at det blir for stort – vi sveller ut. Et talespråkskorpus, derimot, er et innsamlet materiale, og det vil vi ha så stort og fullstendig som mulig. Drøyt 900 000 ord samlet fra 166 informanter, transkribert og morfologisk tagget, med transkripsjonene koblet sammen med lyd- og videofiler – det er imponerende svært.

Trolig tenker folk flest på medisin, fysikk, kjemi og biologi når det er snakk om dyrt eller tungt vitenskapelig utstyr. Det er nok mindre kjent at også språkforskere og andre humanistiske og samfunnsvitenskapelige forskere trenger avansert teknologi. Det gjelder ikke minst når store mengder av opplysninger skal systematiseres, bearbeides og tas vare på.

Leksikografisk bokmålskorpus og dagens demonstrasjon av Oslo-delen av Norsk talespråkskorpus er utmerkete eksempler på at også humanister trenger store databaser.  Universitetet i Oslo er kommet langt i å anvende ny teknologi innen språkforskningen, med sitt Tekstlaboratorium. Ledelsen ved UiO har støttet oppbygningen av databaser og laboratorium. I ”Innspill til arbeidet med nasjonalt veikart for stor forskningsstruktur”, til Norges forskningsråd, 28. september 2007, skriver rektor og universitetsdirektør meget også om humanistenes behov. Jeg gir en liten smakebit:

”Behovet for og nytteverdien av digital forskningsinfrastruktur er stort og kraftig økende i humaniora. Det er særlig innenfor språkvitenskap og språkteknologi at det lenge har vært etterspørsel etter databaser med et bredt språklig innhold og grammatisk annotering. Infrastruktur for norsk språk og kultur må naturlig nok utvikles nasjonalt. Mange faglige og fagpolitiske rapporter de siste årene har beskrevet behovet (bl.a. Norsk Språkbank 1999, Handlingsplan for språk og IKT 2001, Stortingsmelding 48, 2002-3). Språkteknologisk forskning og infrastruktur er avgjørende for at norsk skal være et bruksspråk etter som samfunnet blir stadig mer preget av tekniske innretninger med språklig grensesnitt.

UiO-miljøet innen språkvitenskap og –teknologi er vitenskapelig sterkt, noe som blant annet avspeiles i partnerskapet i det nordiske senteret for fremragende forskning, NORMS. UiO er også en viktig aktør når det gjelder språkteknologisk infrastruktur, og er valgt til hovedsamarbeidspartner for flere nordiske prosjekter. Ressursene som er utviklet ved UiO brukes av forskere i mange titalls land.

Lanseringen av denne boka gir altså anledning til å slå enda et slag for at vitenskapelig utstyr er viktig for frontlinjeforskningen. Selvsagt er det forskertalentene som må gi det vitenskapelige arbeidet retning og innhold.  Men rekruttering av de gode forskerne er i økende grad avhengig av at institusjonene har utstyr som kan gi forskerne de beste muligheter til å systematisere, analysere og presentere det de undersøker.

Norge har hittil ikke satset tilstrekkelig på vitenskapelig utstyr og annen infrastruktur. Det finnes flinke stipendiater ved Universitetet i Oslo som er nødt til å dra til utlandet for å låne laboratoriekapasitet og avansert teknologi fordi utstyret mangler her i landet. Vi har nylig samlet inn en rekke eksempler på personer som blir forsinket i sin forskning på grunn av åpenbare mangler. Dette presenterer vi i vår argumentasjon overfor Regjeringen.

UiO har inngått en allianse med SINTEF, NHO, Forskningsrådet og NTNU i kravet om at Norge må avsette 20 milliarder til et utstyrsfond. Avkastningen av dette fondet skal gjøre det mulig å ruste opp eller anskaffe teknologi som trengs for at vi skal kunne delta fullverdig i frontforskningen og være konkurransedyktige internasjonalt. Forskningsrådet har gjennomført en analyse av utstyrsbehovet nasjonalt og funnet at det er nødvendig med en årlig tilførsel av midler på 800 millioner for å ta igjen etterslep og tilfredsstille klare, fornuftige krav til fornyelse.

Dette betyr naturligvis ikke at stipendiater ikke trenger å reise utenlands for å lære å samhandle med andre innen fagfeltet. Men det skal normalt ikke være fordi det ikke finnes god nok infrastruktur her hjemme.

Forskningsdatabaser, slike som det talespråkskorpus vi feirer i dag, og andre databaser, til lagring av grunnlagsmaterialet for vitenskapelige artikler og avhandlinger, tjener også som bolverk mot forskningsjuks. De er søkbare dersom mistanke om vitenskapelig uredelighet oppstår. Men viktigere, og mer positivt, er det selvsagt at databasene representerer en så kolossal lettelse i den videre bearbeidelse av et grunnlagsmateriale. For enkelte typer humanistisk forskning er søkbare databaser et sine qua non – uten databasene kan denne typen forskning simpelt hen ikke foregå. Jeg er gammel nok til å minnes den gang alt var papirbasert, data-søkbarhet var et ukjent begrep.

Det er strålende å høre at det foreliggende talemålskorpus med ord fra Oslo er så bra at det er i bruk blant forskere fra hele Skandinavia.  Det styrker ytterligere argumentet om at utstyr er viktig.

Og så får vi som ikke er språkforskere, åpne boka med spenning og kanskje finne ut noe om hvordan Oslo-språket utvikler seg i ulike retninger og kjenne etter om også vi med annen dialekt og med et språk som ble dannet for mange år siden, klarer å henge med i forståelsen av de nye ord som blir brukt i hovedstaden i dag.