Det er lett å skjønne at det blir kolossale databaser ut av det, og at slike  databaser må bygges møysommelig opp fra bunnen av. Dette koster tid og penger  og blir en utfordring hvis Forskningsrådet bare bevilger penger til kjøp av  kommersielt tilgjengelige databaser.
              I det faget jeg  kommer fra, medisin, betyr korpus legeme, og et av vår sivilisasjons  store problemer er at det blir for stort – vi sveller ut. Et talespråkskorpus,  derimot, er et innsamlet materiale, og det vil vi ha så stort og fullstendig  som mulig. Drøyt 900 000 ord samlet fra 166 informanter, transkribert og  morfologisk tagget, med transkripsjonene koblet sammen med lyd- og videofiler –  det er imponerende svært.
              Trolig tenker folk  flest på medisin, fysikk, kjemi og biologi når det er snakk om dyrt eller tungt  vitenskapelig utstyr. Det er nok mindre kjent at også språkforskere og andre  humanistiske og samfunnsvitenskapelige forskere trenger avansert teknologi. Det  gjelder ikke minst når store mengder av opplysninger skal systematiseres,  bearbeides og tas vare på. 
              Leksikografisk  bokmålskorpus og dagens demonstrasjon av Oslo-delen av Norsk talespråkskorpus  er utmerkete eksempler på at også humanister trenger store databaser.  Universitetet i Oslo er kommet langt i å  anvende ny teknologi innen språkforskningen, med sitt Tekstlaboratorium.  Ledelsen ved UiO har støttet oppbygningen av databaser og laboratorium. I  ”Innspill til arbeidet med nasjonalt veikart for stor forskningsstruktur”, til  Norges forskningsråd, 28. september 2007, skriver rektor og  universitetsdirektør meget også om humanistenes behov. Jeg gir en liten  smakebit:
              ”Behovet for og  nytteverdien av digital forskningsinfrastruktur er stort og kraftig økende i  humaniora. Det er særlig innenfor språkvitenskap og språkteknologi at det lenge  har vært etterspørsel etter databaser med et bredt språklig innhold og  grammatisk annotering. Infrastruktur for norsk språk og kultur må naturlig nok  utvikles nasjonalt. Mange faglige og fagpolitiske rapporter de siste årene har  beskrevet behovet (bl.a. Norsk Språkbank 1999, Handlingsplan for  språk og IKT 2001, Stortingsmelding 48, 2002-3). Språkteknologisk  forskning og infrastruktur er avgjørende for at norsk skal være et bruksspråk  etter som samfunnet blir stadig mer preget av tekniske innretninger med  språklig grensesnitt.
              UiO-miljøet innen  språkvitenskap og –teknologi er vitenskapelig sterkt, noe som blant annet  avspeiles i partnerskapet i det nordiske senteret for fremragende forskning,  NORMS. UiO er også en viktig aktør når det gjelder språkteknologisk  infrastruktur, og er valgt til hovedsamarbeidspartner for flere nordiske  prosjekter. Ressursene som er utviklet ved UiO brukes av forskere i mange  titalls land.
              Lanseringen av  denne boka gir altså anledning til å slå enda et slag for at vitenskapelig  utstyr er viktig for frontlinjeforskningen. Selvsagt er det forskertalentene  som må gi det vitenskapelige arbeidet retning og innhold.  Men rekruttering av de gode forskerne er i  økende grad avhengig av at institusjonene har utstyr som kan gi forskerne de  beste muligheter til å systematisere, analysere og presentere det de  undersøker. 
              Norge har hittil  ikke satset tilstrekkelig på vitenskapelig utstyr og annen infrastruktur. Det  finnes flinke stipendiater ved Universitetet i Oslo som er nødt til å dra til  utlandet for å låne laboratoriekapasitet og avansert teknologi fordi utstyret  mangler her i landet. Vi har nylig samlet inn en rekke eksempler på personer  som blir forsinket i sin forskning på grunn av åpenbare mangler. Dette  presenterer vi i vår argumentasjon overfor Regjeringen. 
              UiO har inngått en  allianse med SINTEF, NHO, Forskningsrådet og NTNU i kravet om at Norge må  avsette 20 milliarder til et utstyrsfond. Avkastningen av dette fondet skal  gjøre det mulig å ruste opp eller anskaffe teknologi som trengs for at vi skal  kunne delta fullverdig i frontforskningen og være konkurransedyktige  internasjonalt. Forskningsrådet har gjennomført en analyse av utstyrsbehovet  nasjonalt og funnet at det er nødvendig med en årlig tilførsel av midler på 800  millioner for å ta igjen etterslep og tilfredsstille klare, fornuftige krav til  fornyelse. 
              Dette betyr  naturligvis ikke at stipendiater ikke trenger å reise utenlands for å lære å samhandle  med andre innen fagfeltet. Men det skal normalt ikke være fordi det ikke finnes  god nok infrastruktur her hjemme.
              Forskningsdatabaser,  slike som det talespråkskorpus vi feirer i dag, og andre databaser, til lagring  av grunnlagsmaterialet for vitenskapelige artikler og avhandlinger, tjener også  som bolverk mot forskningsjuks. De er søkbare dersom mistanke om vitenskapelig  uredelighet oppstår. Men viktigere, og mer positivt, er det selvsagt at  databasene representerer en så kolossal lettelse i den videre bearbeidelse av  et grunnlagsmateriale. For enkelte typer humanistisk forskning er søkbare  databaser et sine qua non – uten databasene kan denne typen forskning  simpelt hen ikke foregå. Jeg er gammel nok til å minnes den gang alt var  papirbasert, data-søkbarhet var et ukjent begrep. 
              Det er strålende å  høre at det foreliggende talemålskorpus med ord fra Oslo er så bra at det er i  bruk blant forskere fra hele Skandinavia.   Det styrker ytterligere argumentet om at utstyr er viktig.
              Og så får vi som ikke  er språkforskere, åpne boka med spenning og kanskje finne ut noe om hvordan  Oslo-språket utvikler seg i ulike retninger og kjenne etter om også vi med  annen dialekt og med et språk som ble dannet for mange år siden, klarer å henge  med i forståelsen av de nye ord som blir brukt i hovedstaden i dag.