Kort om hva et tagget korpus er, og hvem det er for


Et korpus er en samling tekster. Når det er grammatisk tagget, slik Oslo-korpuset er, fremkommer hvert eneste ord med minst én grammatisk beskrivelse (=tagg). Et elektronisk korpus er lett og raskt å søke i. Oslo-korpuset har forøvrig den enestående muligheten at man kan gjøre nokså avanserte søk uten noen forkunnskaper, bare ved å klikke i bokser.

Et tagget korpus er selvsagt en berikelse for alle språkforskere, som her har et nyttig verktøy for raskt å sjekke språklige data for å bekrefte eller avkrefte en teoretisk hypotese, eller for å samle kvantitative mål om et gitt ord eller uttrykk, eller finne mulige bruksmåter for dem.

Men et tagget korpus er minst like nyttig for andre forskere, som kanskje er mer opptatt av begreper enn av grammatikk. Filosofer, litteraturvitere, historiskere, religionsvitere, for å ta noen få, kan ha stor glede av et tagget korpus.

La oss ta noen eksempler. Er jeg interessert i vennskap, og hvordan begrepet "venn" brukes, kan jeg skrive venn i et søkevindu. Men da får jeg også med tilfellene der venn er imperativ av verbet venne (seg til). Dessuten får jeg ikke de andre formene, som vennen, venner, vennene. I et tagget korpus som Oslo-korpuset kan jeg skrive ordet, og så klikke i boksen for substantiv. Da får jeg ikke de irriterende verbforekomstene. Dessuten kan jeg klikke i stammeboksen, da får jeg alle bøyingsformene av ordet. Resultatet vises som en konkordanse - en liste over alle ordene med en viss kontekst.

Hvis jeg er interessert i stilistiske trekk i forskjellige genrer, kan jeg undersøke f.eks. hvor personlige de er. Da kan jeg sammenligne antallet forekomster av jeg/vi/du/deg i romaner og avistekster. For å unngå f.eks. imperativformen av verbet vie, kan jeg krysse av på personlig pronomen, første og andre person. Så kan jeg krysse av for hvilken teksttype søket skal gjøres i.

Oslo-korpuset gir muligheten til å spesifisere søk etter ord eller kombinasjoner av ord, teksttype, forfatter eller verk, grammatiske egenskaper eller kombinasjoner de forestående. Resultatet av søket vises som en liste - konkordanse - av søkeordene i kontekst. Man kan be om et tilfeldig utvalg av søkeresultatene og velge hvilken form de skal vises i.


[Neste | Innhold | Tekstlab]


19. april 2001, AN, <anders.noklestad@ilf.uio.no>