Et nytt korpus av taggede norske tekster


Denne utgaven av Tekstlabbulletinen er i sin helhet viet Oslo-korpuset av taggede norske tekster. Det er ingen overdrivelse å si at vi er stolte over å kunne presentere dette korpuset. For det første er det første gang et så brukervennlig korpus er presentert for noen språkforsker noe sted (så vidt vi vet). For det andre er det første gang et større korpus av grammatisk taggede tekster tilbys på norsk. For det tredje har vi satset på nynorsk så vel som på bokmål, noe som er mer uvanlig i språkteknologisk sammenheng.

Samtidig må vi få minne om at det tross alt er første versjon vi presenterer her. Derfor er det ikke alle typer søk som går like raskt. Ei heller er alle ord entydig tagget.

Bokmåls- og nynorskdelene av korpuset kan finnes på disse adressene (men husk å sende en e-post for å få brukernavn og passord): http://tekstlab.uio.no/norsk/bokmaal og http://tekstlab.uio.no/norsk/nynorsk. Forøvrig vil vi presentere Oslo-korpuset 1. september 1999, og anbefaler gjerne interesserte å møte opp da. Det innleder forelesningsserien Lingvistisk Forum, som i høst er viet korpuslingvistikk. Vi anbefaler også resten av foredragene i serien - her blir det nok noen tips å hente for fornyelse av forskningsmetoden for noen hver av oss.

Vi bringer også en rapport fra den aller første konferanse noensinne om språkteknologi for norsk, som ble holdt nå i høst. Dessuten har vi med en anmeldelse av den nye versjonen av nynorskoversetteren Nyno for Windows.

Som vanlig håper vi bulletinen vil gi et lite innblikk i hva Tekstlaboratoriet gjør og kan assistere med, samt at den kanskje kan inspirere til forskning på en annen måte. Les gjerne sivilarbeider Pedersens bidrag, Kort om Tekstlaboratoriet og våre web-sider!

Vi ønsker alle lesere og brukere riktig GOD JUL og GODT NYTTÅR!

Janne Bondi Johannessen, leder, Tekstlaboratoriet


[Neste | Innhold | Tekstlab]


19. april 2001, AN, <anders.noklestad@ilf.uio.no>