Et par ord fra programmereren


Jeg er ansatt på Tekstlaben på timebasis som programmerer nå i høst, til ut på nyåret. Mitt arbeid består i å utvikle et grensesnitt mot World Wide Web (internett) for korpora av tekster på bokmål og nynorsk. Diana Santos har tidligere utviklet et tilsvarende grensesnitt mot et korpus av bosniske tekster. Jeg har tatt utgangspunkt i deler av Santos' programvare i mitt arbeid. Korporaene er kodet ved bruk av IMS Corpus Workbench utviklet ved Universitetät Stuttgart, Institut für maschinelle Sprachverarbeitung. Utgangstekstene er tagget med en automatisk tagger for norsk utviklet ved Tekstlaboratoriet. Søk i korpuset skal kunne gjøres ved regulært uttrykk eller ved å legge inn et eller to søkeord og klikke på bokser for grammatiske kategorier på Web-siden.

Sigurd Schiøth

Sigurd Schiøth

Sigurd Schiøth


[Neste | Innhold | Tekstlab]


18. desember 1998, AN, <anders.noklestad@ilf.uio.no>