Oslo-Bergen-taggeren på nett


Oslo-Bergen-taggeren er en morfologisk og syntaktisk tagger, utviklet i sammarbeid mellom UiO og UiB. Tidligere har taggeren bare vært allment tilgjengelig for tagging av enkeltsetninger eller kortere tekstavsnitt via web. Skulle man tagge større tekster, måtte dette gjøres i samarbeid med en språkingeniør. Nå kan imidlertid taggeren lastes ned og kjøres av alle.

Tidligere var taggeren tilgjengelig gjennom et enkelt webgrensesnitt eller ved hjelp av protokolen SOAP. Selv om taggeren har vært svært nyttig også på denne måten, har verken web- eller SOAP-grensesnittene vært optimale. Webgrensesnittet er ikke egnet til større tekster, mens SOAP forutsetter god teknisk forståelse. Det har desutten vist seg å være lite gunstig at taggeren kun er tilgjengelig over nettet.

I slutten av 2005 fikk Tekstlaboratoriet i oppdrag å utbedre de overnevnte svakhetene. Videre ble det besluttet at taggeren skulle gjøres tilgjengelig for forskere og studenter som en nedlastbar applikasjon, via et tilhørende nettområde med brukerveiledninger og andre ressurser. Oppgaven ble løst ved å lage et såkalt wrapper, et annet program som fungere som et mellomledd, og som tilpasser inputen og outputen. Dette programmet kjøres direkte fra kommandolinje. Det er også laget et grafisk brukergrensesnitt til wrapperen, som minner om vanlige Windows programmer.

Skjermbilde av kjøring via kommandolinje




På webområdet ( http://omilia.uio.no/obt/ ) finner man:

  • bakgrunnsinformasjon om taggeren
  • en oversikt av taggsettet
  • en online demo av taggeren
  • en nedlastbar utgave av taggeren (med lisenbetingelser)

Det er per i dag kun laget en nedlastbar utgave av taggeren for Linux-platformen på grunn av manglende lisenser for Windows eller OS X.

Joel Priestley

 

 

 



Skjermbilde av kjøring via grafisk brukergrensesnitt

Til bulletin-forside