NorDiaSyn - Verktøy
 
 

 

 
 

De tekniske løsningene for Nordisk dialektkorpus og Nordisk syntaksdatabase er utviklet av Tekstlaboratoriet.


Korpusverktøy
Korpuset er søkbart via søkergrensesnittet Glossa, utviklet ved Tekstlaboratoriet. Glossa er et brukervennlig brukergrensesnitt for søking og resultatbearbeiding, bygget over systemet IMS Corpus Work Bench Query. Søkeresultatene vises som konkordanser koplet sammen med lyd og bilde.


Glossa gjør det mulig å bearbeide søkeresultatene. Man kan eksportere dem til andre filformater, få vist dem med frekvenstellinger eller som kart.


Glossa: https://www.hf.uio.no/iln/om/organisasjon/tekstlab/tjenester/glossa/index.html

IMS Corpus Work Bench Query system: https://www.ims.uni-stuttgart.de/forschung/projekte/CorpusWorkbench.html


Transkripsjonsverktøy og dialekttransliterator
Den fonetiske transkripsjonen er gjort via den frie programvaren Transcriber. Den ortografiske transkripsjonen er gjort som en oversettelse fra den fonetiske transkipsjonen via den halvautomatiske Oslo-translitteratoren, som også er utviklet ved Tekstlaboratoriet. Den fonetiske og ortografiske transkripsjonen er knytta sammen i Glossa, og man kan velge å søke i bare én av dem, eller begge to samtidig.


Transcriber: https://trans.sourceforge.net/en/presentation.php

Oslo-translitteratoren: https://www.hf.uio.no/iln/om/organisasjon/tekstlab/tjenester/oslo-translitterator/index.html


Tagger
Taggingen av Norsk dialektkorpus er gjort  med en Treetagger trent på korrekturlest output fra Oslo-Bergen-taggeren. Taggeren ble først utviklet for NoTa-korpuset. Taggeren har oppnådd 96,9 % (performance ved 10-fold cross validation).

 

Nøklestad, Anders and Åshild Søfteland (2007). Tagging a Norwegian Speech Corpus. NODALIDA 2007 Conference Proceedings..


TreeTagger: https://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/

Oslo-Bergen Tagger: https://tekstlab.uio.no/obt-ny/index.html

De tekniske løsningene er finasiert av NorDiaSyn og NordForsk.

 
 




Nordisk dialektkorpus og syntaksdatabase

 

UiO