To andre nordiske nettverk


 

Mens navnegjenkjenningsprosjektet er Tekstlaboratoriets hovedansvar, er vi også med i to NorFa-nettverk som menige deltagere. Det ene nettverket heter SPINN (SProgteknologi og INformationssøgning i Norden - et netværk om harmonisering og sammenkædning af sprogteknologiske ordbaser med særligt henblik på informationssøgning). Dette prosjektet ledes av Bolette Pedersen ved Center for Sprogteknologi i København, men har også lokale ledere, og i Norge er det Ruth Vatvedt Fjeld her ved UiO. Vi sakser fra nettverkets hjemmeside (http://www.cst.dk/spinn/spinnhome.html):

 

"SPINN er et tværfagligt netværk mellem forskere i Skandinavien og på Island. Intentionen med netværket er at sikre at forskningsmiljøer der arbejder med at udvikle ensproglige og flersproglige ordbaser, samt forskningsmiljøer der er interesseret i informationssøgning, udveksler erfaringer og indleder et fagligt samarbejde. De nordiske lande har hidtil på flere områder været i front i den teknologiske udvikling set i et europæisk perspektiv. I de senere år er der imidlertid sket en massiv udvikling inden for det sprogteknologiske område for de større europæiske sprogs vedkommende, og dette har bl.a. betydet langt mere avancerede informationsbehandlingsværktøjer for disse sprog. Denne udvikling betyder paradoksalt nok at de nordiske lande får sværere og sværere ved at gøre sig gældende i  netværkssamfundet - i hvert fald på deres egne sprog. Målet for SPINN er derfor at sammenkæde allerede igangværende arbejde inden for sprogteknologi og informationssøgning på de nordiske sprog for at imødegå en samlet indsats på området.  Mere konkret er målet på længere sigt at få igangsat arbejdet med at udvikle en prototype til tværsproglig informationssøgning mellem norsk, svensk og dansk - og i mindre udstrækning islandsk."

 

Det andre NorFa-prosjektet som Tekstlaboratoriet er med i som menig deltager, er Corpus based research on spoken language: Cooperation between general linguistics, computational linguistics, language technology and speech technology in the Nordic countries, ledet av Jens Allwood og  Elisabeth Ahlsén ved Göteborgs Universitet. Andre norske deltagere er Hanne Gram Simonsen (UiO), Gjert Kristoffersen (UiB) og Torbjørn Nordgård (NTNU).  Vi sakser fra prosjektbeskrivelsen: ".Internationally, work on spoken language corpora is most advanced for English. Most research has so far been done for British English but several large state initiatives are under way for American English as well. Although such corpora to some extent already exist for the Nordic languages, much more work is needed. This work is needed, since spoken interactive language in many significant ways is different from written language. Differences exist at all levels:

(i)                  In spoken language, there is often a radical reduction of morphemes and words in pronunciation.

(ii)                In spoken language it is essential to gain a better understanding of the role of prosody for information structuring and expression of attitude and emotion.

(iii)               The frequencies of words, collocations and grammatical constructions are highly different in spoken and written language (Allwood 1999).

(iv)              The grammar and semantics of spoken language is also significantly different from that of written language; 30-40% of all utterances consist of short utterances of 1-2-3 words with no predicative verb.

(v)                In spoken language, language is often used interactively, not monologically, which gives rise to a host of problems related to issues of dialog management in creating computer supported systems for interaction human-computer.

In the proposed network, we want to promote work on all Nordic languages in exploration of issues such as the ones above. Since direct face to face human communication is not only spoken but also multimodal, the network will also stay open to incorporation of work on multimodal communication, which is now rapidly growing as a field. If the Nordic languages are going to be used not only to localize systems originating in the English speaking countries, we think it is essential that we develop research for the spoken language of each Nordic language based on naturalistic corpora in the manner suggested above."

Janne Bondi Johannessen


[Neste | Inhold | Tekstlab | HF]


2. mai 2001, AN, <anders.noklestad@ilf.uio.no>