Mens navnegjenkjenningsprosjektet er Tekstlaboratoriets hovedansvar, er vi også med i to NorFa-nettverk som menige deltagere. Det ene nettverket heter SPINN (SProgteknologi og INformationssøgning i Norden - et netværk om harmonisering og sammenkædning af sprogteknologiske ordbaser med særligt henblik på informationssøgning). Dette prosjektet ledes av Bolette Pedersen ved Center for Sprogteknologi i København, men har også lokale ledere, og i Norge er det Ruth Vatvedt Fjeld her ved UiO. Vi sakser fra nettverkets hjemmeside (http://www.cst.dk/spinn/spinnhome.html):
"SPINN er et tværfagligt netværk mellem forskere i Skandinavien og på Island. Intentionen med netværket er at sikre at forskningsmiljøer der arbejder med at udvikle ensproglige og flersproglige ordbaser, samt forskningsmiljøer der er interesseret i informationssøgning, udveksler erfaringer og indleder et fagligt samarbejde. De nordiske lande har hidtil på flere områder været i front i den teknologiske udvikling set i et europæisk perspektiv. I de senere år er der imidlertid sket en massiv udvikling inden for det sprogteknologiske område for de større europæiske sprogs vedkommende, og dette har bl.a. betydet langt mere avancerede informationsbehandlingsværktøjer for disse sprog. Denne udvikling betyder paradoksalt nok at de nordiske lande får sværere og sværere ved at gøre sig gældende i netværkssamfundet - i hvert fald på deres egne sprog. Målet for SPINN er derfor at sammenkæde allerede igangværende arbejde inden for sprogteknologi og informationssøgning på de nordiske sprog for at imødegå en samlet indsats på området. Mere konkret er målet på længere sigt at få igangsat arbejdet med at udvikle en prototype til tværsproglig informationssøgning mellem norsk, svensk og dansk - og i mindre udstrækning islandsk."
Det
andre NorFa-prosjektet som Tekstlaboratoriet er med i som menig deltager, er Corpus based research on spoken language:
Cooperation between general linguistics, computational linguistics, language
technology and speech technology in the Nordic countries, ledet av Jens
Allwood og Elisabeth Ahlsén ved
Göteborgs Universitet. Andre norske deltagere er Hanne Gram Simonsen (UiO),
Gjert Kristoffersen (UiB) og Torbjørn Nordgård (NTNU). Vi sakser fra prosjektbeskrivelsen: ".Internationally, work on
spoken language corpora is most advanced for English. Most research has so far
been done for British English but several large state initiatives are under way
for American English as well. Although such corpora to some extent already
exist for the Nordic languages, much more work is needed. This work is needed,
since spoken interactive language in many significant ways is different from
written language. Differences exist at all levels:
(i)
In
spoken language, there is often a radical reduction of morphemes and words in
pronunciation.
(ii)
In
spoken language it is essential to gain a better understanding of the role of
prosody for information structuring and expression of attitude and emotion.
(iii)
The
frequencies of words, collocations and grammatical constructions are highly different
in spoken and written language (Allwood 1999).
(iv)
The
grammar and semantics of spoken language is also significantly different from
that of written language; 30-40% of all utterances consist of short utterances
of 1-2-3 words with no predicative verb.
(v)
In
spoken language, language is often used interactively, not monologically, which
gives rise to a host of problems related to issues of dialog management in
creating computer supported systems for interaction human-computer.
In the proposed
network, we want to promote work on all Nordic languages in exploration of
issues such as the ones above. Since direct face to face human communication is
not only spoken but also multimodal, the network will also stay open to
incorporation of work on multimodal communication, which is now rapidly growing
as a field. If the Nordic languages are going to be used not only to localize
systems originating in the English speaking countries, we think it is essential
that we develop research for the spoken language of each Nordic language based
on naturalistic corpora in the manner suggested above."