En grammatikkontroll for bokmål


 

Det siste året har Tekstlaboratoriet utviklet en grammatikkontroll for bokmål på oppdrag fra det finske firmaet Lingsoft. Resultatet blir å finne i Microsofts nye Office-pakke som etter planen skal komme på markedet i sommer. Det er artikkelskriverne, Kristin Hagen og Pia Lane, som har arbeidet med Grammatikkontrollen. Vi har brukt Lingsofts svenske grammatikkontroll Grammatifix som arbeidsmodell, men vi har selvsagt lagt ned mye arbeid i å bearbeide den for norske forhold.

Kristin Hagen og Pia Lane har utviklet den første grammatikkontrollen for norsk.

 (Foto: Arthur Sand)

 

I denne artikkelen vil vi kort presentere hvilke feil den norske grammatikkontrollen finner, og forklare hvilke metode vi har brukt for å lage den. De lange eksemplene vi presenterer, er funnet under testingen av programmet og er hentet fra avistekster i Oslo-korpuset.

Hvilke feil finner grammatikkontrollen?

 

Grammatikkontrollen er lagt inn i tekstbehandleren og finner feil som stavekontrollen ikke kan se. En setning som Hvor intimt er individets politiske frihet knyttet til den almene konsumentfrihet? går greit igjennom stavekontrollen fordi  almene er en bøyingsform av substantivet alm. I denne setningen er imidlertid almene en feilskriving av adjektivet allmenne, og grammatikkontrollen vil påpeke at det er et misforhold mellom den bestemte entallsartikkelen den og flertallssubstantivet almene.

 

Grammatikkontrollen sjekker altså flere ord av gangen i motsetning til stavekontrollen som sjekker ett og ett. Her er de viktigste feiltypene grammatikkontrollen prøver å finne:

 

-         Manglende samsvar i kjønn i substantivfraser

o        Jeg kjøpte en nytt hus/et ny hus --> Jeg kjøpte et nytt hus

-         Manglende samsvar i tall i substantivfraser

o       Jeg spiste et epler --> Jeg spiste et eple

-         Feil bruk av substantivets bestemthetsform

o       Jeg solgte et huset --> Jeg solgte et hus

-         Feil bruk av adjektivets bestemthetsform

o       Jeg kjøpte et grønne hus --> Jeg kjøpte et grønt hus

-         Flere adjektiv etter hverandre

o       Han kjørte en rød rask bil --> Han kjørte en rød, rask bil/ Han kjørte en rød og rask bil

-         Manglende samsvar mellom subjekt og predikativ

o       Bilen er rødt --> Bilen er rød

-         Bruk av ingen og noen ved negasjon

o       Jeg kjøpte ikke ingen bok i bokhandelen --> Jeg kjøpte ikke noen bok i  bokhandelen

o       Jeg kjøper noen bok i bokhandelen --> Jeg kjøper ei bok i bokhandelen

-         og/å-feil

o       De gikk å sang </div>--> De gikk og sang

o       Hun skal å vise meg den nye kjolen  </div>--> Hun skal vise meg den nye kjolen

o       Den lille gutten kan både snakke å synge --> Den lille gutten kan både snakke og synge

o       Jeg trenger og sove --> </div> Jeg trenger å sove

o       Han skal prøve og skrive korrekt --> </div>Han skal prøve å skrive korrekt

o       Han orket sykle til jobben.  --> </div>Han orket å sykle til jobben.

(Merk at Hun orket ikke sykle til jobben er korrekt og vil ikke gi feilmelding.)  

-         Finitt verb etter hjelpeverb

o       De kan forsøker å hjelpe deg --> De kan forsøke å hjelpe deg

-         Perfektum partisipp uten ha

o       Jeg skal spist innen klokka tre --> Jeg skal ha spist innen klokka tre

-         Feil bruk av s-passiv

o       Duken behøver vaskes --> Duken må vaskes./Duken behøver ikke vaskes

-         For mange finitte verb i setningen

o       I Norge er var det slik --> I Norge er det slik.

-         Ingen finitte verb i setningen

o       Den gamle mannen syk.  --> </div>Den gamle mannen er syk

-         Plassering av adverb i leddsetninger

o       Jeg går ikke ut hvis det slutter ikke å regne --> Jeg går ikke ut hvis det ikke slutter å regne.

-         Plassering av subjekt og finitt verb

o       Nå gutten kommer --> Nå kommer gutten.

-         Pronomener i akkusativ

o       Han ser på jeg --> Han ser på meg

 

Når grammatikkontrollen har funnet en feil, gir den brukeren en kort feilmelding, et forslag til retting og en henvisning til en lengre hjelpetekst eller grammatikk som brukeren kan slå opp i om han eller hun fortsatt er usikker:

 

Feilmelding og forslag til endring fra grammatikkontrollen.

 

Hvor nyttig er denne grammatikkontrollen?

 

Vår første tanke da vi fikk se den svenske grammatikkontrollen for første gang var: Gjør folk virkelig denne typen feil? Og svaret er ja, det gjør de! I forbindelse med utviklingen av det norske programmet har vi testet over 4 millioner ord, hovedsakelig fra avistekster som har vært trykket, og selv i trykte tekster florerer feil av typen:

 

Gruppen står ikke på scenen selv denne gang, men bruker andre skuespiller.

Hun er bekymret for leien i en erstatningsleiligheten.

Han avventet i går resultater av åstedsgranskernes arbeid og 32-åringens egne forklaring.

I en av forretningen beslagla politiet 2000 filmer.

... at Sigurd Rushfeldt avgjorde årets cupfinale med sitt scoring i kampens siste sekunder.

Å finne en strekspiller har tradisjonelt vært en problem for det norske herrelandslaget.

... (han) brukte en del av sin prosedyre på understreke at hans klient forsøkte å dekke sin medtiltalte ...

Han understreker poengterer at båtopplag av praktiske og trafikkmessige årsaker nødvendigvis bør ligge ved sjøen.

Grunnen kan være at risikoen for å blir oppdaget er blitt så stor at ...

 

Slike feil skyldes sannsynligvis ”klipp og lim”-funksjonen i tekstbehandleren, eller at forfatteren av teksten har vurdert flere uttrykksmåter og gått videre med skrivingen uten å ha bestemt seg.  

 

Grammatikkontrollen finner også feil i forhold til rettskrivingsnormen som kan være overraskende for noen og enhver:

 

Dessuten står seks lastebiler på en idrettsstadion. ---> et stadion

... at flytrafikken over India har hatt en sterk oppsving i 1990-årene ... ---> et oppsving

Alle genre er representert ... ---> genrer

Et godt utbygget kollektivnett er det som vil bidra mest ... -->utbygd

Et stort ansvar hviler på vår unge kulturministers skuldre. ---> skuldrer

... ny kino-satsing på østkanten betinges av at andre tyngre kulturtilbud er tilstede først. ---> til stede

 

Hva slags feil finner ikke grammatikkontrollen?

 

En grammatikkontroll må nødvendigvis ha opplysninger om ordklasse og bøying på ordene  for å finne feil. En kan for eksempel ikke si noe om at en ikke kan stå sammen med biler dersom en ikke har opplysninger om at bil er et substantiv i flertall og at en er en entallsartikkel. Problemet er at mange ord er flertydige, og folk bør ikke belemres med feilmeldinger som sier at en biler er feil i denne setningen: en biler til jobben siden biler her er et verb. For å få en god grammatikkontroll må derfor setningene analyseres med hensyn til ordenes ordklasse og bøying. Til dette brukes en omarbeidet versjon av taggeren som ble utviklet av Tekstlaboratoriets. Selve grammatikkontrollen består av ca 700 regler som blir kjørt etterpå. Taggeren og grammatikkontrollen er bygget opp etter en metode som kalles Constraint Grammar eller føringsbasert grammatikk.

 

Selv om grammatikkontrollprogrammet finner ordklassen til hvert enkelt ord, kan det ikke forstå hva ordene betyr. Derfor er det grenser for hvilke feil det er mulig å finne. Dette er for eksempel grunnen til at feilskrivingen almene i stedet for allmenne ikke blir funnet  i setningen De lydene er almene. Denne setningen er nemlig helt korrekt i en kontekst som: De lydene er almene. De blåser i vinden. Derimot er det altså en skrivefeil dersom sammenhengen er slik: De lydene er almene. De gjelder for alle.

 

Fordi programmet ikke kan forstå innholdet i det som er skrevet,  kan det også gi pussige diagnoser i en del tilfeller. Det vil si at programmet finner feilen, men ikke klarer å gi riktig beskjed om hva som er feil. I den almene konsumentfriheten burde diagnosen ideelt sett ha vært at brukeren hadde skrevet adjektivet allmenne feil. Men siden programmet ikke forstår betydningen av hvert enkelt ord, blir diagnosen at det ikke kan forekomme et substantiv i flertall etter entallsartikkelen den:

 

Med feil rettskriving blir feilmeldingen deretter...

 

Vi håper at grammatikkontrollen vil være et verdifullt supplement til stavekontrollen, som hittil har vært det eneste korrekturverktøyet for norsk. Prosjektet skal presenteres på NoDaLiDa-konferansen i Uppsala i mai, og ble behørig omtalt i Aftenposten rett før påske: http://www.aftenposten.no/nyheter/nett/d203147.htm 

Kristin Hagen og Pia Lane

 


[Neste | Inhold | Tekstlab | HF]


30. april 2001, AN, <anders.noklestad@ilf.uio.no>