NODALIDA '93
Proceedings of
9:e Nordiska Datalingvistikdagarna'
Stockholm 3-5 June 1993
R o b e r t E k l u n d , e d i t o r
T h is v o lu m e w as sp o n so re d by:
Humanistisk-Samhallsvetenskapliga Forskningsrådet (HSFR) Skriptor International AB
Department of linguistics, Stockholm University
T yp eset a n d layout:
Robert Eklund
P u b lish ed by:
Department of Lingustics, Computational Linguistics Stockholm University, S -106 91 Stockholm, Sweden
P rin te d by:
L ars A h ren b erg
T op o lo g ica l fra m e s in sig n -b a sed g ra m m a rs... ...9 Jan A nw ard
P ieces fo r a G lo b a l P u z z le... ...19 B jo rn B esk ow
S ystem A rc h ite c tu re a n d C o n tro l in the M u ltra S y ste m... ...41 B enny B rod d a
A u to m a tic T a g g in g o f T urn s in the L o n d o n -L u n d C o rp u s
w ith R e s p e c t to T yp e o f T u rn... ...51 D ou glas C u ttin g
P orting a S to ch a stic P a rt-o f-S p eech T a g g er to S w e d is h... ...65 M a rtin E in eb o rg & B jö rn G am b ä ck
T ag gin g E xp erim en ts U sing N eu ra l N e tw o r k s... ...71 R ob ert E klun d
A P ro b a b ilistic W ord C lass T a g gin g M o d u le B a se d On
Surface P attern M a tc h in g... ...83 B jö rn G am bä ck
O n Im p lem en tin g S w ed ish T ense a n d A sp e c t... ...97 S teffen L eo H an sen
P e te r In g e ls
R o b u st P a rsin g w ith C harts an d R e la x a tio n... . 123 P er A n k er J e n se n , B o d il N istru p M a d sen ,
A n n ie S ta h é l & C a rl V ik n er
F ro m S e m a n tic R e p re se n ta tio n s to S Q L Q u e r ie s... . 133 J u ssi K a rlg ren , B jö rn G am b äck & C h rister S a m u elsso n
C lu sterin g S e n te n c e s — M a kin g S en se o f S yn o n ym o u s
Sen ten ces... . 143 A rn e L a r so n & M a g n u s M erk el
S em io tics a t W ork: T ech n ica l C o m m unication a n d T ran slation in a M u ltilin g u a l C o rpora te E n viro n m en t... . 155 J o a k im N iv re
P ra g m a tics T hrough C ontext M a n a g e m e n t... . 165 T o rb jø rn N ord gård
O n G B P a rsin g a n d S em a n tic In te rp reta tio n... . 175 O le N o rlin g -C h risten sen
M e th o d s a n d T o o ls fo r C o rpus L e x ic o g ra p h y... . 187 C la u s P o v lsen
N a tu ra l la ng uag e p ro cessin g in dialogu e system s w ith
sp o k e n in p u t ... . 197 B jö rn R auch
A u to m a tisk ig en kä n n in g av n o m in a lfra ser i lö pa nde te x t... .207 A tle R o
In terla n g u a g e a n d S e t T h e o ry... .217 C h rister S am u elsson
M o rp h o lo g ic a l T a g gin g B a sed E n tirely on B a yesia n In feren ce...225 P e te r S e ip e l
V ad ja g i m in v e rk sa m h e t so m rä ttsin fo rm a tik e r och ju r is t
sk u lle vilja a tt d a to rlin g v istik e n b id ro g m e d... .239 A n n ie S ta h é l & H e lle W eg en er
A nna S å g v a ll H ein
P referen ces a n d L in g u istic C hoices in the M u ltra
M achine T ranslation S y ste m... ...267 T orb en T h ran e
C onstituency an d Sem antic In terp reta tio n... ...277 M arta T hunes
M a ch in e T ran slation Stra teg ies: A C om parison o f
F -S tructure T ra n sfer an d Sem a n tica lly B a sed In te rlin g u a... ...291 A tro V o u tila in en
A N o u n P h ra se P a rse r o f E n g lis h... ...301 M argareta W estm an
V ad ja g i m in v e rk sa m h e t som sp rå k v å rd a re sk u lle vilja
a tt d a to rlin g v istik e n b idro g m ed... ...311 Jord an Z latev
Preface
Vi datorlingvister har egentligen alltid vetat om det men nu (äntligen) har omvärlden också så sakta börjat komma till insikt om det, nämligen att datorlingvistiken är ett nyckelområde för det som i dag benämns informationsteknologi, IT. För bara ett år sedan var det väl bara ett litet fåtal specialister som hade hört talas om IT, men nu plötsligt har intresset för området formligen exploderat. Den svenska regeringen har nyligen lagt fram ett visonärt program om storsatsning på IT i en nära framtid - "elektroniska highways" är slagordet - och tidningarna är fyllda med fan tastiska visoner om hur informationsteknologin skall omdana vår värld och lägga grunden för vårt framtida välstånd. Med hjälp av de elektroniska nätverken kommer vi ha tillgång till all världens vetenskapliga, tekniska och kulturella information bokstavligen i våra fingerspetsar. Med multimediatekniken kan vi få bilder och ljud från alla jordens höm direkt i våra vardagsrum, et cetera, et cetera. En fantastisk
ny värld finns bara runt hörnet.
För alla tillämpningar som nämnts ovan - frågebesvarande system, informationssökning, automatisk översättning samt taligenkänning och talgenerering - så finns det i dag ett nästan obegränsat behov av färdiga teknologier, det vet alla. Vi datorlingvister vet också att färdiga lösningar rätt och slätt inte föreligger, utan att det krävs ett långt och mödosamt arbete för att få något så när hyggliga lösningar. De nämnda tillämpningsområdena har alla en komponent av datorlingvistisk karaktär i sig, och det är inte en tillfällighet att för vart och ett av dem så finns det presentationer med klara implikationer för just det området i denna volym.
Även om de nämnda tillämpningarna är utomordentligt viktiga så får vi naturligtvis inte sälja vår själ. Vi har också ett inomvetenskapligt uppdrag. Men som jag ser det så behöver det inte finnas en motsättning mellan det samhälleliga behovet och detta uppdrag. Man kan fråga sig vad målet egentligen är för datorlingvistiken - om man nu kan tala om ett
mål. En central frågeställning måste i alla fall vara att åstadkomma en semantisk modell som på ett något så när entydigt och fullständigt sätt möjliggör en automatisk härledning av betydelseinnehållet i första hand i en godtycklig mening ("sentence") och på sikt också också i en sekvens av sammanhängande meningar, alltså i en text. Inom parentes sagt, så är detta också en central frågeställning för den teoretiska lingvistiken.
Lyckas vi med det uppdraget, ja då har vi också början till lösningar för de nämnda utomvetenskapliga problemställningarna.