SIMULERING AF RELATIONEL DATABASE
B o d i l N i s t r u p Madsen I n s t i t u t f o r D a t a l i n g v i s t i k
Indlæg på Symposium f o r d a t a m a t s t ø t t e t l e k s i k o g r a f i og t e r m i n o l o g i , 5 . - 6 . november 1987, H a n d e l s h ø j s k o l e n i København
I d e t f ø l g e n d e r a p p o r t e r e s om e t f o r s ø g , som e r g e n n e m f ø r t med h e n b l i k på a t a f p r ø v e , om e t i n f o r m a t i o n s s ø g n i n g s s y s t e m med f o r h o l d s v i s b e g r æ n s e d e d a t a s t r u k t u r e r i n g s m u l i g h e d e r kan b r i n g e s t i l a t f u n g e r e s å l e d e s , a t man op n år de samme f o r d e l e som i e t r e l a t i o n e l t d a t a b a s e s y s t e m .
F o r s ø g e t e r b e s k r e v e t i d e t a l j e r i e t s æ r s k i l t LAMBDA-nummer, LAMBDA Nr. 6 ( N i s t r u p Madsen 1 9 8 8 ) , h v o r f o r i n d l æ g g e t s i n d h o l d h e r g e n g i v e s i f o r k o r t e t form uden o p l y s n i n g e r og e k s e m p le r a f
s y s t e m - e l l e r p r o g r a m m e r i n g s t e k n i s k a r t .
J e g v i l g e r n e t a k k e mine k o l l e g e r i DANLEX-gruppen, uden h v i s op m un tri ng og s t ø t t e f o r s ø g e t i k k e kunne g e n n e m f ø r e s . En s p e c i e l tak t i l Hanne Ruus f o r go d e f o r s l a g og t i l Ebba H j o r t , som ha r l e v e r e t e k s e m p e l m a t e r i a l e .
1 . BAGGRUND
O r d b o g s a r t i k l e r i v i d e n s k a b e l i g e o r d b ø g e r i n d e h o l d e r o f t e e t meget s t o r t a n t a l i n f o r m a t i o n s t y p e r , som i n d g å r i f o r s k e l l i g e r e l a t i o n e r med h i n a n d e n . Ved e d b - b e h a n d l i n g a f l e k s i k o g r a f i s k e d a t a , f . e k s . ved l a g r i n g i e t d a t a b a s e s y s t e m , s k a l de l o g i s k e f o r b i n d e l s e r mellem de f o r s k e l l i g e o p l y s n i n g e r a f s p e j l e s , s å l e d e s a t r e l a t i o n e r n e kan an vendes ved s ø g n i n g og p r æ s e n t a t i o n a f d a t a .
-p r o j e k t e r . DANSTATUS e r den danske v e r s i o n a f d e t e n g e l s k e i n f o r m a t i o n s s ø g n i n g s s y s t e m STATUS I I . I f o r b i n d e l s e med DANLEX- gr uppens p r o j e k t " L a g r i n g og b e h a n d l i n g a f m a s k i n l æ s b a r e l e k s i k o g r a f i s k e d a t a i d a t a b a s e s y s t e m e r " b l e v d e r g j o r t f o r s ø g med l a g r i n g a f d a t a f r a en v i d e n s k a b e l i g o r d b o g , Gammeldansk Ordbog i DANSTATUS. F o r s ø g e t e r b e s k r e v e t i V e s t e r g a a r d (1 9 8 7 ) og kon k l u s i o n e n e r , a t DANSTATUS i k k e kan b e t r a g t e s som e t i d e e l t sys tem , da a f s p e j l i n g e n a f r e l a t i o n e r mellem d a t a ik k e u m i d d e l b a r t e r m u l i g . Det k o n k l u d e r e s e n d v i d e r e , a t den s y s t e m t y p e , d e r s k a l b y g g e s v i d e r e på, må være r e l a t i o n e l .
DANSTATUS ha r i m i d l e r t i d en række f o r d e l e , som e r så v æ g t i g e , a t d e t e r i n t e r e s s a n t a t u n d e r s ø g e , om man ved h j æ l p a f n o g l e s æ r l i g e p r o g r a m m e r i n g s f a c i l i t e t e r ( m a c r o f a c i l i t e t e r ) i DANSTA TUS kan s i m u l e r e en r e l a t i o n e l d a t a b a s e og d e r v e d opnå den øn skede s t r u k t u r a f s p e j l i n g .
2 8 7
-2 . ARTIKELSTRUKTUREN I GAMMELDANSK ORDBOG (GLDO)
Som e t l e d i p r o j e k t e t " E d b - b e h a n d l i n g a f v i d e n s k a b e l i g e o r d b o g s d a t a " ha r DANLEXgruppen u d a r b e j d e t en t a k s o n o m i t i l k l a s s i f i c e r i n g a f l e k s i k o g r a f i s k e d a t a . Denne t a k s o n o m i b e s k r i v e s i D e s c r i p t i v e T o o l s f o r E l e c t r o n i c P r o c e s s i n g o f D i c t i o n a r y Data ( 1 9 8 7 ) . på b a s i s a f t a k s o n o m i e n e r d e r u d a r b e j d e t e t fo r m a t t i l GLDO, som e r anve nd t ved i n d t a s t n i n g a f en række a r t i k l e r ved h j æ l p a f o r d b o g s r e d i g e r i n g s s y s t e m e t C o m p u l e x i s .
GLDO-formatet e r i n d d e l t i 4 a f s n i t :
I : i d e n t i f i k a t i o n s a f s n i t B: b ø j n i n g s a f s n i t
S: s e m a n t is k a f s n i t E: e t y m o l o g i s k a f s n i t
N e d e n f o r v i s e s t i l e k s e m p l i f i c e r i n g en o r d b o g s a r t i k e l f r a (JLDO
f o r o p s l a g s o r d e t " d r æ k " , f i g u r 1.
IHOM lOPO dræk lOKA sb.
SEC § BSUB n.
BØKK Kv Rosg. BØKV 76,15 SEC §
BFLE sg. bek. BØFO -ket SEC §
SBEB snavs, smuds, skarn, spec. om ekskrementer
SBC I ther efter skulle han al thenne veridens lyst vyrde sosom drek
SBCK Suso. SBCV 50,8 SCKF træk SKFO Sv. SCKF stercus
SKFO Lat. (jf. stercora.Filip.3,8(Vulg.))
SBC I then indwolff, som vdsender eller vd skyuder drecket ok skarnet aff mennisken
SBCK Kv Rosg. SBCV 76,15 SEC § SBEB overf.
SBC I skrøbelig mænniske, som ær drek oc madek SBCK Suso.
SBCV 175,29
SCKF putredo et vermis Cjf, S/r. 1 9 ,3 (V u lg .))
SKFO Lat. SEC §
SBEB måske sammenblandet med d rxg
SBCI fex .. dreck eller berme .. fecula .. lyden drek vel berme SBCK Chr. Ped. Voc. 1510.
SBC^ 63'' SEC § ELDK fra ELPS mnt. ELPO dreck ELPB skarn etc.;
ELDK egl. samme ord som t h r s k , EEHL jf. Bland.1.43
F i g u r 1: O r d b o g s a r t i k e l f r a GLDO f o r o p s l a g s o r d e t "dræk"
For t y d e l i g e r e a t v i s e den h i e r a r k i s k e o p b y g n i n g g e n g i v e s l i g e
2 8 9
-lOPO
SBCV SBCV SBCV SBCV ELPS
KF SCKF SC
SKFo s k:
SCKF
SKFO
F ig u r 2: T r æ s t r u k t u r f o r a r t i k l e n "dræk"
Et a f de gr un dlæ gg en de k r a v ved l a g r i n g a f d a t a e r , som o v e n f o r nævnt, at r e l a t i o n e r n e mellem o p l y s n i n g e r n e s k a l a f s p e j l e s . Det v i l f . e k s . b e t y d e , a t sammenhængen mellem b e t y d n i n g e r (SBEB) og t i l h ø r e n d e c i t a t e r (SBCI) og k i l d e r (SBCK) s k a l være e n t y d i g . Ved s ø g n i n g i en d a t a b a s e s k a l d e t s å l e d e s være m u l i g t a t få en
s e l e k t i v u d s k r i f t a f a r t i k l e n , o m f a t t e n d e f . e k s . lOPO ( o p s l a g s o r d ) , lOKA ( o r d k l a s s e ) , SBEB, SBCI og SBCK, j f r . f i g u r 3.
IHOM lOPO dræk lOKA sb.
SBEB snavs, smuds, skarn. spec. om ekskrementer
SBCH ther efter skulle han al thenne veridens lyst vyrde sosom drek
SBCK Suso.
SBCI then indwolff, som vdsender eller vd skyuder drecket ok skarnet atf mennisken
SBCK Kv Rosg. SBEB overf.
SBCI skrdbelig mænniske. som ær drek oc madek SBCK Suso.
SBEB måske sammenblandet med dræg
SBCI fex .. dreck eller berme .. fecula
SBCK Chr. Ped. Voc. 1510.
lyden drek vel berme
C o m p u l e x i s - a r t i k l e r n e kan uden p r o b l e m e r o v e r f ø r e s t i l DANSTA- T U S - p o s t e r , i d e t én C o m p u l e x i s - a r t i k e l s v a r e r t i l én DANSTATUS- p o s t . I V e s t e r g a a r d (1 9 8 7 ) f i n d e s en d e t a l j e r e t b e s k r i v e l s e a f o v e r f ø r s l e n . Her s k a l b l o t v i s e s e t e k s e m p e l, ne m li g a r t i k l e n
" d r æ k " , f i g u r 4.
lOPO dræk
lOKA sb.
BSUB n.
BOKK A089
BOKV 76,15
BFLE sg. bek.
BOFO -ket
SBEB snavs, smuds, skarn, spec. om ekskrementer
SBCI ther efter skulle han al thenne veridens lyst vyrde sosom drek
SBCK A148
SBCV 50,8
SCKF træk
SKFO SV.
SCKF stercus
SKFO Lat. (jf. stercora. Filip.3 , 8 (Vulg.))
SBCI then indwolff, som vdsender eller vd skyuder drecket
aff mennisken ok skarnet
SBCK A089
SBCV 76,15
SBEB o v e r f .
SBCI skrøbelig mænniske, som ær drek oc madek
SBCK A148
SBCV 175,29
SCKF putredo et vermis (jf. S i r .19,3(Vulg.))
SKFO Lat.
SBEB måske sammenblandet med dræg
SBCI fex .. dreck eller berme .. fecula .. lyden drek vel berme
SBCK A020
SBCV 63 r
ELDK fra
ELPS mnt.
ELPO dreck
ELPB s k a m etc. ;
ELDK egl. samme ord som thræk ,
EEHL jf. Bland.I.43
F i g u r 4 ; A r t i k l e n "dræk" o v e r f ø r t t i l DANSTATUS
Hvis man i m i d l e r t i d b e d e r om en s e l e k t i v p r æ s e n t a t i o n på skær men, s v a r e n d e t i l den i f i g u r 3 v i s t e , f å s i k k e d e t ø n s k e d e
2 9 1
-lOPO lOKA SBEB
SBCI
SBCK
dræk sb.
snavs, smuds, skarn, spec. om ekskrementer o v e r f .
måske sammenblandet med dræg
ther efter skulle han al thenne veridens lyst vyrde sosom drek then indwolff, som vdsender eller vd skyuder drecket ok skarnet aff mennisken
skrøbelig mcnniske, som ær drek oc madek fex
A148 A089 A148 A020
dreck eller berme fecula lyden drek vel berme
F ig u r 5: S e l e k t i v u d s k r i f t a f a r t i k l e n "dræk" i DANSTATUS
Denne u d s k r i f t e r n a t u r l i g v i s u t i l f r e d s s t i l l e n d e , i d e t d e t i k k e k l a r t f r em gå r , h v i l k e b e t y d n i n g e r , c i t a t e r og k i l d e r , d e r h ø r e r sammen. Å rsagen e r , a t DANSTATUS o p f a t t e r a l l e f o r e k o m s t e r a f sanirae f e l t n a v n i en a r t i k e l som ét f e l t f o r d e l t på f o r s k e l l i g e s t e d e r i p o s t e n .
3 . DATASTRUKTURERING MED HENBLIK PA UDARBEJDELSE AF EN RELA TIONSMODEL
I Ruus- (1 98 8 ) f i n d e s e t E n t i t e t s - R e l a t i o n s d i a g r a m f o r S - a f s n i t - t e t i GLDO. I D e s c r i p t i v e T o o l s (1 9 8 7 ) e r r e d e g j o r t f o r h v o r l e des de r t i l u d a r b e j d e l s e n a f e t E -R -d ia g r a m f o r en o r d b o g kan anvendes både e t i n d h o l d s - og s t r u k t u r b e s k r i v e l s e s v æ r k t ø j , hhv. DANLEX-taksonomien og W ar nie r & Orr^s klammediagram.
F ig u r 6; U d s n i t a f E n t i t e t s - R e l a t i o n s d i a g r a m f o r S - a f s n i t t e t i GLDO
S va r en de t i l d e t t e diagr am kan d e r f . e k s . o p s t i l l e s en r e l a t i o n s d a t a m o d e l , som den i f i g u r 7 v i s t e .
I r e l a t i o n s d a t a m o d e l l e n s å v e l som i den e f t e r f ø l g e n d e b e s k r i v e l s e e r G L D O -f e lt n a v n e n e u d s k i f t e t med na vn e, som e r u m id d e l b a r t f o r s t å e l i g e uden s æ r l i g t ken dskab t i l GLDO. Der anvendes
OPSL o p s l a g s o r d = lOPO ORDKL o r d k l a s s e a n g i v e l s e = lOKA BETYD b e t y d n i n g s b e s k r i v e l s e = SBEB CITAT b e t y d n i n g s c i t a t = SBCI KILDE b e t y d n i n g s k i l d e k o n s t a n t = SBCK
2 9 3
-o p s l a g s -o r d OPSL ORDKL
b e t y d n i n g s o p l y s n i n g e r
OPSL BETNR BETYD
b e t y d n i n g s -CITAT
BETNR CITAT KILDE
I DANSTATUS o p e r e r e s i k k e med f o r s k e l l i g e t a b e l l e r , i n d e h o l d e n de f o r s k e l l i g e t y p e r p o s t e r , sådan som d e t e r t i l f æ l d e t i e t
r e l a t i o n e l t d a t a b a s e s y s t e m . En DANSTATUS d a t a b a s e b e s t å r a f én t e k s t f i l og é t i n d e k s , h v o r i d er s ø g e s . En DANSTATUS d a t a b a s e kan i m i d l e r t i d i n d e h o l d e p o s t e r med f o r s k e l l i g s t r u k t u r , d v s . f o r s k e l l i g e f e l t e r , og e t f e l t n a v n kan g e n t a g e s inden f o r én p o s t . Der a f s æ t t e s i k k e f e l t n a v n e e l l e r p l a d s t i l ik ke u d f y l d t e f e l t e r . Det e r d i s s e f a c i l i t e t e r , d e r e r u d n y t t e t ved f o r s ø g e t med i m p l e m e n t e r i n g e n a f den r e l a t i o n e l l e d a t a m o d e l .
I f i g u r 8 e r v i s t de t r e t a b e l l e r , som e r u d a r b e j d e t s p e c i e l t med h e n b l i k på DANSTATUS. T a b e l l e r n e e r o p s t i l l e t s å l e d e s , a t de m u l i g h e d e r d e r l i g g e r i DANSTATUS m a c r o f a c i l i t e t e r u d n y t t e s b e d s t m u l i g t . A l l e t r e t a b e l l e r r e a l i s e r e s i én DANSTATUS d a t a b a s e , som o p b y g g e s a f t r e f o r s k e l l i g e p o s t t y p e r (e n f o r h v e r
t a b e l ) .
o p s l a g s o r d OPSL ORDKL j^OPSL ?^GREN
b e t y d n i n g s b e s k r i v e l s e
c i t a t
BETYD t^o p s l ^GREN
CITAT KILDE ?^OPSL ?^GREN
2 9 5
-I t a b e l l e r n e e r d e r t i l f ø j e t n o g l e i d e n t i f i k a t i o n s - e l l e r n ø g l e f e l t e r :
t^OPSL o r d b o g s a r t i k e l n u m m e r
( e n t y d i g i d e n t i f i k a t i o n a f o r d b o g s a r t i k l e r n e ) ?^GREN betydnin gs gren num me r
( e n t y d i g i d e n t i f i k a t i o n a f b e t y d n i n g e r n e i en o r d b o g s a r t i k e l )
I o v e r e n s s t e m m e l s e med t a b e l l e r n e i f i g u r 8 o p r e t t e s t r e p o s t t y p e r i DANSTATUS, j f r . f i g u r 9 .
P o s t t y p e I t o p s l a g s o r d s p o s t e r OPSL
ORDKL ID
T^OPSL ?^GREN
P o s t t y p e 2 ; b e t y d n i n g s b e s k r i v e l s e s p o s t e r BETYD
ID
?^OPSL j^GREN
P o s t t y p e 3 : b e t y d n i n g s c i t a t p o s t e r CITAT
KILDE ID
?^OPSL ?^GREN
I f i g u r 10 v i s e s de 8 i n d l æ s t e p o s t e r , som tilsam men udgør d e t v a l g t e u d s n i t a f den t i d l i g e r e v i s t e o r d b o g s a r t i k e l " d r æ k " .
1. OPSL ORDKL ID 2. BETYD ID 3 . CITAT KILDE ID 4. CITAT KILDE ID 5. BETYD ID 6. CITAT KILDE ID 7. BETYD ID 8. CITAT KILDE ID dræk sb
#OPSL 1 #gren ( 1 2 3 )
snavs, smuds, skarn, spec. om ekskrementer
#OPSL 1 #gren 1
ther efter skulle han al thenne veridens lyst vyrde sosom drek
Suso
#OPSL 1 #gren 1
then indwolff, som vdsender eller vd skyuder drecket ok skarnet aff mennisken
Kv Rosg
#OPSL 1 #gren 1
o v e r f .
#OPSL 1 #gren 2
skrøbelig mænniske, som ær drek og madek Suso
#OPSL 1 #gren 2
måske sammenblandet med dræg
#OPSL 1 #gren 3
fex .. dreck eller berme .. fecula .. lyden drek vel berme Chr Ped Voc 1510
#OPSL 1 #gren 3
F i g u r 10: DANSTATUS-poster f o r a r t i k l e n "dræk'*
4 SØGEMEMO BASERET PA MACROFACILITETERHE I DAMSTATUS
2 9 7
-I p o s t t y p e 1, o p s l a g s o r d s p o s t e r n e , i n d f ø r e s i ^GREN nummeret på s a m t l i g e g r e n e i o r d b o g s a r t i k l e n . Herved opnås a t man ik k e b l o t kan kæde a l l e p o s t e r h ø r e n d e t i l én o r d b o g s a r t i k e l sammen ( v e d h j æ l p a f ^OPSL), men a t man o g s å kan kæde u d v a l g t e b e t y d n i n g s p o s t e r ( g r e n e ) og o p s l a g s o r d s p o s t e n f r a én a r t i k e l sammen ( v e d h j æ l p a f ?^GREN) .
Menuen b e s t å r a f 4 h o v e d f a s e r :
(1) S ø g n i n g , h e r u n d e r - v a l g a f s ø g e p r o f i l ,
- o p l y s n i n g om a n t a l s v a r , - v a l g mellem a t se
- h e l e a r t i k l e n e l l e r - u d v a l g t e f e l t e r
(2) V a l g mellem a t se - a l l e g r e n e e l l e r
- kun de g r e n e h v o r i s ø g e o r d e t f i n d e s
(3) Pr æs ent ation , herunder - v al g a f p r o f i l
(4) V a l g mellem a t
- f o r e t a g e ny s ø g n i n g - s l u t t e
For en d e t a l j e r e t gennemgang a f søgemenuen og de u d n y t t e d e ma- c r o f a c i l i t e t e r h e n v i s e s t i l LAMBDA Nr. 6.
Søgemenuen b y g g e r b l . a . på de e r f a r i n g e r , d e r e r i n d h ø s t e t ved u d v i k l i n g a f en søgemenu t i l DANTERM, Dansk Termbank (Wegener 1986) .
* *
* MENU til søgning i GLDO *
* *
'k i t ’k i t i f k i i i H t i f k i t ' k - k i H f k l t i t ’k i t i t i f k ' k i t ’k i f k i t i t i t i t i f k i t skriv søgeord
dreck
skriv søgefelt(er adskilt af komma) citat
søgeordet er fundet 1 gang i citat
vil du se hele artikeln (y) eller nogle udvalgte felter (n)
1
OPSL
ORDKL dræksb
BETYD snavs, smuds, skarn, spec. om ekskrementer
CITAT ther efter skulle han al thenne veridens lyst
vyrde sosom drek
KILDE Suso
CITAT then indwolff, som vdsender eller vd skyuder
drecket ok skarnet aff mennisken
KILDE Kv Rosg
BETYD overf.
CITAT skrøbelig mænniske, som ær drek og madek
KILDE Suso
vil du se mere ja (y) eller nej (x)
y
BETYD måske sammenblandet med dræg
CITAT ' fex .. *dreck^ eller berme .. fecula .. lyden drek vel herme
KILDE Chr Ped Voc 1510
vil du fortsætte søgningen (y) eller slutte (x)
y
skriv søgeord dreck
skriv søgefelt(er adskilt af komma) citat
søcjeordet er fundet 1 gang i citat
vil du se hele artikeln (y) eller nogle udvalgte felter (n) n
vil du se alle grene (y) eller kun grene indeholdende søgeord (x)
X
vælg præsentationsprofil (1, 2 eller 3):
1
OPSL
ORDKL dræksb
BETYD måske sammenblandet med dræg
CITAT fex .. *dreck* eller berme .. fecula .. lyden drek vel berme
KILDE Chr Ped Voc 1510
5 UDVIDELSER AF SØGEMENU
Som nævnt ovenfor er kun en del af S-afsnittet i GLDO-formatet inddraget i det beskrevne forsøg. Hvis søgemenuen skal udvides til at omfatte alle oplysningstyper i alle afsnit af GLDO-for- matet, er der behov for mange nye posttyper og en betydelig udvidelse af macroerne. såvidt det kan overskues, vil dette dog ikke medføre nye principielle problemer.
En forudsætning for at anvende metoden til et konkret projekt, er endvidere, at der udarbejdes særlige proce d u r e r til indlæs ning og ajourføring af data.
Endvidere bør menuen udvides med h j æl p e t e k s t e r og sikring mod forkerte svar fra brugerens side, jfr. Wegener (1986).
2 9 9
-6 KONKLUSION
Forsøget med simulering af relationel database har vist, at der er langt bedre muligheder for d a t a s trukturering i DANSTATUS, end den hidtidige anvendelse af systemet har tydet på.
Som tidligere nævnt anvendes DANSTATUS til en række t e r m inolo gi- og ordbogsprojekter. Som eksempler kan nævnes DANTERM
(Dansk Termbank) og Dansk-Fransk ordbogsbase (Blinkenberg & Høybyes Dansk-Fransk O r d b o g ) . I begge projekter er der tale om hierarkisk strukturerede data, dog med færre niveauer end i GLDO. Der er således også h er behov for en bedre afspejling af relationerne mellem data, end det er muligt at opnå ved den almindelige anvendelse af DANSTATUS, hvor én termbank- eller ordbogsartikel svarer til én post i systemet.
REFEREHCBR
De scriptive Tools for Electronic Processing of Dictionary Data
(1987), Studies in C omputational Lexicography, The DANLEX
Group, Danish Working Group on Computational Lexicography: Ebba Hjorth, Jane Rosenkilde Jacobsen, Bodil Nist r u p Madsen, Ole Norling-Christensen, Hanne Ruus. (Le xicographica Series Maior 20), Tubingen, Niemeyer.
Nistrup Madsen, Bodil (1988): Simulering af relationel databa se. (LAMBDA Nr. 6), Institut for Datalingvistik, Handelshøjsko len i København.
Ruus, Hanne (1988): Lexical Data Structures. Indlæg på XIV ALLC konf ere nce i Göteborg 1987. Udkommer i Literary and Linguistic C omputing 1988.
Vestergaard, Bodil (1987): Undersøgelse af databasesystemer til ordbøger. (LAMBDA Nr. 2), Institut for Datalingvistik, Handels hø j s k o l e n i København.