• No results found

Problems of Formal Representation of Text Structure From the Point of View of Automatic Translation

N/A
N/A
Protected

Academic year: 2020

Share "Problems of Formal Representation of Text Structure From the Point of View of Automatic Translation"

Copied!
9
0
0

Loading.... (view fulltext now)

Full text

(1)

PIIOBLi~IS O F F01@biL R E P R E S E N T A T I O N O F T E X T S T R U C T U R E F R O M T H E P O I N T O F VIEL{ O F A U T O M A T I C T i t i N S L A T I O N

Z.M. S h a l y a p i n a

I n s t i t u t e o f 0 r i e n ~ a l S t u d i e s o f tile A c a d e m y o f S c i e n c e s o f tile U S S R

l.loscow, U S S R S t u m n a r y

T h e p a p e r i s d e v o t e d t o l i n g u i s t i c p r o b l e m s o f d e f i n i n g t h e b a s i c f o r m a l i z - ed

representation

o f t e x t i n a n a u t o m a t i c t r a n s l a t i o n s y s t e m w i t h i n the frsmlework o f the s o - c a l l e d i n t e g r a l f o r m a l m o d e l o f tile tr~ulslation p r o c e s s , t h e p r i m a r y r e - q u i r e m e n t f o r tills r e p r e s e n t a t i o n c o n s i - d e r e d to be a c o m p r o m i s e b e t w e e n i t s se-

mal~ticity,

s u p e r f i c i a l i t y ~ a/id e x h a u s t i - v e n e s s . A r e p r e s e n t a t i o n c o v e r i n g f i v e

major

a s p e c t s o f t e x t s t r u c t u r e (its l e x i c o - g r a ~ ] m a t i c a l c o m p o s i $ i o n ; i t s p r e -

dicate-ar~iment

o r g a n i z a t i o n o n the se- m a n t i c o - s y n t a c t i c l e v e l ; the syTitactic g r o u p i n z ~ o f i t s u n i t s ; t h e a/iaphoric r e - l a t i o n s b e t w e e n t h e m ; tile p e c u l i a r i t i e s o f t h e i r l i n e a r a r r m l g e m e n t ) a n d r e f e r - r e d ~o as C o m b i n e d S t r u c t u r a l R e p r e s e n - t a t i o n (CSR) o f text, is d e s c r i b e d to s h o w tile w a y s a n d m e a n s o f a c h i e v i n g t h i s c o m p r o m i s e i n the J a p a n e s e - R u s s i a n A u t o m a t i c T r a n s l a t i o n P r o j e c t , n o w u n d e r d e v e l o p m e n t at tile I n s t i t u t e o f O r i e n t a l S t u d i e s o f the A c a d e m y o f S c i e n c e s o £ the U S S R ( M o s c o w ) .

I n t r o d u c t i o n

M a n y p r o b l e m s o f the a u t o m a t i c p r o c e s - s i n g o f t e x t r e q u i r e f o r t h e i r

effect-

i v e s o l u t i o n a p r e v i o u s a n a l y s i s o f the t e x t p r o c e s s e d , a i m e d at t r a / i s f o r m i n g t h i s t e x t i n t o i t s i n t e l n n e d i a t e f o r m a l i - z e d r e p r e s e n t a t i o n o f s o m e k i n d , m o r e s u i t a b l e f o r f u r t h e r p r o c e s s i n g t h a n t h e t e x t i t s e l f . I'~hen d e t e r m i n i n g tile c o n c - r e t e c h a r a c t e r i s t i c s o f s u c h a r e p r e s e n - t a t i o n o n e m u s t o b v i o u s l y t a k e i n t o ac- c o u n t the o p e r a t i o n s m e a n t to be a p p l i e d to it, o r to b e p e r f o r m e d on i t s b a s i s w i t h i n t h e f r a m e w o r k o f t h e s y s t e m ilivol- red. I f it is the p r o b l e m o f a u t o m a t i c

tra~Islation that

the s y s t e m is to s o l v e , the set o f tile c o r r e s p o n d i n g o p e r a t i o n s w i l l d e p e n d p r i m a r i l y on the g e n e r a l f o r - m a l m o d e l o f t h e t r a n s l a t i o n p r o c e s s u n - d e r l y i n g t h i s s y s t e m . O n e v e r s i o n o f tlle m o d e l i n q u e s t i o n , p r o p o s e d in I a/id d i s - c u s s e d i n m o r e d e t a i l in 2, e n v i s a g e s t h e f o l l o w i n g m a i n g r o u p s o f o p e r a t i o n s :

1 ) a n a l y s i s a n d i n t e r p r e t a t i o n o f the i n i t i a l text, s i m u l a t i n g the p r o c e s s o f p e r c e i v i n g a n d u n d e r s t a n d i n g i t s s i g n i f i - c a t i o n a n d d e n o t a t i o n ; i d e a l l y , it p r e - s u p p o s e s a s e m a n t i c d e s c r i p t i o n o f tile text, a s w e l l as a m o d e l o f the s i t u a t i o n

( " w o r l d " f r a ~ m e n t ) p r e s e n t e d in it, being"

c o n s t r u c t e d f r o m t h i s t e x t ( p o s s i b l y , v i a a ,lumber o f i n t e l n n e d i a t e r e p r e s e n - t a t i o n s ) ;

2) tra/islation p r o p e r , w h i c h is p e r - f o r m e d at a l e v e l R o f s o m e f o r m a l re-

presentation

R i o f the i n i t i a l text, d e - r i v e d f r o m i t s a n a l y s i s , a n d 6ullounts to s e l e c t i n g t r a n s l a t i o n e q u i v a l e n t s f o r the u n i t s i n c l u d e d i n l{i: the r e s u l t is a n i n t e r m e d i a t e r e p r e s e n t a t i o n R t o f tlle t a r g e t

text,

t h i s

representation

b e i n g u s u a l l y

(although

n o t n e c e s s a r i l y ) o f the s a m e l e v e l as Ri;

3) v e r i f i c a t i o n o f the a d e q u a c y o f the tr~ulslation

performed,

b y m e a n s o f a/lalyzili~' the resulta/it r e p r e s e n t a t i o n R t a/id c o m p a r i n g the s e m a n t i c d e s c r i p - t i o n a n d the s i t u a t i o n a l m o d e l o b t a i n e d , w i t h the sema/itic

description

alid the m o d e l o f tlre s i t u a t i o n c o r r e s p o n d i n g to the i n i t i a l text.;

I~) generation

( s y n t h e s i s ) o f the tar,z'et t e x t by t r a / l s f o r m i n g tlre i n t e ~ n e - d i a t e r e p r e s e n t a t i o n R t f o r m e d d u r i n g

translation

p r o p e r a n d a s s u m e d to be a d e q u a t e b y the v e r i f i c a t i o n p r o c e d u r e , i n t o a s e q u e n c e o f a c t u a l w o r d - f o r m s azld p u n c t u a t i o n m a r k s m a k i n g u p the tar- tset l.a/i~age text;

5) e v a l u a t i o n o f ~he t a r g e t t e x t w i t h a v i e w fie d e t e c t u n d e s i r a b l e a m b i - Ln/ities a n d i n a c c u r a c i e s t h a t mi~-ht h a v e s l i p p e d in d u r i n g the s y n t h e s i s p r o c e s s ; it i m p l i e s 8/lalyzin~- the t e x t b a c k to the I{ l e v e l a n d

checking,whether

tile r e - s u l t i n g r e p r e s e n t a t i o n R t c o i n c i d e s w i t h the r e p r e s e n t a t i o n R t

from

w h i c h t h i s

text

h a s b e e n f o r m e d ;
(2)

It is r e a d i l y s e e n t h a t the b a s i c le- v e l o f f o r m a l t e x t r e p r e s e n t a t i o n f r o m the s t a n d p o i n t o f the a b o v e c o n c e p t i o n o f t h e t r a n s l a t i o n p r o c e s s is l e v e l R, d i r e c t l y c o n c e r n e d w i t h the m o s t i m p o r -

t a n t t r a n s l a t i o n o p e r a t i o n s , p r i m a r i l y , t h e o p e r a t i o n s o f t r a n s l a t i o n p r o p e r , t h e s c o p e o f ~ l i c h is p r a c t i c a l l y c o n f i n - e d to t h e l e v e l i n q u e s t i o n , a n d the o p e - r a t i o n s o f s y n t h e s i s e n s u r i n g t h e t r a n - s i t i o n f r o m the R - l e v e l r e p r e s e n t a t i o n o f a t e x t to i t s m o r e " s u p e r f i c i a l " re- p r e s e n t a t i o n s u p to the t e x t a s such.

S o m e o t h e r o f t h e o p e r a t i o n s m e n t i o n - e d i n v o l v e a l s o s w i t c h i n g f r o m t h e R - l e - v e l to " d e e p e r " l e v e l s o f i n t e r m e d i a t e f o r m a l t e x t r e p r e s e n t a t i o n a n d t a k i n g i n t o c o n s i d e r a t i o n s u c h s u p p l e m e n t a r y f a c t o r s a s t h e e s s e n c e o f t h e s i t u a t i o n d e s c r i b e d b y the t e x t to b e t r a n s l a t e d , t h e s e m a n t i c p e c u l i a r i t i e s o f t h e v o c a b u - l a r y a n d the s y n t a x o f t h e two l a n g u a g e s ; t h e r e q u i r e m e n t s o f g r ~ n m a t i c a l i t y a n d s t y l i s t i c n o r m a t i v i t y ( r e g u l a r i t y ) o f t h e t a r g e t text, a n d so on. T h e f o r e g o i n g s h o w s t h a t t h e s e o p e r a t i o n s a r e m o s t l y a u x i l i a r y in n a t u r e , t h e i r m a i n p u r p o s e b e i n g to i m p r o v e t h e c o n t e n t a d e q u a c y a n d the l i n g u i s t i c a c c e p t a b i l i t y o f t h e t r a n s l a t i o n t e x t f o r m e d t h r o u g h t h e u s e o f t h e R - l e v e l r e p r e s e n t a t i o n ; in a c o n - c r e t e a u t o m a t i c t r a n s l a t i o n s y s t e m b a s e d e s s e n t i a l l y o n ~he f o r m a l m o d e l w e h a v e o u t l i n e d , t h e y m a y b e r e d u c e d o r e v e n a l - t o g e t h e r o m i t t e d f o r v a r i o u s p r a c t i c a l r e a s o n s .

H o w e v e r , w h e t h e r t h e s e s u p p l e m e n t a r y o p e r a t i o n s b e i n c l u d e d i n a n A T s y s t e m o r n o t , it is c l e a r t h a t t h e s y s t e m w i l l d e p e n d l a r g e l y f o r i t s e f f i c i e n c y o n t h e c h o i c e o f t h e i n t e r m e d i a t e l e v e l R. It is p r e c i s e l y t h i s b a s i c l e v e l t h a t w e a r e n o w G o i n g to c o n s i d e r .

G e n e r a l R e q u i r e m e n t s

F r o m the p o i n t o f v i e w o f t h e p u r p o s - es a n d p e c u l i a r i t i e s o f the t r a n s l a t i o n p r o c e s s , t h e r e a r e t w o o p p o s i t e r e q u i r e - m e n t s t h a t c a n b e p l a c e d u p o n t h e i n t e r - m e d i a t e f o r m a l i z e d r e p r e s e n t a t i o n R in a n a u t o m a t i c t r a n s l a t i o n s y s t e m .

O n the o n e h a n d , i n s o f a r as t r a n s l a - t i o n b o i l s d o w n to t r a n s f o r m i n g t h e s u r - f a c e s t r u c t u r e o f a t e x t w h i l e p r e s e r v - i n g i t s c o n t e n t , i t s e e m s s a f e to a s s u - m e t h a t i f s o m e ,components o f t h e t e x t to be t r a n s l a t e d ~ s o m e f e a t u r e s o f t h e s e c o m p o n e n t s , o r l i n k s b e t w e e n t h e m a r e re- l e v a n t f o r t h e c o n t e n t s t r u c t u r e o f t h i s text, t h e y m a y a l s o p r o v e o f i m p o r t a n c e f o r c h o o s i n g t h e c o r r e c t t r a n s l a t i o n e q u i v a l e n t s f o r t h e t e x t u n i t s . C o n s e q u e - n t l y , the a d e q u a t e r e p r e s e n t a t i o n R u s e d i n a u A T s y s t e m s h o u l d be s u f f i c i e n t l y " s e m a n t i c " f o r a l l t h e n e c e s s a r y info~11a-

t i o n c o n c e r n i n g t h e c o m p o n e n t s , l i n k s a n d f e a t u r e s i n q u e s t i o n to b e e i t h e r e x p l i c i t l y g i v e n i n t h i s r e p r e s e n t a t i o n Or, at l e a s t , to be e a s i l y o b t a i n a b l e f r o m it. T o p u t it d i f f e r e n t l y , r e p r e s e - n t a t i o n R o f a t e x t p r o c e s s e d m u s t r e f - l e c t i t s s e m a n t i c s t r u c t u r e w i t h s u f f i - c i e n t p r e c i s i o n a n d i n s u f f i c i e n t d e - tail.

O n the o t h e r h a n d , t h e s t r u c t u r e s o f t h e s o u r c e a n d the t a r g e t l ~ a g e s w i l l , as o f t e n as n o t , h a v e c e r t a i n f e a t u r e s i n c o , n o n , t h i s l e a d i n g to a n i n e v i t a b l e n e u t r a l i z a t i o n o f a n y a n a l y s i s t r a n s f o r - m a t i o n s i n v o l v i n g s u c h f e a t u r e s , b y the

i n v e r s e t r a n s f o ~ n a t i o n s d u r i n g t h e s y n - t h e s i s p r o c e s s . S u c h t r a n s f o ~ n a t i o n s w i l l t h u s p r o v e u n n e c e s s a r y f o r t r a n s l a - t i o n p u r p o s e s , n o m a t t e r h o w i n ~ o r t a n t t h e y m i g h t be a s r e g a r d s t h e f u l l s e m a n - tic a n a l y s i s o f t h e t e x t . A c c o r d i n g l y , r e p r e s e n t a t i o n R m u s t be s u f f i c i e n t l y

" s u p e r f i c i a l " f o r i t s c o n s t r u c t i o n to in- c o r p o r a t e the m i n i m u m p o s s i b l e o f s u c h s u p e r f l u o u s t r a n s f o r m a t i o n s .

A s w e see, t h e s e c o n d r e q u i r e m e n t p r o - v i d e s a k i n d o f l i m i t a t i o n o n t h e f i r s t one, r e s t r i c t i n g the e x t e n t a n d t h e m e - t h o d s o f t h e e x p l i c a t i o n n e c e s s i t a t e d b y tile l a t t e r p o f t h e s e m a n t i c s t r u c t u r e o f the t e x t . T a k i n g i n t o a c c o u n t b o t h o f t h e s e r e q u i r e m e n t s w i l l m o s t l i k e l y r e - s u l t i n a k i n d o f a c o m p r o m i s e s o l u t i o n s u g g e s t i n g t h a t i n f o r m a t i o n m a d e e x p l i - c i t i n r e p r e s e n t a t i o n R o f a c e r t a i n t e x t s h o u l d n o t i n c l u d e a l l the e l e m e n t s o f i t s s e m a n t i c s t r u c t u r e ; r a t h e r , it s h o u l d c o v e r o n l y t h o s e o f t h e m w h i c h a r e a p r i o - r i k n o w n to b e e x t e n s i v e l y u s e d i n e s t a b - l i s h i n g i n t e r - l ~ g u a g e c o r r e l a t i o n s d u r - i n g t r a n s l a t i o n .

W i t h s u c h a s o l u t i o n , h o w e v e r , o n e m u s t b e f u l l y a w a r e t h a t r e a l t e x t s w i l l c o n t a i n a s u b s t a n t i a l p r o p r t i o n o f c a s e s w h e r e s o m e t e x t i n f o r m a t i o n o v e r l o o k e d b y o u r a n a l y s i s m i g h t e v e n t u a l l y t u r n o u t r e l e v a n t f o r t r a n s l a t i o n . If we d o n o t w a n t to g i v e u p t h e i d e a o f a d e q u a t e l y p r o c e s s i n g s u c h t e x t s as i m p r a c t i c a b l e i n p r i n c i p l e , it s e e m s u s e f u l to i m p o s e a t h i r d r e q u i r e m e n t o n r e p r e s e n t a t i o n R - t h e r e q u i r e m e n t o f " e x h a u s t i v e n e s s " w h i c h m a y be f o r m u l a t e d as f o l l o w s . A l l i n f o r - m a t i o n c o n t a i n e d i n a n a t u r a l l a n g u a g e t e x t a n d n o t m a d e e x p l i c i t i n i t s i n t e r - m e d i a t e r e p r e s e n t a t i o n m u s t b e p r e s e r v e d w i t h i n t h i s r e p r e s e n t a t i o n ; i f p o s s i b l e , it s h o u l d b e p r e s e r v e d f u l l y a n d w i t h o u t c h a n g i n g i t s o r i g i n a l ( n a t u r a l l a n g u a g e ) f o r m , so t h a t t h e r e m i g h t b e n o a c c i d e n - tal l o s s e s o r d i s t o r t i o n s .

(3)

a d d i t i o n a l a n a l y s i s ~ l l p l i f y i n g the r e s - u l t s o f tile s t a n d a r d a n a l y z i n g p r o c e d u r e a n d p r o v i d i n g a c c e s s to s o m e e x t r a i n f o r - m a t i o n t h a t m a y b e r e q u i r e d . T h i s is to s a y t h a t t h e l i n g u i s t d e s c r i b i n g the m e a n s o f t r a n s l a t i n g c o n c r e t e l a n g u a g e u n i t s w i t h i n s u c h a s y s t e m w i l l n o t be s u b j e c t to the p r e s s u r e o f too s t r i n g e n t l i m i t a t i o n s o r i g i n a t i n g f r o m t h e c o n v e n - t i o n s o f t h e s y s t e m , r a t h e r t h a n f r o m the n a t u r e o f t h e m a t e r i a l h e d e a l s w i t h , a n d c o m p l i c a t i n g h i s t a s k ( d i f f i c u l t e n o u g h as it is). ~ l e o r e t i c a l l y , h e w i l l b e f r e e to u s e a n y t e x t i n f o r m a t i o n ( b o ~

" s u p e r f i c i a l " a n d " d e e p " ) i n a n y w a y h e m a y f i n d l i n g u i s t i c a l l y a p p r o p r i a t e : w h e t h e r as s o u r c e u n i t s to be r e p l a c e d b y t r ~ i s l a t i o n e q u i v a l e n t s , o r as c o n d i - t i o n s d e t e r m i n i n g the e q u i v a l e n t s c h o s - en f o r s o m e o t h e r u n i t s , o r e l s e as t r a - n s l a t i o n e q u i v a l e n t s t h e m s e l v e s .

T h e a b o v e p r i n c i p l e s a r e g e n e r a l e n o u g h to a l l o w o f v a r i o u s w a y s o f i m p - l e m e n t i n g t h e m i n a c o n c r e t e a u t o m a t i c t r a n s l a t i o n p r o j e c t . We sl~all p r e s e n t h e r e o n e a t t e m p t o f s u c h i m p l e m e n t a t i o n m a d e i n d e f i n i n g the s o - c a l l e d C o m b i n e d S t r u c t u r a l R e p r e s e n t a t i o n to b e u s e d i n the s y s t e m o f J a p a n e s e - R u s s i a n a u t o m a t i c t r a n s l a t i o n , n o w u n d e r d e v e l o p m e n t at t h e I n s t i t u t e o f O r i e n t a l S t u d i e s o f t h e A c a d e m y o f S c i e n c e s o f t h e U S S R

(~oscow)3.

C o m b i n e d St, ruc, t u r a l R e p r e s e n t a t i o n (CSR), T a k i n g i n t o a c c o u n t the t y p o l o g i c a l c o r r e l a t i o n b e t w e e n the J a p a n e s e a n d t h e R u s s l a n l a n 6 ~ a g e s , we c o n s i d e r it n e c e s - s a r y to s p e c i f y i n the C S R o f the i n i t i - al J a p a n e s e t e x t s , as w e l l as o f t h e i r Russiax, t r a n s l a t i o n s , f i v e m a i n a s p e c t s o f t e x t s t r u c t u r e : the l e x i c o - g r a n m l a t i - cal c o m p o s i t i o n o f t h e t e x t p r o c e s s e d , i t s p r e d i c a t e - a r ~ i m e n t o r g a n i z a t i o n on the s e m a n t i c o - s y n t a c t i c l e v e l , the s y n - t a c t i c g r o u p i n g o f i t s u n i t s , the ~ a p h o - t i c r e l a t i o n s b e t w e e n them, a n d the p e c u - l i a r i t i e s o f t h e i r l i n e a r a r r a n g e m e n t . W i t h i n t h e C S R t h e c o r r e s p o n d i n g f i v e t y p e s o f l i n g u i s t i c i n f o r m a t i o n a b o u t the t e x t f o r m s e p a r a t e c o m p o n e n t s ~ l i c h w i l l n o w be d i s c u s s e d i n turn, m o s t l y f r o m the p o i n t o f v i e w o f t h e i r c o n s i s t e n c y witll the g e n e r a l r e q u i r e m e n t s s t a t e d a b o v e .

L e x i c o - ~ | r ~ l a t i . c a l c o m p o s i t i o n ~ e c o m p o n e n t o f the C S R c o n c e r n e d w i t h the l e x i c o - g r a n m ~ a t i c a l c o m p o s i t i o n o f t h e t e x t is i n t e n d e d to c o n t a i n e x p l i - cit d e s c r i p t i o n s o f a l l l e x e m e s p r e s e n t o r i m p l i e d (if e l l i p s i s is t h e c a s e ) i n t h e t e x t u n d e r c o n s i d e r a t i o n , as w e l l as o f a l l g r a m m a t i c a l ( m o r p h o - s y n t a e t i c a l ) e l e m e n t s a c c o m p a n y i n g t h e m in the c o r r e s - p o n d i n g w o r d f o r m s o r q u a s i - w o r d f o r m s

( u n i t s t a k e n to b e f u n c t i o n a l l y a n a l o g o u s

to w o r d f o r m s ) . T h e d e s c r i p t i o n s r e q u i r - ed m u s t i n c l u d e , a p a r t f r o m the s ~ n b o l s o f the u n i t s i n v o l v e d , i n f o r m a t i o n a b o u t t h e i r m e a n i n g s w i t h i n the t e x t i n q u e s t - i o n a n d a b o u t t h e i r r e l e v a n c y o r i r r e l e - v a n c y as r e g a r d s the p r o c e s s o f i t s t r a - n s l a t i o n .

~ l e o p e r a t i o n s n e c e s s a r y to o b t a i n t h i s c o m p o n e n t o f the C S R ~ l e n a n a l y z i n g the i n i t i a l J a p a n e s e t e x t w i l l e v i d e n t l y c o m p r i s e i s o l a t i n g s e p a r a t e w o r d f o r m s a n d d e t e r m i n i n g t h e i r i n t e r n a l s t r u c t u r e (in t e r m s o f l e x e m e s a n d m o r p h o l o g i c m a r - k e r s ) , r e s o l v i n g ~ n b i ~ i t i e s f o r all u n i t s e s t a b l i s h e d ; e l i m i n a t i n g s y n o n y m y w h e r e it is m a n i f e s t e d as s u p p l e m e n t a r y d i s t r i b u t i o n o r f r e e v a r i a t i o n o f m o r p h o - l o g i c u n i t s ; d e t e c t i n g p h r a s e o l o g i c a l w o r d c o m b i n a t i o n s ~ d r e d u c i n g t h e m to a o n e - w o r d s y m b o l ; g i v i n g s p e c i a l l a b e l s to t h o s e w o r d f o r m s o r p a r t s o f w o r d f o r m s w h i c h p l a y ~ a u x i l i a r y r o l e in the t e x t a n a l y z e d a n d r e q u i r e no s p e c i a l t r a n - s l a t i o n e q u i v a l e n t s ; f i l l i n g i n the u n i t s o m i t t e d i n the s o u r c e t e x t i f t h e i r a b - s e n c e o b s c u r e s i t s s t r u c t u r e a n d h i n d e r s the t r a n s l a t i o n p r o c e s s (due to the d i f - f e r e n c e s b e t w e e n the r u l e s o f l i n g u i s t i c e l l i p s i s i n the two l m l g u a g e s ) , etc.

F r o m t h i s it f o l l o w s t h a t the l e x i c o - g r a n m ~ a t i c a l c o m p o s i t i o n o f a t e x t c a n n o t b e d e f i n i t i v e l y e s t a b l i s h e d in the c o u r s e o f i t s a n a l y s i s w i t h o u t d r a w i n g u p o n i n - f o r m a t i o n a b o u t i t s s t r u c t u r a l c h a r a c t e - r i s t i c s . T h e s a m e k i n d o f i n f o r m a t i o n is a l s o n e e d e d ~ e n w o r k i n g w i t h t h i s c o m p o - n e n t o f t h e C S R i n the s y n t h e s i s p r o c e s s

( c h i e f l y in c o n n e c t i o n w i t h s u c h m e a n s o f e x p r e s s i n g s t r u c t u r a l r e l a t i o n s as g r a m m a t i c a l a g r e e m e n t a n d g o v e r n m e n t , t y p i c a l o f the R u s s i a n l ~ , g u a g e ) .

T h e r e f o r e ~ in d e c i d i n g w h a t l a n g u a g e u n i t s a r e to b e d e s c r i b e d as p e r m i s s i b l e

(4)

i t s e l f , w h i l e t h e r e s h o u l d a l s o e x i s t a w e l l - d e f i n e d ( a l t h o u g h n o t n e c e s s a r i l y o n e - t o - o n e ) c o r r e s p o n d e n c e b e t w e e n c e r - t a i n s u b s e t s o f u n i t s b e l o n g i n g to the a d j a c e n t l e v e l s o f p r o c e s s i n g . A c c o r d i n g to t h i s c r i t e r i o n , the s t a t u s o f s e p a r - a t e w o r d s is j u s t i f i e d , a m o n g o t h e r s , f o r s u c h J a p a n e s e u n i t s a s the s o - c a l l e d

" c a u s a t i v e v o i c e " m a r k e r - s e r u / - s a s ~ the " c o n d i t i o n a l m o o d " m a r k e r - ~ , t h e n e g a t i o n m a r k e r - n a i (at l e a s t , i n c o n - d i t i o n a l c o n t e x t s ~ d s o m e o t h e r s .

Ajnong u n i t s ftulctionally a n a l o g o u s to in- d e p e n d e n t w o r d f o r m s (and, c o n s e q u e n t l y , a p p e a r i n g as s u c h w i t h i n the C S R ) , a r e a l s o c l a s s i f i e d p u n c t u a t i o n m a r k s w h i c h are, to o u r m i n d , q u i t e s i m i l a r to w o r d s i n t h a t t h e y c a n be m e a n i n g f u l a n d c a n c o r r e s p o n d to d e f i n i t e t r a n s l a t i o n e q u i - v a l e n t s (or p l a y the r o l e o f such, cf. J a p a n e s e k a vs. R u s s i a n ?).

I n t h i s way, so f a r a s t h e p o s i t i o n o f a u n i t i n t e x t s t r u c t u r e a n d i n the sys- t e m o f t r a n s l a t i o n t r a n s f o r m a t i o n s is re- l a t e d to the m e a n i n g o f t h i s u n i t , o u r g e n e r a l p r i n c i p l e s o f d e s c r i b i n g the le- x i c o - g r a m m a t i c a l c o m p o s i t i o n o f t e x t s in t h e i r C S R c o n f o r m to the r e q u i r e m e n t o f i t s " s e m a n t i c i t y " . O n the o t h e r h a n d , the " e x h a u s t i v e n e s s " r e q u i r e m e n t is a l s o m e t , s i n c e w e mm/¢e it a p o i n t n o t to l e a v e o u t o f t h e C S R a n y t e x t e l e m e n t s , u p to t h o s e t h a t s e r v e e s s e n t i a l l y a s s u r f a c e m a r k - e r s o f o t h e r l i n g u i s t i c u n i t s m a d e e x p l i - cit i n t h i s r e p r e s e n t a t i o n , a n d do n o t t h e m s e l v e s p a r t i c i p a t e to a n y s i g n i f i c a n t e x t e n t i n the s e m a n t i c o p e r a t i o n s p r o v i d - e d i n the s y s t e m (e.g. J a p a n e s e " c a s e " p a r t i c l e s ; R u s s i a n m o r p h o l o g i c a l c a t e g o - r i e s o f case, g e n d e r a n d n u m b e r o f a d j e c - t i v e s ; " s u r f a c e " l i n g u i s t i c e x p r e s s i o n o f " l e x i c a l f u n c t i o n s " a n d t h e i r t r a n s l a - t i o n e q u i v a l e n t s , e t c . ) .

P r e d i c a t e - a r g u m e n t o r g a n i z a t i o n o f the t e x t o n the s e m a n t i c o - s y n t a c t i e l e v e l

T h i s c o m p o n e n t o f the C S R r e p r e s e n t s s e m a n t i c o - s y n t a c t i c l i n k s b e t w e e n w o r d s a n d / o r q u a s i - w o r d s c o r r e s p o n d i n g to t h e i r p r e d i c a t e - a r z ~ m e n t r e l a t i o n s and, a c c o r - d i n g l y , c o n s t i t u t i n g m e a n i n g f u l t e x t u n i t s . It is c o m m o n k n o w l e d g e t h a t the

s u r f a c e e x p r e s s i o n o f t h e s e u n i t s is l a n g u a g e - s p e c i f i c w h i l e t h e i r s e m a n t i c c o n t e n t is g e n e r a l l y a s s u m e d to b e o f a m o r e o r l e s s u n i v e r s a l n a t u r e . So i n t r a - n s l a t i o n t h e y m u s t e i t h e r r e m a i n e s s e n -

t i a l l y the s a m e ( n a t u r a l l y , w i t h a l l the n e c e s s a r y m o d i f i c a t i o n s o f t h e i r s u r f a c e m a r k e r s ) o r m u s t be t r a n s f o r m e d b y c e r -

t a i n f o r m a l r u l e s d e p e n d i n g on the s e m a n - tic i n t e r p r e t a t i o n o f t h e l i n k s i n q u e s - t i o n a n d o n t h e i r r e l a t i o n w i t h the m e a n - i n g o f the u n i t s l i n k e d .

T h e l e x i c o - s y 1 ~ t a c t i c t r a n s l a t i o n t r a n s -

f o r m a t i o n s m e n t i o n e d a r e m o s t colmnonly u s e d w h e r e t h e s o u r c e a n d the t a r g e t l a n g u a g e s h a v e a p p r e c i a b l e t y p o l o g i c a l d i f f e r e n c e s . T h i s is p r e c i s e l y the c a s e w i t h the J a p a n e s e - R u s s i a n c o r r e l a t i o n

(a s i m p l e e x a m p l e : k a t e - w e m a n n e n h i t s u - o n u s u m a r e m a s h i t a , lit. "he w a s s t o l e n a p e n " , t r a n s l . Y H e r o

yEpaa~ pyqEy

"he h a d h i s p e n s t o l e n " ) . B e a r i n g t h i s i n m i n d w e h a v e c h o s e n the d e p e n d e n c y g r a m m a r to r e p r e s e n t the p r e d i c a t e - a r - g u m e n t s t r u c t u r e o f t e x t s i n t h e i r CSR, p r e f e r r i n g it to i t s a l t e r n a t i v e - the i m m e d i a t e c o n s t i t u e n t s y s t e m , f o r a c c o r - d i n g to a n u m b e r o f s p e c i a l i s t s , t h i s t y p e o f t r a n s f o r m a t i o n s is e a s i e r to d e s c r i b e i n d e p e n d e n c y t e r m s .

O n e o f t h e c e n t r a l l i n g u i s t i c p r o b - l e m s c o n n e c t e d w i t h p r e s e n t i n g the p r e - d i c a t e - a r L ~ n n e n t s t r u c t u r e o f a t e x t in i t s C S R is w h i c h a m o n g the v a r i o u s (~u~d o f t e n s e m a n t i c a l l y o v e r l a p p i n g ) d e p e n d e n - c i e s b e t w e e n the t e x t u n i t s s h o u l d be se- l e c t e d f o r e x p l i c i t d e s c r i p t i o n . I n s o l v - i n g t h i s p r o b l e m w e p r o c e e d f r o m the p r i n c i p l e o f the p o s s i b i l i t y o f " i m m e - d i a t e s e m a n t i c s u b s t a n t i a t i o n " o f the d e p e n d e n c i e s to b e s e l e c t e d . It can b e

s p e c i f i e d as the f o l l o w i n g r e q u i r e m e n t b e a r i n g o n the w a y s a n d m e t h o d s o f d e s -

c r i b i n g w o r d s a n d g r a m m a t i c a l c o n s t r u c - t i o n s w h e n c o m p i l i n g the l i n g u i s t i c in- f o r m a t i o n f o r the a u t o m a t i c t r a n s l a t i o n s y s t e m :

- a l l s y n t a c t i c d e p e n d e n c i e s r e g i s t e - r e d i n the C S R o f a c e r t a i n t e x t m u s t r e a l i z e s o m e s e m a n t i c o - s y n t a c t i c v a l e n - c i e s o f the l e x i c a l o r g r a m m a t i c a l u n i t s p r e s e n t i n it (and u s u a l l y f o r m i n g p a r t o f t h e l e x i c o - g r a m m a t i c a l c o m p o s i t i o n o f the w o r d f o r m s o r q u a s i - w o r d f o r m s l i n k - e d by t h e c o r r e s p o n d i n g d e p e n d e n c i e s ) .

T h e s e v a l e n c i e s , in t h e i r t u r n , m u s t d i r e c t l y c o r r e l a t e w i t h the s e m a n t i c c h a r a c t e r i s t i c s o f the u n i t s t h e y a r e a s c r i b e d to, s e m a n t i c c o n s i d e r a t i o n s v i e w e d a s the m a j o r f a c t o r u n d e r l y i n g

t h e i r a s s i g n m e n t to t h o s e u n i t s . O n e im- p o r t a n t c o n s i d e r a t i o n o f t h i s k i n d c o n - s i s t s i n p r e f e r r i n g t h e d e s c r i p t i o n s w h e r e the m a x i m u m p o s s i b l e o f the v a l e n - c i e s e n v i s a g e d c o u l d be r e a l i z e d i n c o n - c r e t e t e x t s b y t w o - w o r d c o m b i n a t i o n s a n d t h e m a x i m u m p o s s i b l e o f s u c h c o m b i n a t i o n s c o u l d b e c h e c k e d f o r t h e i r s e m a n t i c ac- c e p t a b i l i t y ( c o n s i s t e n c y ) w i t h o u t r e g a r d to a n y u n i t s o u t s i d e them.

(5)

t h e l i n ~ i s t i c d e s c r i p t i o n .

F r o m t h e a b o v e it c a n b e i n f e r r e d t h a t the l i n g u i s t i c i n f o r m a t i o n u s e d to r e v e a l ~u]d/or p r o c e s s the p r e d i c a t e - a r g u m e n t s t r u c t u r e o f c o n c r e t e t e x t s s h o u l d c o m - b i n e d a t a on the m e a n s o f s u r f a c e e x p r e s - s i o n o f the l i n k s i n v o l v e d (i.e. w o r d or- d e r , f u n c t i o n w o r d s , e t c . ) w i t h f a i r l y d e t a i l e d s e m a n t i c d e s c r i p t i o n s o f the w o r d s to be fin/ted a n d o f t h e i r c o m b i n a - t o r i a l p o t e n t i a l i t i e s . T o p r o v i d e the f o r m a l t o o l s n e c e s s a r y f o r c o n s t r u c t i n g s u c h d e s c r i p t i o n s we h a v e d e v i s e d a s p e - c i a l f o r m a l i z e d s e m a n t i c l a n g u a g e SLS, the c h a r a c t e r i s t i c p r o p e r t i e s o f w h i c h ca/l be b r i e f l y o u t l i n e d as f o l l o w s .

T h e v o c a b u l a r y o f S L c o m p r i s e s t h r e e c a t e g o r i e s o f the s o - c a l l e d s e m a n t i c e l e - m e n t s : c a t e g o r i a l e l e m e n t s , e n c y c l o p a e - d i c e l e m e n t s a n d i d e n t i f y i n g e l e m e n t s . A m o n g t h e s e t h e l e a d i n g r o l e b e l o n g s to the catez'orial e l e m e n t s w h i c h a r e g i v e n s p e c i a l d e s c r i p t i o n s c o n s t i t u t i n g a k i n d o f f o r m a l i z e d s e m a n t i c ~'ra~nmar o f the n a -

t u r a l l a n g u a g e . T h e s y ~ t a x o f SL, u s e d to c o m b i n e s e m a n t i c e l e m e n t s i n t o s e m a n - tic f o r m u l a e ~ a c c o u n t s b o t h f o r the se- :**antic r e l a t i o n s e s t a b l i s h e d b e t w e e n t h e c o m p o n e n t s o f s u c h a f o r m u l a a n d f o r i t s c o m m u n i c a t i v e o r g a n i z a t i o n d e t e r m i n i n g t h e b e h a v i o u r o f i t s c o m p o n e n t s as re- g a r d s tile l o g i c o p e r a t i o n s tllat c a n be a p p l i e d to the f o r m u l a as a w h o l e . F r o m

t h e f o r m a l p o i n t o f v i e w a s e m a n t i c f o r - m u l a is a l i n e a r s e q u e n c e o f s y m b o l s ,

s t r u c t u r a l l y e q u i v a l e n t to a s p e c i a l t y p e o f a d e p e n d e n c y t r e e w h e r e the n o d e s c a n be l a b e l e d b y tile s y m b o l s n o t o n l y o f

s i n g l e sems/~tic e l e m e n t s , b u t a l s o o f t h e i r c o m b i n a t i o n s ( s u b t r e e s ) o f 8x~y l e n g t h .

Sema/2tic f o r m u l a e caxl b e e m p l o y e d to e x p r e s s : I) s e m a n t i c d e f i n i t i o n s o f n a t u - r a l l~u~G-uage tu~its ( f r o m a s e p a r a t e w o r d u p to a w h o l e t e x t ) ; 2) t h e i r p a r a d i g m a -

tic s e m ~ m t i c f e a t u r e s ; 3) t h e i r s y n t a g m a - tic s e m a n t i c p r o p e r t i e s ( s e m a n t i c i n t e r - p r e t a t i o n s o f t h e i r s y n t a c t i c v a l e n c i e s ) .

A n i m p o r t a n t d i s t i n g u i s h i n g c h a r a c t e - r i s t i c s o f S L is t h a t it a f f o r d s f o r m a l d e r i v a b i l i t y o f i n f o r m a t i o n a b o u t the se- max~tic p a r a d i L n n a t i c a n d syntagm,atic f e a -

t u r e s o f ls/~guage u n i t s f r o m t h e i r s e m a n - tic d e f i n i t i o n s . T h i s h e l p s to m a k e the s e m a ~ t i c d e s c r i p t i o n s o f t h e s e u n i t s m o r e c o m p a c t (by e l i m i n a t i n g the u n n e c e s s a r y r e i t e r a t i o n o f e s s e n t i a l l y the sarape d a t a ) a n d to i m p r o v e t h e i r r e l i a b i l i t y , o w i n g to tl~e p o s s i b i l i t y o f m o r e o b j e c t i v e l y e v a l u a t i n g the a d e q u a c y o f s e m a n t i c d e f i - n i t i o n s on the b a s i s o f s u c h a c r i t e r i o n as the d e g r e e o f c o r r e l a t i o n b e t w e e n the synta&~natic p r o p e r t i e s o f a u n i t d e r i v - a b l e f r o m i t s d e f i n i t i o n , on the o n e h a n d , a n d i t s a c t u a l s e m a n t i c e o m b i n a b i l i t y as

o b s e r v e d in r e a l t e x t s , on the o t h e r ha/id. ~ o r e o v e r , it i n c r e a s e s the r a n g e o f l i n g u i s t i c f a c t s e x p l a i n a b l e on s e m a n - tic g r o u n d s . T h u s , it b e c o m e s p o s s i b l e to g i v e u n i f o r m r u l e s ( u n a t t a i n a b l e i f o n e s t a y s w i t h i n tile b o u n d s of p u r e l y le- x i c o - s y n t a c t i c p h e n o m e n a ) f o r the s e l e c t - i o n o f tile c o r r e c t m o r p h o - s y u ~ t a c t i c a l m a r k e r s (as w e l l as f o r the a p p r o p r i a t e s y n o n y m o u s t r a n s f o r m a t i o n s a n d l o g i c a l d e d u c t i o n s - o p e r a t i o n s c o m m o n l y u s e d as t r a n s l a t i o n d e v i c e s ) w h e n h a n d l i n g c o n - s t r u c t i o n s w i t h s u c h R u s s i a n v e r b s as

FpO3HTB

("run

the

risk"), 0naCaTBCS

("fear"), O~cM~aT~ ("expect"),

ycneBaT~

("be in t i m e " ) , e t c . , ta/<ing p r e d i c a t e w o r d s as t h e i r ar~'uments. T h e s e r u l e s w i l l e n a b l e us, f o r ex~uuple, to c h o o s e the c o r r e c t Russi6u] s e n t e n c e

K paHeHO~,ly 0n0s~an~

o

nomo~sD

("IIelp c~une l a t e to the w o u n d e d m a n " ) , r a t h e r tha/l

* PaHeHBI~ 0n0s~az c

HOMOI~BD

( " T h e w o u n d e d m a n w a s l a t e w i t h h e l p " ) as t r a n s l a t i o n o f the J a p a n e s e s e n t e n c e K e g a n i n - w a t e a t e - g a o k u r e t e s h i m a t t a .

W i t h s e n n ~ t i c d e f i n i t i o n s o f w o r d s f o r m u l a t e d in the SL tel~ns, a l l s y n t a c -

tic d e p e n d e n c i e s l i n k i n g t h e s e w o r d s in t e x t s c a n be i n t e r p r e t e d ( f o r the m o s t p a r t , unsm, b i ~ u o u s l y ) as s e m a n t i c r e l a t - i o n s b e t w e e n c e r t a i n e l e m e n t s w i t h i n t h e i r d e f i n i t i o n s , a n d r e p l a c i n 6' a w o r d b y i t s semaxltic d e f i n i t i o n w i l l n o t a l - t e r the g e n e r a l f o r m o f the p r e d i c a t e - a r g u m e n t s t r u c t u r e o f the text. T h e ef- f e c t is t h a t ill the f r a m e w o r k o f the p r e - d i c a t e - a r z u l m e n t c o m p o n e n t o f the C S t { tile c o n t r a d i c t i o n b e t w e e n the " s e m a n t i c i t y " a/id the " s u p e r f i c i a l i t y " r e q u i r e d o f its t u r n s o u t Go be to a l a r g e e x t e n t e l i m i - n a t e d . F o r o n e t h i n g , a n y fraG~nent o f

the p r e d i c a t e - a r u u m e n t s t r u c t u r e o f a t e x t Call be i n t e r p r e t e d ( d e v e l o p e d ) as a s t r u c t u r e o f sem~ultic e l e m e n t s a n d re- l a t i o n s ; f o r ~ o t h e r , the s c o p e o f s u c h i n t e r p r e t a t i o n d o e s n o t d e p e n d o n a n y but l i n g u i s t i c c o n s i d e r a t i o n s , a n d i f n o t r a n s f o r m a t i o n s a f f e c t i n ~ the i n t e r n a l semaxltic s t r u c t u r e o f w o r d s o r r e l a t i o n s b e t w e e n t h e m a r e n e c e s s a r y f o r t r a n s l a t - i n g a c e r t a i n t e x t fraglnent, the l a t t e r n e e d n o t be s e m a n t i c a l l y i n t e r p r e t e d , no m a t t e r w h e t h e r t h i s k i n d o f i n t e r p r e t a - t i o n be i n d i s p e n s a b l e f o r s o m e o t h e r frail'penis o f the s a n e text.

S y n t a c t i c group_in(~ o f t e x t u n i t s

(6)

i n f o ~ n a t i o n is ~ a l o g o u s to the i n f o r m a - t i o n a b o u t the c o n s t i t u e n t s t r u c t u r e o f the text. ~ e d i f f e r e n c e is, t h o u g h , t h a t the a s p e c t s o f s y n t a c t i c w o r d - g r o u p i n g i n c l u d e d in the C S R o f a t e x t a r e l i m i t e d to t h o s e t h a t c a r r y s e m a n t i c a l l y r e l e v a n t i n f o r m a t i o n l a c k i n g i n i t s d e p e n d e n c y s t r u c t u r e 6 (and, f o r tI~at m a t t e r , n o t al- w a y s d i r e c t l y e x p r e s s i b l e in the c l a s s i - cal c o n s t i t u e n t m a r k e r f o r m , e i t h e r ) .

F o r the p r e s e n t , the g i v e n c o m p o n e n t o f the C S R o f a t e x t is s u p p o s e d to spe- c i f y o n l y the w o r d g r o u p s e s t a b l i s h e d w i t h i n c o n n e c t e d f r a ~ n e n t s o f i t s d e p e n - d e n c y t r e e in s i t u a t i o n s ~ e r e the c o m p o -

s i t i o n o f s u c h g r o u p s a n d t h e i r b o u n d a - r i e s a r e i m p o r t a n t f o r s o m e o f t h e o p e r a - t i o n s e m p l o y e d to p r o c e s s it, s u c h a s a s c e r t a i n i n g the d o m a i n o f the q u a n t i f i - ers; d i s t i n g u i s h i n g b e t w e e n d e s c r i p t i v e a n d r e s t r i c t i v e a t t r i b u t e s ; r e v e a l i n g the f u l l f o r m o f s o m e t y p e s o f e l l i p t i c a l c o n - s t r u c t i o n s (e.g. ~ h o s e w i t h c o - o r d i n a t i v e r e d u c t i o n ) ; d e c i d i n g o n w h e t h e r it w o u l d b e s a f e to e m p l o y t r a n s f o r m a t i o n s d i s j o i - n i n g e l e m e n t s o f s o m e w o r d - c o m b i n a t i o n s w i t h i n the t e x t ' s d e p e n d e n c y s t r u c t u r e o r l i n e a r r e p r e s e n t a t i o n (it s e e m s r e a s o n a - ble to m a r k the c o m b i n a t i o n s e x c l u d i n g t h i s k i n d o f l e x i c o - s y n t a c t i c t r a n s f o r m a - t i o n s aS a s p e c i a l t y p e o f s y n t y c t i c w o r d - g r o u p s ) , etc.

T h e r e l e v a n c y o f t h e d a t a o n s y n t a c t i c w o r d - g r o u p i n g f o r t r a n s l a t i o n p u r p o s e s can b e i l l u s t r a t e d b y t h e J a p a n e s e sen- ~ e n c e

W a t a k u s h i t a c h i - n o t s u k a u n i c h i - ~ h i n - :doen:olaw~in~da t s u k a t t e m e h e r a - h a l m e a n i n g " A m o n g the t h i n g s we u s e d a i l y

t h e r e a r e n o n e t h a t c o u l d b e u s e d f o r a l o n g t i m e a n d s t i l l r e m a i n a s g o o d as n e ~

I f the d a t a i n q u e s t i o n is n o t t a k e n i n t o a c c o u n t h e r e w e a r e l i a b l e to d i s - t o r t the p r e s u p p o s i t i o n a l s t r u c t u r e o f the s e n t e n c e b y g i v i n g it the " l i t e r a l " t r a n s l a t i o n :

*Cpe~H

nononssyeMMx

HaME Be~e~ 10ia~-

Hero 06zx0~a HOT TaEMx, EOTORMe 6N

He

~3Ha~Ba~HcB,

~ame ecnH HM~

H o n ~ -

30BaTBCS ~0nr0e

B p e M a

( " A m o n g the t h i n g s w e u s e d a i l y t h e r e a r e n o n e t h a t d o n o t w e a r out, e v e n

i f u s e d f o r a l o n g t i m e " ) ,

h a v i n g the e v i d e n t l y f a l s e i m p l i c a t i o n t h a t the l o n g e r t h i n g s a r e u s e d the l e s s t h e y w e a r o u t (of.:

HeT

Be~e~, EOT0pNe

6~

He

MJHa~MBa~McB,

~axe ecnH HMH Hon~-

BOBaTBC~ O ~ e H ~ ~ K K y p ~ T H O " ~ e r e are n o t h i n g s t h a t w o u l d n o t w e a r out e v e n i f t h e y a r e t a k e n g o o d c a r e of").

T h e o r i g i n o f t h i s u n d e s i r a b l e i m p l i - c a t i o n c a n b e e x p l a i n e d t w o - f o l d . T h e f i r s t e x p l a n a t i o n is t h a t one o f the w o r d - g r o u p b o u n d a r i e s i n the g i v e n R u s s i a n

s e n t e n c e s e p a r a t e s the n e g a t i o n He ( " n o t " ) f r o m the w h o l e o f the f r a g m e n t f o l l o w i n g it in the l i n e a r s e q u e n c e o f t h i s s e n t e n c e : H a H a ~ H B a ~ Z e b 6 ~

~a~e

eom[ m~M H0~BSOBQTBC2 ~0nr0e

BpeMs

( " w e a r o u t e v e n i f t h e y a r e u s e d f o r a l o n g t i m e " ) , so t h a t the f r a g m e n t c i t e d is i n t e r p r e t e d as a n i n t e g r a l seme/itieo- s y n t a c t i c u n i t , t h i s g i v i n g r i s e to the i m p l i c a t i o n to be a v o i d e d . A c c o r d i n g to the o t h e r e x p l a n a t i o n , the b o u n d a r y r e s - p o n s i b l e f o r the i n t e r p r e t a t i o n o f the R u s s i a n s e n t e n c e r u n s b e t w e e n the w h o l e o f i t s i n i t i a l f r a g m e n t

Cpe~H

HCH0~B3y-

eMNX HaM~ Be~e~

~0MamHer0 06~x0~a

HeT

T a E H X , KOT0pBIe 6BI He ~ J H a ~ H B a ~ C B ( " A m o n g the t h i n g s w e u s e d a i l y t h e r e a r e n o n e t h a t d o n o t w e a r o u t " ) a n d the r e m a i n i n g s e q u e n c e

~axe

e0n~ HmH

H o n s - S O B a T B C a ~ 0 z r 0 e B p e M ~ ( " e v e n i f t h e y a r e u s e d f o r a l o n g t i m e " ) . F r o m t h i s s t a n d p o i n t , the f a l s e i m p l i c a t i o n is ac- c o u n t e d f o r by the p o s s i b i l i t y , s u g g e s - t e d by g r o u p i n g the s e n t e n c e u n i t s i n t o the a b o v e two f r a g m e n t s , o f i n t e r p r e t i n g a n d / o r t r a n s f o r m i n g t h e s e i n d e p e n d e n t l y o f e a c h o t h e r , t h u s o b t a i n i n g

~ e

Hs ~CH0X~syeM~x HaM~ Beme~

~0-

MamHero o ~ x o ~ a

~sHamHBa~Tca, ,~a~e

e c z H H M M HO~BSOBaTBCS

~ o n r o e

Bpems

( " A l l o f the t h i n g s w e u s e d a i l y w e a r

o u t t e v e n i f u s e d f o r a l o n g t i m e " ) . N o m a t t e r w h i c h o n e o f the two e x p l a - n a t i o n s b e t a k e n as t r u e (the s e c o n d o n e s e e m i n g m o r e p l a u s i b l e , w h i l e the f i r s t o n e s u g g e s t i n g s i m p l e r c h e c k - u p s in p r o - c e s s i n G t e x t s ) it is c l e a r t h a t the t r a n - s l a t i o n p r o b l e m is to a c h i e v e in R u s s i a n the s a m e s y n t a c t i c g r o u p i n g as in the o r i g i n a l , b y i n t r o d u c i n g the c o r r e s p o n d - i n g l e x i c a l a n d / o r p o s i t i o n a l ( l i n e a r ) m o d i f i c a t i o n s , e.g. :

C p e ~ ~cn0a~syeM~x Ha~Z Beme~ ~0ia~-

Her0 06Mx0~a HeT TaKMX, KOT0pNe 6B~

~aze np~ ~nI~Te~BHOM HO~BBOBSHMH OC-

T a B a ~ H C B H e M 3 H O ~ e H H B ~ H .

A n o t h e r (and, p r o b a b l y , m o r e o r d i n a - r y ) c a s e o f u s i n g d a t a on s y n t a c t i c w o r d - g r o u p i n g i n t r a n s l a t i o n c a n b e e x e m p l i - f i e d b y the s e n t e n c e :

q

-

~

F

'

.

~

%

~

~ e w a -

r e - n o s e i k a t s u sui u n - o i t s u m a d e - m o x o k u s a s e r u k o t o - ~ a d e ~ .

(7)

r e s p e c t ) :

I f the w o r k e r s d o n o t ~ t e ~ d ~ f o r w a r d 2 o l i t i c a l ~ e m a n d s l w e s h a l l n e v e r b e a b l e to r a i s e o u r l i f e l e v e l a n d n o t

* I f the w o r k e r s u n i t e a n d do n o t put f o r w a r d p o l i t i c a l d e m a n d s . . . "

G e n e r a l l y s p e a k i n g , the c o r r e c t t r a n - s l a t i o n o f the l a s t e x a m p l e (as w e l l as o f o t h e r c o n s t r u c t i o n s e x p l a i n a b l e in t e r m s o f c o - o r d i n a t i v e r e d u c t i o n ) c o u l d a l s o be o b t a i n e d w i t h o u t r e c o u r s e to tlle i n f o r m a t i o n a b o u t s y n t a c t i c w o r d - g r o u p i n g . I n s t e a d , o n e c o u l d u s e a " d e e p e r " d e s c r i - p t i o n o f the t e x t to be t r a n s l a t e d , w i t h e l l i p t i c a l c o n s t r u c t i o n s t r a n s f o r m e d i n t o t h e i r f u l l r e p r e s e n t a t i o n s . H o w e v e r , t h i s k i n d o f t r a n s f o r m a t i o n w o u l d be b a s i c a l l y s u p e r f l u o u s , f o r in t h e s y n t h e s i s p r o c e s s it w o u l d be n e c e s s a r y to r e d u c e the c o n - s t r u c t i o n s in q u e s t i o n b a c k to t h e i r el- l i p t i c a l f o r m u s i n g b u t s l i g h t l y d i f f e - r e n t r u l e s . It s e e m s t h e r e f o r e p r e f e r a b l e f o r the o p e r a t i o n s o f t r a n s l a t i o n p r o p e r to r e s u l t d i r e c t l y i n axx e l l i p t i c a l c o n - s t r u c t i o n a n a l o g o u s to the o r i g i n a l o n e a ~ d d i f f e r i n g o n l y i n d e t a i l s o f i t s s u r f a c e e x p r e s s i o n ( s u c h as the p o s i t i o n o f n e g a t i o n i n the a b o v e e x a m p l e ) , s p e c i - f i e d b y the s u b s e q u e n t s y n t h e s i s p r o c e - d u r e .

So we see t h a t w h i l e t h e c o m p o n e n t o f the C S R u n d e r d i s c u s s i o n r e g i s t e r s o n l y s e m a n t i c a l l y s i g n i f i c a n t p h e n o m e n a o f t e x t s t r u c t u r e , the m e a n s o f r e p r e s e n t i n g t h e m i n it r e m a i n e s s e n t i a l l y s u p e r f i c i a l , so as to s a t i s f y b o t h the " s e m a n t i c i t y " a n d the " s u p e r f i c i a l i t y " r e q u i r e m e n t s . Anaphor_ic r e l a t i o n s b e t w e e n t e x t u n i t s

F o r i n t e r p r e t i n g t e x t s in r e s p e c t o f tlleir s i c a l i f i c a t i o n a n d e s p e c i a l l y d e n o - t a t i o n , the s t r u c t u r e o f a n a p h o r i c r e l a - t i o n s b e t w e e n t h e i r u n i t s is o n t h e w h o l e n o l e s s i m p o r t a n t t h a n t h e i r p r e d i c a t e - a r g u m e n t s t r u c t u r e . H o w e v e r , the a n a p h o - r i c s t r u c t u r e is e x p r e s s e d m a i n l y b y le- x i c a l r e p e t i t i o n , a n d t h i s c a n be e a s i l y a c c o u n t e d f o r i f w e r e q u i r e t h a t as l o n g as o n e t e x t is d e a l t w i t h , o n e a n d the s a m e t r a n s l a t i o n e q u i v a l e n t s h o u l d be se- l e c t e d , so f a r as p o s s i b l e , f o r a l l oc- c u r r e n c e s o f o n e a n d t h e s a m e l e x e m e (le- x e m e b e i n g d e f i n e d as a w o r d t a k e n in o n e o f i t s v a r i o u s l e x i c a l m e a n i n g s ) . G i v e n t h i s r e q u i r e m e n t ( w h i c h a p p e a r s to be n a - t u r a l e n o u g h and, b u t f o r s o m e s p e c i a l c a s e s , e a s y to c o m p l y w i t h ) , t h e r e is n o n e e d to i n c l u d e t h i s s t r u c t u r e i n the C S R in i t s f u l l form. It s e e m s s u f f i c i e n t to i n d i c a t e it o n l y f o r t h o s e t y p e s o f l a n g u a g e u n i t s w h i c h d i r e c t l y d e p e n d f o r t h e i r t r a n s l a t i o n o n the p r o p e r t i e s o f t h e i r a n t e c e d e n t s i n t h e t e x t at h a n d .

I n J a p a n e s e (as a l s o in o t h e r l a n g u a -

g a s ) t h e r e a r e two t y p e s o f s u c h u n i t s . T h e f i r s t t y p e a r e p r o n o u n s : w h e n t r a n s l a t i n g , say, the p r o n o u n s o r e , the c h o i c e o f o n e o f tile w o r d s : t h i ~ , lle~ s h e , i t s t h e , o ~ e t c . , - as i t s text e q u i v a l e n t w i l l b e d e t e r m i n e d , a m o n g o t h e r t h i n g s , b y t h e s y n t a c t i c c l a s s o f the u n i t c h o s e n as the e q u i v a l e n t o f i t s saltecedent. I f t h i s u n i t is a n o u n , o n e w i l l a l s o n e e d to ]~low i t s n u m b e r a n d

(for Russia~l) g e n d e r .

T h e s e c o n d t y p e o f u n i t s w h i c h c a n - n o t be t r a n s l a t e d p r o p e r l y w i t h o u t in- f o r m a t i o n a b o u t t h e i r a n t e c e d e n t s is m o r e s p e c i f i c . T h e s e a r e w o r d s w h i c h a r e g r a p h i c a l l y i d e n t i c a l w i t h c o m p o n e n t s o f m o r e c o m p l e x u n i t s , a l s o l e x i c a l i z e d

f r o m the p o i n t o f v i e w o f t h e i r s e m a n t i c b e h a v i o u r j a n d w h i c h ca~1 f u n c t i o n as s t r u c t u r a l s u b s t i t u t e s f o r the l a t t e r . W h e n u s e d in t h i s f u n c t i o n , s u c h w o r d s m u s t b e r e p l a c e d e i t h e r b y the t r a n s l a -

t i o n e q u i v a l e n t s o f t h e i r 6uatecederlts I o r b y p r o n o u n s ( w i t h the d a t a on t h e s e a n t e c e d e n t s u s e d i n the s ~ m e f a s h i o n as in t r a n s l a t i n g u s u a l p r o n o u n s ) . A n y w a y , t h e i r o w n tra/~slation e q u i v a l e n t s a r e r u l e d out.

T h u s , the w o r d n i m o t s u , m e a n i n g "lu~'gage" i f u s e d i n d e p e n d e n t l y , w i l l be t r a n s l a t e d as "tllem" o r " t h e s e p a r c e l s " in the c o n t e x t o f the s e n t e n c e

Ko,limo t s u - g a k a r i - ~'a m a z u n i m o t s u - n o m e g a t a - o h a k a r i m a s u ,

w h e r e ~ I z m o t s u is s u b s t i t u t e d f o r k o n i m o - t s u ( " p a r c e l " ) :

T h e c l e r k d e a l i n g w i t h ) a r c e l s f i r s t

~ i ~ s ~ e ~ t

t!~9_2~3e~3~

A S r e g a r d s a l l o t h e r t y p e s o f l e x i - cal u n i t s , o u r a p p r o a c h is t h a t the e x i s - t e n c e of' a n a p h o r i c r e l a t i o n s b e t w e e n t h e m sllould be c h e c k e d a n d t h e r e l a t i o n s t h e m - s e l v e s r e g i s t e r e d in t h e C S R f o r f u r t h e r p r o c e s s i n g o n l y in t h o s e i n f r e q u e n t s i t u - a t i o n s (due m o s t l y to d i s s i m i l a r i t i e s i n the c o m b i n a t o r i a l p r o p e r t i e s o f the o r i - g i n a l l a n g u a g e w o r d s a n d o f t h e i r tra/Is- l a t i o n e q u i v a l e n t s , t h i s n e c e s s i t a t i n g the u s e o f s y n o n y m o u s t r a n s f o r ~ n a t i o n s ) w h e r e it is i m p o s s i b l e to f u l f i l the a b o v e r e q u i r e m e n t o f t r a n s l a t i n g d i f f e - r e n t o c c u r r e n c e s o f the s a m e l e x e m e b y t h e sa~,le e q u i v a l e n t , a/Id o n e h a s to m a k e s u r e t h a t e m p l o y i n g d i f f e r e n t e q u i v a l e n t s i n t h i s c a s e d o e s n o t a f f e c t the o r i g i n a l a n a p h o r i c s t r u c t u r e o f the traxlslated text.

L i n e a r arranK~ement o f t e x t u n i t s

In d e a l i n g w i t h l i n e a r a r r a ~ ' e m e n t o f u n i t s in a ~ext i n the frs/nework o f axl a u t o m a t i c tra~islation s y s t e m , it is importalat to d i s t i n g u i s h b e t w e e n two

(8)

r e l a t i o n s r e q u i r i n g d i f f e r e n t p r o c e s s i n g d u r i n g t r a n s l a t i o n .

I f the f i r s t t y p e o f s u c h r e l a t i o n s o c c u r s b e t w e e n two t e x t u n i t s , the p o s i - t i o n o f o n e o f t h e m i n r e s p e c t to the o t h e r is m e r e l y a s u r f a c e s y n t a c t i c m a r - k e r s h o w i n g the p r e s e n c e (or a b s e n c e ) of,

says s o m e s e m a n t i c o - s y ~ I t a c t i c l i n k be- t w e e n the two, a n a n a p h o r i c r e l a t i o n be- t w e e n them, a s y n t a c t i c w o r d - g r o u p b o u n - d a r y , a n d so on. I n c a s e o f the s e c o n d t y p e s u c h p o s i t i o n is me~nillgul in it- sel~', i r r e s p e c t i v e o f w h e t h e r it s h o u l d o r s h o u l d n o t b e t a k e n i n t o accotult w h e n e s t a b l i s h i n g c e r t a i n s y n t a c t i c l i n k s o r b o u n d a r i e s : it s h o w s the r e l a t i v e p o s i - t i o n s o f the u n i t s i n q u e s t i o n in the c o ~ m n u n i c a t i v e s t r u c t u r e o f the text (i.e. f r o m the p o i n t o f v i e w o f i t s f u n c t i o n a l p e r s p e c t i v e ) .

It s h o u l d be n o t e d t h a t the o p p o s i t i o n o f t h e s e two t y p e s o f p o s i t i o n a l r e l a - t i o n s is n o t the s a m e as that o f r i g i d ( f i x e d ) a n d f r e e w o r d o r d e r : w h i l e free. w o r d o r d e r is a l w a y s " s e m a n t i c " to s o m e e x t e n t , r i g i d w o r d o r d e r ca/is to o u r m i n d , c o r r e s p o n d to b o t h c a s e s , d e p e n d - i n g o n w h e t h e r t h e g i v e n s y n t a c t i c c o n - s t r u c t i o n w i t h r i g i d w o r d o r d e r c o r r e l a - tes i n t h e l a n g u a g e u n d e r c o n s i d e r a t i o n w i t h a n y a l t e r n a t i v e c o n s t r u c t i o n s p r o - v i d i n g t h e s a m e p r e d i c a t e - a r g u m e n t s t r u c - t u r e alld/or s y n t a c t i c g r o u p i n g o f t h e i r E o m p o n e n t s ~ but a s s i g n i n g t h e m a d i f f e - rent l i n e a r arra/l~'ement (a p o s s i b l e e x a m - p l e o f s u c h a l t e r n a t i v e c o n s t r u c t i o n s w h i c h c a n be c o n s i d e r e d as d e p e n d e n t f o r

t h e i r s e l e c t i o n on the w o r d o r d e r r e q u i - red, r a t h e r t h a n v i c e v e r s a , is f u r n i s h - e d by p r e d i c a t i v e c o n s t r u c t i o n s d i f f e r - i n g i n t h e i r v o i c e v a l u e ) .

G u i d e d by t h e " e x / l a u s t i v e n e s s " p r i n - c i p l e , we j u d g e it e x p e d i e n t f o r the C S R to c o n t a i n i n f o r m a t i o n b o t h a b o u t the "mea/lingful" axld the " a u x i l i a r y " t y p e o f w o r d - o r d e r r e l a t i o n s , t h o u z % r e p r e s e n t e d a n d e m p l o y e d in d i f f e r e n t w a y s .

T h e s p h e r e o f employTnent o f the " a u x i - l i a r y w o r d - o r d e r i n f o r m a t i o n is p r a c t i - c a l l y l i m i t e d to the a n a l y s i s a n d s y n t h e - sis p r o c e d u r e s . D u r i n g t h e a n a l y s i s p h a s e t h i s i n f o r m a t i o n s e r v e s m a i n l y as a m e a n s o f r e v e a l i n g a n d f o r m a l l y r e p r e s e n t i n g u n i t s a n d c o n s t r u c t i o n s p e r t a i n i n g to o t h e r c o m p o n e n t s o f the CSR; i n t h e s y n - t h e s i s p h a s e it is u s e d to o b t a i n t h e c o r r e c t f o r m o f the s a m e t y p e o f u n i t s a n d c o n s t x n l c t i o n s i n t h e t a r g e t l a n g u a g e . T h e c o r r e s p o n d i n g f a c t s o f the l i n e a r a r - r a n g e m e n t o f t h e t e x t d o n o t p l a y a n y i n - d e p e n d e n t r o l e e i t h e r i n i t s s e m a n t i c p r o c e s s i n g o r i n c h o o s i n g t r a n s l a t i o n e q u i v a l e n t s f o r i t s u n i t s , so it is p e r - f e c t l y s u f f i c i e n t to r e g a r d t h e m as j u s t o n e o f the v a r i o u s f e a t u r e s o f tile u n i t s

a n d c o n s t r u c t i o n s i n v o l v e d , i m p o r t a n t e n o u g h to be r e g i s t e r e d in t h e i r l i n g u i - s t i c d e s c r i p t i o n s , b u t c o n s t i t u t i n g n o s e p a r a t e o b j e c t s o f d e s c r i p t i o n . To in- c o r p o r a t e t h e s e f a c t s i n the CSi~, we r e - s o r t to nuunbering the w o r d s i n the t e x t p r o c e s s e d i n the o r d e r o f t h e i r s u c c e s - s i v e o c c u r r e n c e (tile r e s u l t i n g n u m b e r s u s e d a l s o , in c o m b i n a t i o n w i t h s o m e o t h e r d a t a , as t h e i r i d e n t i f i e r s t h r o u g h o u t the p r o c e s s i n g ) .

If, on tile c o n t r a r y , a c o n s t r u c t i o n is c h a r a c t e r i z e d by a m e a n i n g f u l w o r d - o r d e r r e l a t i o n b e t w e e n i t s l e x i c a l c o m - p o n e n t s , it is g i v e n t h e s t a t u s o f a s p e c i a l " p o s i t i o n a l u n i t " , d i s t i n c t f r o m the c o n s t r n c t i o n i t s e l f a n d r e p r e s e n t e d e x p l i c i t l y i n ~he CSI~. S u c h a u n i t d i - r e c t l y p a r t i c i p a t e s i n s e m a n t i c o p e r a - t i o n s , i n c l u d i n g t h o s e o f t r a n s l a t i o n p r o p e r , w h i c h m e a n s t h a t it m u s t flare i t s o w n d e s c r i p t i o n (in p a r t i c u l a r , i t s o ~ I t r a n s l a t i o n e q u i v a l e n t ) . It s t a n d s to r e a s o n t h a t t h e r a n g e o f inter-lo/l~- u a g e c o r r e s p o n d e n c e s i n v o l v i n g p o s i t i o - n a l u n i t s o f e i t h e r t h e s o u r c e o r the

t a r g e t laxlguage is n o t r e s t r i c t e d to t h i s c l a s s of u n i t s a l o n e , a s the c o m m u n i c a t - i v e o r g a n i z a t i o n o f t e x t COjl a l s o be c o n - v e y e d b y s o m e t y p e s o f s y n t a c t i c c o n s t - r u c t i o n s a n d l e x i c a l e l e m e n t s . An e x a m - p l e is the J a p a n e s e p a r t i c l e ~ a s u s e d in i n d e p e n d e n t s e n t e n c e s (or, s o m e t i m e s , i n the m a i n c l a u s e s o f c o m p l e x s e n t e n - c e s ) , w h e r e i t s b e s t R u s s i a n e q u i v a l e n t

(if t h e salne t y p e o f p r e d i c a t i v e c o n s t - r u c t i o n is u s e d ) is t h e r e v e r s e o r d e r o f the s u b j e c t a n d t h e p r e d i c a t e .

A s w e see, h e r e a l s o , as i n the o t h e r c o m p o n e n t s o f the CSR, t h e r e is a c o m p r o - m i s e b e t w e e n the " s e m a n t i c i t y " a n d the

" s u p e r f i c i a l i t y " r e q u i r e m e n t s . On the o n e ha/Id, e x p l i c i t i n d i c a t i o n o f tile w o r d - o r d e r r e l a t i o n s f o u n d to be meazlingful i n the text p r o c e s s e d c h a r a c t e r i z e s s o m e a s p e c t s o f i t s s e m a n t i c s t r u c t u r e . O n t h e o t h e r ha/~d, t h e forth o f " p o s i t i o n a l u n i t s " c h o s e n to r e p r e s e n t t h e m is ra- t h e r s u p e r f i c i a l in t h a t it d o e s n o t d i s - p l a y t h e s e m a n t i c c o r r e l a t i o n s u n d e r l y i n g - the i n t e r c h s / M / e a b i l i t y o f t h e s e u n i t s w i t h o t h e r s t r u c t u r a l t e x t f e a t u r e s ( s u c h as the s e l e c t i o n o f t h e n e x u s vs. j u n c - t i o n f o r m o f e x p r e s s i n g the p r e d i c a t e - a r ~ u m e n t d e p e n d e n c i e s b e t w e e n t e x t u n i t s ; the u s e o f " r e l a t i o n a l " w o r d s ~ o f the 0 p e r , o r F u n c i t y p e a n d t h e like; the oc- c u r r e n c e o f e m p h a t i c p a r t i c l e s a n d c o n - s t r u c t i o n s , e t c . ) .

C o n c l u s i o n

(9)

tile b e g i n n i n g o f the p a p e r as e s s e n t i a l f o r t h e b a s i c l e v e l o f f o n u a l l y r e p r e - s e n t i n g t e x t s t r u c t u r e in a n a u t o m a t i c t r a n s l a t i o n s y s t e m . We s h a l l n o w b r i e f l y r e c a p i t u l a t e ~he p o i n t s .

T h e " s e m a n t i c i t y '' r e q u i r e m e n t is a c - c o u n t e d f o r i n the CSR, in t h e f i r s t p l a c e , b y t h e v e r y p o s s i b i l i t y p r o v i d e d i n it o f e x p l i c i t l y d e s c r i b i n g the f i v e m o s t i m p o r t a n t a s p e c t s o f t e x t s t r u c t u r e a n d c o m p o s i t i o n , a s s t a t e d a b o v e . T h e q u e s t f o r " s e m a n t i c i t y " f o r m s a l s o the b a s i s o f t h e p r i n c i p l e s w e e m p l o y in se- l e c t i n g c o n c r e t e i n f o r m a t i o n to b e m a d e e x p l i c i t . A m o n g t h e s e o n e c a n m e n t i o n t h e c r i t e r i o n o f s t r u c t u r a l s i g n i f i c a n c e o f the u n i t s to b e r e p r e s e n t e d i n the C S R a s s e p a r a t e w o r d s o r q u a s i - w o r d s ; t h e p r i n c i p l e o f " i m m e d i a t e sems/itic s u b s t a ~ - t i a t i o n " o f the p r e d i c a t e - a r g u J n e n t s y n t a - c t i c r e l a t i o n s r e g i s t e r e d i n it; the re- q u i r e m e n t o f s u p p l y i n g the e l e m e n t s o f t h e l e x i c o - g r a m m a t i c a l c o m p o s i t i o n o f the t e x t u n d e r c o n s i d e r a t i o n , as w e l l as o f i t s l i n e a r a r r a n g e m e n t , w i t h i n d i c a - t i o n s o f t h e i r m e a n i n g f u l o r a u x i l i a r y r o l e w i t h i n t h i s text; the e m p l o y m e n t o f a s p e c i a l f o r m a l l a n g u a g e to d e f i n e the s e m a n t i c p r o p e r t i e s o f w o r d s a n d w o r d - c o m b i n a t i o n s , etc.

T h e

" s u p e r f i c i a l i t y " of

the C S R is s e e n , erelong o t h e r t h i n g s , i n t h e f a c t t h a t t h i s l e v e l o f t e x t r e p r e s e n t a t i o n e n v i s a g e s the u s e o f l e x i c o - s y n t a c t i c t r a n s l a t i o n e q u i v a l e n t s a n d d o e s n o t n e - c e s s a r i l y r e q u i r e d e c o m p o s i t i o n o f l e x e - rues i n t o c o m b i n a t i o n s o f s m a l l e r u n i t s o f mea/~ing, s u c h d e c o m p o s i t i o n c o n s i d e r - e d a p p r o p r i a t e b u t i n c o m p a r a t i v e l y r a r e c a s e s o f d e s c r i p t i v e a n d i n t e r p r e t a t i v e t r a n s l a t i o n . O t h e r f e a t u r e s o f the C S R o r i g i n a t i n g f r o m the " s u p e r f i c i a l i t y " p r i n c i p l e a r e a b s e n c e o f e x h a u s t i v e in- f o r m a t i o n a b o u t t h e a n a p h o r i c s t r u c t u r e o f the text, i n c l u s i o n o f o n l y t h o s e d a - t a o n s y n t a c t i c w o r d - g r o u p i n g w h i c h a r e o f i m p o r t a n c e f o r the t r a n s l a t i o n p r o - c e s s , d i r e c t t r 6 u ] s l a t i o n o f e l l i p t i c a l c o n s t r u c t i o n s , w h e r e v e r p o s s i b l e , etc.

F i n a l l y , the " e x h a u s t i v e n e s s " r e q u i r e - m e n t is s p e c i f i e d a s w:hat m a y be c a l l e d t h e " l o s e - n o t h i n g " p r i n c i p l e o f c o n s t r u c - t i n g tlle CSR. It inca/is t h a t w h e n s p e c i a l l a b e l s a r e fetched i n it to e x p l i c i t l y d i s p l a y v a r i o u s s t r u c t u r a l e l e m e n t s im- p l i c i t l y p r e s e n t i n t h e s u r f a c e f o r m o f the t e x t at h a n d , tile s u r f a c e t e x t m a r k - e r s ( s u c h as the " a u x i l i a r y " t y p e w o r d o r d e r ; m o r p h o l o g i c a l f e a t u r e s e x p r e s s i n g t ~ r a m m a t i c a l a g r e e m e n t o r g o v e r n m e n t ; f u n c t i o n w o r d s a n d p u n c t u a t i o n m a r k s h a - v i n g n o i n d e p e n d e n t t r a n s l a t i o n e q u i v a - l e n t s , a ~ d so on), t h o u g h h a v i n g b e e n u s e d a l r e a d y to r e v e a l t h o s e e l e m e n t s , a r e n o t e l i m i n a t e d f r o m the r e p r e s e n t a -

t i o n b e i n g f o r m e d . T h e y a r e m e r e l y s u p - p l e m e n t e d by the d e s i g n a t i o n s o f the e l o - me]its r e v e a l e d , as w e l l as by f o r m a l in- d i c a t i o n s o f t h e i r o~al a u x i l i a r y n a t u r e , a n d t h u s r e m a i n a c c e s s i b l e f o r a n y f u r - t h e r a n a l y s i s t h a t

might

p r o v e u s e f u l , s h o u l d it t u r ~ o u t t h a t t h e i r f ~ m c t i o n s i n the t e x t a r e n o t l i m i t e d to just i d e n - t i f y i n g tile u n i t s a l r e a d y m a d e e x p l i c i t .

N o t e s

1 3.M.~anan~¢Ha.

!< np0OneMe n0CTp0-

eH~S

¢0pManBH0~ M0~enM np0uecca nepeB0-

~a. - B EH. :

Te0pMs nepeB0~a M HayqHBIe

O C H O B H H O ~ F O T O B K H

HepeBOAq~EOB. qaCTB

~. M., [975, C. 'I65-~72.

2 Z.M. S h a l y a p i n a . A u t o m a t i c t r a n s l a - t i o n as a m o d e l o f tlle h u m a n tra/islation a c t i v i t y . - I n t e r n a t i o n a l F o r u m on I n f o r - m a t i o n a n d D o c u m e n t a t i o n , 1980, v o l . 5 , N o . 2 , p . 1 3 - 2 3 .

3 A n e a r l i e r v e r s i o n o f t e x t r e p r e - s e n t a t i o n a i m e d at i n c o r p o r a t i n g the p r i n c i p l e s p r o p o s e d h a d b e e n d e v e l o p e d i n the f r a m e w o r k o f all A/iglo-I{ussian au- t o m a t i c t r a n s l a t i o n p r o j e c t a/id d e s c r i b - e d b r i e f l y

in:3.M.Wa~HMHa.

AHF~o~pyc-

c E ~

MHOFOaoneETH~ aBTOMaTZqecK~z

cn0-

Bap~ (APMAC). - M a m H H H ~ nepeB0~

np~Ena~HaS nHHFBMCTNKa. BS:H. [7. M.

[974, C.

7-67.

T h e n o t i o n o f l e v e l s o f t e x t p r o - c e s s i n z is n o t i d e n t i c a l w i t h the n o t i o n o f l e v e l s o f

text

r e p r e s e n t a t i o n (al- t h o u g h t h e r e c e r t a i n l y e x i s t s o m e s t r o n g

correlations).

L i n g u i s t i c a l l y , the f o r - m a r c o r r e s p o n d s

r a t h e r

to tlle n o t i o n o f la/16u/age t i e r s i n t r o d u c e d in:

~.,D.Bap-

~ y ~ B . 0CHOBBI

0HM0aTeZBH0~

~ M H F B H C T M K M .

M., "HayEa", ~977.

5 A d e t a i l e d f o r m a l d e f i n i t i o n o f t h i s la~ICuage a n d a d e s c r i p t i o n o f s o m e o f i t s l i n g u i s t i c i n t e r p r e t a t i o n s a r e

g i v e n in:

3.M.~aasHHHa. ~opMaaBH~I~

2BME

~ 2 2 3 a H H O H T O J I E O B a H H ~ CJIOB PI O Z O B O O O q e - T a H O e . -

[Ip0OneMu

E z O e p H e T ~ E Z . B~In. 36. M., [ 9 7 9 , c. 2 4 7 - 2 7 8 .

6 T h e r e is a l s o a p a p e r on a F r e n c h - RussisJl a u t o m a t i c t r a n s l a t i o n p r o j e c t w h e r e a s i m i l a r t y p e o f s t r u c t u r a l i n f o r - m a t i o n is m e n t i o n e d as n e c e s s a r y (see:

D.A.AnpecsH

z Ap. H~HrBZCT~qecEoe 00ec-

References

Related documents

Figure 5: Correlation between detection accu- racy and human evaluation scores on systems from WMT 13’ against non-reference sentences, using the syntactic CFG features described

is thousands of times more generalizable. People can automatically process stories, but computers must be programmed to have these skills. My work teaches computers the ability

Hindawi Publishing Corporation Advances in Difference Equations Volume 2010, Article ID 381932, 24 pages doi 10 1155/2010/381932 Research Article Structure of Eigenvalues of Multi

A rule-based approach tries to model linguistic knowledge to formalise rules allowing the processing of data from the input source through more abstract representations and over to

In this work, we showed (on a small data set) that the automatic simplification of English rela- tive clauses can improve English-to-Serbian and English-to-German machine

To estimate the true accuracy of the diegesis clas- sifier over this corpus we randomly sampled and checked the diegesis of 200 texts (including the sin- gle homodiegetic text).. Of

In this work, we showed (on a small data set) that the automatic simplification of English rela- tive clauses can improve English-to-Serbian and English-to-German machine

Clause number Paragraph number Clause number Clause number Clause number Clause number Establis h the corpus Create Docume nt-Data matrix Create abstract data model