• No results found

PHONY: A Heuristic Phonological Analyzer

N/A
N/A
Protected

Academic year: 2020

Share "PHONY: A Heuristic Phonological Analyzer"

Copied!
6
0
0

Loading.... (view fulltext now)

Full text

(1)

PHONY: A H e u r i s t i c P h o n o l o g i c a l A n a l y z e r * L e e A. B e c k e t

I n d i a n a U n i v e r s i t y

D O M A I N A N D T A S K

P H O N Y is a p r o g r a m to d o p h o n o l o g i c a l a n a l y s i s . W i t h i n t h e g e n e r a t i v e m o d e l of g r a m m a r the f u n c t i o n of t h e p h o n o l o g i c a l c o m p o n e n t is to a s s i g n a p h o n e t i c

r e p r e s e n t a t i o n to an u t t e r a n c e b y m o d i f y i n g the u n d e r l y i n g r e p r e s e n t a t i o n s (URs) o f its c o n s t i t u e n t m o r p h e m e s . M o r p h e m e s are t h e m i n i m a l m e a n i n g u n i t s o f language, i.e. t h e s m a l l e s t u n i t s in t h e e x p r e s s i o n s y s t e m w h i c h c a n be c o r r e l a t e d w i t h a n y p a r t of t h e c o n t e n t system, e.g. u n + t i r + i n g + l y . URs are a b s t r a c t e n t i t i e s w h i c h c o n t a i n t h e

i d i o s y n c r a t i c i n f o r m a t i o n a b o u t p r o n o u n c i a t i o n s of m o r p h e m e s .

(1)

P H O N O L O G I C A L

U n d e r l y i n g C O M P O N E N T P h o n e t i c R e p r e s e n t a t i o n s . . . > R e p r e s e n t a t i o n s

(URs) (rules)

P h o n o l o g i c a l a n a l y s i s a t t e m p t s to d e t e r m i n e the n a t u r e of the URs a n d to d i s c o v e r the g e n e r a l p r i n c i p l e s or r u l e s t h a t r e l a t e t h e m to the p h o n e t i c r e p r e s e n t a t i o n s .

(2)

URs

P r o n o u n c i a t i o n s P H O N Y

( p h o n o l o g i c a l anal

R u l e s

T h e input to P H O N Y are p r o n o u n c i a t i o n s of w o r d s a n d p h r a s e s u p o n w h i c h a p r e l i m i n a r y m o r p h o l o g i c a l a n a l y s i s h a s b e e n c o m p l e t e d . T h e y h a v e b e e n d i v i d e d into m o r p h e m e s , a n d d i f f e r e n t i n s t a n c e s of the same m o r p h e m e h a v e b e e n a s s o c i a t e d . T h e s e a r e r e p r e s e n t e d as s t r i n g s of p h o n e t i c s y m b o l s i n c l u d i n g m o r p h e m e - a n d w o r d - b o u n d a r i e s . I n d i c e s a r e u s e d to a s s o c i a t e v a r i o u s i n s t a n c e s o f the s a m e m o r p h e m e .

(3)

# i s a r a p # # 1 s a r a b + 2 d a # # 1 s a r a v + 3 u # # 1 s a r a v + 4 e # # 5 a d + 6 a # # 5 a t # , , ,

T h e o u t p u t of P H O N Y is a set o f p h o n o l o g i c a l r u l e s or r e g u l a r i t i e s in the data, as w e l l as a set o f ' u n d e r l y i n g r e p r e s e n t a t i o n s ' for the m o r p h e m e s . T h e p h o n o l o g i c a l r u l e s g e n e r a t e the v a r i o u s p r o n o u n c i a t i o n s of the m o r p h e m e s f r o m their u n d e r l y i n g

r e p r e s e n t a t i o n s .

* T h i s r e s e a r c h w a s s u p p o r t e d in p a r t b y N a t i o n a l S c i e n c e F o u n d a t i o n g r a n t n u m b e r MCS 8 1 - 0 2 2 9 1 .

R E P R E S E N T A T I O N

In G e n e r a t i v e P h o n o l o g y s o u n d s a r e r e p r e s e n t e d as m a t r i c e s o f f e a t u r e

s p e c i f i c a t i o n s , t h e p h o n e t i c s y m b o l s b e i n g a s h o r t h a n d for t h e s e m a t r i c e s .

(4)

- s y l l a b i c + consonanta~ - c o n t i n u a n t + v o i c e

- n a s a l

+ a n t e r i o r + c o r o n a l

T h e set o f ' d i s t i n c t i v e features' p r o p o s e d b y C h o m s k y a n d H a l l e [2] w e r e c l a i m e d to b e s u f f i c i e n t to d i s t i n g u i s h t h e s o u n d s in a n y l a n g u a g e . F u r t h e r t h e s e f e a t u r e s w e r e all c l a i m e d to h a v e t w o v a l u e s ; the f e a t u r e w a s e i t h e r p r e s e n t o r absent. T h e r e h a s b e e n a fair aunount o f d i s p u t e a b o u t t h e s p e c i f i c features, a n d s e v e r a l a d d i t i o n a l o n e s h a v e b e e n p r o p o s e d , e.g. g r a v i t y , a d v a n c e d t o n g u e root. T h e r e h a s a l s o b e e n c o n s i d e r a b l e d i s p u t e a b o u t w h e t h e r the f e a t u r e s a r e a l l b i n a r y . N e v e r t h e l e s s m o s t p h o n o l o g i s t s use the o r i g i n a l b i n a r y features, o f t e n w i t h a f e w a d d i t i o n a l ones. P h o n o l o g i c a l r u l e s a r e o p e r a t i o n s u p o n sets o f t h e s e f e a t u r e

m a t r i c e s b y w h i c h f e a t u r e s p e c i f i c a t i o n s a r e a s s i g n e d to the m a t r i x w h e n it a p p e a r s in a c e r t a i n c o n t e x t . T h e r u l e e x p r e s s e d (in s h o r t h a n d ) n o r m a l l y as

(e)

S -> S /ji (read s b e c o m e s s in p o s i t i o n i m m e d i a t e l y b e f o r e i)

w o u l d b e e x p r e s s e d as f o l l o w s u s i n g f e a t u r e m a t r i c e s .

(7)

E

coronal

anterio l

syllabi

a n t e r i o r I ~ h i g h 2 / - " h i g h I

s t r i d e n t ~ b a c k J

T h e r e p r e s e n t a t i o n p r o v i d e s a l a n g u a g e in w h i c h to e x p r e s s h y p o t h e s e s . T h e t a s k is to find s t a t e m e n t s in t h i s l a n g u a g e to e x p r e s s the data. T h u s t h e r e p r e s e n t a t i o n

i m p l i c i t l y d e f i n e s t h e s e a r c h space. T h e s e a r c h s p a c e is r e s t r i c t e d b y t h e f o l l o w i n g c o n s t r a i n t o n t h e 'distance' b e t w e e n a U R a n d its p r o n o u n c i a t i o n s . E v e r y f e a t u r e s p e c i f i c a t i o n in the UR m u s t b e p r e s e n t in a

(2)

T h i s c o n s t r a i n t r e s t r i c t s its p o s s i b l e URs to /sarap/, /sarah/, /sarav/, / s a r a f / . E v e n If] d o e s n o t a p p e a r in a n y o f the p r o n o u c i a t i o n s o f t h i s m o r p h e m e , its

+ c o n t i n u a n t s p e c i f i c a t i o n o c c u r s in Iv] a n d its - v o i c e s p e c i f i c a t i o n o c c u r s in [p]; its o t h e r f e a t u r e s p e c i f i c a t i o n s are c o m m o n to [p], Cb], Iv]. T h i s c o n s t r a i n t is w e a k e r than the " s t r o n g a l t e r n a t i o n c o n d i t i o n " (cf. [4]), w h i c h w o u l d r e s t r i c t the f i n a l U R s e g m e n t to b e /p/, /b/, or /V/o T h e t e r m " a l t e r n a t i o n " w i l l be i m p o r t a n t o f the d i s c u s s i o n b e l o w ; h e r e [p] vs. [b] vs. Iv] is an a l t e r n a t i o n .

T H E P R O B L E M O F M U L T I P L E S O L U T I O N S

It s h o u l d b e p o i n t e d o u t t h a t m o s t o f t e n s e v e r a l sets o f c o m b i n a t i o n s o f u n d e r l y i n g r e p r e s e n t a t i o n s a n d p h o n o l o g i c a l r u l e s c a n be used to d e r i v e the s a m e p r o n o u n c i a t i o n s . T h i s c o u l d h a p p e n in s e v e r a l w a y s . It c o u l d b e u n c l e a r w h a t t h e UR is, a n d d i f f e r e n t URs t o g e t h e r w i n h d i f f e r e n t r u l e s c o u l d d e r i v e t h a t s a m e p r o n o u n c i a t o n s , i.e. the

d i r e c t i o n a l i t y o f the r u l e c o u l d b e u n c l e a r . C o n s i d e r m o r p h e m e 5 f r o m (3) a b o v e :

(8)

P r o n o u n c i a t i o n s : # a d ÷ a # #at#

S o l u t i o n I: U R /ad/ & R u l e d -, t / # S o l u t i o n 2: U R /at/ & R u l e t -> d / a a T h e s y m b o l # r e p r e s e n t s a w o r d b o u n d a r y , a n d t h e s y m b o l + r e p r e s e n t s a m o r p h e m e b o u n d a r y , T h e d i f f e r e n c e in the p r o n o u n c i a t i o n o f the l a s t s e g m e n t o f t h i s m o r p h e m e , d vs. t, is c a l l e d an a l t e r n a t i o n . G i v e n t h i s

a l t e r n a t i o n , o n e c o u l d m a k e t w o h y p o t h e s e s . O n e c o u l d h y p o t h e s i z e t h a t the UR is /ad/ a n d t h a t t h e r e is a r u l e w h i c h c h a n g e s d to t w h e n it o c c u r s a t the e n d o f a w o r d , or o n e c o u l d h y p o t h e s i z e t h a t the U R is /at/ a n d t h a t t h e r e is a r u l e w h i c h c h a n g e s t to d b e t w e e n a's. A l s o some p h e n o m e n a c o u l d b e e x p l a i n e d b y a s i n g l e m o r e g e n e r a l r u l e o r b y s e v e r a l m o r e s p e c i f i c r u l e s .

G e n e r a l l y , t h e r e a r e t w o a p p r o a c h e s t h a t c o u l d b e t a k e n t o d e a l w i t h the p r o b l e m o f m u l t i p l e p o s s i b l e s o l u t i o n s . O n e c o u l d a t t e m p t to i m p o s e r e s t r i c t i o n s o n w h a t c o u l d c o n s t i t u t e a v a l i d s o l u t i o n , or o n e c o u l d use an e v a l u a t i o n p r o c e d u r e to d e c i d e in c a s e s o f m u l t i p l e p o s s i b l e s o l u t i o n s . O n e c o u l d a l s o use b o t h o f t h e s e a p p r o a c h e s ; in w h i c h c a s e the m o r e r e s t r i c t i o n , the less e v a l u a t i o n is n e c e s s a r y . A n o r i g i n a l s i n g l e e v a l u a t i o n c r i t e r i o n - ' s i m p l i c i t y ' , as m a n i f e s t e d in the n u m b e r o f f e a t u r e s p e c i f i c a t i o n s u s e d - h a s n o t p r o v e d w o r k a b l e . A L s o no p a r t i c u l a r p r o p o s e d r e s t r i c t i o n s h a v e b e e n e m b r a c e d b y the v ~ s t m a j o r i t y o f p h o n o l o g i s t s .

I n d i v i d u a l p h o n o l o g i s t s are g e n e r a l l y g u i d e d in t h e i r e v a l u a t i o n s o f s o l u t i o n s , i.e. sets o f r u l e s a n d URs, b y v a r i o u s c r i t e r i a . T h e w e i g h t i n g o f t h e s e c r i t e r i a is l e f t o p e n . In this c o n n e c t i o n the ' c o d i f y i n g function' of the d e v e l o p m e n t o f e x p e r t s y s t e m s is p a r t i c u l a r y r e l e v a n t , i.e. in o r d e r to b e p u t into a p r o g r a m the c r i t e r i a m u s t b e f o r m a l i z e d a n d w e i g h t e d . j 5 ] A l t h o u g h it h a s

s o m e t i m e s b e e n c l a i m e d t h a t n o set of d i s c o v e r y p r o c e d u r e s c a n b e s u f f i c i e n t tO p r o d u c e p h o n o l o g i c a l a n a l y s e s , this p r o g r a m is i n t e n d e d to d e m o n s t r a t e t h e f e a s i b i l i t y o f a p r o c e d u r a l d e f i n i t i o n o f the t h e o r y . T h e t h r e e m o s t w i d e l y u s e d c r i t e r i a a n d the m a n n e r in w h i c h t h e y a r e e m b e d d e d in P H O N Y w i l l n o w b e d i s c u s s e d .

P h o n o l o g i c a l P r e d i c t a b i l i t y

T h i s i n v o l v e s the p r e f e r e n c e o f s o l u t i o n s b a s e d p h o n o l o g i c a l e n v i r o n m e n t r a t h e r t h a n to t h o s e in w h i c h r e f e r e n c e is m a d e to m o r p h o l o g i c a l o r l e x i c a l c a t e g o r i e s o r i n v o l v i n g t h e d i v i s i o n o f the l e x i c o n i n t o a r b i t r a r y c l a s s e s . In o t h e r w o r d s , in d o i n g p h o n o l o g i c a l a n a l y s i s t h e c a t e g o r i e s o r m e a n i n g s o f m o r p h e m e s w i l l n o t be

c o n s i d e r e d , u n l e s s n o s o l u t i o n c a n b e f o u n d b a s e d o n just t h e s o u n d s o r s o u n d s e q u e n c e s i n v o l v e d . T h i s c r i t e r i o n is e m b o d i e d in PHONY, s i n c e n o i n f o r m a t i o n a b o u t m o r p h o l o g - ical o r s y n t a c t i c c a t e g o r i e s is a v a i l a b l e t o P H O N Y . If P H O N Y c a n n o t h a n d l e a n

a l t e r n a t i o n b y r e f e r e n c e to p h o n o l o g i c a l e n v i r o n m e n t , it w i l l r e t u r n t h a t t h i s is a n

' i n t e r e s t i n g c a s e ' . T h e a b i l i t y to i d e n t i f y the * i n t e r e s t i n g cases' is a m o s t v a l u a b l e one, s i n c e t h e s e a r e o f t e n t h e c a s e s t h a t l e a d to t h e o r y m o d i f i c a t i o n . It s h o u l d b e m e n t i o n e d t h a t P H O N Y c o u l d r e a d i l y be e x t e n d e d ( E x t e n s i o n I) to h a n d l e a c e r t a i n r a n g e o f s y n t a c t i c a l l y o r m o r p h o l o g i c a l l y t r i g g e r e d p h o n o l o g i c a l r u l e s . T h i s w o u l d i n v o l v e i n c l u d i n g in t h e i n p u t i n f o r m a t i o n a b o u t s y n t a c t i c c a t e g o r y , and, w h e r e r e l e v a n t , m o r p h o l o g i c a l c a t e g o r y o f t h e c o n s t i t u e n t m o r p h e m e s . T h i s i n f o r m a t o n w o u l d b e i g n o r e d u n l e s s P H O N Y w a s u n a b l e to p r o d u c e a s o l u t i o n , i.e. w o u l d h a v e r e t u r n e d " i n t e r e s t i n g cases"'. It w o u l d t h e n s e a r c h

for g e n e r a l i z a t i o n s b a s e d o n t h e s e c a t e g o r i e s .

N a t u r a l n e s s

T h i s i n v o l v e s the use o f k n o w e l d g e a b o u t w h i c h p r o c e e s e s a r e 'natural' to d e c i d e b e t w e e n a l t e r n a t e s o l u t i o n s , i.e. s o l u t i o n s i n v o l v i n g n a t u r a l p r o c e s s e s are p r e f e r r e d . A p r o c e s s f o u n d in m a n y l a n g u a g e s is j u d g e d to b e ' n a t u r a l ' . A l t h o u g h n a t u r a l p r o c e s s e s a r e o f t e n p h o n e t i c a l l y p l a u s i b l e , t h i s is n o t a l w a y s the c a s e . It s h o u l d b e m e n t i o n e d t h a t n o t o n l y is ' n a t u r a l n e s s ' a n a r b i t e r in c a s e o f s e v e r a l p o s s i b l e s o l u t i o n s , b u t it is a l s o a h e u r i s t i c t o l e a d t h e i n v e s t i g a t o r to p l a u s i b l e h y p o t h e s e s w h i c h h e c a n p u r s u e . P H O N Y c o n t a i n s a c a t a l o g u e o f n a t u r a l

p r o c e s s e s . W h e n a n a l t e r n a t i o n l o o k s as if it m i g h t b e the r e s u l t o f o n e of t h e s e p r o c e s s e s , the e n t i r e i n p u t c o r p u s o f s t r i n g s is t e s t e d to s e e . i f t h i s h y p o t h e s i s is valid.

S i m p l i c i t y

(3)

r u l e s c a n l e a d t o a r e d u c e d n u m b e r o f f e a t u r e s p e c i f i c a t i o n s .

T h e v a r i o u s p r o p o s e d c o n s t r a i n t s o n w h a t c a n b e v a l i d s o l u t i o n s g e n e r a l l y w o u l d c o r r e l a t e w i t h t h e d i f f e r e n c e s in t h e t e s t i n g p r o c e s s o f P H O N Y . M o s t o f t h e s e i n v o l v e d i f f e r e n c e s in a l l o w a b l e o r d e r i n g s o f r u l e s (e.g. ' u n r e s t r i c t e d e x t r i n s i c o r d e r i n g ' , ' f r e e r e a p p l i c a t i o n ' , ' d i r e c t m a p p i n g ' ; cf. [3]). A t p r e s e n t P H O N Y ' s t e s t i n g p r o c e s s i n v o l v e s c h e c k i n g if h y p o t h e s i z e d r u l e s h o l d , i.e. d o n o t h a v e c o u n t e r e x e m p l e s , i n t h e p h o n e t i c r e p r e s e n t a t i o n s ( s u c h a c r i t e r i o n d i s a l l o w s o p a c i t y o f t y p e l; of. [4]). P H O N Y c o u l d b e e x t e n d e d ( E x t e n s i o n 2) t o a l l o w t h e u s e r t o c h o o s e f r o m s e v e r a l o f t h e p r o p o s e d

c o n s t r a i n t s . T h i s w o u l d i n v o l v e u s i n g d i f f e r e n t t e s t i n g f u n c t i o n s . T h i s e x t e n s i o n w o u l d a l l o w a n a l y s e s o f t h e s a m e d a t a u n d e r d i f f e r e n t c o n s t r a i n t s t o e a s i l y b e c o m p a r e d . A d d i t i o n a l l y , n e w c o n s t r a i n t s c o u l d b e a d d e d a n d t e s t e d .

S T R U C T U R E O F P H O N Y

P H O N Y c a n b e d i v i d e d i n t o t h r e e m a j o r p a r t s ~ A L T F I N D E R , N A T M A T C H , a n d R U L E R E D .

A L T F I N D E R

A L T F I N D E R t a k e s t h e i n p u t s t i n g o f p h o n e t i c s y m b o l s a n d i n d i c e s i n d i c a t i n g i n s t a n c e s o f t h e s a m e m o r p h e m e , as in (3), a n d r e t u r n s for e a c h m o r p h e m e i n t u r n a r e p r e s e n t a t i o n i n c l u d i n g t h e n o n - a l t e r n a t i n g s e g m e n t s a n d l i s t o f a l t e r n a t i o n s w i t h t h e c o n t e x t s i n w h i c h e a c h a l t e r n a n t o c c u r s , f o r e x a m p l e ,

f o r m o r p h e m e I, a s i n (9).

(9)

s a r a p ~ b - ~ v

# s a r a p # # s a r a h + d a # # s a r a v + u # # s a r a v ÷ e # T h i s p r o c e s s i n v o l v e s c o m p a r i n g i n t u r n e a c h i n s t a n c e o f a g i v e n k e y m o r p h e m e w i t h t h e c u r r e n t h y p o t h e s i z e d u n d e r l y i n g

r e p r e s e n t a t i o n f o r t h a t m o r p h e m e , a n d for e a c h c a s e o f a l t e r n a t i o n s t o r i n g in N g r o u p s t h e d i f f e r e n t c o n t e x t s t r i n g s i n w h i c h t h e N a l t e r n a n t s o c c u r . T h e c o m p a r i s o n is

c o m p l i c a t e d b y t h e c o m m o n p r o c e s s e s o f e p e n t h e s i s ( i n s e r t i o n o f a s e g m e n t ) a n d e l i s i o n ( d e l e t i o n o f a s e g m e n t ) , a n d o c c a s i o n a l l y b y t h e m u c h m o r e r a r e l y o c c u r r i n g m e t h a t h e s i s ( i n t e r c h a n g e i n t h e p o s i t i o n s o f t w o s e g m e n t s ) . T h e s e p r o c e s s e s a r e i l l u s t r a t e d i n (10).

(10)

G i v e n U R / t a r i s k /,

E p e n t h e s i s ~ -> a [trisk][tarisak] w o u l d .~nv°Ive E l i s i o n a ->

[ t a r i k s ] " M e t h a t h e s i s sk -> k s T h e r e f o r e i n c a s e s w h e r e t h e s e g m e n t s b e i n g c o m p a r e d a r e n o t i d e n t i c a l it is n e c e s s a r y t o a s c e r t a i n w h e t h e r t h e y a r e v a r i a n t s o f a s i n g l e u n d e r l y i n g s e g m e n t o r o n e o f t h e s e p r o c e s s e s h a s a p p l i e d . T h e p o s s i b i l i t i e s a r e i l l u s t r a t e d in (11).

(ii)

G i v e n t w o p r o n o u n c i a t i o n s o f t h e s a m e m o r p h e m e

[ A B C . . . ] w h e r e A is a s s o c i a t e d w i t h D [ D E F . . . ] a n d B is n o t i d e n t i c a l t o E,

T h e r e a r e f o u r p o s s i b l e r e l a t i o n s h i p s :

Bi c... A\B\cl

" ' "

D E F ... D E F ...

A B C ... A B C ...

T h e c r i t e r i a u s e d t o d e c i d e b e t w e e n t h e s e r e l a t i o n s h i p s a r e (a) d e g r e e o f s i m i l a r i t y in e a c h o f t h e c o n c e i v a b l e a s s o c i a t i o n s , a n d (b) a m e a s u r e o f t h e s i m i l a r i t y o f t h e r e s t o f t h e s t r i n g s f o r e a c h o f t h e c o n c e i v a b l e a s s o c i a t i o n s .

A L T F I N D E R y i e l d s a l i s t o f a l t e r n a t i o n s b a s e d o n s e g m e n t s , a s i n (9). T h i s is t h e n c o n v e r t e d i n t o a l i s t o f a l t e r n a t i o n s b a s e d o n f e a t u r e s .

(12) P p - c o n t e x t s

b v

b - c o n t e x t s v - c o n t e x t s

,U,

V O I C E ÷

b - c o n t e x t s & v - c o n t e x t s p - c o n t e x t s C O N T I N U A N T +

v - c o n t e x t s b - c o n t e x t s & p - c o n t e x t s S i n c e e v e r y o n e o f t h e a l t e r n a t i o n s i n t h e f o r m e r m u s t d i f f e r b y a t l e a s t o n e f e a t u r e , t h e n e w l i s t m u s t c o n t a i n a s m a n y

(4)

(13)

# a d + a # # a t #

i I I 1

0 I 0 0 0

0 0 0 0 0

0 0 0 0 0

0 0 0 0 0

0 1 0 1 0 0 l 0

0 O 1 0 0 0 0 0 1 0

0 1 0 0 l 0 0 l 0 0

0 0 0 0 0 0 0 0 0 0

0 1 0 0 l 0 0 1 0 0

0 1 0 0 1 0 0 i 0 0

0 0 1 0 0 0 0 0 I O"

0 0 1 0 0 0 0 0 1 0

0 1 i 0 1 0 V O I C E 0 I 0 0

0 i 0 0 1 0 0 1 0 0

0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0

to t h e r u l e s t -> d / # a + a # d -> t / # a # , i.e. r e s p e c t i v e l y , o n e c a n ' t p r o n o u n c e t in the e n v i r o n m e n t # a + a # b u t r a t h e r m u s t p r o n o u n c e d, a n d o n e c a n ' t p r o n o u n c e d in the e n v i r o n m e n t # a # b u t r a t h e r m u s t

p r o n o u n c e t. T h e l a t t e r r u l e a n d t h e s e c o n d r e p r e s e n t a t i o n ( b o t h w i t h o u t t h e i n i t i a l t w o s e g m e n t s - in t h e i n t e r e s t s of space) in (13) a r e j u x t a p o s e d in (14).

(14)

1 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

D - > T / #

It is o f t e n t h e c a s e t h a t o n e o r b o t h o f t h e s e p o t e n t i a l 'rules' w i l l b e v a l i d , i.e. w o u l d be g e n e r a l i z a t i o n s t h a t w o u l d h o l d o v e r the p r o n o u n c i a t i o n s r e p r e s e n t e d in t h e

input. T h e s e 'rules' w o u l d , h o w e v e r , b e m u c h less g e n e r a l t h a n t h o s e w h i c h a r e f o u n d

in p h o n o l o g i c a l a n a l y s e s . It is a s s u m e d t h a t s p e a k e r / h e a r e r / l a n g u a g e l e a r n e r s c a n a n d d o g e n e r a l i z e f r o m t h e s e s p e c i f i c c a s e s to f o r m m o r e g e n e r a l rules. If t h i s w e r e n o t the c a s e h o w c o u l d s p e a k e r s c o r r e c t l y p r o n o u n c e m o r p h e m e s in n e w e n v i r o n m e n t s . W i t h i n t h e t h e o r y t h e c r i t e r i o n o f

s i m p l i c i t y is s e n s i t i v e t o t h e s e

g e n e r a l i z a t i o n s in t h a t s u c h g e n e r a l i z a t i o n s r e d u c e t h e n u m b e r o f f e a t u r e s p e c i f i -

c a t i o n s . W i t h i n P H O N Y t h e p r e f e r e n c e for m o r e g e n e r a l r u l e s is m a n i f e s t e d b y

c o n t i n u a l l y t r y i n g to g e n e r a t e a n d t e s t m o r e g e n e r a l r u l e s r e s u l t i n g f r o m t h e c o a l e s c i n g or c o m b i n i n g o f t w o or m o r e s p e c i f i c rules. R e c a l l t h a t t h e r e p r e s e n t a t i o n o f t h e s e g m e n t s i n v o l v e d a f e a t u r e m a t r i x w i t h p o s i t i v e or n e g a t i v e s p e c i f i c a t i o n s for e a c h f e a t u r e . In o r d e r to g e n e r a t e m o r e g e n e r a l r u l e s t h i s r e p u e s e n t a t i o n is m o d i f i e d to t w o m a t r i c e s for e a c h s e g m e n t - o n e r e p r e s e n t i n g t h o s e f e a t u r e s w h i c h m u s t b e p o s i t i v e in t h e e n v i r o n m e n t a n d t h e o t h e r for t h o s e f e a t u r e s w h i c h m u s t b e n e g a t i v e . T h e g e n e r a l i z a t i o n p r o c e s s i n v o l v e s t a k i n g t h e ' g r e a t e s t c o m m o n d e n o m i n a t o r ' (GCD) of the p o s i t i v e a n d n e g a t i v e v a l u e s o f t h e s e g m e n t s o f t h e e n v i r o n m e n t s o f t w o s e p a r a t e 'rules'. In the i n t e r e s t s o f s p a c e a n a b b r e v i a t e d e x a m p l e o f the G C D o p e r a t i o n is g i v e n in (15).

(15)

+ . ÷ -- ÷ ÷ - + --

S Y L L i 0 0 1 i 0 0 i 1 0

V O I C E i 0 l 0 1 0 0 i i 0

H I G H 0 1 1 0 l 0 h 1 0 i 0

/

+ -- ÷ -

~voIcEI

VOICEHIGH

01 00 11 00 ~ [-S~L]-'C÷HIGH]/

~HIGH]

m ~

T h e G C D o p e r a t i o n h a s g e n e r a t e d a m o r e g e n e r a l rule. If t h e o r i g i n a l t w o r u l e s a r e a m a n i f e s t a t i o n o f a m o r e g e n e r a l rule, t h e g e n e r a l i z e d r u l e m u s t n o t i n v o l v e or m a k e r e f e r e n c e to t h e t h e i n i t i a l s e g m e n t o f t h e f o r m e r rule. N o t i c e a l s o t h a t in t h e G C D t h e V O I C E f e a t u r e d o e s n o t h a v e to b e p o s i t i v e o r n e g a t i v e ; if t h e t w o o r i g i n a l r u l e s a r e a m a n i f e s t a t i o n o f a s i n g l e r u l e t h e s p e c i f i c a t i o n o f t h e V O I C E f e a t u r e in t h e a l t e r n a t i n g s e g m e n t m u s t n o t b e r e l e v a n t .

N A T M A T C H

A f t e r the a l t e r n a t i o n s in t e r m s o f s e g m e n t s t h a t w e r e o u t p u t b y A L T F I N D E R h a v e b e e n c h a n g e d i n t o a l t e r n a t i o n s in t e r m s o f f e a t u r e s (12) a n d a f t e r t h e s e h a v e b e e n t r a n s f o r m e d f r o m s i n g l e m a t r i c e s i n t o d o u b l e m a t r i c e s , t h e r e s u l t i n g " r u l e s " a r e s e n t to N A T M A T C H . N A T M A T C H c o m p a r e s t h e s e " r u l e s " w i t h t h e d a t a b a s e o f c o m m o n p h o n o l o g i c a l p r o c e s s e s . T h i s i n v o l v e s p a t t e r n m a t c h i n g . If a m a t c h o c c u r s t h e e n t i r e i n p u t c o r p u s is t e s t e d to f i n d o u t if it c a n b e e s t a b l i s h e d w h e t h e r t h i s r u l e or c o n s t r a i n t is v a l i d for this l a n g u a g e . If E x t e n s i o n 2 w e r e

i m p l e m e n t e d , t h i s t e s t i n g p r o c e s s w o u l d d i f f e r for t h e d i f f e r e n t v e r s i o n s o f t h e t h e o r y . If t h e v a l i d i t y c a n b e e s t a b l i s h e d , t h e u n d e r l y i n g r e p r e s e n t a t i o n s for t h e m o r p h e m e is a d j u s t e d a n d t h e r u l e is a d d e d to t h e l i s t o f e s t a b l i s h e d rules. C o m m o n p r o c e s s e s in t h e d a t a b a s e a r e o r g a n i z e d b y t h e f e a t u r e w h i c h is a l t e r n a t i n g , a n d a m o n g t h o s e p r o c e s s e s i n v o l v i n g t h e a l t e r n a t i o n o f a g i v e n f e a t u r e t h e m o s t c o m m o n p r o c e s s is l i s t e d a n d t h u s t e s t e d first. If it c a n b e s h o w n to b e valid, it is a d d e d to a l i s t o f e s t a b l i s h e d rules. It s h o u l d b e m e n t i o n e d t h a t A L T F I N D E R m a k e s u s e o f t h i s list, a n d if an a l t e r n a t i o n t h a t it d i s c o v e r s c a n b e h a n d l e d b y a n e s t a b l i s h e d rule, t h e

t e n t a t i v e u n d e r l y i n g r e p r e s e n t a t i o n is so a d j u s t e d a n d t h e a l t e r n a t i o n n e e d n o t b e p a s s e d o n to t h e r e s t o f t h e p r o g r a m . If w i t h i n N A T M A T C H no m a t c h e s a r e f o u n d in t h e d a t a b a s e o r if t h e v a l i d i t y o f t h e m a t c h e s c a n n o t be e s t a b l i s h e d , t h e a l t e r n a t i o n is a d d e d to the l i s t o f t h o s e as y e t n o t a c c o u n t e d for.

R U L E R E D

(5)

are valid. T h e r e s u l t i n g g e n e r a l i z e d r u l e s h a v e the l a r g e s t m a t r i c e s , i.e. t h e l a r g e s t s e t of f e a t u r e s p e c i f i c a t i o n @ , w h i c h a l l the forms u n d e r g o i n g t h e s e r u l e s h a v e in c o m m o n . H o w e v e r , the e l i m i n a t i o n of some of these

f e a t u r e s s p e c i f i c a t i o n m i g h t s t i l l r e s u l t in v a l i d rules. T h e r u l e s w i t h m i n i m a l

m a t r i c e s , i.e. m i n i m a l n u m b e r o f f e a t u r e s p e c i f i c a t i o n s (recall t h e " s i m p l i c i t y " c r i t e r i o n ) , m i g h t b e t e r m e d l o w e s t c o m m m o n d e n o m i n a t o r s (LCDs). T h e s e are p r o d u c e d b y a t t e m p t i n g in t u r n to e l i m i n a t e e a c h s e g m e n t in G C D e d rule; the n e w rule is g e n e r a t e d a n d tested, a n d if v a l i d the s e g m e n t is out, o t h e r w i s e it remains. T h e n an a t t e m p t is m a d e to e l i m i n a t e in t u r n e a c h f e a t u r e s p e c i f i c a t i o n in the r e m a i n i n g segments, a g a i n g e n e r a t e a n d test. Finally, all t h e e s t a b l i s h e d r u l e s a r e combined, w h e r e

p o s s i b l e , a c c o r d i n g to the m a n y a b b r e v i a t o r y c o n v e n t i o n s o f G e n e r a t i v e P h o n o l o g y (cf. [2]). T h i s is d o n e o n the b a s i s o f the f o r m a l p r o p e r t i e s of the rules. F o r example, if t w o g e n e r a t e d r u l e s are i d e n t i c a l e x c e p t t h a t o n e h a s an a d d i t i o n a l s e g m e n t n o t p r e s e n t in the other, t h e s e c a n be into a s i n g l e rule; p a r e n t h e s e s a l l o w t h e i n c l u s i o n of o p t i o n a l s e g m e n t s in the e n v i r o n m e n t of a rule. In addition, a l l the r u l e s g e n e r a t e d a b o v e i n v o l v e a c h a n g e o f o n l y a s i n g l e f e a t u r e s p e c i f i c a t i o n . If t h e r e are s e v e r a l r u l e s w h i c h are i d e n t i c a l e x c e p t that a d i f f e r e n t f e a t u r e s p e c i f i c a t i o n is changed, i.e. the two c h a n g e s o c c u r in the same e n v i r o n m e n t , t h e y c a n b e c o m b i n e d into a s i n g l e rule: in t h i s p a r t i c u l a r e n v i r o n m e n t b o t h s p e c i f i c a t i o n s change.

D I S C U S S I O N

P H O N Y is a l e a r n i n g p r o g r a m . I t is

d i s c o v e r i n g the g e n e r a l p r i n c i p l e s or r u l e s g o v e r n i n g p r o n o u n c i a t i o n in a l a n g u a g e . As such it c a n be said to be l e a r n i n g some a s p e c t of a language. P H O N Y c a n be t h o u g h t o f e i t h e r i n d e p e n d e n t l y or as a p a r t o f a

larger s y s t e m d e s i g n e d to l e a r n a language. In the latter c o n t e x t P H O N Y c o u l d h e l p in d e c i d i n g b e t w e e n a m b i g u o u s m o r p h o l o g i c a l d i v i s i o n s . In addition, P H O N Y c o u l d be u s e d in adjusting, f i n e - t u n i n g h e u r i s t i c s for a m o r p h o l o g i c a l a n a l y z e r . P H O N Y w o u l d a c t as a "critic" in s u c h a s y s t e m (cf. [i]). T w o sets of h e u r i s t i c s m i g h t lead to d i f f e r e n t m o r p h o l o g i c a l a n a l y s e s , w h i c h m i g h t e a c h be input to PHONY~ if o n e input l e a d to

a n a l y s i s t h a t h a d no " i n t e r e s t i n g cases", i.e. problems, w h i l e the o t h e r did, t h e set of h e u r i s t i c s l e a d i n g to the former a n a l y s i s w o u l d be s u p p o r t e d .

I n d e p e n d e n t l y P H O N Y is an e x p e r t system. It p r o v i d e s a p r o c e d u r a l d e f i n i t i o n of

p h o n o l o g i c a l theory. B e c a u s e of this, it c o u l d be u s e f u l to s o m e o n e d e s i r i n g to l e a r n p h o n o l o g i c a l theory. It c o u l d a l s o be of use to w o r k i n g p h o n o l o g i s t s . In a d d i t i o n to p r o d u c i n g the a n a l y s e s , it a l s o i s o l a t e s the

' i n t e r e s t i n g cases', e.g. m o r p h o l o g i c a l l y t r i g g e r e d rules. W i t h E x t e n s i o n i it c o u l d a l s o be u s e d to c o m p a r e v a r i o u s v e r s i o n s of the t h e o r y and to test the the e f f e c t s o f n e w m o d i f i c a t i o n s of the theory.

It s h o u l d b e e m p h a s i z e d t h a t at p r e s e n t P H O N Y is ~ b a r e p r o g r a m . It is h o p e d t h a t it is s u f f i c i e n t to d e m o n s t r a t e the f e a s a b i l i t y a n d w o r t h o f t h e e n d e a v o r . It p r e s e n t s a b a s i c a p p r o a c h : c o n t e x t s in w i t h a l t e r n a t i n g s e g m e n t s are t r a n s f o r m e d

into h y p o t h e s i z e d "rules", t h e s e c a n b e c o m b i n e d v i a t h e G C D o p e r a t i o n , f u r t h e r s i m p l i f i e d to LCDs, a n d t h e n a g a i n c o m b i n e d a c c o r d i n g to t h e a b b r e v i a t o r y c o n v e n t i o n s . T h e r e is a " g r i n d i n g " q u a l i t y to t h i s p r o c e s s . P h o n o l o g i s t s o n l y r e s o r t to a s i m i l a r grind, w h e n all t h e i r h e u r i s t i c s h a v e led to d e a d e n d s . T h e o n l y h e u r i s t i c p r e s e n t l y i n c o r p o r a t e d in P H O N Y is the c o m p a r i s o n to a l i s t o f n a t u r a l p r o c e s s e s ; this a l l o w s a t r e m e n d o u s s h o r t c u t in t h e s e a r c h M o r e h e u r i s t i c s o b v i o u s l y c o u l d b e a d d e d to PHONY.

It w o u l d a l s o be p o s s i b l e for a M E T A P H O N Y to find h e u r i s t i c s to b e to b e u s e d b y PHONY. ( P o s s i b l e d e c i s i o n c r i t e r i a to be u s e d in e v a l u a t i n g d i f f e r i n g sets of h e u r i s t i c s c o u l d b e t h e n u m b e r of t e s t s o f the input c o r p u s a n d the n u m b e r of

" i n t e r e s t i n g c a s e s " . ) T h e s e h e u r i s t i c s c o u l d i m p r o v e e f f i c i e n c y o f P H O N Y by o b v i a t i n g m u c h o f the " g r i n d i n g " p r o c e s s . At the same

t i m e M E T A P H O N Y c o u l d a l s o be m a k i n g d i s c o v e r i e s a b o u t p h o n o l o g i e s of n a t u r a l l a n g u a g e s in g e n e r a l . For example, in the p r o c e s s o f g e n e r a t i n g L C D s i n s t e a d o f g o i n g s e g m e n t b y s e g m e n t a n d f e a t u r e b y feature, M E T A P H O N Y c o u l d a c q u i r e a n d i n c o r p o r a t e in P H O N Y k n O w l e d g e a b o u t w h a t a s p e c t s o f p r o n o u n c i a t i o n a r e n o t / r a r e l y p e r t i n e n t to r u l e s a f f e c t i n g a c e r t a i n feature.

R E F E R E N C E S

i. B u c h a n a n , B.G., T.M. M i t c h e l l , R.G. Smitch, C.R. J o h n s o n , Jr. 1979. M o d e l s o f l e a r n i n g systems. E n c y c l o p e d i a o f C o m p u t e r S c i e n c e a n d T e c h n o l o g y . J. Belzer, A. H o l t z m a n , A. K e n t (Eds.). N e w York: M a r c e l Dekker, Inc. V o l 3, pp 24-51.

2. C h o m s k y , N. and M. Halle. 1968. T h e S o u n d P a t t e r n of E n g l i s h . N e w York: H a r p e r a n d Row.

3. K e n s t o w i c z , M. a n d C. K i s s e b e r t h . 1977. T o p i c s in P h o n o l o g i c a l T h e o r y . N e w York: A c a d e m i c Press.

4. K i p a r s k y , P. 1968. H o w a b s t r a c t is p h o n o l o g y ? In O. F u j i m u r a (Ed.), T h r e e D i m e n s i o n s in L i n g u i s t i c T h e o r y . 1973. Tokyo: TEC.

(6)

References

Related documents