hpsg tutvustus ikodu.ut.ee/~kaili/loengud/mudelid/hpsgslaidid.pdf · hpsg tutvustus i...
TRANSCRIPT
-
HPSG tutvustus ISüntaksiteooriad ja -mudelid 2005/06
Kaili Müürisep
ATI
9. märts 2006
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 1 / 36
-
Ülevaade
Kontekstivaba grammatika
Tunnuste struktuurid
Tüübihierarhia
Unifikatsioon
Leksikon oluline
Konstruktsioonid
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 2 / 36
-
KVG puudused
Väga palju reegleid
Reeglitel pole kitsendusi NP → Adv AP
Pole üldiseid reegleid
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 3 / 36
-
Tunnuste struktuurid
Fraasistruktuurireeglite tipud on tunnus-väärtus paaride kogumid.
DCG
np(K,A) → ap(K,A), np(K,A).See on samaväärne:np(kääne: K, arv: A) → ap(kääne: K, arv: A), np(kääne: K, arv: A).
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 4 / 36
-
Tunnuste struktuurid
Fraasistruktuurireeglite tipud on tunnus-väärtus paaride kogumid.Tunnused võivad olla ka keerukamad
slash-tunnus DCG-ss –>np(pers:P,numb:N,sex:S,case:C),s(slash:np(pers:P,numb:N,sex:S,case:C)).
s → np
pers : Pnumb : Nsex : Scase : C
, s
slash : np
pers : P ,numb : N ,sex : S ,case : C
.
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 4 / 36
-
Tunnuste struktuurid
Fraasistruktuurireeglite tipud on tunnus-väärtus paaride kogumid.Tunnused võivad olla ka keerukamad
Väärtustatakse ainult need tunnused, mis olulised:
DCG
np(kääne: K, arv: A) → np(kääne: gen, arv: _), np(kääne: K, arv: A).
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 4 / 36
-
Tunnuste struktuurid
Fraasistruktuurireeglite tipud on tunnus-väärtus paaride kogumid.Tunnused võivad olla ka keerukamad
Väärtustatakse ainult need tunnused, mis olulised:
Tunnused võimaldavad üldistada: kõik verbid on tunnusega[
HEAD : verb]
sõltumata nt nende transitiivsusest ja pöördest.
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 4 / 36
-
Tunnuste struktuurid
Fraasistruktuurireeglite tipud on tunnus-väärtus paaride kogumid.Tunnused võivad olla ka keerukamad
Väärtustatakse ainult need tunnused, mis olulised:
Tunnused võimaldavad üldistada: kõik verbid on tunnusega[
HEAD : verb]
sõltumata nt nende transitiivsusest ja pöördest.
Tunnusstruktuurid võivad olla rekursiivsed:
Genealoogia������������������
isikEESNIMI ANUPEREKONANIMI TAMM
SÜNNIAEG 09.03.2006
ISA
�������isikEESNIMI JAANPEREKONANIMI TAMM
SÜNNIAEG 09.03.1966ISA ...
� ������
� �����������������
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 4 / 36
-
Veel tunnuste struktuuridest: subsumptsioon
(1) FS1:[
CAT np]
(2) FS2:[ ]
(3) FS3:
CAT np
ARG
[
NUM sg
PERS 3rd
]
(4) FS4:[
CAT np
ARG[
NUM sg]
]
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 5 / 36
-
Veel tunnuste struktuuridest: subsumptsioon
(1) FS1:[
CAT np]
(2) FS2:[ ]
(3) FS3:
CAT np
ARG
[
NUM sg
PERS 3rd
]
(4) FS4:[
CAT np
ARG[
NUM sg]
]
FS2 v FS1 v FS4 v FS3
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 5 / 36
-
Veel tunnuste struktuuridest: subsumptsioon
(1) FS1:[
CAT np]
(2) FS2:[ ]
(3) FS3:
CAT np
ARG
[
NUM sg
PERS 3rd
]
(4) FS4:[
CAT np
ARG[
NUM sg]
]
FS2 v FS1 v FS4 v FS3
Definition
Tunnuste struktuur B subsumeerib tunnuste struktuuri A (B v A), kui Bsisaldab informatsiooni, mis on alamhulk A informatsioonist.
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 5 / 36
-
Struktuuri jagamine
Kaks või enam erinevat atribuuti võivad omada üht ja sama tunnustestruktuuri
SUBJ
AGR 1
[
NUM sg
PERS 3rd
]
PRED[
AGR 1]
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 6 / 36
-
Tüübihierarhia
Tüübid võimaldavad täpselt deklareerida, milliseid operatsioone sedatüüpi objektiga saab teha, millised on tema argumendid ja nendeväärtused.
Tüüpide deklareerimine hõlbustab keeruliste andmestruktuuride korraltagada grammatika (programmi) korrektsust.
HPSG signatuur defineerib, millist tüüpi objekte eksisteerib, mis onnende atribuudid ja mis on nende atribuutide võimalikud väärtused.
Tüübid on struktueeritud hierarhiatesse, mis võimaldab vastavaidobjekte jagada klassidesse.
ERGis 3559 tüüpi
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 7 / 36
-
Unifitseerimine
Tunnuste struktuurid võivad sisaldada erinevat, kuid siiski ühilduvatinformatsiooni
(5) FS5:[
CAT np
ARG[
NUM sg]
]
(6) FS6:[
CAT np
ARG[
PERS 3rd]
]
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 8 / 36
-
Unifitseerimine
Tunnuste struktuurid võivad sisaldada erinevat, kuid siiski ühilduvatinformatsiooni
Aga ka erinevat ja mitteühilduvat informatsiooni
(7) FS7:[
CAT np
ARG[
NUM sg]
]
(8) FS8:[
CAT np
ARG[
NUM pl]
]
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 8 / 36
-
UnifitseerimineTunnuste struktuurid võivad sisaldada erinevat, kuid siiski ühilduvatinformatsiooni
(5) FS5:[
CAT np
ARG[
NUM sg]
]
(6) FS6:[
CAT np
ARG[
PERS 3rd]
]
Aga ka erinevat ja mitteühilduvat informatsiooniKui kaks struktuuri ühilduvad, siis leidub kolmas, mida nad mõlemadlaiendavad.
(9) FS9:
CAT np
ARG
[
NUM sg
PERS 3rd
]
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 8 / 36
-
UnifitseerimineTunnuste struktuurid võivad sisaldada erinevat, kuid siiski ühilduvatinformatsiooni
(5) FS5:[
CAT np
ARG[
NUM sg]
]
(6) FS6:[
CAT np
ARG[
PERS 3rd]
]
Aga ka erinevat ja mitteühilduvat informatsiooniKui kaks struktuuri ühilduvad, siis leidub kolmas, mida nad mõlemadlaiendavad.
(9) FS9:
CAT np
ARG
[
NUM sg
PERS 3rd
]
Definition
Kahe tunnuste struktuuri A ja B unifikatsiooniks nimetatakse tunnustestruktuuri C, nii et A v C ja B v C .
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 8 / 36
-
Leksikon
HPSG-s on enamik informatsiooni leksikonis
Leksikoni kirjed sisaldavad informatsiooni ortograafia, sõnaliigi,ühildumise, valentsi, semantika ja argumentide liitmise kohta.
Kasutatakse rohkesti supertüüpe, nii et tegelik kirje määrab vaid sõnatüübi, ortograafia ja võtmerelatsioonid
Leksikaalsed reeglid seovad leksikoni baaskirjed teiste kirjetega(mitmus, passiivivorm jne)
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 9 / 36
-
Konstruktsioonid
Väga üldised fraasistruktuurireeglid teevad enamuse tööst:
põhi-määratleja e head-specifier
põhi-argument e head-complement
põhi-alus e head-subject
põhi-täitja e head-filler
põhi-laiend e head-modifier
Üksikud konsruktsioonid vajavad eraldi reegleid:
Relatiivlaused
Noun-noun compounds
Lisand
ERGis on 105 reeglit
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 10 / 36
-
Võrdlus GB-ga
SarnasusedI Kontekstivabad grammatikadI Mõlemad kasutavad üldisi printsiipeI Reeglite osakaal väikeI Leksikonil suur osakaalI Mitmed printsiibid on väga sarnased
ErinevusedI Puudub igasugune transformatsiooni mõisteI Tasandid on teisiti jaotatudI ’radical nonautonomy’ - ükski grammatilise teadmiste tasand pole
priviligeeritud seisusesI HPSG on andmetele orienteeritud, GB teooriale orienteeritud.
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 11 / 36
-
Märgi struktuur
Märk Sign - lause, sõna, fraas, mitmelauselised diskursused(analüüsiühik).
Märk - vormi ja tähenduse paar ehk
Märk on struktuur, mis sisaldab fonoloogilist, süntaktilist, semantilist,diskursuse ja fraasistruktuuri informatsiooni.
Märgil on vähemalt kaks atribuuti:
I PHON - kirjeldab märgi foneetilist sisu;I SYNSEM - kirjeldab süntaktilist ja semantilist informatsiooni. Jaguneb
omakorda:F LOCAL (LOC)-CATEGORY, CONTENT, CONTEXTF NONLOCAL (NONLOC) -kasutatakse määramata liikumiste
kirjeldamisel
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 12 / 36
-
Märgi struktuurist veel
sign
PHON phon
SYNSEM synsem
word[
phrase
DTRS head_struc
]
Kõik objektid tüüpi sign peavad olema kas tüüpi word või tüüpi phrase.Kõik objektid tüüpi sign on atribuutidega PHON ja SYNSEM, ja lisaks ontüüpi phrase objektidel atribuut DTRS.
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 13 / 36
-
Üldine pilt
word
PHON phonlist
SYNSEM
synsem
LOCAL
local
CAT category
CONTENT content
CONTEXT context
NONLOCAL nonlocal
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 14 / 36
-
LOCAL
CATEGORY tunnusel on 2 atribuuti: HEAD ja SUBCAT
SUBCATi asemel kasutatakse ka kolme valentsitunnust: SUBJ(subject), COMPS (complements) ja SPR (specifier).
CONTENT kannab semantilist informatsiooni
CONTEXT sisaldab kontekstitundlikku lingvistilist informatsiooni
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 15 / 36
-
LOCAL informatsioon asesõnale he
������������������������������������
SS | L
������������������������������������
local
CATEGORY
������cat
HEAD
�noun
CASE nom �SUBCAT 〈〉
� �����
CONTENT
���������
ppro
INDEX 1
������ref
PER 3rd
NUM sing
GEND masc
� �����
� ��������
CONTEXT
�������context
BACKGR ���� ������ psoaRELN maleINST 1
� ���� �����
� ������
� �����������������������������������
� �����������������������������������
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 16 / 36
-
CATEGORY
HEAD tunnus näitab sõnaliiki. Tüübistruktuur:head
subst
noun verb adj prep
funct
det mark
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 17 / 36
-
NOUN
[
CASE case]
Käände tüübi jagunemine (inglise k) case
nom acc gen dat
HEAD informatsioon asesõnale he
HEAD
[
noun
CASE nom
]
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 18 / 36
-
PREPOSITION
[
PFORM pform]
Inglise keele eessõna jagunemine:pform
to for by of ...Verb depend vajab eessõna on:[
PFORM on]
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 19 / 36
-
VERB
VFORM vform
AUX boolean
INV boolean
vform
fin bse psp
vform
prp pas inf ger
Verbivorm gives
HEAD
verb
VFORM fin
AUX -
Verbivorm has
HEAD
verb
VFORM fin
AUX +
INV boolean
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 20 / 36
-
SUBCATSUBCAT on tunnus CATEGORY väärtusessubkategorisatsioon on spetsifikatsioon, mis näitab selle märgigaseotud teiste elementide arvu ja vormi. Eesti keelegrammatikatraditsioonis rektsioon + ...
magab: SUBCAT
〈
NP[
nom]
〉
armastab: SUBCAT
〈
NP[
nom]
, NP[
part]
〉
mõtleb SUBCAT
〈
NP[
nom]
, NP[
elat]
|PP[
üle]
| S[
et]
〉
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 21 / 36
-
SUBCAT
SUBCAT on tunnus CATEGORY väärtuses
subkategorisatsioon on spetsifikatsioon, mis näitab selle märgigaseotud teiste elementide arvu ja vormi. Eesti keelegrammatikatraditsioonis rektsioon + ...
Elementide järjekord freimis väljendab grammatiliste seoste olulisust,mitte pindmist laiendite järjekorda
SUBJECT =⇒ DIRECTOBJECT =⇒ INDIRECTOBJECT =⇒OBLIQUES =⇒ GENITIVES =⇒ OBJECTSOFCOMPARISON
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 21 / 36
-
SUBCAT
SUBCAT on tunnus CATEGORY väärtuses
subkategorisatsioon on spetsifikatsioon, mis näitab selle märgigaseotud teiste elementide arvu ja vormi. Eesti keelegrammatikatraditsioonis rektsioon + ...
Elementide järjekord freimis väljendab grammatiliste seoste olulisust,mitte pindmist laiendite järjekorda
Hiljem SUBCAT tunnus asendati kolme valentsi tunnusega SUBJ,COMP ja SPR. See lubab paremini kirjeldada kategooriaid, misvajavad laiendit, kuid mitte alust. Määratlejad eristatakse alusest, sestnad võivad mõlemad esineda sama põhja juures (öeldistäitegalausetes).
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 21 / 36
-
Asesõna he leksikonikirje
PHON〈
he〉
SS | L
local
CATEGORY
HEAD
[
noun
CASE nom
]
VAL
SUBJ 〈〉
COMPS 〈〉
SPR 〈〉
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 22 / 36
-
Nimisõna book leksikonikirje
PHON〈
book〉
SS | L
local
CATEGORY
noun
HEAD noun
VAL
SPR〈
DetP〉
SUBj 〈〉
COMPS 〈〉
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 23 / 36
-
Verb sends����������������������������
PHON�sends �
SS |L
������������������������
local
CAT
���������������������
category
HEAD
��� verbVFORM finAUX -
� ��
VAL
�������valence
SUBJ � 1 NP � nom � � 3Sg ���COMPS � 3 NP � acc � , 5 NP � acc ���
� ������
ARG-S�
1 , 3 , 5 �
� ��������������������
� �����������������������
� ���������������������������
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 24 / 36
-
Eestikeelsed näited
V[
SUBCAT 〈〉]
1 NP
PeeterV
[
SUBCAT〈
1
〉
]
magab
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 25 / 36
-
Transitiivne verb
V[
SUBCAT 〈〉]
1 NP
PeeterV
[
SUBCAT〈
1
〉
]
V
[
SUBCAT〈
1 , 2〉
]
ootab
2 NP
Mari
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 26 / 36
-
Valentsireeglid HPSGs
Spetsiifiline reegel verbi põhi-argumentseose kohta:V[
SUBCAT A]
→A , V
[
SUBCAT A ⊕〈
B
〉
]
kus ⊕ on otsekorrutis:(a) ⊕ (b) = (a, b)()⊕ (a, b) = (a, b)(a, b) ⊕ () = (a, b)
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 27 / 36
-
Põhi-argumentreeglite näide
V � SUBCAT 〈〉�
1 NP
PeeterV
�SUBCAT
�1 ���
V
�SUBCAT
�1 , 2 ���
ootab
2 NP
Mari
VP2->NP,VP
V � SUBCAT A � → A , V � SUBCAT A ⊕ � B ��� A = (), B = 1
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 28 / 36
-
Põhi-argumentreeglite näide
V � SUBCAT 〈〉�
1 NP
PeeterV
�SUBCAT
�1 ���
V
�SUBCAT
�1 , 2 ���
ootab
2 NP
Mari
VP->V NP
V � SUBCAT A � → A , V � SUBCAT A ⊕ � B ��� A = 1 , B = 2
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 28 / 36
-
Põhi-argumentreeglite üldistamine
V[
SUBCAT A]
→A , V
[
SUBCAT A ⊕〈
B
〉
]
A[
SUBCAT A]
→A , A
[
SUBCAT A ⊕〈
B
〉
]
N[
SUBCAT A]
→A , N
[
SUBCAT A ⊕〈
B
〉
]
P[
SUBCAT A]
→ P
[
SUBCAT A ⊕〈
B
〉
]
, A
↓
H[
SUBCAT A]
→ H
[
SUBCAT A ⊕〈
B
〉
]
, A
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 29 / 36
-
FraasidFraaside tunnusstruktuuril on atribuut DAUGHTERS (DTRS), milleväärtuseks on struktuur tüübist constiuent-structure (con-struc), mis esitabfraasi vahetuid allujaid.con-struc tüübil on palju alamtüüpe erinevat liiki tütartippudekirjeldamiseks.Olulisim neist on headed-structure (head-struc), mida kasutatakse kõigispõhjaga konstruktsioonides.
HEAD-DAUGHTER (HEAD-DTR)
COMPLEMENT-DAUGHTERS (COMP-DTRS)
ADJUNCT-DAUGHTER
FILLER-DAUGHTER
MARKER-DAUGHTER
head-struc
HEAD-DTR (a sign)
COMP-DTRS (a list of signs)
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 30 / 36
-
Lause näide
phrase
PHON〈
Kim,walks〉
SYNSEM S[
fin]
DTRS
head-comp-struc
HEAD-DTR
phrase
PHON〈
walks〉
SYNSEM VP[
fin]
COMP-DTRS
〈
phrase
PHON〈
Kim〉
SYNSEM NP[
nom]
〉
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 31 / 36
-
Subkategorisatsiooni printsiip
Printsiip
In headed phrase (i.e. a phrasal sign whose DTRs calue is of sorthead-struc), the SUBCAT value of the head daughter is the concatenationof the phrase’s SUBCAT list with the list of SYNSEM values of thecomplement daughters.
H[
SUBCAT A]
→ H
[
SUBCAT A ⊕〈
B
〉
]
, A
SUBCAT 1
HEAD-DTR
[
SUBCAT 1⊕〈
2
〉
]
COMPS
[
SUBCAT〈
2
〉
]
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 32 / 36
-
Ta andis mehele raamatu
V[
SUBCAT 〈〉]
1 NP[
nom]
ta
V
[
SUBCAT〈
1
〉
]
2 NP[
gen]
raamatu
3 NP[
all]
mehele
V
[
SUBCAT〈
1 , 2 , 3〉
]
andis
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 33 / 36
-
Põhja tunnuse printsiip (HFP)
Printsiip
The HEAD value of any headed phrase is structure-shared with the HEADvalue of the head daughter.
head-argument-structure
HEAD 1
SUBCAT 2
HEAD-DTR
[
HEAD 1
SUBCAT 2⊕ 3
]
COMPS〈
3
〉
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 34 / 36
-
Näide põhjaprintsiibist ja subkategorisatsioonist
V
�HEAD 4
SUBCAT 〈〉 �1 NP � nom �
ta
V
�� HEAD 4SUBCAT
�1 �
��
2 NP � gen �raamatu
3 NP � all�mehele
V
�� HEAD 4 verb[fin]SUBCAT
�1 , 2 , 3 �
��andis
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 35 / 36
-
Kokkuvõte
KVG: Kogu info, mis ühes sõlmes vaja oli, tulenes otseselt reeglist.
FSG: Nii reeglid, leksikon kui printsiibid kirjeldavad grammatikatosaliselt
Tunnusstruktuurid on keeleüksuste mudelid, mis kirjeldavad täielikultantud üksust. Konkreetne kirjeldus võib olla poolik.
Grammatika on hea, kui tunnusstruktuurid vastavad reaalse maailmaüksustele.
Esitusviisid: tunnusväärtusmaatriksid (AVM), kastdiagramm
Grammatika ülesanne: kuidas leksikoni üksused on seotud sõnatunnusstruktuuriga; kuidas väiksematest üksustest saab kokku pannasuuremaid
Põhja, alamkategooriate ja tunnusstruktuuri abil saadud grammatikaon võrreldes KVGga abstraktsem ja üldistavam.
Kaili Müürisep (ATI) HPSG tutvustus I 9. märts 2006 36 / 36