Download - Optimaliteitstheorie & Semantiek
Optimaliteitstheorie & Semantiek
Petra Hendriks
Maart 2004
Semantiek
• Semantiek = betekenisleer.
• Pragmatiek = leer van betekenis in een bepaalde context of gebruik.
• Een goede semantische theorie moet kunnen verklaren hoe de betekenis van een samengestelde uitdrukking wordt opgebouwd uit kleinere betekeniseenheden.
Compositionaliteit
• Taal is recursief.
• Betekenissen kunnen dus niet gegeven worden door eindige lijst van zinnen met bijbehorende betekenissen.
• Algoritme voor afleiden van betekenissen nodig Principe van Compositionaliteit van Betekenis.
Principe van Compositionaliteit
Principe van Compositionaliteit van Betekenis:
De betekenis van een samengestelde uitdrukking is een functie van de betekenissen van de samenstellende delen en de manier waarop ze zijn samengevoegd.
Standaardaanname in de taalkunde:
Manier van samenvoeging = syntactische structuur.
Zinsbetekenis
De betekenis van een zin is afhankelijk van de betekenis van de woorden:
• Marie zag Jan.• Marie hoorde Jan.
Maar ook van de manier waarop die worden samen-gevoegd:
• Marie zag Jan.• Jan zag Marie.
Problemen met compositionaliteit
• Idiomen: een blauwtje lopen, boter op het hoofd hebben.
• Figuurlijk taalgebruik, o.a. metaforen en ironie: de avond valt, het schip der woestijn.
• Anaforen: zichzelf, hem, het.• Context-afhankelijke betekenissen: gisteren, hier,
ik.• Mismatches tussen syntactische en semantische
structuur, o.a. bereik van kwantoren, en ellipsis: drie kwamen.
Oplossing OT
• Syntactische structuur is een zachte constraint op interpretatie.
• Interpretatie is onderhevig aan constraints van verschillende aard (syntactisch, semantisch, prosodisch, pragmatisch).
• Syntactische constraints kunnen geschonden worden indien er sterkere constraints zijn waaraan anders niet voldaan kan worden.
Conflicterende constraints
• Constraints op interpretatie kunnen conflicteren.
Voorbeeld
Algemene tendens om talige elementen te interpreteren als anaforen.
Pragmatische constraint op betekenissen:• Don’t Overlook Anaphoric Possibilities (DOAP):
– Opportunities to anaphorize text must be seized.
(Williams, 1997)
Anaforische interpretaties
• Heike Drechsler stopt na de Olympische Spelen van Athene met atletiek.
• De 40-jarige Duitse won twee olympische titels verspringen en talloze andere kampioenschappen, ook op de 100 meter.
• Haar deelname in Athene is overigens nog lang niet zeker, want zij moet de limiet van 6,75 meter nog springen.
(Volkskrant, 11 maart 2004)
Hem
• Jan liep op straat.
• Marie zag hem.
hem = Jan
Deze interpretatie gehoorzaamt DOAP.
Hem
• Jan keek in de spiegel.
• Toen zag Jan hem.
hem Jan
Deze interpretatie schendt DOAP.
Hoe kan dat?
Conflict
Blijkbaar is er een conflict tussen DOAP en een sterkere constraint.
Syntactische constraint op betekenissen:
• Principle B:– If two arguments of the same semantic relation
are not marked as being identical, interpret them as being distinct.
Hem
Input: Jan zag hem. Principle B DOAP
hem = Jan *!
hem = iemand
anders
*
Zichzelf
Input:
Jan zag zichzelf.
Principle B DOAP
zichzelf = Jan
zichzelf = iemand
anders
*
Hem
Input:
Jan liep op straat.
Marie zag hem.
Agreement Principle B DOAP
hem = Marie *! *
hem = Jan
hem = iemand
anders
*!
Automatische pronomenresolutie
• Gerlof Bouma ontwikkelde een systeem voor automatische pronomenresolutie.
• Systeem maakt gebruik van grammaticale informatie aangeleverd door de parser Alpino.
• Systeem vindt de optimale betekenis voor de pronomina hij, zij/ze, hem, haar, hun/hen, zijn, zichzelf (maar niet het).
• Input = pronomen.• Output = optimale antecedent voor het pronomen.
Gerlof Bouma’s constraints (1)
Constraints m.b.t. agreement:• Respect Human Sex:
– Use the appropriate pronoun for a human referent.
• Agree:– Agree semantically or syntactically.
• *Change Your Mind:– If the antecedent is a pronoun, there has to be syntactic
agreement.
Gerlof Bouma’s constraints (2)
Constraints m.b.t. binding:• Principle A:
– Zichzelf takes a co-argument as an antecedent.
• Disjoint Reference Principle (= Principle B):– Never take a co-argument as an antecedent.
Binding + Agreement constraints BA
Gerlof Bouma’s constraints (3)
Constraints m.b.t. prominentie van het antecedent:• Subject/Object (Su/Ob):
– The antecedent is a subject/object.
• Sentential Proximity (SP):– Don’t have a sentence boundary between the pronoun
and the antecedent.
• Pronoun (Pr):– The antecedent is a pronoun.
Gerlof Bouma’s constraints (4)
Overige constraints:• Parallelism (Pa):
– The pronoun and the antecedent are in the same argument position.
• Human (Hu):– The antecedent has a human referent.
• Possessives Hack (PH):– Possessives take their antecedent in the current
sentence.
Webdemo
Webdemo van Gerlof Bouma’s systeem voor automatische pronomenresolutie:
http://wodan.let.rug.nl/gerlof_bin/oplos_script2
Optimalisatie van vorm en betekenis
• OT syntaxis:– Input = betekenis
– Output = (gestructureerde) vorm
– Richting van optimalisatie: van betekenis naar vorm
• OT semantiek:– Input = vorm
– Output = (gestructureerde) betekenis
– Richting van optimalisatie: van vorm naar betekenis
Problemem met unidirectionele modellen van optimalisatie
Beaver & Lee (te verschijnen):• Als OT produktie (OT syntaxis) en OT
interpretatie (OT semantiek) gecombineerd worden in één model, dan is het resultaat een model waarin niet persé een consistente relatie tussen betekenissen en vormen bestaat.
• Voorbeeld: betekenis ‘Jan’ ==> vorm hem ==> betekenis ‘Piet’.
• Dit is onwenselijk.
Bidirectionele optimalisatie
Oplossing:
Bidirectionele OT (Blutner, 2000):
Input en output zijn vorm-betekenis-paren.
Bidirectionele OT (sterke versie)
• Een vorm-betekenis paar is optimaal () wanneer:– Er geen paar is met een betere vorm voor die
betekenis.– Er geen paar is met een betere betekenis voor
die vorm.
Blokkering
• Sterke bidirectionele OT kan verklaren waarom de vorm woedendheid niet mogelijk is:– <woede, ‘toestand van boos zijn’>– <woedendheid, ‘toestand van boos zijn’>
• De eerste vorm is beter want korter.
• Daardoor wordt de tweede vorm geblokkeerd.
Maar: sterke bidirectionele OT is te sterk!
• Er zijn gevallen waarin de langere vorm niet geblokkeerd wordt, maar een andere, bijzondere betekenis krijgt.
• Voorbeeld: – <kill, ‘vermoorden’>– <cause to die, ‘op een indirecte manier
vermoorden’>• Dit kan sterke bidirectionele OT niet verklaren. Zwakke bidirectionele OT
Bidirectionele OT (zwakke versie)
• Een vorm-betekenis-paar is superoptimaal () wanneer:– Er geen ander superoptimaal paar is met een
betere vorm voor die betekenis.– Er geen ander superoptimaal paar is met een
betere betekenis voor die vorm.
Superoptimaliteit
• Een vorm-betekenis-paar is alleen dan niet superoptimaal, wanneer er een superoptimaal paar is met een betere vorm of betekenis.
• Niet-optimale (= verliezende) paren doen niet meer mee in de verdere competitie.
• Zwakke bidirectionele OT creëert hierdoor extra vorm-betekenis-paren.
• Elk paar dat optimaal in de sterke versie van bidirectionele OT is tevens superoptimaal, maar niet omgekeerd.
Superoptimale paren
• Voorbeeld:– <kill, ‘vermoorden’>– <kill, ‘op een indirecte manier vermoorden’>– <cause to die, ‘vermoorden’>– <cause to die, ‘op een indirecte manier vermoorden’>
• Eerste paar is optimaal en dus ook superoptimaal.• Tweede en derde paar zijn niet-optimaal, want ze
verliezen van het eerste paar.• Daardoor is vierde paar superoptimaal.
Ongemarkeerde vormen
• Ongemarkeerde vormen worden meestal gebruikt voor ongemarkeerde situaties:– ‘Kill’: directe causatie, bijv. iemand met een
pistool neerschieten.
Gemarkeerde vormen
• Gemarkeerde vormen worden meestal gebruikt voor gemarkeerde situaties:– ‘Cause to die’: indirecte causatie, bijv.
veroorzaken dat een pistool in de handen van de schutter ontploft door iets in de loop te stoppen.
Verwerving van betekenissen
De Hoop & Krämer (2004):
Verwerving van de interpretatie van indefinieten:
• een meisje
• enkele jongens
Indefinieten
• Betekenis 1 = verwijzend:– o.a. specifiek, anaforisch, zeer prominent.
• Betekenis 2 = niet-verwijzend:– o.a. niet specifiek, niet-anaforisch, laag
prominent, predikatief.
Indefiniete subjecten
Vorm 1= subject in eerste zinspositie:• Een konijn kwam uit de hoed.
Vorm 2 = subject in zinsinterne positie:• Er kwam een konijn uit de hoed.
Indefiniete objecten
Vorm 1= bijwoord-object -werkwoord (unscrambled form):
• ... dat ik gisteren een ei heb gebakken.
Vorm 2 = object-bijwoord-werkwoord (scrambled form):
• ... dat ik een ei gisteren heb gebakken.
De verwerving van indefinieten
Wanneer volwassenen een referentiële interpretatie toekennen aan een indefiniet subject, doen kinderen dat meestal ook.
Bergsma-Klein (1996):
• Een meisje gleed twee keer uit.
Leeftijd: 4;0-7;0.
Dezelfde respons als volwassenen: 74%.
De verwerving van indefinieten
Wanneer volwassenen een niet-referentiële interpretatie toekennen aan een indefiniet subject, doen kinderen dat vaak niet.
Termeer (2002):• Er ging twee keer een jongen van de
glijbaan af.Leeftijd: 8;7-10;4.Dezelfde respons als volwassenen: 32%.
De verwerving van indefinietenWanneer volwassenen een referentiële
interpretatie toekennen aan een indefiniet object, doen kinderen dat juist niet.
Krämer (2000):
• Het meisje heeft een appel
niet geplukt.
Leeftijd: 4;0-7;7.
Dezelfde respons als volwassenen: 15%.
De verwerving van indefinieten
Wanneer volwassenen een niet-referentiële interpretatie toekennen aan een indefiniet object, doen kinderen dat ook.
Krämer (2000):
• Het meisje heeft geen appel geplukt.
Leeftijd: 4;0-6;10.
Dezelfde respons als volwassenen: 100% .
Patroon in experimenten
Volwassenen
• Referentiële interpretatie subject
• Niet-referentiële interpretatie subject
• Referentiële interpretatie object
• Niet-referentiële interpretatie object
Kinderen (% volwassen respons)
• 74%
• 32%
• 15%
• 100%
Vergelijking tussen talen
Algemeen patroon in talen:
• Subjecten zijn meestal referentieel.
• Objecten zijn meestal niet-referentieel.
Kinderen maken fouten als ze van dit patroon moeten afwijken.
Waarom?
Indefiniete subjecten
**<subject zinsintern, niet-referent.>
**<subject zinsintern, referentieel>
*<subject eerst, niet-referentieel>
*<subject eerst, referentieel>
F1M2M1M1: subjecten zijn referentieel.M2: indefinieten zijn niet-referentieel.F1: subjecten staan in eerste zinspositie.
Indefiniete objecten
<- scrambling, niet-referentieel>
**<- scrambling, referentieel>
*<+ scrambling, niet-referentieel>
***<+ scrambling, referentieel>
F1M2M1M1: objecten zijn niet-referentieel.M2: indefinieten zijn niet-referentieel.F1: indefiniete objecten scramblen niet.
Volwassenen vs. kinderen
• De interpretatie van indefinieten door volwassenen kan worden gemodelleerd door zwakke bidirectionele OT.
• Ongemarkeerde vormen met ongemarkeerde betekenissen zijn gemakkelijk voor kinderen.
• Gemarkeerde vormen met gemarkeerde betekenissen zijn moeilijk voor kinderen.
• De interpretatie van indefinieten door kinderen kan daarom het best worden gemodelleerd door unidirectionele OT.
Optimalisatie-strategieën
• Als de analyse van de Hoop & Krämer (2004) correct is, dan verschilt de grammatica van volwassenen van die van kinderen in de gehanteerde optimalisatie-strategie:– Volwassenen: zwakke bidirectionele OT.– Kinderen tot zeker 7 jaar: unidirectionele OT.
De rol van pragmatiek
• De Hoop & Krämer (2004) voorspellen dat kinderen een andere optimalisatie-strategie gaan gebruiken ergens na hun 7de jaar.
• Deze transitie lijkt overeen te komen met het gebruik van pragmatische kennis door kinderen.
• Deze transitie heeft niet alleen effect op de interpretatie van indefinieten, maar ook van scalaire implicaturen en pronomina.
Conclusie
• Unidirectionele interpretatieve OT = semantiek.
• Zwakke bidirectionele OT = pragmatiek.