getan - gesagt? - - gesagt.pdf · getan – gesagt? pragmatische und lexikalisierte erklärungen...

Download Getan - gesagt? - - gesagt.pdf · Getan – gesagt? Pragmatische und lexikalisierte Erklärungen zur…

Post on 18-Nov-2018

212 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Getan gesagt?Pragmatische und lexikalisierte Erklrungen zur Besetzung von Argumentstellen mit neuem Material

    Amir Zeldes Korpuslinguistik

    IDSL HU Berlin

    amir.zeldes@rz.hu-berlin.de

    mailto:amir.zeldes@rz.hu-berlin.de

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 1/39

    Manche

    Konstruktionen

    sind repetitiver

    als

    andere

    Part.-Pf. (Pkt.) Part.-Pf. [N] essen [N] trinken

    Gesagt , gebucht ! Klebreis Alkohol

    Gesagt , getan ! Bratwurst Milch

    Gesagt , getan ! eine Kuh Alkohol

    Versprochen gehalten ! Menschenfleisch Sekt

    Gesagt getan . Fleisch Bier

    Gesagt , getan : Pizza Bier

    Gesagt , getan . Fleisch AlkoholGesagt , getan . Fleisch Alkohol

    Gesagt getan . Kleinigkeit Kaffee

    Gesagt , getan . se Sachen Haarshampoo

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 2/39

    Semantische/pragmatische Erklrungsanstze

    Die Menge der essbaren Gegenstnde ist grer als die der Getrnke

    Nicht wirklich

    beide Klassen sind offen,

    nicht aufzhlbar: |trinkbar|=|essbar|=0

    Wir wiederholen Getrnke fter als Gerichte im Alltagsleben

    Getanes fhrt zu Gesagtem?

    Gilt das fr alle Flle?

    Was ist mit den gesagt-getan-Stzen?

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 3/39

    Exkurs: Morphologische

    Produktivitt

    Ein hnliches Phnomen wird in der morphologischen Produktivitts-

    forschung

    thematisiert

    Manche morphologische Prozesse sind produktiver

    als andere (s. Bauer 2001)

    grere Hufigkeit

    greres Vokabular

    grere Bereitschaft fr Neubildungen

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 4/39

    Sind diese Wortbildungsmuster gleich produktiv?

    Komparativbildung -er

    Nomenbildung auf -ung

    Nomenbildung auf -tum

    Adjektivbildung mit -lich

    Adjektivbildung mit -bar

    Adjektivbildung mit -sam

    sehrsehrwenigmittelhochgar nicht?

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 5/39

    Konsequenz: nicht

    binre

    Produktivitt

    n+1 leichter als m+1:

    machbar, dehnbar, miniaturisierbar n

    natrlich, lslich, landessprachlich m

    langsam, grausam, ?

    Wie kann man das messen?

    Knnen wir in jedem Fall beurteilen, ob eine produktive Bildung vorliegt?

    Miniaturisierbarkeit (Neologismus? Schon mal gehrt?)

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 6/39

    Produktivitt messen?

    Baayens

    (1992, 2001, 2009 i.a.)

    Vorschlge

    basieren auf:

    Tokenanzahl

    N(C)

    Typenanzahl

    V(N,C)

    Anzahl der Hapax Legomena V1(N,C)

    Implizite (falsche) Annahmen:

    Neologismen

    Hapax Legomena

    Konstantes Verhltnis

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 7/39

    Ergebnisse

    fr -lich/-bar/-sam

    Korpus: 5 Jahre

    CT Magazin

    14.596.537 Token

    595.022 Typen

    356.075

    hapax

    -lich -bar -samN 120458 26797 7672

    V 829 716 43V1 201 260 7P =V1/N 0.001668 0.009702 0.000087

    -sam ist in jeder Hinsicht am unproduktivsten

    -lich war ggf. bisher produktiver, breitet sich aber nun langsamer aus als -bar

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 8/39

    Vocabulary

    Growth Curves

    (VGC)

    wie oft sieht man ein neues Wort, wenn man schon einige gesehen hat?

    Kurve steigt: Prozess produktiv

    Kurve wird flach: Prozess unproduktiv

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 9/39

    Vocabulary

    Growth Curves

    (VGC)

    Visualisierung des Sttigungsgrades

    Statistisches Modell fr jede Kurve berechenbar (fZM, Evert 2004)

    Gesamtwortschatz-

    Vorhersage durch Asymptote (S = Species)

    Vorsicht

    unterschiedliche Mengen, Fehler, Dispersion

    (vgl. Evert & Ldeling 2001)

    (C'T, von Hand bereinigt)

    http://www.linguistik.hu-berlin.de/institut/professuren/korpuslinguistik/institutkorpora

    0 20000 60000 1000000

    200

    400

    600

    800

    Vocabulary Growth

    N

    VN

    barlichsamV=43; S=48.20738

    http://www.linguistik.hu-berlin.de/institut/professuren/korpuslinguistik/institutkorpora

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 10/39

    Was hat das mit der Argumentwahl zu tun?

    Argumente kann man genauso messen

    Verhalten sehr hnlich

    Ist anstrengen (im juristischen Sinne) das -sam

    der Verben?

    Objekt-Kpfe:

    Prozess,

    Verfahren,

    Klage

    ?

    P

    (hinterziehen)=0 !!

    0 200 400 600 800 10000

    100

    200

    300

    400

    500

    Vocabulary Growth

    N

    VN

    leistenhegenanstrengen

    V(leisten)=603; S=2079.22

    V(hegen)=59; S=81.83078

    V(anstrengen)=7; S=?

    (deWaC, Baroni et al. 2009,

    von Hand bereinigt)

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 11/39

    Wer kann was mehr?

    Produktivitt als Phnomenenkomplex

    (PC)

    0 10000 20000 30000

    050

    010

    0015

    0020

    0025

    00

    N(C)

    V

    spend

    sift

    push

    incur

    harbor

    eat

    drinkdefy/

    achieve

    [Daten aus ukWaC, Baroni et al. 2009]

    )}(,{

    )(limlim)('

    )(},,,{

    NvgcfPC

    NvgcVSNvgc

    NvgcVSVfPC

    NNN

    N

    N

    NNN

    P

    P

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 12/39

    Ranking nach unterschiedlichen Kriterien

    Rank S V N P N(C)=10001 eat eat achieve push2 achieve push spend eat3 incur achieve eat harbor4 push spend push defy5 spend drink incur achieve6 drink harbor drink drink7 harbor defy harbor spend8 defy incur defy incur9 sift sift sift (sift)

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 13/39

    Lexikalische Semantik als Modell

    Argumentstellen verlangen unterschiedliche semantische Klassen (Jackendoff

    1987, 1990)

    Verben spezifizieren Prferenzen bspw. durch sog. Entailments

    (Weinreich 1966, Dowty

    1991)

    trinken verlangt [+liquid]Wasser[+liquid]

    trinken

    # Steine[-liquid]

    trinken

    ? Lava[+liquid]

    trinken

    Welche Klasse verlangt anstrengen?

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 14/39

    Man muss oft von Individual

    thematic

    roles

    (Dowty

    1991)

    ausgehen

    Verb-spezifische

    Restriktionen

    [+trinkbar]

    [+anstrengbar]

    Zirkelschluss

    keine

    Vorhersagekraft?

    Es sei denn, mehrere Stellen teilen dieselbe Klasse

    jOTRINKiTRINKERsSIT

    trinkenRELN

    RESTR

    sINDEXpropMODE

    SEM

    jINDEXaccCASE

    NPCOMPS

    iINDEXNP

    SPRVAL

    verbHEAD

    SYN

    trinken

    _

    ,

    Nach Bosch (2007)

    Lexikalische Semantik als Modell

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 15/39

    Hypothese 1

    Semantik

    Wenn ausschlielich semantische Klassen fr Argumentwahl verantwortlich sind:

    i.

    mssten Argumentstrukturen mit gleicher Bedeutung hnliche Vokabeln realisieren

    schwierig, weil zufllig unterschiedliche Lexikalisierungen mglich sind

    ii.

    sie mssen wenigstens gleich produktiv sein, denn neue Flle knnen nicht lexikalisiert sein

    Synonyme als Minimalpaar

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 16/39

    Fall 1

    wegen X oder X wegen?

    Wegen tritt mit 3 syntaktischen Argumentstrukturen auf:

    (Braunmller 1982:200; Zifonun

    et al. 1997:2080ff; Petig

    1997)

    wegen des Vaters = pre-gen

    des Vaters wegen = post-gen

    wegen dem Vater = pre-dat

    Alle Varianten sind semantisch synonym* salva veritate

    Gibt es Intuitionen ber ihre Produktivitt?* abgesehen von Register/Pragmatik

    mehr dazu spter

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 17/39

    des X wegen ist weniger produktiv

    Kein signifikanter Unterschied bei pre-dat/gen

    post-gen

    ist schwcher (p

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 18/39

    des X wegen auf dem Weg raus?

    Wird post-gen

    eines Tages auf ihre

    hufigsten Vertreter beschrnkt?

    des Geldes wegen

    der Liebe wegen

    der Kinder wegen

    der bersichtlichkeit wegen

    ?

    Vgl. von Amts wegen, an Eides statt, Eng. the world over,

    in Christs stead

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 19/39

    Fall 2

    je desto

    Monotone Korrelation von Eigenschaften (comparative

    correlatives

    -

    CC)

    Prferenzen fr beide Teilstze: (Zeldes 2009,2011)

    je (c1): spatiotemporal

    lnger

    hher

    lter

    desto (c2): evaluativ

    besser

    schwieriger

    wahrscheinlicher

    Je grer das Risiko, desto hher der Gewinn

    Risiko

    Gew

    inn

    =besser

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 20/39

    Fall 2

    je destotype je desto kurz-je kurz-desto freqbesser 70 212 0 37 18270spter 22 5 0 0 7983strker 65 56 0 0 6844lnger 179 23 2 0 4659

    hher 179 76 0 1 3330grer 195 120 4 2 3126

    schwieriger 7 24 0 0 1344...

    wahrscheinlicher 0 10 0 0 103 [ct-Korpus

    +

    Parlamentsreden]

  • A. Zeldes Getan gesagt? IZ Colloquium, FU Berlin 10.5.2011 21/39

    Varianten u