theoretischer leitfaden zur verwendung der reffmech-datenbank
TRANSCRIPT
LOEWE Fundierung linguistischer Basiskategorien
Syntax/Semantik-Schnittstelle
ReffMech Version 1.0
Die Relation von formalen und funktionalen Mechanismen
in der Form/Inhalts-Zuordnung.
Leitfaden zur Datenbank der LOEWE Syntax/Semantik-Schnittstelle
http://www.regionalsprache.de/loewe/main.aspx
©Simon Kasper
technische Umsetzung: Frank Nagel, Slawomir Messner und Raphael Stroh
am Konzept beteiligt: Magnus Birkenes, Felix Esser, Giulia Grassi, Sara
Hayden, Axel Harlos, Julia Schüler, Paul Widmer
Philipps-Universität Marburg, 2012ff.
2
Gliederung
Seite
I Theoretischer Hintergrund………………………………………………………….. 3
1 Generelle Konzeption (Organigramm) …………………………………… 6
2 Kategorien und Ausprägungen……………………………………………. 9
2.1 Sprachübergreifend……………………………………………….. 9
2.1.1 Text………………………………………………………………... 9
2.1.2 Satz………………………………………………………………... 12
2.1.3 Teilsatz……………………………………………………………. 12
2.1.4 Phrase (Satzglied) ………………………………………………… 14
2.1.5 Satzgliedteil……………………………………………………….. 42
2.1.6 Wort/Morphem……………………………………………………. 42
II Anwendung……………………………………………………………………… 51
3 Eingabe, Bearbeitung, Segmentierung & Klassifikation………….............. 54
3.1 Prozedere: einfaches Beispiel.....………………………………….............. 52
Exkurs: Zur Bearbeitung des Textmaterials 57
3.2 Prozedere: weiteres Beispiel………………………………………………. 79
3.3 FAQs 87
3.4 Prozedere: sprachspezifisch 88
3.4.1 Richtlinien für die Textbearbeitung: TP 6...............................……… 88
3.5 Symbole……..…………………………………………………………… 92
4 Datenbankanfragen (Frank Nagel)………………………………............... 93
Literaturhinweise……………………………………………………................... 102
Abkürzungen…………………………………………………….......................... 103
3
I Theoretischer Hintergrund
Das o.g. Konzept (ReffMech) bildet eine korpuslinguistische Methode zur Validierung bzw.
Falsifizierung der folgenden These (LOEWE: 22):
„Je weniger formale Mittel eine Sprache bzw. die aktuelle syntaktische Struktur zur Verfügung
stellt, um semantische Relationen zu kodieren, desto höher ist der Anteil an nicht-formseitigen
Konzepten (wie der Belebtheitshierarchie), die für die adäquate Inhalt-zu-Form-Zuordnung
funktional belastet werden.“
Unter „formale Mittel“ sind die Kasus- und Kongruenzmorphologie sowie
Wortstellungsbeschränkungen hinsichtlich derjenigen sprachlichen Elemente zu verstehen,
die Prädikat-Argument-Strukturen kodieren. Die sprecher- und hörerseitige Anwendung
dieser Mittel dient dazu, in intersubjektiver Weise das – verkürzt gesprochen – „Wer tut was
mit wem“ (stellvertretend für alle möglichen Prädikat-Argument-Relationen) im Erfahrungs-
oder Wissensrepertoire der Sprecher durch En- und Dekodierung zum Zweck erfolgreicher
Kommunikation hinreichend anzugleichen. Dies konkurriert partiell mit einer weiteren
Auffassung:
„Gehen in einer Sprache Kasusmarker verloren, kann eine starrer werdende Serialisierung die
entstandene Unterspezifiziertheit der ausgedrückten Relationen kompensieren. […] [D]ie formale
Seite [lässt] nur einen solchen Grad der Unterspezifiziertheit zu […], dass sie noch erfolgreiche
verbale Kommunikation ermöglicht.“ (LOEWE: 21)
Faktisch gewährleisten aber alle bekannten Sprachen in allen ihren dokumentierten
Sprachstufen und Diasystemen die erfolgreiche Kommunikation ihrer Sprecher, und zwar
unter verschiedenartiger (von stark ausgeprägter bis hin zu fehlender) Ausschöpfung der
oben genannten formalen Mittel.
Damit wird erfolgreiche Kommunikation, nicht aber das Vorhandensein von morphologischen
Markierungen oder Wortstellungsbeschränkungen zum definierenden Merkmal von Sprache.
Aus der Sprachverstehens-Perspektive spielen […] spezifische kognitive Prozesse eine
entscheidende Rolle. Weist eine Sprache beispielsweise Kasussynkretismen und gleichzeitig
relative Serialisierungsfreiheit auf, kommt es mitunter zu Ambiguitäten, d. h. die semantischen
Relationen gehen nicht eindeutig aus der morphosyntaktischen Struktur hervor. An dieser Stelle
müssen bei der Dekodierung andere Hinweise auf die adäquate Form-zu-Inhalt-Zuordnung
herangezogen werden. (LOEWE: 21)
4
Dies bedeutet aber, dass die Formseite von sprachlichen Äußerungen in manchen Sprachen
regulär, d.h. konventionell, in anderen Sprachen punktuell hinsichtlich der semantischen
Relationen, die sie kodieren (keine eineindeutigen Zuordnungen), unterspezifiziert sind; die
nicht-formalen Mittel, die auf Hörerseite nötig sind, um eine unterspezifizierte Formseite
einer Sprecher-Äußerung hinreichend ähnlich zu dessen ursprünglichem Ereigniskonzept zu
konzeptualisieren, gehören also weder zur Form- noch zur Inhaltsseite des sprachlichen
Zeichens.
Die Hypothese ist nun, dass die in der funktional-typologischen Linguistiktradition
postulierten Skalen (diskurs-pragmatische, semantische, Akzessibilitäts-/Topik- und
Spezifizitätsskala; s.u.) diejenigen Einheiten enthalten, die die zum Sprachverstehen
benötigten Mittel bereitstellen. Gemeinsam bilden diese Skalen die „Belebtheits“hierarchie.
Die Klassifikation von Äußerungsteilen hinsichtlich dieser Skalen kann als universell
applizierbar betrachtet werden, d.h. jeder (im weitesten Sinne) nominale Ausdruck als Teil
einer Äußerung kann in jeder Sprache hinsichtlich der Skalen klassifiziert werden. Die
Applikation von Wortstellungsbeschränkungen und Kasusmorphologie ist nicht universell,
und zwar in dem Sinne, dass Sprachen konventionell oder punktuell keine
Wortstellungsbeschränkungen und keine Kasusmorpheme aufweisen. Damit sind die
Einheiten auf den Skalen das Konstante, während die genannten formalen Merkmale das
Variable sind.
Sprachsysteme unterscheiden sich (unter anderem) bezüglich der Kategorien Raum und Zeit:
diatopisch als historisch verwandte oder nicht verwandte nebeneinander existierende
Einzelsprachen sowie als Varietäten einer Einzelsprache; diachron in Bezug auf die
Entwicklungsstände von Einzelsprachen zu verschiedenen Zeiten. Die Entwicklung der
Morphosyntax von Einzelsprachen in Kurz- und Langzeit sowie die Morphosyntax der
Varietäten einer Sprache zu einem Zeitpunkt weisen Wandlungsregularitäten bzw.
systematische Varianzen auf. Die betrachteten Regularitäten betreffen dabei vor allem die
diachrone Entwicklung/diatopische Ausprägung von kasusmorphorphologischen
Synkretismen (vgl. LOEWE: 24ff.; Teilprojekte 5 u. 6) sowie die Entwicklung von einer
Grundwortstellung in eine andere (LOEWE: 30ff.; Teilprojekt 7), damit also genau die o.g.
Variablen.
In dem Maße, in dem es gelingt, die o.g. formalen Eigenschaften von (Varietäten von)
Einzelsprachen (historisch u. rezent) zu dokumentieren, zu systematisieren und zu den
5
Skaleneigenschaften der in sprachlichen Äußerungen kodierten nominalen Ausdrücken in
Beziehung zu setzen, ist es beispielsweise auch möglich, Rückschlüsse auf die
Zusammenhänge zu ziehen
• zwischen kasusmorphologischen Systemen und Worstellungsbeschränkungen, z.B.
zwischen
o (global) ambigen Strukturen und dem Grad, zu dem
Wortstellungsbeschränkungen in unterschiedlichen Sprachen vorhanden
sind/sich zwischen Sprachstufen verändern,
o morphologisch stark spezifizierenden Strukturen und dem Grad, zu dem
Wortstellung in unterschiedlichen Sprachen vorhanden frei ist/sich zwischen
Sprachstufen verändert;
• zwischen den formalen (Morphologie u. Wortstellung) Eigenschaften von
Sprachsystemen/ Äußerungen und den Skaleneigenschaften der in ihnen enthaltenen
nominalen Ausdrücke, z.B.
o zwischen „Subjekts“ausdrücken und ihren Skalenwerten in formal
unterschiedlichen Sprachen oder unterschiedlichen Sprachstufen,
o zwischen den syntaktischen Positionen von Objekten in formal
unterschiedlichen Sprachen oder unterschiedlichen Sprachstufen,
o zwischen Veränderungen im Sprachsystem und den Skaleneigenschaften der
betroffenen syntaktischen Einheiten,
o zwischen der Ausbildung von Synkretismen und deren Einfluss auf die
Skalenwerte von „Subjekten“ und Objekten,
o die Differenz der gemittelten Skalenwerte von „Subjekten“ und Objekten in
Sprachstufen, zwischen denen Wandel stattgefunden hat
• usw.
Anhand dieser Möglichkeiten können die zentralen Fragestellungen der Teilprojekte
korpuslinguistisch (und z.T. begleitet von Neuerhebungen) angegangen werden:
In den TPen 5 und 6 soll „die Interaktion zwischen den synkretistischen Prozessen und den
semantischen Eigenschaften der Partizipanten“ geprüft werden, wobei diese Prozesse „A)
[d]ie Reduktion eines 4-Kasus-Systems um zwei Kasus, B) de[n] Kernkasussynkretismus in
einem lokal begrenzten Bereich, C) de[n] Synkretismus eines Kernkasus mit einem Nicht-
Kernkasus, D) Teilsynkretismus von Nominativ und Akkusativ bzw. von Akkusativ und
6
Dativ, E) die Eliminierung der Reste eines Zwei-Kasus-System“ betreffen (LOEWE: 24).
„Ziel des Teilprojektes [7] ist […], den Zusammenhang zwischen den Strategien für die
Identifikation von Argumenten im Mittelkymrischen und Bretonischen (V2) und den V1-
favorisierenden Faktoren sowie die möglicherweise dahinterstehende Basiskategorie näher zu
beleuchten.“ Auch für die Teilbehandlung dieses Problems liefert das genannte Konzept das
geeignete Instrumentarium.
1 Generelle Konzeption (Organigramm)
Gemäß dem oben skizzierten Hintergrund müssen sprachliche Daten dokumentiert und
hinsichtlich ihrer formalen, d.h. morphologischen und syntaktischen Struktur systematisiert
werden. Daneben müssen sie ebenfalls hinsichtlich ihrer funktionalen Eigenschaften (Skalen)
klassifiziert werden. Aus konzeptionellen Gründen sind damit zwei Datenklassen gegeben:
eine formale Beschreibung und eine funktionale Charakterisierung. In seiner simpelsten Form
hat ReffMech die folgende Architektur:
Mit der Zuordnung eines nominalen Ausdrucks aus einer Äußerung zu den
Einheiten auf den Spezifizitäts-, diskurs-pragmatischen, informationsstruktu-rellen und semantischen Skalen sowie
seiner Klassifikation hinsichtlich
Kategorie, Position und Kasus sind im
Prinzip alle oben genannten Datenklassen
vorhanden.
Alle im Folgenden beschriebenen
Modifikationen dieses Basis-
Organigramms sind der Berücksichtigung
von Eventualitäten und Erwägungen der
Umsetzung geschuldet, die die Basis-
Architektur ergänzen müssen. Dennoch bildet sie in kondensierter Form den konzeptionellen
Kern von ReffMech ab.
Die infrage stehenden Verb-Komplement-Strukturen beschreiben die Strukturen von
Äußerungen, die wiederum Teile von Texten sind. Die o.g. Kategorie des nominalen
Ausdrucks, seine Position im Syntagma und sein Kasus müssen also in Bezug zur
7
Größeneinheit des Satzes gesetzt werden, in die ein Text segmentiert werden muss. Sätze
wiederum variieren hinsichtlich bestimmter Parameter, die mit den formalen und funktionalen
Eigenschaften von nominalen Ausdrücken korrelieren könnten. Darum müssen diese
Parameter ebenfalls erfasst werden. Diese Erwägungen sind strukturgebend für ReffMech in
dem Sinn, dass bestimmte formale Kategorien (Texte, Matrixsätze, Nebensätze, …) durch
Segmentierung erfasst werden; jede dieser Kategorien hat bestimmte Ausprägungen,
hinsichtlich derer Äußerungseinheiten klassifiziert werden können. Die in der Performanz
beschränkte, aber potentiell vorhandene Rekursivität von Sätzen sowie die
Dependenzstrukturen zwischen Matrix- und Nebensätzen machen es zudem erforderlich, dass
Einbettungen bei der Segmentierung berücksichtigt werden.
Um die formalen Eigenschaften von nominalen Ausdrücken
bestimmen zu können, müssen auch diese segmentiert
werden. Da (mindestens) referierende Ausdrücke nicht isoliert, sondern in endozentrischen
Konstruktionen vorkommen, deren Köpfe nominalen Charakter haben, werden diese
nominalen Ausdrücke als Phrasen (oder „Konstituenten“ oder „Satzglieder“) segmentiert, die
wiederum hinsichtlich bestimmter Parameter (Ausprägungen) variieren.
Erst die Segmentierung der nominalen Ausdrücke macht diese eindeutig identifizierbar, so
dass sie nun ausführlich formal und funktional klassifiziert werden können. Wie erwähnt
bilden Kasus (des Kopfes), Position und (Wort-)Kategorie die zentralen Informationen, die
für die Beziehung von Kasusmorphologie, Wortstellung und Belebtheitshierarchie von
Bedeutung sind. Die ersteren beiden sind allerdings unabhängig von diversen anderen
formalen Klassifikationskategorien nicht informativ in Bezug auf die Projektziele:
Beispielsweise könnten sich signifikante Korrelationen dadurch nivellieren, dass bestimmte
nominale Ausdrücke gleich behandelt werden, beispielsweise die „Subjekte“ von
Handlungsverben und Subjekt-Experiencerverben. Behandelt man diese gleich, ignoriert man
von vornherein die Möglichkeit, dass z.B. Subjekt-Experiencer andere Skaleneigenschaften
haben als Handlungs-„Subjekte“. Daher müssen auch Verben segmentiert und klassifiziert
werden, nämlich hinsichtlich ihres „Alignments“, d.h. der Frage, wie sie die unmarkierte
Abfolge der von ihnen geforderten Proto-Rollen lexikalisieren.
Einen entscheidenden formalen Indikator für semantische Relationen stellt die Kongruenz
des Verbs mit einem anderen Element dar. Die morphologisch eindeutige bzw. nicht
eindeutige Verb-Kongruenz korreliert daher auch stark mit dem Grad der formalen
Unterspezifiziertheit einer Äußerung und sollte ein entscheidender Faktor für Signifikanz der
funktionalen Kategorien sein, auch hinsichtlich des inkrementellen Sprachverstehens.
8
Die o.g. „Proto-Rollen“ generalisieren über den semantischen Status von Referenten von
nominalen Ausdrücken. Sie sind die semantische Beschreibungskategorie für die
Partizipanten des „Wer tut was mit wem?“ und liefern damit potentiell wichtige
Informationen darüber, welche Relationen wie kodiert werden, ob sich dies diachron
verändert oder diatopisch variiert, und zwar in Abhängigkeit von den anderen formalen und
funktionalen Eigenschaften der infrage stehenden nominalen Ausdrücke.
Vor allem in den kognitiv und funktional ausgerichteten Grammatikmodellen wird außerdem
einer weiteren semantischen Kategorie entscheidender Einfluss auf die Kodierung von
Relationen zugesprochen, nämlich der Rolle eines Referenten in einem kausalen
Zusammenhang. Obwohl diese Ansätze o.g. thematische/semantische Rollen aus der
Kausalstruktur eines Ereignisses/einer Situation ableiten, kann man beide Kategorien
unabhängig voneinander beschreiben. Es könnte sich z.B. herausstellen, dass nicht-
verursachende Proto-Agenten sich hinsichtlich bestimmter Kategorien anders als
verursachende Agenten verhalten.
Für einen Teil der untersuchten Sprachen könnte die Klassifikation der Verben und
Komplemente bezüglich der von ihnen eingenommen Positionen im topologischen Felder-
Modell von Bedeutung sein. Daher
bildet diese eine weitere
Klassifikationskategorie.
Bekanntlich bilden sich Kasus- und
andere Synkretismen nicht
gleichzeitig in allen syntaktischen
Kategorien aus. Daher werden auch
die Kategorien der klassifizierten
nominalen Ausdrücke erfasst.
Aus diversen Gründen
(diskontinuierliche Verbkom-plexe,
finite u. infinite Teile, variable NP-Strukturen, Dia-thesen, Modi, Tempora usw.) erscheint es
erforderlich, auch umfangreiche Klassifi-kationen auf Wort- bzw. Morphemebene
vorzuneh-men: Z.B. wären eventuell vorhandene signifikante Korrelationen gar nicht
feststellbar, wenn man Passiv-„Subjekte“ mit Aktiv-„Subjekten“ gleich behandeln würde.
9
2 Kategorien und Ausprägungen
2.1 Sprachübergreifend
2.1.1 Text
Texte bilden die oberste Ordnungseinheit für die Analysen. Diachrone, diatopische und
diastratische Parameter sind an Texte gebunden (s.u., II–IV). Texte werden hinsichtlich der
Kategorien in den nachfolgenden Organigrammen klassifiziert:
Dreifache Punkte zeigen an, dass der jeweilige Knoten noch eine Sub-Struktur hat.
Die Substruktur von „Autographie“:
Die Substruktur von „Edition“:
10
Die Substruktur von „Korpus“:
Die Substruktur von „Einordnung synchron, diachron & diatopisch“:
Die Substruktur von „Aramäisch“:
12
Die Substrukturen von „Sorbisch“ und „Friesisch“:
2.1.2 Satz
Sätze bilden die Äußerungseinheiten, die Träger der zu analysierenden Verb-Komplement-
Strukturen sind. Ganze Sätze (sentence layer in van Valin & LaPolla 1997) werden lediglich
aus dem Text segmentiert, aber nicht klassifiziert. Sentences umfassen potentiell mehrere
Teilsätze (clause layer in van Valin & LaPolla 1997).
2.1.3 Teilsatz
Innerhalb von Sätzen werden Teilsätze segmentiert. Darunter fallen sowohl Matrixsätze, d.h.
nicht abhängige (Teil-)Sätze, als auch subordinierte, d.h. abhängige Teilsätze verschiedenen
Typs (Satzart). Subordinationsverhältnisse können rekursiv strukturiert sein, d.h. abhängige
Teilsätze können gegenüber ihnen abhängigen Teilsätzen superordiniert sein.
Vollständigkeit:
13
• Ein (Teil-)Satz gilt als unvollständig, wenn z.B. in Koordinationen, elliptischen
Konstruktionen, Infinitiv- oder Partizipialkonstruktionen argumenthafte nominale oder
prädikative verbale Ausdrücke nicht realisiert sind. (Teil-)Sätze in Pro-drop-Sprachen
sind deshalb nur dann als „pro dropped und unvollständig“ zu klassifizieren, wenn
Auslassungen dieser Art vorliegen. Ansonsten sind sie als „pro dropped und
vollständig“ zu klassifizieren. Partizipialsätze haben beispielsweise keine Subjekte, so
dass eine pro-drop-Klassifizierung nicht applizierbar ist. Abgesehen davon können
auch sie vollständig oder unvollständig sein.
ref. Rahmen:
• In manchen der untersuchten Sprachen wird formal und mit Skopus über den (Teil-
)Satz markiert, ob dieser (Teil-)Satz bestimmte Aspekte des Diskurses fortschreibt
oder nicht.
Modus (nicht zu verwechseln mit der verbalen Kategorie):
• Unter Modus ist die formal angezeigte oder kontextuell zu inferierende illokutionäre
Kraft der Äußerung zu verstehen, die der syntaktischen Struktur zugrundeliegt.
Polarität:
• Enthält der (Teil-)Satz (grammatisch oder lexikalisch) eine Negation mit Skopus über
die durch den (Teil-)Satz ausgedrückte Proposition, ist der Satz als negativ zu
klassifizieren, ansonsten als positiv.
Diathese:
• Da oftmals nicht für ein Wort oder eine Phrase angegeben werden kann, um welche
Art der Diathese es sich handelt, aber man immer sagen kann, ob ein (Teil-)Satz ein
Aktiv-, Passiv- oder sonstiger Satz ist, wird die Kategorie „Diathese“ hier klassifiziert.
Ambiguitäten:
14
KONJKONJ_øVV_øAUXAUX_øMODMOD_øLVLV_øPV_NPPV_NP_øPV_APPV_AP_øPV_VPPV_VP_øPV_SPV_S_øPV_PPPV_PP_øn.b.n.a.n.n.a.
SUBSUB_øLSUBLSUB_øIOIO_øDODO_øOO_øPOPO_øKADJKADJ_øADJADJ_øREFLEXIVUMREFLEXIVUM_øNEGNEG_ø
• Hier kann angegeben werden, wenn ein (Teil-)Satz lexikalische oder eine strukturelle
Ambiguität aufweist. In der Klassifikation muss man sich notwendigerweise für eine
Lesart entscheiden. Mit dieser Angabe wird erfasst, dass es andere Lesarten gibt.
2.1.4 Phrase (Satzglied)
Ungeachtet der Applizierbarkeit des Phrasen-Begriffs auf verschiedene syntaktische
Hierarchieebenen sollen hier darunter genau die syntaktischen Einheiten verstanden – und
segmentiert – werden, die die verbalen oder (adpositional begleiteten) nominalen Teile von
Verb-Komplement-Strukturen darstellen. In einigen modernen Grammatiken und der
klassisch-lateinischen Grammatik sind die (adpositional begleiteten) nominalen Einheiten
durch Wer oder Was, Wessen, Wem oder Was, Wen oder Was, Wo, Wohin, Woher, Womit,
Wann, Wie lange, Von wem usw. erfragbar. Die Erfragbarkeit soll hier nur als Diagnose für
den Phrasen-/Satzgliedstatus dienen, nicht für die konkrete syntaktische Funktion. Gemäß den
Erwägungen aus Kapitel 1 ist die Phrase diejenige Größe, die hinsichtlich der meisten
Kategorien klassifiziert wird, wobei diese z.T. komplexe Ausprägungen haben.
• (SUB: Subjekt, LSUB: logisches Subjekt, IO:
indirektes Objekt, DO: direktes Objekt, PO:
präpositionales Objekt/Prapositionalobjekt, O: Objekt,
KADJ: Komplement-Adjunkt, ADJ: Adjunkt, PVXP:
Prädikativum mit XP-Status, AUX: Auxiliar, MOD:
Modalverb, LV: light verb, V: Verb, KONJ:
Konjunktion, Einleiter, NEG: Negation, X_ø:
phonetisch/graphisch nicht realisierte Funktion).
Zunächst müssen innerhalb der (Teil-)Sätze Phrasen
segmentiert werden, auch solche, die phonetisch/graphisch
nicht realisiert sind (X_ø), aber klassifiziert werden sollen.
Darunter fallen z.B. gedroppte Komplemente aller Art, z.B.
auch 2.Ps. in Imperativsätzen. Diesen Segmenten (worunter auch „ø“ fallen kann) werden
dann syntaktische Funktionen zugeordnet. Auch unter Berücksichtigung des (besonders)
umstrittenen Status von syntaktischen Funktionen sollen diese – falls der folgende
Klassifikationsleitfaden sich als unpraktikabel erweist – weniger als grammatische
Klassifizierung als als heuristisches Hilfsmittel für alle folgenden Klassifikationen verstanden
15
werden (s. Teil II). Dabei sollen dennoch grammatiktheoretisch heikle Annahmen vermieden
werden für den Fall, dass der Leitfaden sich als praktikabel erweist. Die Definitionen der
syntaktischen Funktionen – des „Subjekts“ mehr als der Objekte – orientieren sich zugunsten
der hier erforderlichen typologischen Generalisierbarkeit an van Valin & LaPolla 1997 sowie
van Valin 2001 und 2005.
Demzufolge sind Subjekte (SUB) (eigentlich „privilegierte syntaktische Argumente“) als
Komplemente in einer bestimmten Verb-Komplement-Struktur sowohl
• „pivots which are the omitted NP in a control or conjunction reduction construction or
the matrix-coded NP in a matrix coding construction“ als auch
• „controllers, which are the triggers for verb agreement, the antecedents of reflexives
and the controller of the omitted argument in a conjunction-reduction construction.”
(van Valin 2001: 2121; für Details vgl. van Valin & LaPolla 1997, Kap. (6.2 +) 6.3,
van Valin 2005, Kap. 4).
Für das logische Subjekt (LSUB) beispielsweise von kymrischen Verbalnomen ('sein Gehen',
'Gehen des Mannes') kann derzeit nicht entschieden werden, ob es die obigen Bedingungen
für SUB (teilweise) erfüllt. Es wird daher eindeutig durch die Zuweisung von LSUB
differenziert.
Das indirekte Objekt (IO) soll hier ebenfalls formal charakterisiert werden. Alle im
Folgenden genannten (eingeklammerten) inhaltlich-semantischen Merkmale von IOs dürfen
nicht als verbindliche Diagnostiken für die Ermittlung von IOs verstanden werden, sondern
benennen lediglich Tendenzen im cross-linguistischen Linking, die zusätzlich bei
Zweifelsentscheidungen herangezogen werden können:
• Wenn eine zwei- oder dreistellige Konstruktion ein IO enthält, erkennt man dies
daran, dass die Form und Funktion des IO erhalten bleibt, wenn der Satz passiviert
wird: IO > IO. Zum Vergleich: Wenn ein Satz ein DO enthält, wechselt es Form und
Funktion, wenn der Satz passiviert wird: DO > SUB. (Peter vertraut dem Lehrer. Dem
Lehrer wird vertraut. Peter belügt den Lehrer. Der Lehrer wird belogen.)
• Freie Verwendungen von Kasus obliquus werden als KADJ klassifiziert (s.u.)
(- Das IO trägt in Sprachen mit morphologischen Kasus immer vom Verb
zugewiesenen obliquen Kasus (tritt also niemals in einer PP auf).
1 Für Details vgl. van Valin & LaPolla 1997, Kap. (6.2 +) 6.3; van Valin 2005, Kap. 4.
16
• In ditransitiven Konstruktionen ist das IO eher weglassbar als das DO, ohne dass die
Konstruktion inakzeptabel würde.
• Im Idealfall ist das IO auf den indoeuropäischen Dativ zurückführbar. In jüngeren
Sprachstufen können die Funktionen des ie. Dativs mit denen des Lokativs und/oder
Instrumentals und/oder Ablativs und/oder Genitivs in eine Form zusammengefallen
sein.
• Das IO konkurriert in der sog. Dativalternation mit (hinsichtlich Haben- und
Transferrelationen) lokativen, direktiven oder ablativen (im Sinne von 'von etw. weg')
PPs, d.h. bildet Nahezu-Paraphrasen mit diesen. (Peter sendet Maria Blumen. Peter
sendet Blumen an Maria.)
• Die prototypische semantische Rolle, die ein indirektes Objekt in ditransitiven
Relationen relativ zum Verb trägt, ist die des Proto-Rezipienten. Darunter fallen –
grob gesprochen – die diskreten Rollen Rezipient, Bene-/Malefaktiv und manche
Possessoren.
• Die erste, daraus ableitbare schematische Bedeutung kann also folgendermaßen
beschrieben werden: Bei dreistelligen (und manchen zweistelligen) Verben steht der
Referent des IO in einer konkreten, abstrakten oder metaphorischen Relation des
Habens, Bekommens oder Verlierens zu SUB-V-DO. In dieser Rolle ist der IO-
Referent fast immer belebt. Weil SUB-V-DO oft bereits eine eigenständige Relation
beschreiben, ist das IO gut weglassbar. Dagegen würde SUB-V-IO keine
eigenständige Relation beschreiben. (Peter sendet Maria Blumen. Peter sendet
Blumen. *Peter sendet Maria.))
Von indirekten Objekten müssen direkte Objekte (DO) unterschieden werden.
• Wenn eine zwei- oder dreistellige Konstruktion ein DO enthält, erkennt man dies
daran, dass die Form und Funktion des DO sich ändern, wenn der Satz passiviert wird:
DO > SUB. (Zum Vergleich: Wenn ein Satz ein IO enthält, behält es Form und
Funktion, wenn der Satz passiviert wird: IO > IO. (Peter vertraut dem Lehrer. Dem
Lehrer wird vertraut. Peter belügt den Lehrer. Der Lehrer wird belogen.)
Eine dritte Kategorie bilden (einfache) Objekte (O).
• Greifen die beiden formal basierten Regeln für IOs und DOs (sowie POs, s.u.) nicht,
wird eine NP als O klassifiziert, d.h. eine NP wird dann als O klassifiziert, wenn die
Konstruktion, in der sie auftritt, nicht passivierbar ist, so dass die Form-/Funktions-
Konstanz oder -Veränderung nicht überprüfbar ist. O ist daneben die Kategorie für
nicht-nominale Objekte wie Objekts-VPs oder -sätze
17
Eine Konsequenz, die implizit in den SUB-, IO-, DO- und O-Definitionen ist, dass in
Sprachen mit Einheitskasus, bei denen im Falle der Passivierung (trivialerweise) keine
formale Veränderung des fraglichen Aktiv-Objekts vonstatten geht, geprüft werden muss, ob
sich die betreffende NP im Passiv als SUB im o.g. Sinne klassifizieren lässt. Wenn ja, ist das
Objekt des Aktivsatzes als DO zu klassifizieren, wenn nicht, als IO.
Als Präpositionalobjekt oder präpositionales Objekt (PO) gilt ein solches Objekt,
• das adpositional begleitet ist und dessen nominaler Bestandteil gegebenenfalls durch
die Adposition formdeterminiert ist,
• dessen (a) Auftreten vom Verb gefordert ist, wobei die Form entweder determiniert
(hoffen auf, warten auf) oder indeterminiert ist (wohnen auf/unter/neben/zwischen/…),
• dessen (b) Auftreten nicht (unbedingt) gefordert ist, wobei die Form, wenn es auftritt,
determiniert ist (Ø Ø spenden Ø, Ø Geld Ø spenden, der Wohlfahrt Ø spenden, der
Wohlfahrt Geld spenden, (Geld) an/*über/*auf*/zu*/*nach die/der Wohlfahrt
spenden).
• (- zur Konkurrenz zum IO, s.o. unter IO)
Bisweilen rangieren „zwischen“ Komplementen und Adjunkten sog. „Argument-Adjunkte“.
Diese sollen hier, um die rein formseitige Terminologie beizubehalten, Komplement-
Adjunkte (KADJ) genannt werden.
• KADJ sind wie manche POs nicht vom Verb gefordert.
• Wenn sie auftreten, ist ihre Form durch die Konstruktion erzwungen, d.h. sie bilden
innerhalb der Konstruktion keine Option zu einer alternativen Variante (außer „0“).
Darunter fallen
o Passiv-Agens-Phrasen
o freie Kasus obliqui
o Instrument-Phrasen
o Komitativ-Phrasen
Echte Adjunkte (ADJ) (d.h. ¬Komplement-Adjunkte)
• sind weder gefordert noch jemals formdeterminiert und werden daher nicht mit einer
der wählbaren Kernfunktionen versehen.
• Echte Adjunkte werden nicht hinsichtlich Proto-Rollen und Kausalität klassifiziert.
Prädikative (PVNP, PVAP, PVPP, PVVP, PVS) beschreiben Eigenschaften oder Zustände (in
verschiedenen Aktionsarten) von nominalen (oder satzwertigen) Phrasen/Satzgliedern.
18
• Die Kopulae bilden nur Verbindungsstücke zwischen den Elementen, in ihnen ist
lediglich Identität und Aktionsart lexikalisiert. Als Kopulae kommen in Frage z.B. 'be',
'become', 'remain', 'prove', 'seem'.
• Was prädiziert wird, kann als NP, AP, PP, VP oder S (Teilsatz) auftreten.
Unter den verbalen Elementen bilden die Klassen der Auxiliare (AUX) und Modalverben
(MOD)
• geschlossene Klassen mit festen Mengen an Vertretern.
• Auxiliare sind grammatische Elemente und semantisch (nahezu) leer. Sie spezifizieren
die vom lexikalischen oder Vollverb bezeichnete Eventualität primär hinsichtlich
Tempus/Aspekt/Modus.
• Modalverben spezifizieren die Relation zwischen Subjekt und Vollverb hinsichtlich
des Komplexes „Wunsch“ „Zwang“, „Möglichkeit“ (u. z.T. Epistemizität, d.h.
epistemische Modalität)
Als light Verbs (LV)
• werden diejenigen Verben in Sätzen klassifiziert, in denen Verbalnomen-
Konstruktionen Phrasen-Status besitzen und einen Zustand/Prozess/eine Aktivität
kodieren. Das grammatische Subjekt eines LVs ist das logische/psychologische
Subjekt eines Verbalnomens.
Vollverben (V)
• sind lexikalische Elemente in einer offenen Klasse.
• Wenn finit, verorten sich Vollverben z.T. selbstständig hinsichtlich Tempus/
Aspekt/Modus . Wenn nicht, bilden sie mit AUX oder MOD einen Verbkomplex.
Unter die Klasse der Konjunktionen (KONJ) fallen
• Komplementierer, also satzeinleitende Konjunktionen, sowie
• Konjunktionen im engeren Sinn, also und, oder etc.
Reflexiva (REFLEXIVUM)
• sind vom Verb geforderte Pronomina, die keine semantischen Argumente sind. (Peter
und Maria wundern sich. *Wen wundern Peter und Maria? Sich!)
• sind von gleichlautendenden Pronomina zu unterscheiden, die Argumentstatus haben
(Peter und Maria bewundern sich. Wen bewundern Peter und Maria? Sich
(gegenseitig)!)
Negationen (NEG)
19
Kategorie
0AdjunktAppellativumDemonstrativpronomenIndefinitpronomenInterrogativpronomenKlitikumPräpositionaladverbPropriumRelativpronomenSatzVerbalnomenVPn.b.n.a.n.n.a.
• sind Ausdrücke mit Konstituentenstatus, die Propositionen verneinen (Ich habe Peter
nicht gesehen. Ich habe nicht Peter gesehen. In Ich habe keinen Peter gesehen wird
keinen nicht als NEG klassifiziert.)
Aufgrund der endozentrischen Organisation von
Phrasen/Satzgliedern haben diese Köpfe. Hinsichtlich des
Zusammenhangs von Wortstellung, Kasusmorphologie und
Prominenzskalen kann es von entscheidender Bedeutung sein, ob
Wandel oder Variation an die grammatische Kategorie des
(prinzipiell) nominalen Kopfes der Phrase gebunden ist.
Darum werden diese ebenfalls differenziert.
Zunächst kann ein semantisches Argument formseitig überhaupt
nicht ausgedrückt sein. Aus diversen Gründen ist es somit
phonetisch/graphisch (bei Koordinationen, Ellipsen, Kontroll-,
Infinitiv-, Partizipialkonstruktionen, Fragmenten, pro-drop etc.) performanz-, überlieferungs-
oder sprachsystematisch bedingt „null“.
Klitika sind gebundene, lexikalische, nicht betonbare Morpheme, deren Extension die gleiche
ist wie die von Nomen, d.h. sie referieren potentiell auf die gleichen Entitäten wie
Appellativa.
Unter dem Demonstrativum soll hier das Demonstrativpronomen verstanden werden. In
seiner Artikelverwendung wird es auf Wort-/Morphemebene erfasst (s.u.). Das
Demonstrativum kann anaphorisch und/oder deiktisch auf nominale Referenten referieren,
d.h. auf ko-textuell vorgenannte als auch auf in der Sprechsituation im Raum verortete.
Das Pronomen, genauer: Personalpronomen, obwohl es für alle Arten von Entitäten stehen
kann, ist eine Ersatzform für ein „volles“ Nomen. Es ist nicht gebunden und (mit Ausnahmen)
betonbar. In der ersten und zweiten Person ist es grundsätzlich deiktisch, in der dritten Person
kann es auch anaphorisch verwendet werden.
Das Relativpronomen besitzt in einem Attributsatz Komplement-/Argumentstatus, ist aber
koreferent mit einem nominalen Element des (Teil-)Satzes, in dem das Bezugswort auftritt.
Wenn es flektierbar ist, kann es in Numerus und Genus mit dem Bezugswort kongruieren,
nicht aber im Kasus.
Interrogativpronomen sind solche Fragepronomen, die in Bestimmungsfragen auftreten
(wh-phrases, wer, wohin etc.).
20
Indefinipronomen sind Pronomen wie viele, jemand, alle, man etc.
Präpositionaladverbien sind Adverbien, die Komplementstatus haben. Sie werden als PO
klassifiziert mit der Ausprägung Präpositionaladverb.
Propria umfassen alle Varianten von Eigennamen, die (eigentlich) Exemplare, nicht
Kategorien bezeichnen.
Appellativa bezeichnen dagegen Kategorien, nicht Exemplare (es sei denn, sie werden
dahingehend modifiziert, s. Demonstrativum). Sog. „Stoffe“ sollen hier wie Appellativa
behandelt werden. Der traditionelle Unterschied zu Appellativa kann über die Spezifizität
(Skala 4, s.u.) rekonstruiert werden. Dies ist für Propria viel weniger klar, daher werden sie
zunächst eigens klassifiziert.
Das Verbalnomen besitzt eine nominale Form und ist (theoretisch) deklinierbar, bezeichnet
aber eine/n Zustand, Prozess, Aktivität. Die Tatsache, dass es semantisch Prädikat, aber
syntaktisch auch Komplement sein kann, begründet seine Sonderstellung. Die Phrase, deren
Kopf das Verbalnomen ist, wird entweder als (Teil-)Satz oder als (komplexes) Satzglied
klassifiziert, je nachdem, ob sie satzwertig ('sein Gehen' als Satz) oder satzgliedwertig ('Er tat
ein Gehen'; 'Ein Jagen kommt in seine Gedanken') ist. Als Adjunkte (da eigentlich keine
Wortkategorie) sollen solche Phrasenköpfe klassifiziert werden, deren Phrasen als
Adjunkte/adverbiale Bestimmungen klassifiziert worden sind, und deren Wortart keiner der
anderen entspricht (z.B. Ausdrücke wie dort, gestern, manchmal, vielleicht, aufgrund etc.).
Zuletzt sind noch VP- und S-wertige Satzglieder zu nennen. Wie das Verbalnomen
bezeichnen sie keine Entitäten, aber anders als das Verbalnomen ganze
Situationen/Ereignisse/Zustände/Relationen. VPs werden so behandelt, dass die durch sie
ausgedrückten Prädikat-Argument-Strukturen auch klassifiziert werden.
Manche Kategorien können noch hinsichtlich bestimmter Parameter variieren.
21
0
prolept.nota augens
Klit.
n.b.n.a.n.n.a.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Pron.
m. Nebensatzo. Nebensatz
n.b.n.a.n.n.a.
prolept.nota augensprolept. & Nebensatznota augens & Nebensatz
m. Attr.satzo. Attr.satz
Prop.
o. alles
n.b.n.a.n.n.a.
Dem.-pron.
App.
m. Nebensatzo. Nebensatz
m. Nebensatzo. Nebensatz
V-Nomen
m. Nebensatzo. Nebensatz
m. Nebensatzo. Nebensatz
VP S
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
Interrog.-pron.
m. Attr.satz
n.b.n.a.n.n.a.
Indef.-pron.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Präpos.-Adv.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Relat.-pron.
ADJ
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
0
prolept.nota augens
Klit.
n.b.n.a.n.n.a.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Pron.
m. Nebensatzo. Nebensatz
n.b.n.a.n.n.a.
prolept.nota augensprolept. & Nebensatznota augens & Nebensatz
m. Attr.satzo. Attr.satz
Prop.
o. alles
n.b.n.a.n.n.a.
Dem.-pron.
App.
m. Nebensatzo. Nebensatz
m. Nebensatzo. Nebensatz
V-Nomen
m. Nebensatzo. Nebensatz
m. Nebensatzo. Nebensatz
VP S
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
Interrog.-pron.
m. Attr.satzo. Attr.satzn.b.n.a.n.n.a.
Indef.-pron.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Präpos.-Adv.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Relat.-pron.
ADJ
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
0
prolept.nota augens
Klit.
n.b.n.a.n.n.a.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Pron.
m. Nebensatzo. Nebensatz
n.b.n.a.n.n.a.
prolept.nota augensprolept. & Nebensatznota augens & Nebensatz
m. Attr.satzo. Attr.satz
Prop.
o. alles
n.b.n.a.n.n.a.
Dem.-pron.
App.
m. Nebensatzo. Nebensatz
m. Nebensatzo. Nebensatz
V-Nomen
m. Nebensatzo. Nebensatz
m. Nebensatzo. Nebensatz
VP S
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
Interrog.-pron.
m. Attr.satz
n.b.n.a.n.n.a.
Indef.-pron.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Präpos.-Adv.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Relat.-pron.
ADJ
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
0
prolept.nota augens
Klit.
n.b.n.a.n.n.a.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Pron.
m. Nebensatzo. Nebensatz
n.b.n.a.n.n.a.
prolept.nota augensprolept. & Nebensatznota augens & Nebensatz
m. Nebensatzo. Nebensatz
Prop.
o. alles
n.b.n.a.n.n.a.
Dem.-pron.
App.
m. Nebensatzo. Nebensatz
m. Nebensatzo. Nebensatz
V-Nomen
m. Nebensatzo. Nebensatz
m. Nebensatzo. Nebensatz
VP S
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
Interrog.-pron.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Indef.-pron.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Präpos.-Adv.
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Relat.-pron.
ADJ
m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.
Der erste dieser Parameter bestimmt darüber, ob eine gegebene Kategorie das Bezugswort
eines Attributsatzes ist. Der zweite Parameter bestimmt, ob eine Kategorie formal definit
oder indefinit ist. D.h., hier gilt nicht semantische Definitheit, sondern die Präsenz eines
determinierenden Elements. Der dritte Parameter bestimmt, ob eine der nominalen Kategorien
bereits durch Prolepse (Klitikum an einem anderen Element im Satz) „vorweggenommen“
wurde. Unter nota augens versteht man ein enklitisches Pronomen, dessen Auftreten
Emphase oder Kontrast ausdrückt und/oder dessen Auftreten an die gleichen Bedingungen
gebunden ist wie das Auftreten von Pronomen in pro-drop-Sprachen.
Für verbale Elemente sollen engl. Glossen angegeben werden. Dies erlaubt nachher eine
Systematisierung bzw. Abfragen nach Verbklassen.
22
PA > PP > PLPA > PL > PP
Akkusativ Ergativ
Alignment
1-stellig
PAPRPPPL
2-stellig
3-stellig:
(a)
PA > PR > PPPA > PP > PRPP > PR > PPPP > PP > PRPR > PP > PPPR > PR > PP
(b)
PA > PP > PLPA > PL > PPPP > PP > PLPP > PL > PPPL > PL > PPPL > PP > PL
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
1-stellig
PAPRPPPL
2-stelligPA > PR/PP/PLPL/PP/PR > PAPR > PP/PLPP > PL/PRPL > PR/PPidentische Rollen
3-stellig:
(a)
PA > PR > PPPA > PP > PR
(b)
n.b.n.a.n.n.a. n.b.
n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
0-stellig 0-stelligPA > PR/PP/PLPL/PP/PR > PAPR > PP/PLPP > PL/PRPL > PR/PPidentische Rollenn.b.n.a.n.n.a.
n.b.n.a.n.n.a.
Beim Alignment (= unmarkierte Abfolge der Komplemente eines Verbs) soll zunächst ein
akkusatives und ein ergatives Alignment und dann zwischen null-, ein-, zwei- und
dreistelligen Verben unterschieden werden. Bei einstelligen wird nur die einzige, semantisch
geforderte Proto-Rolle des Verbs angegeben. Bei zweistelligen wird die unmarkierte Abfolge
hinsichtlich der Information spezifiziert, welche Proto-Rolle vor oder nach der anderen Proto-
Rolle realisiert wird. Hinsichtlich dreistelliger Verben wird unterschieden, welche die
Abfolge der zwei Rollen für die Objekte sind: Proto-Rezipient und Proto-Locational sollten
nicht zusammen auftreten können, daher bleiben die jeweils zwei Kombinationen aus Proto-
Patiens und Proto-Rezipient sowie Proto-Patiens und Proto-Locational. Was die Stelligkeit
von Verben betrifft, muss man hier diejenige des Types, nicht die des im aktuellen Satz vor-
gefundenen Verb-Tokens angeben.
Für Sprachen, hinsichtlich derer aufgrund fehlender Daten keine Alignment-Angaben für
Verben gemacht werden können, besteht evntl. die Möglichkeit, auf Basis der gesammelten
restlichen Daten schließlich auch dazu Prädiktionen ableiten zu können. Bei der Alignment-
Kategorie ist zu beachten, dass hier nur als „V“ getaggte Phrasen klassifiziert werden, nicht
nominale Phrasen. Das heißt, Alignment ist ausschließliches Merkmal von Verben.
Zur Kodierung des „Wer tut was mit wem?“ gehört die Information darüber, ob und wenn ja,
womit die verbalen (nicht die anderen) Bestandteile kongruieren. Entscheidend für die
Klassifikation ist die formale Kon-gruenz, d.h. Kongruenz anhand von morphologischen
Markierungen.
23
In Frage kommen
• Kongruenz des Verbs mit einer der syntaktischen Funktionen, worunter auch ein
gedropptes Subjekt fallen kann,
• keine morphologische Kongruenz für den Fall, dass das betreffende Verb infinit ist,
• keine morphologische Kongruenz für den Fall, dass z.B. in einer unpersönlichen
Konstruktion das Verb per default 3.Ps.Sg. aufweist,
• keine Kongruenz, wobei dies dennoch sprachsystematisch regulär ist, z.B. SUB im
Sg., V im Pl. im Kymrischen,
• keine morphologische Kongruenz, aber semantische. Dabei ist wieder anzugeben,
welche die syntaktische Funktion ist, mit deren Kopf-Referenten das Verb kongruiert,
• keine morphologische Kongruenz und semantisch ambig.
Möglicherweise relevant für
die Fragestellungen sind die
Positionen von Phrasen
bezüglich topologischer
Felder. Letztere ergeben sich durch die Stellungsmöglichkeiten von finiten Verben in einer
Sprache. Die Positionen vor, nach und zwischen den möglichen Stellungen finiter und
infiniter Verben machen die eigentlichen topologischen Felder aus. Bei der Entwicklung eines
topologischen Feldermodells sind im Allgemeinen besonders relevant
24
• die Anzahl der Phrasen/Satzglieder, die jeweils vor, nach und zwischen dem finiten
und infiniten Verb stehen können,
• die Frage, ob eine Adjazenzregel für finite und infinite Verbteile besteht (Aux/Mod +
Vinfin);
o wenn ja, besitzt die Sprache keine Klammerstruktur, d.h. die verbalen
Bestandteile können kein „Mittelfeld“ einklammern,
o wenn nein, ist eine Klammerstruktur vorhanden.
• VVF: Vorvorfeld, VF: Vorfeld; LK: linke Klammer; MF: Mittelfeld; RK: rechte
Klammer; NF: Nachfeld, RAF: rechtes Außenfeld
Erklärungsbedürftig sind VVF, RAF und LK & RK. VVF und RAF sind nicht dadurch
differenziert, dass verbale Elemente sie trennen. Sie sind eher durch den Unterschied von
geschriebener und gesprochener Sprache, von (kodifizierter) Norm und Gebrauch, von
Kompetenz und Performanz bestimmt. Das Vorvorfeld und das rechte Außenfeld sind der
„left detached position“ bzw. „right detached position“ in van Valins (2005) syntaktischer
Struktur sehr ähnlich; sie dienen mehr oder weniger zur Erfassung derselben sprachlichen
Phänomene, nämlich syntaktisch eher isolierten Voranstellungen und Nachträgen
(Korrekturen, nachträgliche Ergänzungen etc.). Auch Mehrfachauswahl ist möglich für den
Fall, dass eine diskontinuierliche Konstituente auf verschiedene Felder verteilt steht und per
Tag + Connect verbunden wird. Für einige Sprachen sind „Satztopologien“ bisher nicht
konsensfähig oder nicht vorgeschlagen worden. Für diese Sprachen besteht eventuell die
Möglichkeit, anhand der aus den anderen Klassifikationskategorien entstehenden Ergebnissen
Feldermodelle abzuleiten.
Von zentraler Bedeutung für viele der untersuchten Sprachen ist die Kategorie „Kasus“.
„Kasus“ ist dabei eins der prominenten formalen Mittel, anhand derer die konkreten
semantischen Relationen zwischen Prädikaten und Argumenten in Verb-Komplement-
Strukturen kodiert werden. Die Sprache von „Kasus“ soll folgendermaßen konkretisiert
werden:
• Kasus als Kasuskategorien „sind abstrakte Einheiten der linguistischen
Beschreibung. Sie bezeichnen Paradigmen, Klassen von [F]ormen, die füreinander
einsetzbar sind.“ (Dürscheid 1999: 2). In genau diesem Sinn kann man von
„Nominativen“, „Ablativen“ usw. sowie „Kasussystemen“ verschiedener
Sprachen/Varietäten sprechen.
25
• Kasusträger sind zunächst diejenigen lexikalischen Einheiten (inkl. „0“), die
Kasusmorphologie tragen können. Kasusträger besitzen unstrittig intrinsische
semantische Merkmale. Allein oder durch Kongruenz mit anderen Elementen (z.B. in
Kasus, Numerus, Genus) bilden die Kasusträger auf einer nächsten
Beschreibungsebene Phrasen/Satzglieder.
• Kasusformen sind die formalen Manifestationen von Kasuskategorien in Form von
Morphemen. Sie bilden Paradigmen. Der semantische Status von Kasusformen ist
umstritten. Hier soll die Form definiens einer Kasuskategorie sein. Kasusformen treten
in den untersuchten Sprachen auf in Form von
o Flexionsmorphemen an nominalen Ausdrücken (d.h. am Nomen selbst),
o Flexionsmorphemen an Ausdrücken, die nominale Ausdrücke determinieren/
modifizieren (d.h. an Determinierern u./o. Adjektivattributen),
o Morphemen an Elementen, die semantisch Prädikate sind, z.B. am Verb, und
die syntaktisch Phrasenköpfe sind.
o Nom: Nominativ, Gen: Genitiv, Dat: Dativ, Akk: Akkusativ, Vok: Vokativ,
Abl: Ablativ, Instr: Instrumental, Erg: Ergativ, All:Allativ, Obl: Oblativ, E-
kasus: Einheitskasus)
Neben dem Kasus einer Nominalphrase, d.h. konkret
der/n Kasusform/en, die (ein) Kasusträger
trägt/tragen, kann das Verb auch eine Adposition
regieren, die wiederum den Kasus einer NP regiert.
Es müssen also adverbale und adpositionale Kasus
unterschieden werden. Beide Kategorien werden
dabei unmittelbar bzw. mittelbar vom Verb regiert.
Die Adpositionen werden zum Zweck der
semantischen Differenzierbarkeit sprachspezifisch
als types gesammelt.
Eine besondere Schwierigkeit der Kasusformen-Klassifikation besteht darin, dass für viele
Sprachen in vielen Sprachstufen sowie in ihren Varietäten die Kasusparadigmen zu einem
hohen Grad schon vor der Klassifikation bekannt sein müssen, um konkrete Formen als
Instanzen von Kasuskategorien erkennen zu können. Dies ist aber nur sehr eingeschränkt der
Fall. Die Kategorie der Kasusform muss also wie z.T. diejenigen des Alignments und der
topologischen Felder als „in Entwicklung“ begriffen werden: Die Kasusform (nebst
Kasuskategorien) kann im günstigsten Fall
26
• einerseits durch distributionelle Analyse der Formen eines oder mehrerer hinsichtlich
der anderen Kategorien vollständig klassifizierten Texte(s) konstruiert werden und
• andererseits mit Bezug auf bekannte historische Kasussysteme konstruiert werden.
Sofern möglich, sollen für einen gegebenen nominalen Ausdruck alle Kasuskategorien
genannt werden, auf die die Form potentiell zutrifft, d.h. unabhängig vom Syntagma und der
Verbvalenz. Damit soll die eventuelle Unterspezifiziertheit der Formseite vollständig erfasst
werden.
Syntaktische Funktionen, Kasus-, Alignment- und Skaleninformationen sind auch gemeinsam
nicht in der Lage, die semantische Rolle, die ein Element in einer syntaktisch kodierten
Relation einnimmt, zu spezifizieren. Trotz der Pluralität der vorhandenen Rollendefinitionen
und -listen soll hier eine unkomplizierte und theoretisch dennoch tragfähige Klassifikation
von nominalen Ausdrücken hinsichtlich semantischer Rollen vorgenommen werden.
Semantische Rollen sind Generalisierungen über semantische Merkmale von Argumenten von
Prädikaten, und zwar in Abhängigkeit von der Semantik der Prädikate. D.h., obwohl der
Schütze eines Schießen-Ereignisses und der Esser eines Essens-Ereignisses körperlich groß
sein können, steht diese Eigenschaft in keinem logischen Zusammenhang zu den beiden
Prädikaten – Schießen und Essen finden auch unabhängig von Größe statt. Dagegen finden sie
nicht unabhängig von der Kapazität ihrer Träger zur Selbstbewegung und zum zielgerichteten
Handeln statt. Letztere Eigenschaften bilden sog. entailments von Prädikaten (d.h.: Immer
wenn Prädikat P, dann Eigenschaft f in Argument A; wenn nicht f in A, dann nicht P).
Überlegungen wie diese haben in der Vergangenheit zur Formulierung diverser Rollen
geführt. Hier soll von den Annahmen ausgegangen werden,
• dass Äußerungen in der Regel nicht mehr als dreistellige Relationen, bisweilen auch
vierstellige Relationen kodieren und
• dass die Annahme von entsprechend vielen – stark generalisierenden – semantischen
Rollen daher ausreicht.
Die Charakterisierung der folgenden Proto-Rollen
orientiert sich an den Ansätzen von Dowty (1991),
Primus (1999, 2006) und van Valin (2002, 2005). An
Dowty und Primus orientiert sie sich insofern, als die
Proto-Rollen über die semantischen Eigenschaften
„diskreter“ semantischer Rollen in Prototypen-ähnlicher Weise generalisiert (z.B. über
Agens, Instrument, Causer). An van Valin erinnert sie insofern, als die Generalisierungen
27
zunehmend feinkörnige Differenzierungen neutralisieren (z.B. die zwischen einem „Sender“,
einem öffnenden Schlüssel und einem tötenden Autounfall). Die folgende Tabelle zeigt, über
welche traditionellen, diskreten Rollen die Proto-Rollen Agens, Rezipient, Patiens und
Locational generalisieren.
[Abbildung zur Erklärung; keine Kategorien + Ausprägungen]
Die schematischen, von den Proto-Rollen abgedeckten Argument-Bedeutungen in
Abhängigkeit vom jeweiligen Prädikat können folgendermaßen charakterisiert werden:
A Proto-Agens:
1. verursacht die vom Prädikat verkörperte Eventualität, (a) entweder als erste Ursache
oder (b) als intermediäre;
2. falls ersteres, ist es möglicherweise auch eine als willentlich kategorisierte
Verursachung.
3. Bei Abwesenheit von Verursachung gilt ausschließlich das Kriterium der
Willentlichkeit, bzw. der zugeschriebenen Willentlichkeit, Kontrollausübung oder
Verantwortlichkeit.
B Proto-Rezipient:
1. Die vom Prädikat verkörperte Eventualität ist konkret oder metaphorisch, oft im Sinne
eines Transfers oder einer Besitzrelation; damit das Prädikat zutrifft, ist dann
Beteiligung im Sinne von Ko-Agentivität des PR nötig. Bsp.: Er bekommt ein Buch.
Er gratuliert ihr. Sie schenkt ihm ein Buch. Sie besitzt/hat/braucht ein Buch.
2. Die Eventualität kann auch handlungstheoretische Relevanz für ihn tragen, ohne dass
er kausal involviert ist, darunter ihm nützen oder schaden, zusagen oder nicht zusagen.
Bsp.: Papa kauft ihm ein Auto. Das Glas fällt ihm herunter.
3. Der PR ist Träger von Wahrnehmungen (als Perceiver), Gedanken (als Cognizer)
und Gefühlen (als Emoter). Als solcher weist er reduzierte Agentivität auf. In einem
28
anderen Sinn weist er reduzierte (d.h. weniger affiziert) Patientivität auf, indem seine
mentalen Zustände nicht unbedingt gewollt sind. In einer solchen Relation zwischen
dem PR und dem Stimulus findet kein Zustandswechsel statt, d.h. die Relation ist
statisch, der mentale Zustand ist von keiner anderen Entität verursacht. Bsp.: Das
Buch gefällt ihr. Sie fürchten sich. Er sieht einen Fuchs. Er denkt an ihn.
Die Charakteristika von (B1)–(3) bringen es mit sich, dass zur inhärenten Semantik
des Rollenträgers gehört, dass er prototypisch belebt ist.
C Proto-Patiens:
1. die Rolle von den Dingen, die sich konkret oder metaphorisch nicht selbstverursacht
bewegen und dabei selbst auch nichts verursachen, entweder in intransitiven,
transitiven oder ditransitiven Relationen (s. B1). Bsp.: Die Katze stinkt. Er kickt sie
durchs Fenster. Er schickt ihr einen Kondolenzbrief.
2. die Rolle von den Dingen, die von einer Eventualität betroffen sind, wobei B1–3
nicht zutreffen (d.h. hinsichtlich des Prädikat-Entailments ist die Entität nicht
zukünftiger Possessor bezüglich einer Transferrelation (B1); hinsichtlich des Prädikat-
Entailments besitzt die Relation für die Entität keine handlungstheoretische Relevanz
(B2); hinsichtlich des Prädikat-Entailments ist die Entität nicht Cognizer/
Perceiver/Emoter (B3)). Bsp.: Sie liest ein Buch. Das geht ihn nichts an. Sie
verschweigen ihm die Wahrheit.
3. die Rolle von Cognizers/Perceivers/Emoters, wobei diese Erfahrungen sich durch
eine Zustandsveränderung erst einstellen oder aufhören, indem sie verursacht werden
(daher „C“-Cognizer/-Emoter/-Perceiver für „verursacht“) d.h. die Relation ist nicht
statisch, sondern dynamisch. Bsp.: Sie ängstigen ihn zu Tode. Das Gewitter hat sie
erschreckt. Hans schreckt auf.
Die Charakteristika von (C1)–(3) bringen es mit sich, dass die PP-Rolle indifferent
gegenüber Belebtheit ist.
D Proto-Locational:
1. die Rolle des Wo?, Woher?, Wohin?, Wann? und Wie lange? der vom Prädikat
verkörperten Eventualität. Als solche steht PL in Opposition zu PA, PR und PP.
2. Zu PA steht PL in Opposition, wenn PA zugleich Ort, Quelle oder Ziel einer
Eventualität ist. Wenn die fragliche Entität in einer solchen Relation akzeptabel so
modifiziert werden kann, dass Agentivität impliziert ist, handelt es sich um ein PA.
Wenn nicht, um ein PL. Bsp.: In Peter nimmt eine Postsendung an ist Peter Ziel (PL)
der Bewegung. Agentivität ist in akzeptabler Weise impliziert, wenn man den Satz
29
entsprechend modifizieren kann: Peter nimmt (absichtlich/*unabsichtlich) eine
Postsendung an. Peter ist daher PA.
3. Zu PR steht PL in Opposition, weil viele Transferrelationen Aspekte sowohl von
Besitzrelationen als auch von simplen räumlichen Relationen aufweisen. Prädikate
können den einen oder anderen Aspekt betonen. Je nachdem variieren ihre
Entailments. Transfer-Besitzrelationen sind durch die Belebtheit, physische
Beteiligung und Ko-Agentivität des „Zielpunkts“ des Transfers restringiert (→PR),
Bsp.: Er erzählt ihr die Geschichte. Sie schickt ihm das Buch. Für rein räumliche
Transfer-Relationen besteht diese Restriktion nicht (→PL), Bsp.: Er faxt die
Geschichte an sie. Sie schickt das Buch an ihn. Bei diesen ist die „Entität“ oft ein Ort.
Ein Ort kommt als PR nicht in Frage. (Er schickt *Frankfurt/Holger einen Brief.) Ist
nicht klar, ob es sich bei einer belebten Entität um ein PR oder PL handelt, ist zu
überlegen, ob der Satz noch akzeptabel ist, wenn die Entität sich nicht beteiligt im
Sinne von Ko-Agentivität (Nicht-Beteiligung, →PL); oder ob die Entität notwendig
kausal involviert ist, so dass eine Haben-Relation notwendig zustande kommt (wenn
ja, →PR). Als simple Regel könnte man formulieren: Ist ein Personen-Ausdruck durch
einen Ortsausdruck ersetzbar, trägt die Person die PL-Rolle. Ist ein
Personenausdruck nicht durch einen Ortsausdruck ersetzbar, handelt es sich
höchstwahrscheinlich um ein PR. Aber: Ob ein Ortsausdruck durch einen
Personenausdruck ersetzbar ist, hat dagegen keine Aussagekraft.
4. In einer ähnlichen Opposition wie zu PR steht PL zu PP, nämlich hinsichtlich C2.
Die Regel soll sein: Orte können im Unterschied zu Objekten nicht kausal affiziert
sein, da Orte relativ zu menschlichen Größenverhältnissen nicht als in der
Wahrnehmung abgegrenzte Objekte auftreten. Bsp.: Peter sieht [PPMaria] an. Peter
sieht in [PLden Wald] hinein. Peter ruft [PPMaria]. Peter ruft nach [PLMaria]. Peter
bemalt [PPdie Wand] mit Blumen. Peter malt Blumen auf [PLdie Wand]. Menschen
können in der Vorstellung über ihre eigenen Größenverhältnisse hinausgehen, indem
sie aus vorgestellten Szenen „herauszoomen“ und auf diese Weise Entitäten, die im
Normalfall Orte wären (z.B., wenn ‚Tetsuhiro in [PLder Stadt] ist‘, zu Objekten
machen, die kausal affizierbar sind, (z.B., wenn Tetsuhiro in seiner Vorstellung aus
der Stadt herauszoomt und von oben beobachtet, wie ‚[PPdie Stadt] von Godzilla
zerstört wird‘). Menschen können also, je nachdem, welche Beobachterposition sie in
der Vorstellung relativ zu einer Entität einnehmen, diese als Ort oder als Objekt
konstruieren.
30
Metaphorische Ausdrücke sind raumkognitiv aufzulösen (die Idee ist, dass alle Metaphern
sich letztlich der senso-motorisch basierten Ausdrücke bedienen): Die Fee verwandelt [PPden
Zauberer] in [PLeine Unke]. Meronymische Ausdrücke werden nach der Semantik ihrer
assoziierten Referenten klassifiziert. Bsp: In Der Leberschaden sitzt im Wartezimmer wird
Der Leberschaden klassifiziert wie die Person, für die der Ausdruck steht (hier: PA), nicht für
die Semantik eines Leberschadens.
S- und VP-Komplemente tragen meistens die Rolle Proto-Patiens (Peter sagt, das sei
Quatsch), können aber auch Proto-Locational (Peter wohnt, wo der Pfeffer wächst) tragen
oder indeterminiert sein (In Marburg zu wohnen gleicht im Nirgendwo zu wohnen). Bei
Kopulaverben werden im wesentlichen Eigenschaften, darunter auch räumliche und zeitliche
Situiertheit prädiziert. Bei nicht-raumzeitlichen Prädikationen soll die Rolle Proto-Patiens an
das Subjekt vergeben werden (Peter ist Schreiner. Peter ist geschickt), bei raumzeitlichen die
Rolle Proto-Locational (Peter bleibt in Marburg, Das Fest war gestern). Den verschiedenen
Prädikativa wird keine Proto-Rollen zugeordnet, da sie lediglich Identität zu etwas
ausdrücken, das bereits klassifiziert wird.
Die o.g. Kriterien reichen hin, um alle Komplementtypen, die potentiell gemeinsam in einem
Satz auftauchen, hinsichtlich ihrer semantischen Rollen distinkt zu klassifizieren. (Echte
Adjunkte werden nicht hinsichtlich Proto-Rollen klassifiziert.) Eine Ausnahme bleibt: In
einem Satz kann ein (echtes) Agens-Komplement zusammen mit einem Instrument-
Komplement(-Adjunkt) auftreten. Beide würden als PA klassifiziert werden. Die distinkte
Klassifizierung bietet zwar Vorteile, ist aber nicht zwingend nötig. Es spricht nichts dagegen,
zwei Komplemente mit der gleichen Proto-Rolle zu klassifizieren. Ihre Distinktivität – sie
tragen ja nicht gleich zum „Wer tut was mit wem?“ bei – ist durch die Kausalstruktur (s.u.)
und die Funktionszuweisung (s.o.) eindeutig erfasst.
Die semantische-Rollen-Informationen zu Argumenten genügen gemeinsam mit der formalen
Spezifizierung noch immer nicht, um alle möglicherweise relevanten Faktoren für die
übergeordnete Fragestellung zu versammeln. Innerhalb der kognitiv-funktionalen Linguistik
wird die Kausalstruktur einer Eventualität als zentrales Determinans von semantischen
Rollen und diese wiederum als Steuerungsfaktoren ihrer sprachlichen Umsetzung gesehen.
Dies hat sich vor allem in der generativen Tradition nicht durchgesetzt. Dort werden
thematische Rollen nicht konsistent in Abhängigkeit von kausalen Erwägungen definiert.
Beide Ansätze haben ihre Grenzen, weswegen hier die Stärken beider vereinigt werden sollen.
Eine Charakterisierung semantischer Rollen von Argumenten soll komplementiert werden
31
durch eine Charakterisierung ihres kausalstrukturellen Status. Die Kausalstruktur hat
annähernd Skala-Status, indem die Werte, die einer Entität innerhalb einer Eventualität
zugeordnet werden
können,
verschiedene
Prominenz
ausdrücken.
Prominenz ergibt
sich hier aus der Rolle, die eine Entität in einer Situation/einem Ereignis einnimmt, und zwar
relativ zu den Polen Verursachung und Effekt. Die Einheiten ergeben sich aus einer Synopse
derjenigen Faktoren, die in der theoretischen Literatur im Zusammenhang vor allem mit
Transitivität (z.B. Hopper & Thompson 1980, Jackendoff 1990) diskutiert werden, und
denjenigen, die auf der Basis der Arbeiten von Talmy (1988) zu force dynamics mittlerweile
weit über die kognitive Linguistik hinaus Bedeutung gewonnen haben. Die Logik folgt dabei
derjenigen der wahrgenommenen physischen Kraftübertragung. Kausalität wird damit
rekonstruiert als eine physische Kraft („force“), die von einer Entität an eine andere Entität
(an eine andere Entität) (an eine andere Entität) (…) weitergegeben wird.
• Verursacher ist diejenige Entität, die eine andere Entität durch physische
Kraftausübung affiziert oder einen Zustandswechsel in dieser Entität hervorbringt. Der
Zustand des Verursachers selbst ist dabei (anscheinend) nicht selbst verursacht. In der
Regel sind dies „echte“, d.h. willentliche Agenten, Naturgewalten, aber auch Ma-
schinen. (Peter zerschlägt das Fenster. Peter trifft das Fenster. Der Hagel zerschlägt
das Fenster.)
• Verursacher & Verursachter zugleich sind solche Entitäten, die force auf andere
Entitäten ausüben (mit oder ohne Zustandsveränderung) und deren Zustand dabei
selbst durch force eines Verursachers verursacht ist. Dies entspricht der klassischen
thematischen Rolle des Instruments. (Der Stein zerschlägt das Fenster (weil Peter ihn
geworfen hat).)
• Symmetrisch verursacht/0-affiziert sind solche Entitäten in Zuständen, Prozessen,
Aktivitäten, die entweder symmetrische Relationen ausdrücken (Peter gleicht/ähnelt
seinem Vater; Peter ist wie sein Vater) oder solche, in denen keine physische
Kraftübertragung (force) vorhanden ist. (Peter kennt seinen Vater nicht).
• Ausdrücke, die auf Informationen jeglicher Art referieren, haben hinsichtlich
Kausalität einen problematischen Status und sollen von physischen Entitäten getrennt
32
klassifiziert werden. Grammatische Objekte von Verben, die propositionale
Einstellungen ausdrücken (z.B. eine Geschichte glauben/kennen/anzweifeln) sowie
von Verben des Sagens (z.B. die Antwort sagen/eine Geschichte erzählen) sollen als
Information klassifiziert werden.
• Die restlichen Einheiten applizieren auf Entitäten, die physisch betroffen, d.h. affiziert
sind;
o „positiv affiziert“ ist eine solche Entität, die in irgendeiner Weise so durch
force affiziert wird, dass sich ihr Zustand nicht ändert. Die Art der Affizierung
ist als positiv für die affizierte Entität zu bewerten. Die Einheit „positiv
affiziert“ soll auch für Arten der Affizierung ohne Zustandswechsel verwendet
werden, bei denen „positiv“ vs. „negativ“ nicht zu entscheiden ist (Peter sucht
ihm einen Job.).
o „negativ affiziert“ ist eine solche Entität, die in irgendeiner Weise so durch
force affiziert wird, dass sich ihr Zustand nicht ändert. Die Art der Affizierung
ist als negativ für die affizierte Entität zu bewerten (Peter tritt ihm in den
Hintern.).
o „positiv affiziert mit Zustandsveränderung“ ist gegeben, wenn eine Entität in
irgendeiner Weise so durch force affiziert wird, dass sich ihr Zustand ändert.
Die Art der Affizierung ist als positiv für die affizierte Entität zu bewerten
(Peter hilft ihm auf die Beine.). Die Einheit „positiv affiziert mit
Zustandsveränderung“ soll auch für Arten der Affizierung mit
Zustandswechsel verwendet werden, bei denen „positiv“ vs. „negativ“ nicht zu
entscheiden ist (Er hat das Brot aufgegessen).
o „negativ affiziert mit Zustandsveränderung“ ist gegeben, wenn eine Entität in
irgendeiner Weise so durch force affiziert wird, dass sich ihr Zustand ändert.
Die Art der Affizierung ist als negativ für die affizierte Entität zu bewerten
(Peter schlägt ihn grün und blau.)
1. Richtlinien für die Anwesenheit von Verursachern und affizierten Entitäten:
a) In der Art und Weise, wie wir über Kausalität sprechen, können sowohl Objekte als auch Ereignisse/Zustände
als Verursacher bzw. affizierte Entitäten fungieren:
[Ursache=EreignisDie schlechte Formulierung des Abschnitts] hat [Affiziertes=Ereigniseine Neuformulierung] erfordert.
[Ursache=ObjektDer Metzger] hat [Affiziertes=Objektdie Schweinehälfte] zerlegt.
[Ursache=ZustandDie brüchigen Gleise] haben [Affiziertes=Objektden Zug] zum Entgleisen gebracht.
[Ursache=ObjektEin Mann] hat [Affiziertes=Ereignisdie Zentrifugierung] erfunden.
33
Der Vorschlag ist, in der Datenbank nur die objekthaften Entitäten hinsichtlich Kausalität zu klassifizieren in
Abhängigkeit davon, ob sie plausiblerweise im gegebenen Ereignis force ausüben. Zustände/Ereignisse können
kein force ausüben. Das würde bedeuten:
Die schlechte Formulierung des Abschnitts: n.a.; eine Neuformulierung: n.a.
Der Metzger: Verursacher; die Schweinehälfte: pos. aff. u. Zust.veränderung
Die brüchigen Gleise: n.a.; den Zug: neg. aff. u. Zust.veränderung; Entgleisen: n.a.
Ein Mann: Verursacher; die Zentrifugierung: n.a.
b) Das heißt auch, dass ein Objekt in der Regel nicht seinen eigenen Zustand verursacht, es sei denn, es wirkt auf
sich selbst ein. In Peter tanzt ist Peter kein Verursacher. Aber in Peter tanzt sich in Trance ist Peter (=früherer
Peter) der Verursacher und sich (=späterer Peter) positiv affiziert mit Zustandsveränderung (Trance: n.a.)
2. Was ist mit metaphorischen und metonymischen Ausdrücken?2
a) Der Vorschlag ist, metaphorische Ausdrücke so zu klassifizieren wie nicht-metaphorische Ausdrücke. Bsp.:
metaphorisch: [VerursacherPeter] hat [pos.aff+Zust.veränd.mich] auf [0-affdie Idee] gebracht [0-aff.ø] zu studieren. Warum ist
das metaphorisch? Weil jmd. auf eine Idee bringen ein nicht-sensomotorisch basiertes Ereignis beschreibt, das
mit den sprachlichen Mitteln senso-motorisch basierter Sachverhalte beschrieben wird wie jmd. auf einen Berg
bringen. Wichtig dabei ist, dass der Unterschied zwischen metaphorischen und nicht-metaphorischen
Äußerungen über die Skalenwerte differenziert wird: jmd. auf [locationeinen Berg] bringen vs. jmd. auf [abstracteine
Idee] bringen.
b) Bei metonymischen Ausdrücken wird nicht der Referent dieses Ausdrucks, sondern der kognitiv assoziierte
klassifiziert (Also in Der Leberschaden sitzt in Zimmer 3 wird der Leberschaden so klassifiziert wie der kognitiv
mit ihm assoziierte „Träger“, d.h. irgendeine im Diskurs identifizierbare Person. Während der Leberschaden eher
ein Zustand ist, ist sein „Träger“ ein Objekt und würde als 0-affiziert (sie/er sitzt im Wartezimmer) klassifiziert.
3. Was ist unter einer Zustandsveränderung zu verstehen?
Eine Zustandsveränderung in einer Entität ist gegeben, wenn sich in dem durch die Äußerung ausgedrückten
Ereignis ein oder mehrere Merkmale dieser Entität ändern, hervorgebracht werden oder aufhören zu bestehen.
Auch Ortswechsel sind Zustandswechsel.
4. Erste Hilfe für kausalstrukturelle Notfälle
Schritt 1: Bestimme die Aktionsart der fraglichen Konstruktion
2 Metapher: Eine nicht senso-motorisch verankerte konzeptuell-semantische Domäne wird mit den sprachlichen
Mitteln einer anderen, senso-motorisch verankerten konzeptuell-semantischen Domäne beschrieben: Sein Tod
hat uns schwer getroffen. Die psychische „Betroffenheit“ der Referenten von uns wird mit den Mitteln echter
physischer Affiziertheit (treffen) ausgedrückt, weil beide Domänen strukturelle Ähnlichkeiten aufweisen.
Metonymie: Ein Referent wird mit einem Ausdruck versprachlicht, der auf eine konzeptuell assoziierte Entität
referiert: z.B. der Mann mit Leberschaden, der beim Arzt im Wartezimmer 3 sitzt mit dem Ausdruck der
Leberschaden (sitzt in Zimmer 3). Anders als bei der Metapher besteht hier keine Ähnlichkeit zwischen dem
Mann und dem Leberschaden, sondern eine kontingente kognitive Assoziation zwischen zwei Entitäten.
34
Relevante Aktionsarten:
a. Atelisch state (i): be sick, be tall, be dead, love, know, believe, have
Atelisch activity (ii): march, walk, roll (the intransitive versions); swim, think, rain, read, eat
b. Telisch achievement (i): pop, explode, collapse, shatter (intransitive)
Telisch accomplishment (ii): melt, freeze, dry (the intransitive versions); learn, receive
Telisch active accomplishment (iii): devour, walk to the store, eat the pizza
c. kausative Gegenstücke zu den genannten
Test für die telisch/atelisch-Unterscheidung:
a. Atelische Ereignisse haben keinen inhärenten Endpunkt. Sie können also modifiziert werden mit adverbialen
Bestimmungen wie für alle Ewigkeit, für viele Jahre/Monate/Stunden. Dabei darf aber keine iterative Lesart
entstehen. Wenn eine iterative Lesart entsteht, handelt es sich wahrscheinlich um ein telisches oder
semelfaktives Ereignis. Dieser Test sollte für telische Verben semantische Anomalien verursachen (#Er verzehrte
das Brötchen für viele Jahre --> telisch; #Das Licht flackerte für alle Ewigkeit --> semelfaktiv).
b. Telische Ereignisse haben einen inhärenten Endpunkt. Sie können also modifiziert werden mit adverbialen
Bestimmungen wie innerhalb von wenigen Jahren/Monaten/Stunden/Minuten/ Augenblicken. Dieser Test sollte
für atelische Verben semantische Anomalien verursachen (#Er war innerhalb von wenigen Jahren krank).
Test für die state/activity-Unterscheidung:
a. Activities können durch Adverbien wie heftig, gewaltsam, energisch, mit Mühe usw. modifiziert werden (Er
rollt sich mit Mühe den Berg hinunter). Dies ist nicht möglich für states (#Er ist gewaltsam groß).
Test für die achievement/accomplishment-Unterscheidung:
a. Achievements sind nicht durch Adverbien modifizierbar, die eine langsame Geschwindigkeit eines Ereignisses
spezifizieren (#Der Luftballon ist langsam geplatzt). Sie sind lediglich durch solche Adverbien modifizierbar, die
augenblickliche Zustandsänderungen implizieren (Der Luftballon ist plötzlich/in diesem Augenblick geplatzt).
b. Accomplishments können umgekehrt durch Adverbien modifiziert werden, die langsame Geschwindigkeiten
oder den allmählichen Eintritt eines Zustandswechsels ausdrücken (Das Eis ist langsam geschmolzen). Achtung:
Der Achievement-Test kann auch für Accomplishments funktionieren, der umgekehrte Fall ist ausgeschlossen.
Test für active accomplishment:
a. Active accomplishments liegen vor, wenn sowohl der Activity-Test als auch der Accomplishment-Test
funktionieren.
Test für Kausativität:
a. Die infragestehende Konstruktion ist paraphrasierbar als x wirkt physisch3 so auf {x, y} ein, dass {P, ø} {x, y,
z} verbt/geverbt ist/wird.
3 Beachte Metaphern-Regelung.
35
Peter streicht die Hauswand --> 'Peter wirkt so auf die Hauswand ein, dass die Hauswand gestrichen ist/wird'
(Kausativität gegeben) (Achtung: Telizität ambig)
Peter denkt an seine Oma --> #'Peter wirkt so auf seine Oma ein, dass an die Oma gedacht ist/wird' (Kausativität
nicht gegeben)
Peter bringt nichts aus der Ruhe --> ' (Nicht) etwas wirkt so auf Peter ein, dass Peter beunruhigt ist/wird'
(Kausativität gegeben)
Peter sprach zu ihnen: „Fürchtet euch nicht!“ --> 'Peter wirkt so auf 3pl ein, dass zu 3pl „Fürchtet euch nicht“
gesagt ist/wird'
Achtung: (i) Dieser Test ist kein Test für Telizität. (ii) Die Paraphrase darf keine Prädikate enthalten, die nicht in
der fraglichen Konstruktion bereits ausgedrückt (wenn auch inkorporiert) sind.
Schritt 2: Nun, da Du die Aktionsart bestimmt hast, führe Dir die logische Struktur deiner Konstruktion
vor Augen. Verwende die folgenden logischen Strukturen für Aktionsarten (vereinfacht):
States und Activities sind basal, alles andere wird aus ihnen aufgebaut.
activity (x) pred‘
state (x) pred‘
Telizität (x) BECOME pred‘
Atelizität [BECOME-Prädikat abwesend]
Verursachung (x) FORCE{x, y}
accomplishment (x) BECOME pred‘
achievement (x) BECOME pred’
active accomplishm. (x) BECOME pred‘
caus. state (x) FORCE {x, y} pred’ {z, ø}
caus. activity (x) FORCE {x, y} pred’ {z, ø}
caus. accomp. (x) FORCE {x, y} BECOME pred’ {z, ø}
caus. achievement (x) FORCE {x, y} BECOME pred’ {z, ø}
caus. act. accomp. (x) FORCE {x, y} BECOME pred’ {z, ø}
Schritt 3: Weise Kausalrollen an die Argumente in der logischen Struktur zu
Regel 1: Klassifiziere ein Element in der logischen Struktur, das links von FORCE steht, als Verursacher
(Ausnahme unter (2)).
Regel 2: Klassifiziere ein Element in der logischen Struktur, von dem aus links und rechts FORCE steht, als
Verursacher & Verursachtes.
Regel 3: Klassifiziere ein Element in der logischen Struktur, das rechts von FORCE steht, als affiziert
(Ausnahme unter (2), (4)).
Regel 4: Klassifiziere ein Element in der logischen Struktur, das links von BECOME steht, als affiziert mit
Zustandsveränderung
- Ausnahme: Wenn „(x) activity-pred‘ & (x) BECOME pred‘“, dann x = 0-affiziert4
4 Diese Ausnahme bedeutet: Wenn ein Objekt durch eigene Aktivität seinen Zustand/Ort wechselt, ist er nicht
als affiziert mit Zustandswechsel zu klassifizieren.
36
Regel 5: Klassifiziere Elemente, auf die (1)–(4) nicht zutreffen, als 0- bzw. symmetrisch affiziert oder als
Information.
Beispiele:
a. atelisch state
The boy is afraid.
(boy) afraid’ Regel 5
b. atelisch activity
The soldiers marched in the field.
(soldiers) march’ & (soldiers) be-at’ (field) Regel 5
c. causative state
The dog frightens/scares the boy. (VORSICHT: ambig, könnte auch caus. achievem. sein)
(dog) FORCE (boy) scared’ Regel 1, Regel 3
(dog) FORCE (boy) BECOME scared’ Regel 1, Regel 4
d. Achievement:
The balloon popped.
(balloon) BECOME popped’ Regel 4
e. Causative achievement:
The cat popped the balloon.
(cat) FORCE (balloon) BECOME popped’ Regel 1, Regel 4
[f. Semelfactive:
The light flashed.
(light) flash’ Regel 5
g. Causative semelfactive:
The conductor flashed the light.
(conductor) FORCE (light) flash’] Regel 1, Regel 3
h. Accomplishment:
The ice melted.
(ice) BECOME melted’ Regel 4
i. Causative accomplishment:
The hot water melted the ice.
(hot water) FORCE (ice) BECOME melted’ Regel 1, Regel 4
j. Activity:
The soldiers marched in the field.
(soldiers) march’ & (soldiers) be-at’ (field) Regel 5
k. Causative activity:
The sergeant marched the soldiers in the field.
(sergeant) FORCE (soldiers) march’ & (soldiers) be-at’ (field) Regel 1, Regel 3
l. Active accomplishment:
The soldiers marched to the field.
37
(soldiers) march’ & (soldiers) BECOME be-at’ (field) Regel 4 (Ausnahme)
m. Causative active accomplishment:
The sergeant marched the soldiers to the field.
(sergeant) FORCE march’ (soldiers) & (soldiers) BECOME be-at (field) Regel 1, Regel 4
n. causative active accomplishment
Jason cut off the Medusa’s head with a knife.
(Jason) FORCE (knife) FORCE (head) BECOME be-off’ Regel 1, 2, 4
o.
Peter sent his brother to London
(Peter) FORCE (brother) BECOME be-at’ (London) Regel 1, 4, 5
p.
Peter sent his brother a letter
(Peter) FORCE (letter) BECOME be-at’ (brother) & (brother) BECOME have’ (letter) Regel 1, 4, 5
Diejenigen Phrasentypen, die hinsichtlich Proto-Rollen klassifiziert werden, werden auch
hinsichtlich Kausalstruktur klassifiziert. Dies sind alle nominalen Phrasen (inkl. PO),
ausgenommen echte Adjunkte (ADJ) und Prädikativa.
Zuletzt fehlen noch diejenigen Informationen, die nicht Teil des sprachlichen Zeichens sind,
d.h. die weder in der Form einer Äußerung vorhanden sind, noch kausal mit den inhaltlich-
semantischen Entailments eines Prädikats verbunden sind. Diese funktionalen Informationen
– so die These – helfen im Sprachverstehen dabei, formale und inhaltlich-semantische
Einheiten einander zuzuordnen.
38
Die diversen, in der Literatur vorgeschlagenen und unter verschiedenen Bezeichnungen
kursierenden „Belebtheits“hierarchien vereinen oftmals Einheiten, deren
Definitionsmerkmale entweder grammatische, semantische, diskurs-pragmatische,
informationsstrukturelle oder spezfizitätsbezogene sind. Stellvertretend sei hier diejenige von
Silverstein (1976) genannt: Personalpronomina der 1. und 2. Person > Personalpronomina der
3. Person > Eigennamen > menschliche Nomen > belebte Nomen > unbelebte Nomen >
zählbare Nomen > Kontinuativa > abstrakte Nomen. In dieser Form kann eine
„Belebtheits“hierarchie – zu verstehen als Chiffre für die verschiedenartigen Skalen – aber
keine Aufschlüsselung der formalen, inhaltlich-semantischen und funktionalen Beiträge zum
Sprachverstehen leisten. Aus diesem Grund muss die Belebtheitshierarchie bereits vor der
Analyse dekomponiert werden. Ihre Wortarteninformationen – eine formales Merkmal –
wurden daher bereits aus der Silverstein-Hierarchie extrahiert. Sie finden sich oben in diesem
Kapitel unter „grammatische Kategorie“.
• Informationen über die Person, speziell der Unterschied zwischen der ersten und
zweiten gegenüber der dritten Person können über den diskurs-pragmatischen
Unterschied zwischen Sprechaktpartizipanten (SAP) und Nicht-Sprachaktpartizipanten
rekonstruiert werden.
• Informationen über intrinsische semantische Merkmale der Einheiten bezüglich ihrer
Belebtheit im engeren Sinne des Ausdrucks lassen sich auf einer entsprechenden
39
semantischen Skala anordnen. (Zum Unterschied zwischen „inanimate object“ und
„location“ siehe „Proto-Locational“, Absatz (4).)
• Die sog. accessibility hierarchy erfasst keine der Einheiten der Silverstein-
Hierarchie. Dies leisten bereits die anderen drei Skalen und die grammatischen
Kategorien. Stattdessen ist sie in der Lage, die relative Akzessibilität der Einheiten der
Silverstein-Hierarchie z.T. zu motivieren. Warum sollte auch ein Proprium „belebter“
sein als ein Nomen, das einen Menschen bezeichnet? Die Antwort bildet das Konzept
der accessibility, d.h. etwa „Abrufbarkeit von Referenten nominaler Ausdrücke im
Diskurs aus verschiedenen Gedächtniskomponenten“. Die These ist, dass
Sprachen die Mittel konventionalisiert haben, anhand derer auf im Diskurs leicht
abrufbare, mittelschwer abrufbare und schwer abrufbare Referenten zugegriffen
werden kann. Diese Mittel bilden dabei nicht die accessibility selbst, sondern
markieren nur den Grad der Abrufbarkeit. Abrufbarkeit dagegen ist die Eigenschaft
von Referenten im Diskurs. Die Abrufbarkeitsmarker finden sich in der Skala und
können als Strategien des sprachlichen Referierens auf dinghafte Referenten im
Diskurs verstanden werden, relativ zu deren Akzessibilität. (Die folgende Abbildung
kombiniert Ideen aus Ariel 1988, 1991 und 2008.) Abweichend von Ariel rangiert am
linken Pol „indefinite description“. Diese Einheit dient für neue, in den Diskurs
eingeführte Referenten. Diese sind per definitionem nicht akzessibel.5
indefinite description > full name + modifier > full name > long definite description > short definite description > last name > first name > distal demonstrative (+ modifier) > proximal demonstrative (+ modifier) > distal demonstrative > proximal demonstrative > stressed pronouns > unstressed pronouns > clitic pronouns > verbal person > zeros
keine/geringe Akzessibilität hohe Akzessibilität
aus Langzeitgedächtnisabgerufen
aus Arbeitsgedächtnisabgerufen
A president > Joan Smith, the president > Joan Smith > The president of the United States > The president > Smith > Joan > That president > This president > That > This > SHE > she > herself > [nominate]s > 0
[Abbildung zur Erklärung; keine Kategorien + Ausprägungen]
5 „Short definite description“: Der Ausdruck enthält ein oder zwei Inhaltsswörter. „Long definite description“:
Der Ausdruck enthält drei oder mehr Inhaltswörter. Die nominalen Ausdrücke müssen jeweils definit sein.
Die Skala hat keine gesonderte Einheit für Varianten wie Joe, the janitor oder Smith, the president. Formal sind
diese Ausdrücke weniger akzessibel als sowohl „first names“ als auch „last names“, sind aber höhergradig
akzessibel als „full names“. Da sie nur zwei Inhaltswörter enthalten, wären sie also als „short definite
descriptions“ + zu klassifizieren.
40
a) Zählbarkeit und Individuiertheit können in einer vierten, einer Spezifizitäts-Skala,
kombiniert erfasst werden. Diese tragen auch zur Differenzierung der Semantik
vonzählbaren Nomen und Kontinuativa bei. Wichtig dabei ist Folgendes: Alle
Menschenhaben prinzipiell die gleichen Fähigkeiten, Entitäten in der Wahrnehmung
abzugrenzen (betrifft Individuiertheit) und gegebenenfalls zu zählen (betrifft
Zählbarkeit). Die sprachlichen Ausdrucksformen in verschiedenen Sprachen variieren
bei den Ausdrücken für bestimmte Entitäten darin, ob sie die Individuiertheit und
Zählbarkeit von bestimmten Entitäten fordern (die obige Fähigkeit muss aktualisiert
werden) oder nicht fordern (die obige Fähigkeit muss nicht aktualisiert werden). Die
wichtigsten Ausdrucksstrategien, die Individuierung und Zählen auf der Seite des
Interpreten fordern, sind Quantifizierer (alle, manche, wenige, viele, keine Steine),
Determinierer (*Wasser, das Wasser, Steine, die Steine), sowohl Sg.- als auch Pl.-
Formen für einen Ausdruck (Stein/Steine, *Wasser/Wasser), Klassifizierer (ein Bund
Petersilie, ein Glas Wasser). Die Anwesenheit von solchen Strategien bei einem
Ausdruck erzwingen auf der Seite eines Interpreten, sich die betreffenden Entitäten als
solche zu vergegenwärtigen, die er/sie zählen könnte. Die aktuelle oder systematische
Abwesenheit solcher Strategien (engl. information, russ. карто́шка ‚Kartoffeln
(koll.)‘) negieren nicht die Fähigkeit zur Abgrenzung und zum Zählen, sondern
erzwingen diese nicht vom Interpreten und lassen ihm/ihr in gewissem Maß offen, was
er/sie konzeptualisiert. Die Klassifikation von betreffenden Ausdrücken sollen sich
daher an den folgenden Leitfragen orientieren:
o bezüglich Individuiertheit: Wird die Entität sprachlich als individuiert oder
nicht individuiert konstruiert? Wenn ich die Äußerung interpretiere, bringt sie
mich dazu, mir ein abgegrenztes Objekt vorzustellen? (Wenn ja:
+individuiert.) Individuiertheit erfasst also die Opposition „1 vs. ¬1“;
o bezüglich Zählbarkeit: Gegeben die sprachliche Form, durch die die Entität im
Satzkontext ausgedrückt ist: Bringt sie mich dazu, dass ich mir sie als
abgegrenzte Menge von mehreren individuierten Objekten vorstelle (nicht
individuiert & zählbar) (z.B. Sie macht Peter viele Komplimente) oder bringt
sie mich dazu, dass ich mir eine nicht abgegrenzte Menge vorstelle, von der ich
nicht sagen kann, wieviel davon gegeben ist oder wie lange sie eine Rolle spielt
(nicht individuiert & nicht zählbar) (z.B. Er trinkt Bier.). Zählbarkeit erfasst
also die Opposition „Masse vs. abgegrenzte Menge“. Ein möglicher Test für
Zählbarkeit ist der folgende: Gegeben eine Äußerung mit einem hinsichtlich
41
Spezifizität problematischen Ausdruck, der ein nomen continuativum
enthält: Ändert sich Wahrheitsgehalt der Äußerung, wenn ich mir
vorstelle, dass ich den Referenten des Massennomens in der Mitte zerteile?
(Bsp.: Peter hat Salz über die Tischkante geschoben. Ich stelle mir vor, Peter
schiebt nur die Hälfte davon über die Tischkante. Ändert sich dann der
Wahrheitsgehalt der Äußerung? nein. Bsp.: Peter hat Maria viel Geld gegeben.
Ich stelle mir, vor, Peter gibt Maria nur die Hälfte des Geldes. Ändert sich dann
der Wahrheitsgehalt der Äußerung? ja, bzw. kann nicht ausgeschlossen
werden. Bsp.: Peter hat Maria Fahrräder geschenkt: Fahrräder kein
Massennomen/nomen continuativum, daher: Fahrräder nicht individuiert, aber
zählbar. Peter hat Maria Salz geschenkt: bei halber Menge Salz: trotzdem
gleicher Wahrheitsgehalt) Damit gilt: Veränderter Wahrheitsgehalt:
zählbar; Gleicher Wahrheitsgehalt: nicht zählbar.
o individuiert: trifft auf Entitäten zu, die in der Äußerung als einzelne,
abgrenzbare Objekte (nicht „mass“ auf der semantischen Skala) konstruiert
werden. Beispiele für individuierte Entitäten: Gib mir mal [individ.das Wasser].
Er hat ihr [individ.das Salz] gereicht. Er hat ihr [individ.die Information] gegeben,
dass… . Er hat ihr gesagt, [individ.dass er sie mag]. Godzilla hat [individ.die Stadt]
zerstört.
o nicht individuiert und zählbar: trifft auf eine Anzahl von Entitäten > 1 zu, die
aber dennoch Objektcharakter haben und abgrenzbar sind (nicht „mass“ auf
der semantischen Skala): Beispiele: Könnten sie uns [nicht individ.&zählb.ein paar
Bier] an den Tisch bringen. Er hat ihr [nicht individ.&zählb.so manches Buch]
geschenkt. Er hat ihr [nicht individ.&zählb.die Informationen] gegeben, dass… . Er
hat ihr [nicht individ.&zählb.eine Handvoll Kartoffeln] auf den Teller gelegt. Er hat
[nicht individ.&zählb.alle Murmeln] verschluckt.
o nicht individuiert und nicht zählbar: Gib mir mal [nicht individ.&¬zählb.Wasser]. Er
hat ihr [nicht individ.&¬zählb.Salz] gereicht. He gave her [nicht
individ.&¬zählb.information] about Paul. Sie ernten [nicht individ.&¬zählb.Kartoffeln].
Somit ist die sog. Belebtheitshierarchie domänenspezifisch dekomponiert. Alle später aus der
Datenbank abfragbaren Korrelationen „der“ Belebtheitshierarchie mit formalen und
inhaltlich-semantischen Merkmalen können damit auch auf die Einheiten der jeweiligen
Domänen-Skalen bezogen werden, was für die Überprüfung des Status der
„Belebtheits“hierarchie von entscheidender Bedeutung sein kann.
42
2.1.6 Satzgliedteil
Satzgliedteile werden innerhalb von (nominalen) Phrasen/Satzgliedern getaggt. Sie besitzen
den Status von Modifizierern. Sie können lediglich hinsichtlich zweier Aspekte für die
Klassifikation auf Phrasenebene relevant sein: erstens hinsichtlich der Frage, ob sie selbst
Verb-Komplement-Strukturen enthalten, die erfasst und klassifiziert werden müssen, nämlich
in dem Fall, dass sie VP- oder teilsatzwertig sind; zweitens sind Modifizierer von nominalen
Ausdrücken mit verantwortlich für deren Abrufbarkeitsgrad (s. accessibility hierarchy).
Letzteres erfordere keinerlei weitere Analysen. VP- oder Teilsatzwertigkeit erfordert eine
Binnenklassifizierung dieser VPs oder Teilsätze. Diese erfolgt genau wie die Klassifikation
einer VP mit Komplementstatus bzw. eines Teilsatzes (s. zusätzliche Parameter bei
„grammatische Kategorie“ in 2.1.5). In allen anderen Fällen sind Satzgliedteile auf Wort-
/Morphemebene zu klassifizieren.
2.1.7 Wort/Morphem
Diverse Gründe machen eine Klassifikation auf Wort- bzw. Morphemebene notwendig, z.B.
Person-, Numerus- oder Genusinformation für die Entstehung von Synkretismen, die Frage,
ob ein Verb finit oder infinit, aktiv oder passiv usw. ist. Die so erfassten Informationen
bewahren möglicherweise vor zu generellen Aussagen bei bestimmten Datenbankanfragen.
Die Wortartenklassifikation orientiert aus Gründen der Übersichtlichkeit an der folgenden
Klassifikation:
43
flektierbar¬flektierbar
Wort
konjugiert &¬dekliniert
deklinierbar
nominal modifizierend/determinierend
AdjektivPoss.pron.AdverbArtikelQuantifiziererDem.artikelKonjunktionKomplementierer
PartikelPerfektivpartikelReflexivpartikelKonjunktionNegationAdpositionExistenzpartikelPräverbVerbalpartikel
Vollverb_finLight Verb_finAuxiliar_finModalverb_finKopula_finVerb. subst._konj
konjugiert & dekliniert
Vollverb_nonfinLight Verb_nonfinAuxiliar_nonfinModalverb_nonfinKopula_nonfinVerbalnomen_dekl
AppellativumKontinuativumAbstraktumPropriumPronomenNota augensDem.pronomenRel.pronomenIndef.pronomenInterrog.pron.
......
...
...
...
Jedes Element, das auf Wortebene
segmentiert wurde und
klassifiziert werden soll, ist
zunächst prinzipiell entweder
flektierbar oder nicht
flektierbar. Wenn ersteres, ist es
möglicherweise konjugiert und
nicht dekliniert, d.h. es trägt eine
Konjugationsform (und sei es die
Nennform), in der es nicht
deklinierbar ist. Oder es ist
deklinierbar, d.h. nicht
konjugierbar. Wenn es deklinierbar
ist, ist es entweder nominal oder
modifizierend bzw. determinierend.
Oder es ist konjugiert und dekliniert
gleichzeitig, d.h. ein Element liegt in einer Konjugationsform vor, die deklinierbar ist und dekliniert ist (inkl. Nennform). Ist das zu klassifizierende
Element nicht flektierbar, wird es der Klasse der nicht flektierbaren Elemente zugeordnet.
Jede der vier Klassen – konjugiert und nicht dekliniert, deklinierbar, konjugiert und dekliniert, nicht flektierbar – hat genau wie das Wort in der
obigen Struktur eine komplexe, hierarchische Substruktur, die sozusagen die obige Verästelung fortsetzt. Dies ist durch „…“ angedeutet. Jedes auf
Wortebene zu klassifizierende Element wird auf jeder Hierarchieebene von „oben nach unten“ durchklassifiziert. Die folgenden Abbildungen führen
die obige Baumstruktur fort.
44
Person Modus TempusGenus/Diathese
KlasseKonjug.
123IcIImIIfIIImIIIf1 Rf2 Rf3 Rf
Num
SgDuPl
Ind.Konj.1Konj.2Opt.Imp.JussivPräkat.Energ.Subj.Prog.Infinit.Partizip
PräsensPräs. habit.PräteritumPast Imp.ImperfektImpfkt. subj.PerfektDopp-Perf.Plq.perf.FuturFutur IFutur IIPlq.prät.wa-yiqtolSuff-konjug.Präf-konjug.
AktivPassivAntipassivMittelReflexivImpersonal
Aspekt
...
konjugiert & ¬dekliniert
Wortart
Vollverb_finLight Verb_finAuxiliar_finModalverb_finKopula_finVerb. subst._konj
...
Formtyp 2
...
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
[sum-mativ]
[sum-mativ]
Formtyp 3
len. rel.nas. rel.n.b.n.a.n.n.a.
Die Abbildung führt unter den flektierbaren Elementen die konjugierten und nicht deklinierten fort. Das zu klassifizierende Element wird hier
ausführlich sub-klassifiziert und zwar hinsichtlich bestimmter Kategorien: Unter der Kategorie Wortart erscheinen hier naturgemäß verbale
Elemente. Die Kategorie Formtyp 2 betrifft ausschließlich das Aramäische. Dort kann ein verbales Element mit einem Zusatz versehen sein, dessen
45
Distributionsbedingungen geklärt werden sollen. Fürs Aramäische soll die Voreinstellung hier das
Nichtauftreten dieses Elements sein. Für alle anderen Sprachen wird die Voreinstellung „nicht applizierbar“
sein. Person umfasst alle möglichen Personen, die in der konkreten Form des Verbs (morphologisch)
ausgedrückt sein können. Die Kategorie Numerus betrifft alle möglichen Numeri, die durch eine konkrete
Verbform (morphologisch) ausgedrückt sein können. Die Kategorie Modus betrifft den formal (d.h.
morphologisch) markierten Modus der in Frage stehenden Form. Das gleiche gilt für Tempus und
Genus/Diathese.
Die Kategorie Klasse Konjugation enthält sprachspezifisch sortiert alle verbalen Stammklassen. Für
manche Sprachen besteht hier gegebenenfalls die Voreinstellung „nicht applizierbar“. In Sprachen, in
denen Aspekt grammatisch oder lexikalisch im Verb kodiert ist, stehen perfektiver, neutraler und
imperfektiver Aspekt mit evntl. weiteren
Ausprägungen zur Auswahl. Beispiele für
inchoativen, terminativen, punktellen und
durativen Aspekt sind erblühen, verblühen,
blitzen und blühen.
46
Die folgende Abbildung geht in der Baumstruktur wieder nach oben unter den „flektierbar“-Knoten und führt die deklinierbaren Elemente fort.
Als deklinierbar (und dabei nicht konjugierbar) sind hier nominale und modifizierende/determinierende Elemente bestimmt. Diese beiden Typen
von deklinierbaren Elementen teilen sich die meisten, aber nicht alle Kategorien, hinsichtlich derer sie spezifiziert werden müssen. Dies ist durch
die Überkreuzzuordnungen markiert. Streng genommen ersetzt die Abbildung zwei Abbildungen, jeweils eine für die beiden Subtypen der
Kategorie „deklinierbar“. Unter den Kategorien nominal < Wortart und modifzierend/determinierend < Wortart erscheinen konsequenterweise
47
KlasseDekl.
aôiuanônînrntWurz.stsw
Aram. Dt. Heth. Ir. Kymr. Pers.
r¬r
oā
ioiāiī
uDipht.Gutt.Dent.Nas.rsKons.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a. n.b.
n.a.n.n.a.
n.b.n.a.n.n.a.
aaiauei-subu-subi-adju-adjnntrr/nlstn.b.n.a.n.n.a.
nominale bzw. modifizierende und determinierende Wortarten. Definitheit betrifft den an dem/durch das nominale/n Element oder dem/das
determinierende/n / modifizierende/n
Element markierten Definitheitsstatus
des Elements. Die Form betrifft
bestimmte Merkmale bestimmter
nominaler und det./mod. Elemente,
vorrangig pronominaler. Vor allem
Letztere können frei oder gebunden
(klitisch) und wenn gebunden,
unterschiedlich affigiert auftreten. In
allen vier Eventualitäten können sie
jeweils einfach, betont, reduplizierend
oder konjunkt auftreten.Unter Lenition wird die Lenisierung von wort-initialen Konsonanten
erfasst, sofern sie syntaktisch oder semantisch relevante Distinktionen markiert. Für die
Klassifikation der Kasus gilt das gleiche wie für die Phrasen-/Satzglied-Klassifikation: Sie
betrifft Kasusformen und sofern möglich, sollen für einen gegebenen Ausdruck alle Kasuskategorien genannt werden, auf die die Form potentiell
zutrifft, d.h. unabhängig vom Syntagma. Die Kategorie Klasse Deklination enthält sprachspezifisch sortiert alle Stammklassen nominaler, det. u.
mod. Ausdrücke. Für manche Sprachen besteht hier gegebenenfalls die Voreinstellung „nicht applizierbar“. Für die Kategorien Person, Numerus
und Genus gilt im Prinzip das gleiche, was oben bereits gesagt wurde: Person umfasst alle möglichen Personen, die in der konkreten Form
ausgedrückt sein können. Die Kategorie Numerus betrifft alle möglichen Numeri, die durch eine konkrete Form ausgedrückt sein können. Die
Kategorie Genus betrifft alle möglichen Genera, die durch eine konkrete Form ausgedrückt sein können. Die Kategorie Komparation erfasst
schließlich die Steigerungsform, in der ein steigerbares Element auftritt.
48
Die folgende Abbildung geht in der Baumstruktur wieder nach oben unter den „flektierbar“-Knoten und führt die konjugierten und deklinierten
Elemente fort.
WortklasseV nonfin
Person Modus TempusGenus V./Diathese KlasseNum
SgDuPl
AktivPassivAntipassivMittelReflexivImpersonal
Aspekt
...
konjugiert & dekliniert
InfinitivSupineGerundGerundivPartizip
Kasus Genus
NomGenDatAkkVokAblInstrErgAllOblE-kasus
Mask.Fem.Neut.Ut.Comm.
Komparation
Pos.Komp.Superl.Äquat.
...
Wortart
Vollverb_nonfinLight Verb_nonfinAuxiliar_nonfinModalverb_nonfinKopula_nonfinVerbalnomen_dekl
123IcIImIIfIIImIIIf1 Rf2 Rf3 Rf
Ind.Konj.1Konj.2Opt.Imp.JussivPräkat.Energ.Subj.Prog.Infinit.Partizip
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
[sum-mativ]
[sum-mativ]
[sum-mativ]
PräsensPräs. habit.PräteritumPast Imp.ImperfektImpfkt. subj.PerfektDopp-Perf.Plq.perf.FuturFutur IFutur IIPlq.prät.wa-yiqtolSuff-konjug.Präf-konjug.
[sum-mativ]
49
¬flektierbar
Partikel Perfektivpartikel Reflexivpartikel Konjunktion Comp. Negation Adposition...
Existenz-partikel
Präverb n.b.n.a.n.n.a.
Verbal-partikel
Klasse
Konjug.
aôiuanônînrntWurz.stsw
Dekl.
Aram. Dt. Heth. Ir. Kymr. Pers. Aram. Dt. Heth. Ir. Kymr. Pers.
r¬r
aaiauei-subu-subi-adju-adjnntrr/nlst
neut.impf.
GDKtDtGtKGt(N)
stsw jsw ōsw ēPr-Präs.Suppl.
a(1)a(2)a(3)b(1)b(2)h(1)h(2)h(3)
oā
ioiāiī
uDipht.Gutt.Dent.Nas.rsKons.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a. n.b.
n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
In diese Klasse fallen alle Wörter, die einen verbalen
Stamm haben, die aber in einer nonfiniten (inkl.
Nennform) auftreten (Wortklasse V nonfin), die sie z.T.
deklinierbar machen. Charakteristikum dieser Wörter ist
damit, dass sie hinsichtlich Kategorien klassifiziert
werden müssen, die sich aus denen für konjugierbare
Ausdrücke und denen für deklinierbare Ausdrücke
zusammensetzen. Alle Kategorien wurden daher bereits
oben besprochen. Bezüglich der Kategorie „Klasse“, sei
angemerkt,
dass hier
vorsichtshalber sowohl die Konjugations- als auch die Deklinationsklassen aufgenommen sind.
Die Kategorie Aspekt wiederholt diejenige aus der Klasse der konjugierten und nicht deklinierten
Ausdrücke.
Schließlich gibt es noch die nicht
flektierbaren Wörter. Sie bilden
notwendigerweise eine
Restkategorie, deren Mitglieder
durch kaum ein Merkmal vereint
50
Adposition
Aram. Dt. Heth. Ir. Kymr. Pers.
ØʔytwtLytʕlʔl
durchbisfürohneentlanggegenumbeimitseitauszunach vonhinterannebenaufunter
bērōnparrōnbēdandarazabarfrāzpadīragjudabāzhandēmānērfrōddurcēwasnādandarciyōnnazd(īk)abarēdkaulparrōn
azōpadhambadīzpadisāyhammistrāytāabāgbēpas(īy)pēštar(ist)tārōnēnyāmayānpērāmōnazērmanāg
zwischenvorinübergegenüberinmittenringsumwegentrotzwährendgemäßaußerhalbum … herumaußer
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
n.b.n.a.n.n.a.
...
n.b.n.a.n.n.a.
anda andan Appanarha handas istarna iwar katta kattan man mahhan para pariyanparranda peran sara ser tapusza
...
...
werden. Die „Töchter“ des „nicht flektierbar“-Knotens sind daher auch die Wortarten selbst.
Mit Konjunktion sind
logische Junktoren
gemeint wie und oder
oder, für die gilt: „Wenn
a Konjunktion b, dann b
Konjunktion a. Dies gilt
nicht für „Comps“ (=
Komplementierer), die
asymmetrisch
„jungieren“ und
meistens Hauptsätze mit
Nebensätzen, die sie
meistens einleiten. Weil
Präpositionen noch
einmal bezüglich des
Syntax/Semantik-
Linkings eine
herausgehobene
Stellung einnehmen, werden diese gesondert erfasst, nach Sprachen und nach Präpositionstypen geordnet (hier: Auszug).
51
II Anwendung
Die Anwendung erfolgt über den REDE-Server: www.regionalsprache.de
Das Datenbanktool ist hier erreichbar: http://www.regionalsprache.de/loewe/main.aspx
Teil I hat in die Konzeption und Funktionsweise von ReffMech eingeführt, die
sprachübergreifenden Kategorien mit ihren Ausprägungen charakterisiert sowie die
sprachspezifischen Ausprägungen differenziert. Teil II nähert sich der Anwendung des
Konzepts. Diese umfasst alle Aktivitäten von der Entscheidung für eine gegebene Quelle bis
zur vollständigen Klassifikation eines Textes und der Form von möglichen anschließenden
Suchanfragen. Kapitel 3 und 4 stellen diese Aktivitäten aus genereller Perspektive und in
chronologischer Reihenfolge ihrer praktischen Durchführung dar. Kapitel 5 zeigt, wie die
Anwendung des Konzepts technisch umgesetzt ist und Kapitel 6 erläutert die Funktionsweise
von Suchanfragen.
3 Eingabe, Bearbeitung, Segmentierung & Klassifikation
Es gibt vier Typen von Arbeitsschritten.
1. Die Eingabe von Informationen zur Quelle/zum Text,
2. die Segmentierung von Textmaterial in Einheiten verschiedener Größe,
3. die Bearbeitung segmentierten Materials für die folgende Klassifikation und
4. die Klassifikation der zuvor segmentierten Einheiten.
Die Schritte (s. Graphik) von der Klassifikation des Textes bis (einschließlich) zur
Segmentierung in Clauses erfolgt immer zuerst und immer gleich. Nachdem der Text
klassifiziert, das Original des Textes und eine Übersetzung (optional) eingegeben wurde, kann
der Originaltext bearbeitet werden (s.u.). Anschließend werden Sätze getaggt, d.h.
segmentiert. Ist dies geschehen, muss man zunächst Teilsätze segmentieren und
klassifizieren.6 Danach können wahlweise Phrasen oder Wörter segmentiert und klassifiziert
werden.
6 Die Datenbank macht derzeit Fehler, wenn man Clauses nach Wörtern segmentiert. Das kann zum Löschen
der Wörter führen. Die Fehlerbehebung ist in Arbeit.
52
SatzSegmentierung
Text*Klassifikation
Text*Eingabe Original
Text*Eingabe Übersetzung (optional)
Text*Bearbeitung (optional)
Wort/MorphemSegmentierung
TeilsatzKlassifizierung
Phrase/SatzgliedSegmentierung
Phrase/SatzgliedKlassifizierung
Wort/MorphemKlassifizierung
TeilsatzSegmentierung
Die verschiedenen Beschreibungsebenen
sind dabei die syntaktischen
Größeneinheiten, wie sie in Kap. 2.1.1 bis
2.1.6 besprochen wurden. Die einzige
Ebene, die bereits „vorsegmentiert“ (daher
*), ist diejenige des ediert oder anders
vorliegenden Texts, da die äußeren Grenzen
des Textes unabhängig von (unseren)
linguistischen Eingriffen bereits bestehen.
Alle anderen syntaktischen Ebenen müssen –
mehr oder weniger überlappend mit der
vorliegenden Form der Texte – erst
„hergestellt“ werden.
3.1 Prozedere: einfaches Beispiel
Der Satz lautet: und hɜn gsagt, miɐ sollə də koffɐ nur nicht zuschickə oder dabhaltə.
53
Nachdem man bestätigt hat, einen Text bearbeiten zu wollen, gelangt man zur
Quellenauswahl. Als Quelle stehen die unter der Text-Ebene präsentierten Einheiten zur
Auswahl. Bei „Name/ID“ ist zu beachten, dass Texte in Einheiten zerteilt werden können.
Dafür muss hinter die ID des Textes eine Sigle angehängt werden. Lautet die ID eines Textes
z.B. ZWN76 und soll dieser Text in fünf Schritten bearbeitet (segmentiert & klassifiziert)
werden, müssen die IDs ZWN76_t1 bis ZWN76_t5 heißen. Es ist möglich, die fünf Teile
nachträglich zu einer Datei ZWN76 zusammenzufügen. Weitere Autographien und Editionen
können hinzugefügt werden. Nach Speichern geht’s weiter.
54
Der nächste Schritt ist, Sprache, Sprachstufe, Sprachstufe II (diachron) und Dialekt
auszuwählen.
Mit Speichern geht’s weiter.
Als nächstes können genaue Angaben zu Informanten gemacht werden, falls vorhanden.
Falls nicht kann es ohne Speichern weiter gehen. Falls Informationen zu Informanten
angegeben werden, unbedingt Speichern wählen!
Nun kann die Textsorte angegeben werden. Dies ist ein Textfeld. Textsortenbezeichnungen
sollten arbeitsgruppenintern abgesprochen werden.
55
Mit Speichern geht’s weiter.
Nun kann es an die Bearbeitung und Auswertung der Sprachdaten gehen. Zunächst kann
die Originalfassung des Textes eingegeben oder in das Texfeld kopiert werden. Das kann
der Text einer Edition sein, eine unbearbeitete Quelle, Transkripte von Sprachdaten oder
Ähnliches. Dieser Text ist wohl derjenige, auf den sich die zuvor eingegebene
bibliographische Angabe sowie Name/ID des Textes beziehen. Behalten Sie den Text in einer
Zwischenablage. Er muss im übernächsten Schritt noch einmal eingefügt werden.
Die Originalfassung wird dann gespeichert.
56
Im folgenden Schritt (hier nicht abgebildet) besteht die Möglichkeit, eine Übersetzung des
Textes zu speichern.
Die Originalfassung ist in den allermeisten Fällen für die Auswertung ungeeignet. Daher muss
sie bearbeitet werden, um sie für die Segmentierung und Klassifikation vorbereitet werden.
Dies kann im Schritt „Text editieren“ erfolgen. Die Bearbeitung besteht prinzipiell aus a)
Hinzufügungen und b) Tilgungen. Hinzugefügt werden können Nullelemente („ø“) und
57
Sternchen („*“) (s.u.), getilgt werden können Textsegmente, die überflüssig sind und die
Daten für die jeweiligen Zwecke nicht verfremden (d.h. die Entfernung von Material darf
nicht dazu führen, dass etwas vom übrigen Material anders klassifiziert würde als im Fall der
Anwesenheit des getilgten Materials). Zu beachten ist, dass die Bearbeitung des Materials –
wenn nicht hier – auch auf Clause-Ebene erfolgen kann. Letzteres ist zu empfehlen, daher
bleibt im obigen Screenshot das Material unbearbeitet.
Exkurs: Zur Bearbeitung des Textmaterials
Alle Regeln in Kurzform:
Die Bearbeitung findet idealiter anhand der „Erweiterungen hinzufügen“-Funktion beim
Arbeitsschritt „Taggen der Clauses“ statt.
1. Nullelemente können an eine beliebige Stelle im Clause gesetzt werden (aber später als
synt. Funktion „_ ø“ klassifizieren!)
2. Platzhalter für abhängige Clauses werden immer unmittelbar vor dem ersten Element des
abhängigen Clauses eingefügt.
3. Wenn durch das Hinzufügen von „*“ diskontinuierliche Clauses oder Phrasen entstehen,
muss man diese mit der Tag+Connect-Funktion auf Clause- bzw. Phrasenebene
zusammenführen.
Allgemeines zur Bearbeitung des Textmaterials
1. Phonetisch/graphisch im Quellentext nicht realisierte, aber für den Forschungszweck
dennoch wichtige Elemente können mit dem Symbol „ø“ in den Text eingefügt werden, z.B.
gedroppte Subjekte, etwa bei Imperativen und Pro-drop, oder die Agens-Phrase im Passiv.
Das Einfügen von Nullelementen hat zwei wichtige Konsequenzen:
(a) Steht das Nullelement für eine Konstituente/ein Satzglied, ist bei der Klassifikation
seiner syntaktischen Funktion die Variante mit „_ø“ zu wählen (z.B. SUB_ ø). (Das ist
deshalb wichtig, da nicht realisierte Elemente streng genommen auch keine Position in
einem Satz haben. Um später die relativen Positionen von Elementen zueinander
abfragen zu können, muss man die Nullelemente von den phonetisch/graphisch
realisierten Elementen unterscheiden. Eine Abfrage über relative Positionen von
Elementen zueinander muss eine Abfrage über SUB, V, DO etc. sein. SUB_ ø, V_ ø,
DO_ ø etc. müssen in solchen Anfragen ausgelassen werden.)
b) Die zweite Konsequenz ist, dass auf der Wortebene diese Elemente nicht als Wörter
erkannt und mitgezählt werden.
58
2. Für Clauses, die von anderen Clauses oder von Elementen in einem anderen Clause
abhängig sind, müssen Platzhalter eingefügt werden: das Symbol „*“. Der Grund dafür ist,
dass man einen Clause nicht zugleich als syntaktische Funktion innerhalb eines
übergeordneten/gleichgeordneten Matrixsatz klassifizieren und ihn selbst in Satzglieder
zerlegen kann. Wenn aber ein Platzhalter „*“ eingefügt wird, kann dieser stellvertretend die
syntaktische Funktion des infragestehenden Clauses in einem weiteren Clause repräsentieren.
Der eigentliche (abhängige) Clause kann so auch weiter zerlegt und selbst in
Satzglieder/Phrasen zerlegt werden.
a) Clauses sind von anderen Clauses abhängig, wenn sie in einem
übergeordneten/gleichgeordneten Clause eine Satzgliedfunktion einnehmen ([SUBDass
Grammatik kompliziert ist,] weiß jeder; Klaus kommt nicht, [ADJdenn er hat den Zug
nicht bekommen]). Das Sternchen „*“ (Setzungsregeln s.u.) ist Platzhalter für den
abhängigen Clause im unabhängigen Clause und wird wie jedes andere Satzglied auch
klassifiziert.
b) Clauses können aber von Elementen in einem anderen Clause abhängig sein, ohne dort
eine Satzgliedfunktion einzunehmen. Sie fungieren dann nur als Satzgliedteile
([SUBPeter, [der gerne trinkt,]] wird dann unausstehlich; [SUBDer Professor (wurde
verurteilt,) [dem unlautere Methoden vorgeworfen wurden]].
Zur Setzung von „ø“ und „*“ bei der Bearbeitung
1. Nullelemente („ø“)
Die Regel zur Setzung der Nullelemente ist denkbar einfach: Setze es irgendwo in den Clause.
(Es bietet sich natürlich aus Nachvollziehbarkeitsgründen an, es an eine Stelle zu setzen, an
der man das Element tatsächlich erwarten würde, wäre es realisiert. Dies gilt insbesondere
dann, wenn mehr als ein Nullelement in einen Clause eingefügt werden muss.)
Das folgende Beispiel dient zur Illustration.
59
Die Originalfassung wurde gespeichert und die Arbeitsschritte des Übersetzung Einfügens
und Text Editierens (durch Speichern) übersprungen. Nun gelangt man zum Schritt „Taggen
der Sätze“. Dort setzt man die Tag-Zeichen und betätigt „Speichern -> Clauses taggen“.
Irgendwann gelangt man zum Arbeitsschritt „Taggen der Clauses“ von „Und dann ist viel
gesungen worden“. Hier können nun die Editierungs-Schritte ausgeführt werden, die anfangs
übersprungen wurden. Es soll eine Nullstelle für die Agensphrase des Passivs eingefügt.
60
werden. Dafür setzt man „ø“ an eine beliebige Stelle, z.B. diejenige, an der man das Element
tatsächlich erwarten würde.
Anschließend betätigt man „Erweiterungen hinzufügen“. Das System speichert die
Änderungen (gesondert vom „Originaltext“).
Nun setzt man die Tag-Zeichen (falls nötig) und betätigt „Clause taggen“.
61
Irgendwann wird man auf der Phrasenebene zum Taggen und zur Klassifikation von „ø“
gelangen. Wichtig ist hier, dem Element eine syntaktische Funktion mit dem Suffix „_ø“
zuzuweisen. Dann können dem Element keine formseitigen oder Positionseigenschaften
zugewiesen werden außer der Tatsache, dass es phonetisch/graphisch „null“ ist. (Die Abfrage
von relativen Abfolgen darf später nur solche syntaktischen Funktionen einbeziehen, die das
Suffix „_ø“ nicht besitzen! Das ist auch der Grund, aus dem die Nullelemente an eine
beliebige Stelle gesetzt werden können.)
2. Platzhalter („*“)
Das Sternchen ist der Platzhalter für einen abhängigen Clause in der Funktion, die er in dem
entsprechenden nichtabhängigen Clause einnimmt. Die Regel zur Setzung ist ebenfalls sehr
einfach: Setze das „*“ immer unmittelbar vor das erste Element des abhängigen Clauses.
Es folgen drei Illustrationen
1. abhängiger Clause nach nichtabhängigem Clause
2. abhängiger Clause vor nichtabhängigem Clause
3. abhängiger Attribut-Clause adjazent zu Kopf-Konstituente
4. abhängier Attribut-Clause nichtadjazent zu Kopf-Konstituente
1. abhängiger Clause nach nichtabhängigem Clause
62
Der Originaltext lautet: … ist traurig. Peter weint, weil Sandra ihn verlassen hat. Er ist
aber…. Wir springen zum Schritt „Taggen der Sätze“ und setzen dort die Tag-Zeichen.
Weiter mit „Speichern -> Clauses taggen“. Angelangt beim kritischen Satz (Peter weint…)
müssen wir nun Erweiterungen einfügen, d.h. hier den Platzhalter für den Nebensatz nach der
Regel: unmittelbar vor das erste Element des abhängigen Clause. Danach „Erweiterungen
hinzufügen“.
63
Nun werden Tag-Zeichen gesetzt, und zwar zwischen das „*“ und das erste Element des
abhängigen Clause. (Damit sagt man der Datenbank, dass das Sternchen mit den Elementen
Peter weint, einen Clause bildet.)
Weiter mit „Clause taggen“.
Auf Phrasenebene muss „*“ natürlich als Satzglied/Phrase getaggt werden. Gelangt man zu
seiner Klassifikation, kann man es nun als Adjunkt mit der Kategorie S(atz) im Mittelfeld
klassifizieren.
64
2. abhängiger Clause vor nichtabhängigem Clause
Der Originaltext lautet: … ist traurig. Weil Sandra ihn verlassen hat, weint Peter. Er ist
aber…. Wir springen zum Schritt „Taggen der Sätze“ und setzen dort die Tag-Zeichen.
Weiter mit „Speichern -> Clauses taggen“. Angelangt beim kritischen Satz (Weil Sandra
ihn…) müssen wir nun Erweiterungen einfügen, d.h. hier den Platzhalter für den Nebensatz
65
nach der Regel: unmittelbar vor das erste Element des abhängigen Clause. Danach
„Erweiterungen hinzufügen“.
Nun werden Tag-Zeichen gesetzt. Hier ist zu beachten, dass die Datenbank nun wissen muss,
welche Elemente zu welchem Clause gehören. „*“ gehört zum Clause weint Peter. Der
Nebensatz steht zwischen beiden. Wir haben es also mit einem diskontinuierlichen
nichtabhängigen Clause zu tun. Es müssen also zwei Tag-Zeichen gesetzt werden, (wieder)
eines zwischen das Sternchen und das erste Element des abhängigen Clause und eines
zwischen das letzte Element des abhängigen Clause und den darauf folgenden Teil des
nichtabhängigen Clause.
66
Nun muss man der Datenbank sagen, dass „*“ und weint Peter. einen Clause bilden. Dazu
dient die „Tag+Connect“-Funktion.
Hier weist man „*“ die gleiche Partner-ID zu wie weint Peter. Klick auf „Aktualisieren“
(wichtig!) und auf „Fertig“.
67
Fertig ist der (diskontinuierliche) Clause. Auf Phrasenebene läuft es weiter wie bei Beispiel 1.
3. abhängiger Attribut-Clause adjazent zu Kopf-Konstituente
Der Originaltext lautet: … ist traurig. Peter, der notorischer Fremdgänger ist, ist traurig. Er
ist aber…. Wir springen zum Schritt „Taggen der Sätze“ und setzen dort die Tag-Zeichen.
68
Weiter mit „Speichern -> Clauses taggen“. Angelangt beim kritischen Satz (Peter, der…)
müssen wir nun Erweiterungen einfügen, d.h. hier den Platzhalter für den Nebensatz nach der
Regel: unmittelbar vor das erste Element des abhängigen Clause. Danach „Erweiterungen
hinzufügen“.
Nun werden Tag-Zeichen gesetzt. Hier ist wieder zu beachten, dass die Datenbank nun wissen
muss, welche Elemente zu welchem Clause gehören. „*“ gehört zum Clause Peter,… ist
traurig, denn es zeigt dort an, dass Peter attributiv erweitert und eine „schwere“ NP ist. Wir
haben es also wieder mit einem diskontinuierlichen nichtabhängigen Clause zu tun. Es
müssen also zwei Tag-Zeichen gesetzt werden, (wieder) eines zwischen das Sternchen und
das erste Element des abhängigen Clause und eines zwischen das letzte Element des
abhängigen Clause und den darauf folgenden Teil des nichtabhängigen Clause.
69
Nun muss man der Datenbank sagen, dass Peter, * und ist traurig. einen Clause bilden. Dazu
dient die „Tag+Connect“-Funktion. Peter, * erhält die gleiche Partner-ID wie ist traurig.
„Aktualisieren“ und dann „Fertig“.
Das Resultat ist die Zusammenführung der beiden Hauptsatzbestandteile.
70
Auf Phrasenebene ist nun zu beachten, dass „*“ keinen Satzgliedstatus hat, sondern nur
zusammen mit Peter eine Konstituente bildet.
Beim Klassifizieren der Phrase äußert sich dies nur bei zwei Kategorien: „Kategorie-
Ausprägung“ und „Skala inf.strukt.“.
71
4. abhängier Attribut-Clause nichtadjazent zu Kopf-Konstituente
Der Originaltext lautet: … durchaus perfide. Der Professor war anwesend, der seine Daten
gefälscht hatte. Er musste…. Wir springen zum Schritt „Taggen der Sätze“ und setzen dort die
Tag-Zeichen.
72
Weiter mit „Speichern -> Clauses taggen“. Angelangt beim kritischen Satz (Der Professor
war…) müssen wir nun Erweiterungen einfügen, d.h. hier den Platzhalter für den Nebensatz
nach der Regel: unmittelbar vor das erste Element des abhängigen Clause. Danach
„Erweiterungen hinzufügen“.
Nun werden Tag-Zeichen gesetzt. Hier ist wieder zu beachten, dass die Datenbank nun wissen
muss, welche Elemente zu welchem Clause gehören. Das ist hier einfach, denn bis
einschließlich „*“ handelt es sich um einen Clause, danach um einen weiteren. Das Tag-
Zeichen kommt daher (wieder) zwischen das letzte Element des einen Clause und das erste
Element des anderen Clause.
73
Weiter mit „Clause taggen“. Der resultierende (unahbängige) Clause ist Der Professor war
anwesend, *. Wenn wir auf Phrasenebene fortfahren und diesen Clause in Phrasen
segmentieren, sieht das so aus:
Hier fällt jetzt natürlich auf, dass „*“ kein Satzglied/keine Phrase ist, sondern nur zusammen
mit Der Professor ein(e) solche(s) bilden kann. Das bedeutet, hier haben wir nun eine
Diskontinuität auf Phrasenebene. Wieder muss die Datenbank wissen, welche Elemente zu
74
einer Phrase/einem Satzglied gehören. Auch hier hilft die Tag+Connect-Funktion. Wir
müssen Der Professor die gleiche ID geben wie „*“.
Das Resultat ist eine (diskontinuierliche) Phrase Der Professor … *, die man als „schwere“
Konstituente wie in Bsp. 3 klassifizieren kann.
Simple Beispiele in Kurzform
Nebensatz:
Text: Peter schimpft Maria, weil sie immer zu spät kommt. Das gefällt Maria nicht.
Sätze taggen: Peter schimpft Maria, weil sie immer zu spät kommt. #Das gefällt Maria nicht.
Bearbeitung: Peter schimpft Maria, *weil sie immer zu spät kommt.
Clauses taggen: Peter schimpft Maria, *#weil sie immer zu spät kommt.
Phrasenebene, 1. clause: Peter: SUB; schimpft: V; Maria: DO; *: Adjunkt
Phrasenebene, 2. clause: weil: Konj; sie: SUB; immer: Adjunkt; zu spät: Adjunkt; kommt: V.
Nebensatz:
Text: Peter schimpft Maria, weil sie immer zu spät kommt und weil sie seine Brillle kaputt machte.
Sätze taggen: Peter schimpft Maria, weil sie immer zu spät kommt und weil sie seine Brille kaputt machte. Das
gefällt Maria nicht.
Bearbeitung: Peter schimpft Maria, *weil sie immer zu spät kommt und *weil sie seine Brille kaputt machte. Das
gefällt Maria nicht.
Clauses taggen: Peter schimpft Maria, *#weil sie immer zu spät kommt #und *#weil sie seine Brille kaputt
machte.
75
Tag + Connect: [Peter schimpft Maria, *] + [und *]
Phrasenebene, 1. clause: Peter: SUB; schimpft: V; Maria: DO; *: Adjunkt; und: Konj; *: Adjunkt
Phrasenebene, 2. clause: weil: Konj; sie: SUB; immer: Adjunkt; zu spät: Adjunkt; kommt: V.
Phrasenebene, 3. clause: usw...
Attributsatz:
Text: Peter, der gestern besoffen war, ist heute schon wieder besoffen. Das gefällt ihm.
Sätze taggen: Peter, der gestern besoffen war, ist heute schon wieder besoffen. #Das gefällt ihm.
Bearbeitung: Peter, *der gestern besoffen war, ist heute schon wieder besoffen.
Clauses taggen: Peter, *#der gestern besoffen war #ist heute schon wieder besoffen.
Tag + connect: [Peter, *] & [ist heute schon wieder besoffen]:
Phrasenebene, 1. clause: Peter *,: SUB; ist: AUX; heute: Adjunkt usw. ...
Phrasenebene, 2. clause: der: SUB; gestern: Adjunkt; usw. ...
Bsp. 4. Aramäische Partizipial-Clauses:
Text: Peter, dem Lande Licht bringend, sprang aus dem Fenster.
Bearbeitung: Peter, * dem Lande Licht bringendø, sprang aus dem Fenster. Das gefällt uns nicht.
Sätze taggen: Peter, * dem Lande Licht bringendø, sprang aus dem Fenster. #Das gefällt uns nicht.
Clauses taggen: Peter *, #dem Lande Licht bringendø, #sprang aus dem Fenster.
Tag + connect: [Peter,] * + [sprang aus dem Fenster.]:
Phrasenebene, 1. clause: Peter *,: SUB; sprang: V; aus dem Fenster: PO
Phrasenebene, 2. clause: dem Lande # Licht# bringend#ø
dem Lande: IO; Licht: DO; bringend: V; ø: LSUB
Exkurs Ende
Wurden Bearbeitungen vorgenommen, geht es weiter mit „Editierten Text speichern“. Der
nächste Schritt ist, Sätze zu segmentieren/taggen mithilfe des Einfügens von Tag-Zeichen
(#).
76
• Abgesehen von „#“ darf nichts mehr am Text hinzugefügt, verschoben oder getilgt
werden (auch keine Leerzeichen).
• Weder das erste noch das letzte Zeichen im Textfeld dürfen Tag-Zeichen sein. Nur
zwischen Sätze werden sie gesetzt.
• Das Tag-Zeichen wird immer direkt vor ein Segment gesetzt (Peter schläft. #Maria
tanzt.)
Im Screenshot befindet sich nur ein Satz, daher werden keine Tag-Zeichen gesetzt. Weiter
geht’s mit „Speichern → Clauses taggen“ (Wörter sollen hier später getaggt werden.)
Nun werden also Teilsätze/Clauses segmentiert. Zuvor soll aber die Bearbeitung des
Textmaterials vorgenommen werden. Dafür steht die Funktion „Erweiterungen hinzufügen“
zur Verfügung. Zuerst müssen Elemente hinzugefügt oder getilgt werden (s.o.). Im Screenshot
wurden einige Symbole hinzugefügt: Das erste „ø“ steht für ein ausgelassenes Subjekt aus
dem vorangegangenen Satz (nicht abgebildet). Die anderen „ø“ sind durch eine koordinierte
Struktur mit Auslassung motiviert. Sie stehen für [miɐ] [sollə] [də koffɐ] [nur nicht]. Das „*“-
Symbol ist der Platzhalter für einen Nebensatz ohne einleitende Konjunktion, der mit miɐ
beginnt, vor das daher der Platzhalter eingefügt wird. (Wenn der Satz uninteressant ist oder
aus anderen Gründen gar nicht bearbeitet werden soll, kann man mit „nächster Satz“ auch
einfach zum nächsten Satz übergehen.)
77
Mit „Erweiterungen hinzufügen“ werden die Änderungen in die Datenbank geschrieben.
Anschließend (!) werden Tag-Zeichen für Teilsätze gesetzt, d.h. im Screenshot hinter „*“.
Mit „Clause taggen“ wird die Segmentierung übernommen. Im nächsten Schritt kann der
Clause in weitere Clauses zerlegt werden oder man kann auf Phrasen-Ebene weitermachen.
Hier steht Letzteres an. Daher geht es mit „Phrasen Modus“ weiter.
Beim Taggen von Phrasen müssen zunächst die Tag-Zeichen gesetzt werden.
78
Dies muss mit „Phrasen taggen“ bestätigt werden. Es geht dann mit der Klassifikation der
soeben getaggten Phrasen weiter. Im Screenshot ist dies beispielhaft für die „leere“
Konstituente gezeigt. (Die „*“-Konstituente würde als O mit Kategorie S klassifiziert
werden.)
Sind alle Phrasen eines Clauses klassifiziert, muss der Clause selbst noch klassifiziert werden.
79
Nach dem Speichern gelangt man so in den nächsten Clause und das Prozedere beginnt von
Neuem.
3.2 Prozedere: weiteres Beispiel
Das folgende Beispiel ist auch in der Datenbank einsehbar, indem man nach Textsorte
„Lexikoneintrag“ sucht. Auch die einzelnen Phrasen wurden klassifiziert. Der Satz lautet:
Ausgehend von dieser Datenbasis stellt sich für die zeitliche Dimension des Klimabegriffs die
Frage, wie wechselhaft das Wetter ist, und welche Schwankungen daher die meteorologischen
Größen aufweisen, welche das Wetter hinreichend beschreiben.
87
Clause klassifizieren (Datenbankleiche)
3.3 FAQs:
1. Relativpronomen, -partikel
• Fehlende relativsatzeinleitende Konjunktionen werden nicht ergänzt.
• Bei dem, was in einem gegebenen Relativsatz realisiert ist, muss unterschieden
werden zwischen
o Relativpartikeln: Sie besitzen keinen Komplementstatus, sind nicht referentiell
und flektieren i.d.R. nicht. Sie können als KONJ getaggt werden; und
o Relativpronomen: Sie besitzen Komplementstatus, sind referentiell und können
flektieren, je nach der syntaktischen Funktion, die sie einnehmen.
2. „Erweiterungen hinzufügen“
• Diese Funktion kann angewendet werden, um Erweiterungen hinzuzufügen, die für die
Eingabe, Segmentierung und Klassifikation von Clauses nötig sind. Die „Erweiterung“
kann dabei durch Hinzufügungen oder Tilgungen von Material oder durch die
Hinzufügung von „*“ und „Ø“ realisiert werden. Der Vorteil, die letztgenannten
Elemente bei diesem Arbeitsschritt hinzuzufügen, liegt darin, dass sie dann nicht mehr
88
Merkmale des Texts sind, sondern der jeweiligen Clauses. Sätze bzw. Clauses, die
nicht klassifiziert werden sollen, aber als Bestandteil eines kohärenten Textes
miterfasst werden sollen, sind so in der Datenbank, müssen aber nicht
bearbeitet/editiert werden.
3. Koordinationen
• Koordinierte Verben (Prädikate) werden in zwei Verb-Komplement-Strukturen zerlegt
und als zwei V-Komp-Strukturen analysiert: Peter schreit und heult. → Peter schreit
und Ø heult → Peter schreit #und Ø heult.
• Koordinierte nominale Elemente zu einem Verb brauchen, wenn sie gleiche
referentielle Merkmale haben, nicht aufgelöst zu werden: Peter und Maria schreien.
→ [SUB Peter und Maria] schreien.
• Koordinierte nominale Elemente zu einem Verb müssen zerlegt und als zwei Verb-
Komplement-Strukturen analysiert werden, wenn sie ungleiche referentielle Merkmale
haben: Ich mag Peter und seine Verwandtschaft nicht. → Ich mag Peter Ø[nicht] #und
Ø[ich] Ø[mag] seine Verwandtschaft nicht. (Dieser Satz ist zudem strukturell ambig:
Ich mag Peter. Ich mag seine Verwandtschaft nicht. vs. Ich mag Peter nicht. Ich mag
seine Verwandtschaft nicht.)
5. Infinitivsätze
• werden bei der Textbearbeitung und bei der Klassifikation behandelt wie Nebensätze.
(Grund: Sie bilden eigenständige Verb-Komplement-Strukturen.)
3.4 Prozedere: sprachspezifisch
3.4.1 Richtlinien für die Textbearbeitung: TP 6
1. Wie verfahren wir damit, dass die Zwirner-Transkripte standardsprachliche Varianten
des Dialektmaterials der Aufnahmen sind?
Die Transkripte werden (etwa ausschnittsweise) in ein Word-Dokument kopiert. Der
bearbeitete Text kann dann beim enstprechenden Arbeitsschritt in die Datenbank
kopiert werden. Das Zwirner-Transkript ist nicht nur das Original des bearbeiteten
Dokuments, sondern soll auch als Übersetzung in der Datenbank gespeichert werden.
Die Aufnahme muss dann mit dem Transkripttext abgeglichen werden. Dabei müssen
Korrekturen im Text dann vorgenommen werden, wenn sie für unsere übergeordnete
89
Fragestellung relevant sind bzw. wenn sie relevant hinsichtlich einer oder mehrerer
der Kategorien sind, bezüglich derer wir unsere Daten klassifizieren. Die Korrekturen
werden anhand des SAMPA-Zeichensatzes vorgenommen:
http://www.phon.ucl.ac.uk/home/sampa/german.htm
Es müssen transkribiert werden
- alle Suppletivformen (vollständig),
- die Flexionsmorphologie von
- Substantiven (Stammvokale und Endungen),
- Adjektiven (Endungen),
- Determinierern (komplett. Nur fürs Alemannische (!) wird nicht zw. stimmhaft und
stimmlos unterschieden, d.h. Dentale der Artikel werden bei den alemannischen
Transkriptionen immer als <d> wiedergegeben.),
- Verben (Stammvokale und Endungen – aber nur grob, um die Formen des
Paradigmas auseinander halten zu können. Dialektgrammatiken können konsultiert
werden.),
- Präpositionen (grob; wichtig für Kasus und ggf. Artikel und weil oft andere Typen
als in der Standardsprache),
- Präfixe (werden nur korrigiert, wenn die falschen Typen (z.B. <auf> anstatt <ab>) in
der Zwirner-Transkription vorliegen. <ge> ignorieren wir.)
- Lexeme, die von der Standardsprache abweichen, sollen transkribiert werden.
(Zwirner-Transkripte nicht immer zuverlässig.)
Weitere Richtlinien, die Form betreffend:
- Die Großschreibung muss in Kleinschreibung geändert werden, da große lat.
Buchstaben phonetische Implikationen in SAMPA haben. (Großschreibung, wenn von
SAMPA gefordert.)
- silbische Segmente wie [n], [l] etc. wird wie in Sampa vorgesehen von uns als <=n>,
<=l> etc. transkribiert.
- Bei Unsicherheiten bezüglich der Transkription können die entsprechenden Stellen
mit “[ ]” markiert werden. Die Klammern müssen allerdings entfernt werden, bevor
der Text in die Datenbank eingespeist wird.
Was nicht transkribiert werden muss:
90
- <w> bleibt auch <w>, weil die Realisierung phonemisch irrelevant ist. (Zwirner-
Transkript <will>, phonetisch [vIl] realisiert, wird von uns <wIl> transkribiert.)
- Partizipien (überhaupt – es sei, die wären plötzlich flektiert…)
- Adverbien/Adjunkte
Mögliche Ansprechpartner bei sprachspezifischen Transkriptionsproblemen sind:
- fürs Alemannische:
- Fr. Elsässer (im Haus)
- Oliver Schallert (im Haus)
fürs Nordniederdeutsche:
- Christoph Purschke (im Haus)
- Manuela Lanwermeyer (im Haus)
- Michael Elmentaler (Kontakt über LOEWE-Mitarbeiter herstellen)
- Robert Langhanke (Kontakt über LOEWE-Mitarbeiter herstellen)
2. Was gilt in der gesprochenen Sprache als Satz?
Als Satz gilt eine vollständige Verb-Komplement-Struktur. Eine Verb-Komplement-
Struktur ist beispielsweise immer dann unvollständig, wenn der Sprecher eine Struktur
nicht zu Ende führt und/oder eine neue Struktur anfängt oder wenn eine Konstruktion
nicht als vollständige Verb-Komplement-Struktur identifizierbar ist. Solche
Abschnitte sind nicht auswertbar und können einfach aus dem Textfeld gelöscht
werden, sofern sie dabei umgebende vollständige Verb-Komplement-Strukturen (also
Sätze) unberührt lassen. Koordinationen wie Peter schreibt und raucht können als ein
Satz mit zwei Hauptsatz-clauses klassifiziert werden. Zwei koordinierte Hauptsätze
ohne Auslassung können als zwei Sätze getaggt werden: Peter schreibt# und Hannah
schimpft. Andererseits ist Peter hat gehört, dass Hannah schimpft ein Satz, da dass
Hannah schimpft Objekt zum Verb des Hauptsatzes ist und damit eine Verb-
Komplement-Struktur vervollständigt, was das ganze per definitionem zum Satz
macht. Typische Gesprächspartikel wie Ja, Ja nu, Also u.v.a. können aus dem Text
gelöscht werden.
3. Wie sehen bibliographische Angaben für Zwirner-Aufnahmen aus?
91
Quellenauswahl: „Korpus“
Bibliographie der Publikation: „Zwirner-Korpus“
Name/ID: z.B. „ZW1F3…“ + „…_sn“* + „…_tn“+
* Wenn bei der Zwirner-Aufnahme mehrere DialektsprecherInnen involviert sind,
müssen die Transkripte nach Sprechern aufgeteilt werden. Pro zu klassifizierendem
Text soll nur ein Sprecher vorkommen. Daher ist an die ID der Zwirneraufnahme noch
die Information _sn (Sprecher Nummer 1–n) anzuhängen (etwa „zw1f3_s1“. Der
andere Teil der Aufnahme (bei zwei Sprechern) wird dann unter „zw1f3_s2“
gespeichert Als Übersetzung kann in der Datenbank aber das Original Zwirner-
Transkript gespeichert werden (damit der Kontext bekannt ist)). + Die meisten Transkripte sind zu lang, um sie auf einmal zu bearbeiten. Daher werden
wir „turn“weise vorgehen. Die sprachlichen Beiträge der Interviewten sind in den
Transkripten meistens als S2 klassifiziert. Der erste Beitrag von S2 ist sein erster Turn.
Daher ist an die ID der Zwirneraufnahme noch die Information _tn (Turn Nummer 1–
n) anzuhängen (falls Interview nicht auf einmal vollständig klassifizierbar), z.B.
„zw1f3_t1“.
Im Fall eines Dialogs und bei der Aufteilung einer Aufnahme in mehrere Turns wird
man mehrere Texte in die Datenbank speichern, z.B.:
ZW479_s1_t1
ZW479_s1_t2
ZW479_s1_t3
und
ZW479_s2_t1
ZW479_s2_t2
ZW479_s2_t3
und
ZW479_s3_t1
ZW479_s3_t2
ZW479_s3_t3
...
Mit „Jahr der Entstehung des Sprachstoffs“ ist das Jahr der jeweiligen Aufnahme
gemeint.
92
3.5 Symbole
Symbol Verwendung Beispiel
...#... Segment (nicht am Anfang und am Ende
eines Strings setzen, sondern nur innerhalb
davon)
* Platzhalter für doppelt zu klassifizierende
Segmente, z.B. Nebensätze, die als Phrasen
des Matrixsatzes und ihrerseits als clauses
klassifiziert werden müssen
Peter *, der oft träumt, hat
geschlafen.
Peter sagt *, dass er träumt.
ø phonetisch/graphisch nicht realisiertes,
dennoch zu klassifizierendes Segment
ø lo veo '[ich] sehe es'
\…\ Hinzufügungen bei
Ellipsen/Koordinationen/…
Ich habe große Lust und du
auch +hast+ +große+ +Lust+
\…%...%\ Asymmetrien bei
Ellipsen/Koordinationen/…, die Tilgungen
erfordern
Ich habe keine Lust und du
auch nicht +hast+ +keine+
+Lust+ +%nicht%+
[…] Lücke im Text aufgrund von Verwitterung,
Verfall und anderen Schäden
weil d[…]ön war
<…> hinzuzufügen, addendum
(…) Auflösung von Abkürzungen
P(ost) S(criptum)
{…} zu tilgen, delendum
n.b. (blaue
Färbung)
Voreinstellung eines Wertes für eine
Klassifikationskategorie
[summativ] Die Kategorie lässt mehrere Werte für eine
Kategorie zu, die alle – summativ –
angegeben werden können sollen
93
4. Datenbankanfragen (Frank Nagel)
Eine Anfrage hat folgende allgemeine Form:
declare <Declaration>
select <ObjectNavList>
where <BoolExpr>
Dabei müssen declare, select und where genau so in der Anfrage vorkommen. Die Worte
in spitzen Klammern sind hingegen Platzhalter, die noch ersetzt werden müssen. Bei
der <Declaration> werden Variablennamen eingeführt, die in <ObjectNavList> und
<BoolExpr> benutzt werden können. Für jede Variable muss ein Typ angegeben werden,
wodurch bestimmt wird, welche Operatoren im Rest der Anfrage zulässig sind und welche
Werte die Variable annehmen kann. Diese Werte sind immer Datensätze aus der Datenbank.
Eine Anfrage wird wie folgt vom System interpretiert: Belege jede der Variablen der Reihe
nach mit den möglichen Werten, wie sie in der Datenbank enthalten sind. Für diese
Variablenbelegung werte die <BoolExpr> aus. Falls für diese Belegung der Ausdruck wahr
ist, berechne eine Zeile, wie sie in <ObjectNavList> angegeben ist, und liefere sie zurück.
Beispiel declare Phrase ph
select ph
where true
Hier wird eine Variable mit Namen ph und dem Typ Phrase deklariert. Da der boolsche
Ausdruck nicht von der Phrase abhängt, sondern immer wahr ist, liefert diese Anfrage jede
Phrase zurück, die in der Datenbank vorhanden ist. Andere Typen sind hier möglich, wie z.B.
Sentence, Clause oder Word.
Typen und Deklaration
Jeder zu deklarierenden Variablen wird ein Typname vorangestellt, gefolgt vom
Variablennamen. Ein Variablenname muss mit einem lateinischen Buchstaben beginnen und
kann dann weitere Buchstaben, Ziffern und den Unterstrich enthalten
(z.B. ph1, phrase1,Ph_1). Es können beliebig viele Variablen deklariert werden. Die
Deklarationen sind durch Kommata voneinander zu trennen.
94
Zu beachten ist, dass Wörter, die bereits eine andere Bedeutung haben, nicht mehr als
Variablennamen verwendet werden dürfen. Das heißt, select, where und Phrase sind
Beispiele für illegale Variablennamen. Folgende Typen für Variablen sind erlaubt:
• Text
• Sentence
• Clause
• Phrase
• Word
• ClauseClassification
• PhraseClassification
• WordClassification
Die Typen Sentence, Clause, Phrase und Word werde ich im folgenden zusammengefasst
als Intervall bezeichnen.
Die aufgelisteten Typen sind zusammengesetzte Typen. Sie enthalten eine Reihe von
Attributen, auf die mittels des Punkt-Operators zugegriffen werden kann.
Beispiel declare Text t
select t.language
where true
Es wird immer gewährleistet, dass alle Intervallvariablen mit Werten aus dem selben Text
belegt werden. Durch Deklaration einer Textvariable und Formulierung von Anforderungen
an diese können die möglichen Belegungen für Intervallvariablen weiter eingeschränkt
werden.
Beispiel declare Text t, Sentence s
select s
where t.language = 'Aramäisch'
Diese Anfrage liefert nur Sätze aus aramäischen Texten zurück.
Die Attribute haben bis auf wenige Ausnahmen den Typ String oder Liste von Strings.
Attribute vom Listentyp sind mittels '[]' hinter dem Attributnamen in der folgenden Auflistung
gekennzeichnet.
• Text o textSort
95
o textEdited o translation o language o languageLevel1 o languageLevel2 o languageLevel3 o dialect
• Sentence o text
• Clause o text o classification (Typ ClauseClassification)
• Phrase o text o classification (Typ PhraseClassification)
• Word o text o classification (Typ WordClassification)
• ClauseClassification o sentenceType o mode o completeness o polarity o referentialContext o diathese o notifications[]
• PhraseClassification o syntacticFunction o protoRole o causalStructure o scaleDiscoursePragmatic o scaleSemeantic o scaleInformationStructural o scaleSpecificity o category o categoryValues o agreement o agreementValues[] o caseForm o caseFormValues[] o alignment o alignmentLevel1 o alignmentLevel2 o alignmentValue o topologicalField[] o verbGloss
• WordClassification o wortart o klasseVFinit o klasseVNonfinit o klasseDekl
96
o klasseKonjug o formtyp2 o formtyp3 o person[] o numerus[] o tempus o aspekt[] o aspekt2 o form o form2 o lenition o kasus[] o genus o komparation o adposition o modus[] o genusVerbi o definitheit o bemerkungen
Weil der Zugriff auf die Klassifikation häufiger auftritt, kann man dieses Attribut auch in der
Deklaration verwenden:
Beispiel declare
Clause c,
ClauseClassification cc = c.classification
select
c
where
cc.sentenceType = 'Hauptsatz'
and cc.mode = 'deklarativ'
Bei den meisten dieser Attribute ist durch die Eingabe die Menge der möglichen Werte
vorgegeben. Diese sind deshalb als Hilfe bei der Eingabe unterhalb des Eingabefeldes
aufgelistet. Durch Klicken auf die Einträge werden diese am Ende des Textfeldes eingefügt.
Struktur der Ergebnisliste
Dem Schlüsselwort select folgend muß man eine komma-separierte Liste angeben, die
definiert, welche Werte die Anfrage zurückliefern soll. Hier sind alle Variablennamen und
alle Attribute erlaubt, auf die man mit dem Punkt-Operator zugreifen kann.
Zusätzlich kann man direkt nach dem select das Wort distinct einfügen, um Duplikate aus
der Ergebnisliste zu streichen.
97
Beispiel declare Text t
select distinct t.language
where true
Boolscher Ausdruck
Der boolsche Ausdruck ist strukturell sehr ähnlich dem, was auch in SQL zur Verfügung
steht, nur deutlich eingeschränkter. Es stehen die Operatoren and, or und not zur Verfügung.
Zusätzlich können die Klammern ( und ) gesetzt werden, um den Ausdruck zu strukturieren.
Des weiteren existieren folgende Operatoren:
Operatoren für String-Attribute
Wie oben bereits in den Beispielen verwendet, kann man diese Attribute auf Gleichheit testen.
Dies funktioniert mit Strings, aber auch zwischen zwei verschiedenen String-Attributen:
Beispiel declare
Clause c, Clause c2
select
c.classification.sentenceType, c, c2
where
c < c2 and
c.classification.sentenceType = c2.classification.sentenceType
Um Oder-Anfragen zu vereinfachen, gibt es einen in-Operator, der testet, ob ein String-
Attribut in der folgenden Liste von Strings enthalten ist:
Beispiel declare
Phrase ph1
select
ph1, ph1.classification.syntacticFunction
where
ph1.classification.syntacticFunction in ['AUX', 'AUX_ø']
Zusätzlich gibt es noch einen Operator, der mit regulären Ausdrücken arbeitet. Dieser eignet
sich für die Texte und die Bemerkungen zur Klassifikation der Wortebene, wo die möglichen
98
Werte keinen Vorgaben entsprechen müssen. In seiner einfachsten Form kann man testen, ob
der String in dem Attribut enthalten ist:
Beispiel declare Clause c
select c
where c.text ~ 'such'
Die folgenden Zeichen [ ] ( ) { } | ? + - * ^ $ \ . haben in regulären Ausdrücken
eine Sonderbedeutung, die dazu dient, kompliziertere Suchmuster zu erzeugen. Wenn man
nach genau diesen Zeichen suchen will, dann muss man ihnen ein Backslash voranstellen.
Beispiel declare Sentence s
select s
where s.text ~ '\[nu=z\]'
Hier ist noch ein einfaches Beispiel, wo nach verschiedenen Formen von Jhesus gesucht wird.
Das Wort kann mit einem Klein- oder Großbuchstaben anfangen und sowohl mit s als auch
mit m enden:
Beispiel declare Sentence s
select s
where s.text ~ '[Jj]hesu[sm]'
Detaillierte Informationen zu den regulären Ausdrücken finden sich in der Dokumentation
von PostgreSQL.
Operatoren für Attribute vom Typ Liste von Strings Hier kann man nur mittels des in-Operators testen, ob ein String in der Liste enthalten ist. Beispiel declare Phrase ph
select ph
where 'SUB dropped' in ph.classification.agreementValues
Operatoren für Intervalle
99
Bei diesen Objekten kann man testen, wie sie relativ zueinander angeordnet sind. Der
Ausdruck intervall1 < intervall2 bedeutet dabei, dass intervall1 vor intervall2 im
Text steht. Analog dazu kann man auch den Operator > verwenden.
Beispiel declare
Text t, Sentence s1, Sentence s2
select
s1, s2
where
t.language = 'Hethitisch' and s1 < s2
Die hierarchische Struktur, die durch das Taggen entsteht, kann mit den zwei Operatoren
parent und ancestor untersucht werden. Der Ausdruck clause1 parent phrase1 ist nur wahr,
wenn phrase1 direkt durch Taggen von clause1 entstanden ist. Der Ausdruck sentence1 ancestor
phrase1 ist wahr, wenn phrase1 Teil von sentence1 ist. Dabei ist egal durch wie viele
Zwischenschritte phrase1 entstanden ist.
Beispiel declare Sentence se1, Clause cl1, Clause cl2
select se1, cl1, cl2
where se1 ancestor cl1 and se1 ancestor cl2
and cl1.classification.sentenceType = 'Hauptsatz'
and cl2.classification.sentenceType = 'Relativsatz'
and cl1 < cl2
Wenn man in obigem Beispiel statt ancestor den Operator parent benutzt, dann werden deutlich
weniger Ergebnisse zurückgeliefert.
Aktualisierungen
• Bei Texten kann jetzt auch auf den Quellennamen zugegriffen werden.Z.B.:
declare Text t
select t.sourceName
where t.sourceName ~ 'Pwyll'
• Für einen schnellen Überblick bei Elementen, die durch Tag+Connect entstanden sind
gibt es jetzt ein Attribut connectedTexts bei Clauses und Phrasen. Dieses Attribut
enthält durch Komma abgetrennt die Textteile aller mit dem aktuellen Objekt durch
'Tag+Connect' verbundenen Intervalle.
100
declare
Text t, Clause c
select distinct c.connectedTexts
where
t.language = 'Aramäisch'
and c.text = '*'
• Analog zum '='-Operator gibt es jetzt einen '!='-Operator. ('nicht gleich')
• Analog zum 'in'-Operator gibt es jetzt einen 'not in'-Operator.
• Es gibt zwei neue Operatoren 'local parent' und 'local ancestor'. Diese Operatoren
liefern weniger Resultate zurück als die ursprünglichen Operatoren, wenn in der
Ahnenreihe mit Tag+Connect gearbeitet wurde.
• Zur Abkürzung kann statt 'c.classification' jetzt auch 'c.cln' geschrieben werden, wobei
'c' ein Intervall ist.
• Die freien Textfelder mit den Bemerkungen können jetzt auch in Abfragen
verwendet werden. Sie können als 'c.cln.remarks' oder 'c.cln.bemerkungen' abgerufen
werden. Dies gilt für alle drei Typen: Clauses, Phrasen und Wörter, sinnvollerweise
zusammen mit dem '~'-Operator. Beispiele:
declare Clause c
select c.cln.remarks
where c.cln.remarks ~ '.'
liefert jede Bemerkung, die mindestens ein Zeichen enthält.
declare Word w
select w.cln.remarks
where w.cln.remarks ~ '(also possible)|(auch möglich)'
liefert jede Bemerkung die 'also possible' oder 'auch möglich' enthält.
101
'|' ist der Oder-Operator im regulären Ausdruck und die Klammern sind notwendig
damit der Oder-Operator weiß, wie weit er gelten soll.
• Das Zählen in den Ergebnissen funktioniert wie folgt: Zwischen dem 'declare'- und
dem 'select'-Teil kommt eine weitere Zeile der Form
'count <Name, der auch im 'select-Teil' vorkommt> in'.
Z.B.:
declare
Text t, Clause c, Phrase phS, Phrase phO, Phrase phV
count phS.classification.scaleSemantic in
select
distinct c, phS.classification.scaleSemantic
where
t.languageLevel2 = 'Althochdeutsch'
and c.classification.sentenceType in ['Hauptsatz', 'Nebensatz (finit)', 'Relativsatz']
and 'ambig (strukturell)' not in c.classification.ambiguity
and c local ancestor phS and c local ancestor phO
and phS.classification.syntacticFunction in ['SUB', 'SUB_ø']
and phO.classification.syntacticFunction in ['DO', 'IO', 'O']
and phS < phO
• Es gibt jetzt eine weitere Variante von COUNT, die folgendermaßen funktioniert:
count separate <Namen, die auch im 'select-Teil' vorkommen> in
Damit können die Ausprägungen verschiedener erkmale *unabhängig* voneinander
gezählt werden. Z.B.:
declare
Text t, Clause c, Phrase phV, Phrase phS, Phrase phO
count separate
phS.cln.protoRole, phS.cln.causalStructure, phS.cln.scaleSemantic,
phO.cln.protoRole, phO.cln.causalStructure, phO.cln.scaleSemantic
102
in
select c.text, phS.cln.protoRole, phS.cln.causalStructure, phS.cln.scaleSemantic,
phO.cln.protoRole, phO.cln.causalStructure, phO.cln.scaleSemantic
where c local ancestor phV and c local ancestor phS and c local ancestor phO
and phO.cln.syntacticFunction = 'DO'
and phV.cln.verbGloss = 'speak'
and t.languageLevel2 = 'Mittelhochdeutsch'
• Abfrage-Ergebnisse können als CSV-Datei heruntergeladen werden. Der
Zeichensatz ist UTF-8. Dies ist beim Import in andere Programme evtl. anzugeben.
Die Original-Abfrage steht als Erstes mit in der Datei, durch '#' am Anfang der Zeile
markiert. Beim Import in R kann man das als Kommentarzeichen definieren und
dementsprechend ignorieren.
• Es gibt jetzt einen Gleichheitstest für die Merkmale mit Mehrfachauswahl. Z.B.:
declare Phrase p
select distinct p.cln, p.cln.caseFormValues
where 'n.b.' in p.cln.caseFormValues
and not [ 'n.b.' ] = p.cln.caseFormValues
Literaturhinweise
Ariel, Mira (1988): Referring and accessibility. Journal of Linguistics, 24, 65–87.
[http://journals.cambridge.org/action/displayAbstract?fromPage=online&aid=2733432]
Ariel, Mira (1991): The function of accessibility in a theory of grammar. Journal of
Pragmatics, 16, 443–463.
[http://www.sciencedirect.com/science/article/pii/037821669190136L]
Ariel, Mira (2008): Pragmatics and grammar. Cambridge: Cambridge University Press.
103
Dowty, David (1991): Thematic proto-roles and argument selection. Language, 67/3, 547–
619. [http://www.jstor.org/stable/10.2307/415037]
Dürscheid, Christa (1999): Die verbalen Kasus des Deutschen. Untersuchungen zur Syntax,
Semantik und Perspektive. Berlin/New York: de Gruyter.
Hopper, P. J./Thompson, S. A. (1980): Transitivity in grammar and discourse. Language, 56,
251–299. [http://www.jstor.org/stable/10.2307/413757]
Jackendoff, Ray (1990): Semantic Structures. Cambridge: MIT Press.
Primus, Beatrice (1999): Cases and thematic roles. Tübingen: Niemeyer.
Primus, Beatrice (2006): Mismatches in semantic-role hierarchies and the dimension of role
semantics. In: Bornkessel, I./Schlesewsky, M./Comrie, B./Friederici, A. D. (Hrsg.): Semantic
role universals and argument linking. Theoretical, typological
and psycho-/neurolinguistic perspectives. Berlin: de Gruyter, 53–87.
Silverstein, M., (1976): Hierarchy of features and ergativity. In: Dixon, R. M. W. (Hrsg.):
Grammatical categories in Australian languages. Proceedings of the 1974 A.I.A.S. Biennial
Conference. Canberra: A.I.A.S., 112–171.
Talmy, Leonard (1988): Force dynamics in language and cognition. Cognitive Science, 12/1,
49–100. [http://www.sciencedirect.com/science/article/pii/0364021388900080]
van Valin, Robert D. jr. (2001): An introduction to syntax. Cambridge: Cambridge University
Press.
van Valin, Robert D. jr. (2002): Semantic macroroles in Role and Reference Grammar.
[http://linguistics.buffalo.edu/people/faculty/vanvalin/rrg/vanvalin_papers/SemMRsRRG.pdf]
van Valin, Robert D. jr. (2005): Exploring the syntax-semantics interface. Cambridge:
Cambridge University Press.
van Valin, Robert D. jr./LaPolla, Randy J. (1997): Syntax. Structure, meaning and function.
Cambridge: Cambridge University Press.
Abkürzungen
Abkürzung Bedeutung
n.b. nicht bearbeitet
n.a. nicht applizierbar
n.n.a. noch nicht applizierbar