theoretischer leitfaden zur verwendung der reffmech-datenbank

LOEWE Fundierung linguistischer Basiskategorien

Syntax/Semantik-Schnittstelle

ReffMech Version 1.0

Die Relation von formalen und funktionalen Mechanismen

in der Form/Inhalts-Zuordnung.

Leitfaden zur Datenbank der LOEWE Syntax/Semantik-Schnittstelle

http://www.regionalsprache.de/loewe/main.aspx

©Simon Kasper

technische Umsetzung: Frank Nagel, Slawomir Messner und Raphael Stroh

am Konzept beteiligt: Magnus Birkenes, Felix Esser, Giulia Grassi, Sara

Hayden, Axel Harlos, Julia Schüler, Paul Widmer

Philipps-Universität Marburg, 2012ff.

2

Gliederung

Seite

I Theoretischer Hintergrund………………………………………………………….. 3

1 Generelle Konzeption (Organigramm) …………………………………… 6

2 Kategorien und Ausprägungen……………………………………………. 9

2.1 Sprachübergreifend……………………………………………….. 9

2.1.1 Text………………………………………………………………... 9

2.1.2 Satz………………………………………………………………... 12

2.1.3 Teilsatz……………………………………………………………. 12

2.1.4 Phrase (Satzglied) ………………………………………………… 14

2.1.5 Satzgliedteil……………………………………………………….. 42

2.1.6 Wort/Morphem……………………………………………………. 42

II Anwendung……………………………………………………………………… 51

3 Eingabe, Bearbeitung, Segmentierung & Klassifikation………….............. 54

3.1 Prozedere: einfaches Beispiel.....………………………………….............. 52

Exkurs: Zur Bearbeitung des Textmaterials 57

3.2 Prozedere: weiteres Beispiel………………………………………………. 79

3.3 FAQs 87

3.4 Prozedere: sprachspezifisch 88

3.4.1 Richtlinien für die Textbearbeitung: TP 6...............................……… 88

3.5 Symbole……..…………………………………………………………… 92

4 Datenbankanfragen (Frank Nagel)………………………………............... 93

Literaturhinweise……………………………………………………................... 102

Abkürzungen…………………………………………………….......................... 103

3

I Theoretischer Hintergrund

Das o.g. Konzept (ReffMech) bildet eine korpuslinguistische Methode zur Validierung bzw.

Falsifizierung der folgenden These (LOEWE: 22):

„Je weniger formale Mittel eine Sprache bzw. die aktuelle syntaktische Struktur zur Verfügung

stellt, um semantische Relationen zu kodieren, desto höher ist der Anteil an nicht-formseitigen

Konzepten (wie der Belebtheitshierarchie), die für die adäquate Inhalt-zu-Form-Zuordnung

funktional belastet werden.“

Unter „formale Mittel“ sind die Kasus- und Kongruenzmorphologie sowie

Wortstellungsbeschränkungen hinsichtlich derjenigen sprachlichen Elemente zu verstehen,

die Prädikat-Argument-Strukturen kodieren. Die sprecher- und hörerseitige Anwendung

dieser Mittel dient dazu, in intersubjektiver Weise das – verkürzt gesprochen – „Wer tut was

mit wem“ (stellvertretend für alle möglichen Prädikat-Argument-Relationen) im Erfahrungs-

oder Wissensrepertoire der Sprecher durch En- und Dekodierung zum Zweck erfolgreicher

Kommunikation hinreichend anzugleichen. Dies konkurriert partiell mit einer weiteren

Auffassung:

„Gehen in einer Sprache Kasusmarker verloren, kann eine starrer werdende Serialisierung die

entstandene Unterspezifiziertheit der ausgedrückten Relationen kompensieren. […] [D]ie formale

Seite [lässt] nur einen solchen Grad der Unterspezifiziertheit zu […], dass sie noch erfolgreiche

verbale Kommunikation ermöglicht.“ (LOEWE: 21)

Faktisch gewährleisten aber alle bekannten Sprachen in allen ihren dokumentierten

Sprachstufen und Diasystemen die erfolgreiche Kommunikation ihrer Sprecher, und zwar

unter verschiedenartiger (von stark ausgeprägter bis hin zu fehlender) Ausschöpfung der

oben genannten formalen Mittel.

Damit wird erfolgreiche Kommunikation, nicht aber das Vorhandensein von morphologischen

Markierungen oder Wortstellungsbeschränkungen zum definierenden Merkmal von Sprache.

Aus der Sprachverstehens-Perspektive spielen […] spezifische kognitive Prozesse eine

entscheidende Rolle. Weist eine Sprache beispielsweise Kasussynkretismen und gleichzeitig

relative Serialisierungsfreiheit auf, kommt es mitunter zu Ambiguitäten, d. h. die semantischen

Relationen gehen nicht eindeutig aus der morphosyntaktischen Struktur hervor. An dieser Stelle

müssen bei der Dekodierung andere Hinweise auf die adäquate Form-zu-Inhalt-Zuordnung

herangezogen werden. (LOEWE: 21)

4

Dies bedeutet aber, dass die Formseite von sprachlichen Äußerungen in manchen Sprachen

regulär, d.h. konventionell, in anderen Sprachen punktuell hinsichtlich der semantischen

Relationen, die sie kodieren (keine eineindeutigen Zuordnungen), unterspezifiziert sind; die

nicht-formalen Mittel, die auf Hörerseite nötig sind, um eine unterspezifizierte Formseite

einer Sprecher-Äußerung hinreichend ähnlich zu dessen ursprünglichem Ereigniskonzept zu

konzeptualisieren, gehören also weder zur Form- noch zur Inhaltsseite des sprachlichen

Zeichens.

Die Hypothese ist nun, dass die in der funktional-typologischen Linguistiktradition

postulierten Skalen (diskurs-pragmatische, semantische, Akzessibilitäts-/Topik- und

Spezifizitätsskala; s.u.) diejenigen Einheiten enthalten, die die zum Sprachverstehen

benötigten Mittel bereitstellen. Gemeinsam bilden diese Skalen die „Belebtheits“hierarchie.

Die Klassifikation von Äußerungsteilen hinsichtlich dieser Skalen kann als universell

applizierbar betrachtet werden, d.h. jeder (im weitesten Sinne) nominale Ausdruck als Teil

einer Äußerung kann in jeder Sprache hinsichtlich der Skalen klassifiziert werden. Die

Applikation von Wortstellungsbeschränkungen und Kasusmorphologie ist nicht universell,

und zwar in dem Sinne, dass Sprachen konventionell oder punktuell keine

Wortstellungsbeschränkungen und keine Kasusmorpheme aufweisen. Damit sind die

Einheiten auf den Skalen das Konstante, während die genannten formalen Merkmale das

Variable sind.

Sprachsysteme unterscheiden sich (unter anderem) bezüglich der Kategorien Raum und Zeit:

diatopisch als historisch verwandte oder nicht verwandte nebeneinander existierende

Einzelsprachen sowie als Varietäten einer Einzelsprache; diachron in Bezug auf die

Entwicklungsstände von Einzelsprachen zu verschiedenen Zeiten. Die Entwicklung der

Morphosyntax von Einzelsprachen in Kurz- und Langzeit sowie die Morphosyntax der

Varietäten einer Sprache zu einem Zeitpunkt weisen Wandlungsregularitäten bzw.

systematische Varianzen auf. Die betrachteten Regularitäten betreffen dabei vor allem die

diachrone Entwicklung/diatopische Ausprägung von kasusmorphorphologischen

Synkretismen (vgl. LOEWE: 24ff.; Teilprojekte 5 u. 6) sowie die Entwicklung von einer

Grundwortstellung in eine andere (LOEWE: 30ff.; Teilprojekt 7), damit also genau die o.g.

Variablen.

In dem Maße, in dem es gelingt, die o.g. formalen Eigenschaften von (Varietäten von)

Einzelsprachen (historisch u. rezent) zu dokumentieren, zu systematisieren und zu den

5

Skaleneigenschaften der in sprachlichen Äußerungen kodierten nominalen Ausdrücken in

Beziehung zu setzen, ist es beispielsweise auch möglich, Rückschlüsse auf die

Zusammenhänge zu ziehen

• zwischen kasusmorphologischen Systemen und Worstellungsbeschränkungen, z.B.

zwischen

o (global) ambigen Strukturen und dem Grad, zu dem

Wortstellungsbeschränkungen in unterschiedlichen Sprachen vorhanden

sind/sich zwischen Sprachstufen verändern,

o morphologisch stark spezifizierenden Strukturen und dem Grad, zu dem

Wortstellung in unterschiedlichen Sprachen vorhanden frei ist/sich zwischen

Sprachstufen verändert;

• zwischen den formalen (Morphologie u. Wortstellung) Eigenschaften von

Sprachsystemen/ Äußerungen und den Skaleneigenschaften der in ihnen enthaltenen

nominalen Ausdrücke, z.B.

o zwischen „Subjekts“ausdrücken und ihren Skalenwerten in formal

unterschiedlichen Sprachen oder unterschiedlichen Sprachstufen,

o zwischen den syntaktischen Positionen von Objekten in formal

unterschiedlichen Sprachen oder unterschiedlichen Sprachstufen,

o zwischen Veränderungen im Sprachsystem und den Skaleneigenschaften der

betroffenen syntaktischen Einheiten,

o zwischen der Ausbildung von Synkretismen und deren Einfluss auf die

Skalenwerte von „Subjekten“ und Objekten,

o die Differenz der gemittelten Skalenwerte von „Subjekten“ und Objekten in

Sprachstufen, zwischen denen Wandel stattgefunden hat

• usw.

Anhand dieser Möglichkeiten können die zentralen Fragestellungen der Teilprojekte

korpuslinguistisch (und z.T. begleitet von Neuerhebungen) angegangen werden:

In den TPen 5 und 6 soll „die Interaktion zwischen den synkretistischen Prozessen und den

semantischen Eigenschaften der Partizipanten“ geprüft werden, wobei diese Prozesse „A)

[d]ie Reduktion eines 4-Kasus-Systems um zwei Kasus, B) de[n] Kernkasussynkretismus in

einem lokal begrenzten Bereich, C) de[n] Synkretismus eines Kernkasus mit einem Nicht-

Kernkasus, D) Teilsynkretismus von Nominativ und Akkusativ bzw. von Akkusativ und

6

Dativ, E) die Eliminierung der Reste eines Zwei-Kasus-System“ betreffen (LOEWE: 24).

„Ziel des Teilprojektes [7] ist […], den Zusammenhang zwischen den Strategien für die

Identifikation von Argumenten im Mittelkymrischen und Bretonischen (V2) und den V1-

favorisierenden Faktoren sowie die möglicherweise dahinterstehende Basiskategorie näher zu

beleuchten.“ Auch für die Teilbehandlung dieses Problems liefert das genannte Konzept das

geeignete Instrumentarium.

1 Generelle Konzeption (Organigramm)

Gemäß dem oben skizzierten Hintergrund müssen sprachliche Daten dokumentiert und

hinsichtlich ihrer formalen, d.h. morphologischen und syntaktischen Struktur systematisiert

werden. Daneben müssen sie ebenfalls hinsichtlich ihrer funktionalen Eigenschaften (Skalen)

klassifiziert werden. Aus konzeptionellen Gründen sind damit zwei Datenklassen gegeben:

eine formale Beschreibung und eine funktionale Charakterisierung. In seiner simpelsten Form

hat ReffMech die folgende Architektur:

Mit der Zuordnung eines nominalen Ausdrucks aus einer Äußerung zu den

Einheiten auf den Spezifizitäts-, diskurs-pragmatischen, informationsstruktu-rellen und semantischen Skalen sowie

seiner Klassifikation hinsichtlich

Kategorie, Position und Kasus sind im

Prinzip alle oben genannten Datenklassen

vorhanden.

Alle im Folgenden beschriebenen

Modifikationen dieses Basis-

Organigramms sind der Berücksichtigung

von Eventualitäten und Erwägungen der

Umsetzung geschuldet, die die Basis-

Architektur ergänzen müssen. Dennoch bildet sie in kondensierter Form den konzeptionellen

Kern von ReffMech ab.

Die infrage stehenden Verb-Komplement-Strukturen beschreiben die Strukturen von

Äußerungen, die wiederum Teile von Texten sind. Die o.g. Kategorie des nominalen

Ausdrucks, seine Position im Syntagma und sein Kasus müssen also in Bezug zur

7

Größeneinheit des Satzes gesetzt werden, in die ein Text segmentiert werden muss. Sätze

wiederum variieren hinsichtlich bestimmter Parameter, die mit den formalen und funktionalen

Eigenschaften von nominalen Ausdrücken korrelieren könnten. Darum müssen diese

Parameter ebenfalls erfasst werden. Diese Erwägungen sind strukturgebend für ReffMech in

dem Sinn, dass bestimmte formale Kategorien (Texte, Matrixsätze, Nebensätze, …) durch

Segmentierung erfasst werden; jede dieser Kategorien hat bestimmte Ausprägungen,

hinsichtlich derer Äußerungseinheiten klassifiziert werden können. Die in der Performanz

beschränkte, aber potentiell vorhandene Rekursivität von Sätzen sowie die

Dependenzstrukturen zwischen Matrix- und Nebensätzen machen es zudem erforderlich, dass

Einbettungen bei der Segmentierung berücksichtigt werden.

Um die formalen Eigenschaften von nominalen Ausdrücken

bestimmen zu können, müssen auch diese segmentiert

werden. Da (mindestens) referierende Ausdrücke nicht isoliert, sondern in endozentrischen

Konstruktionen vorkommen, deren Köpfe nominalen Charakter haben, werden diese

nominalen Ausdrücke als Phrasen (oder „Konstituenten“ oder „Satzglieder“) segmentiert, die

wiederum hinsichtlich bestimmter Parameter (Ausprägungen) variieren.

Erst die Segmentierung der nominalen Ausdrücke macht diese eindeutig identifizierbar, so

dass sie nun ausführlich formal und funktional klassifiziert werden können. Wie erwähnt

bilden Kasus (des Kopfes), Position und (Wort-)Kategorie die zentralen Informationen, die

für die Beziehung von Kasusmorphologie, Wortstellung und Belebtheitshierarchie von

Bedeutung sind. Die ersteren beiden sind allerdings unabhängig von diversen anderen

formalen Klassifikationskategorien nicht informativ in Bezug auf die Projektziele:

Beispielsweise könnten sich signifikante Korrelationen dadurch nivellieren, dass bestimmte

nominale Ausdrücke gleich behandelt werden, beispielsweise die „Subjekte“ von

Handlungsverben und Subjekt-Experiencerverben. Behandelt man diese gleich, ignoriert man

von vornherein die Möglichkeit, dass z.B. Subjekt-Experiencer andere Skaleneigenschaften

haben als Handlungs-„Subjekte“. Daher müssen auch Verben segmentiert und klassifiziert

werden, nämlich hinsichtlich ihres „Alignments“, d.h. der Frage, wie sie die unmarkierte

Abfolge der von ihnen geforderten Proto-Rollen lexikalisieren.

Einen entscheidenden formalen Indikator für semantische Relationen stellt die Kongruenz

des Verbs mit einem anderen Element dar. Die morphologisch eindeutige bzw. nicht

eindeutige Verb-Kongruenz korreliert daher auch stark mit dem Grad der formalen

Unterspezifiziertheit einer Äußerung und sollte ein entscheidender Faktor für Signifikanz der

funktionalen Kategorien sein, auch hinsichtlich des inkrementellen Sprachverstehens.

8

Die o.g. „Proto-Rollen“ generalisieren über den semantischen Status von Referenten von

nominalen Ausdrücken. Sie sind die semantische Beschreibungskategorie für die

Partizipanten des „Wer tut was mit wem?“ und liefern damit potentiell wichtige

Informationen darüber, welche Relationen wie kodiert werden, ob sich dies diachron

verändert oder diatopisch variiert, und zwar in Abhängigkeit von den anderen formalen und

funktionalen Eigenschaften der infrage stehenden nominalen Ausdrücke.

Vor allem in den kognitiv und funktional ausgerichteten Grammatikmodellen wird außerdem

einer weiteren semantischen Kategorie entscheidender Einfluss auf die Kodierung von

Relationen zugesprochen, nämlich der Rolle eines Referenten in einem kausalen

Zusammenhang. Obwohl diese Ansätze o.g. thematische/semantische Rollen aus der

Kausalstruktur eines Ereignisses/einer Situation ableiten, kann man beide Kategorien

unabhängig voneinander beschreiben. Es könnte sich z.B. herausstellen, dass nicht-

verursachende Proto-Agenten sich hinsichtlich bestimmter Kategorien anders als

verursachende Agenten verhalten.

Für einen Teil der untersuchten Sprachen könnte die Klassifikation der Verben und

Komplemente bezüglich der von ihnen eingenommen Positionen im topologischen Felder-

Modell von Bedeutung sein. Daher

bildet diese eine weitere

Klassifikationskategorie.

Bekanntlich bilden sich Kasus- und

andere Synkretismen nicht

gleichzeitig in allen syntaktischen

Kategorien aus. Daher werden auch

die Kategorien der klassifizierten

nominalen Ausdrücke erfasst.

Aus diversen Gründen

(diskontinuierliche Verbkom-plexe,

finite u. infinite Teile, variable NP-Strukturen, Dia-thesen, Modi, Tempora usw.) erscheint es

erforderlich, auch umfangreiche Klassifi-kationen auf Wort- bzw. Morphemebene

vorzuneh-men: Z.B. wären eventuell vorhandene signifikante Korrelationen gar nicht

feststellbar, wenn man Passiv-„Subjekte“ mit Aktiv-„Subjekten“ gleich behandeln würde.

9

2 Kategorien und Ausprägungen

2.1 Sprachübergreifend

2.1.1 Text

Texte bilden die oberste Ordnungseinheit für die Analysen. Diachrone, diatopische und

diastratische Parameter sind an Texte gebunden (s.u., II–IV). Texte werden hinsichtlich der

Kategorien in den nachfolgenden Organigrammen klassifiziert:

Dreifache Punkte zeigen an, dass der jeweilige Knoten noch eine Sub-Struktur hat.

Die Substruktur von „Autographie“:

Die Substruktur von „Edition“:

10

Die Substruktur von „Korpus“:

Die Substruktur von „Einordnung synchron, diachron & diatopisch“:

Die Substruktur von „Aramäisch“:

11

Die Substruktur von „Deutsch“:

Die Substrukturen von „Kymrisch“ und „Irisch“:

12

Die Substrukturen von „Sorbisch“ und „Friesisch“:

2.1.2 Satz

Sätze bilden die Äußerungseinheiten, die Träger der zu analysierenden Verb-Komplement-

Strukturen sind. Ganze Sätze (sentence layer in van Valin & LaPolla 1997) werden lediglich

aus dem Text segmentiert, aber nicht klassifiziert. Sentences umfassen potentiell mehrere

Teilsätze (clause layer in van Valin & LaPolla 1997).

2.1.3 Teilsatz

Innerhalb von Sätzen werden Teilsätze segmentiert. Darunter fallen sowohl Matrixsätze, d.h.

nicht abhängige (Teil-)Sätze, als auch subordinierte, d.h. abhängige Teilsätze verschiedenen

Typs (Satzart). Subordinationsverhältnisse können rekursiv strukturiert sein, d.h. abhängige

Teilsätze können gegenüber ihnen abhängigen Teilsätzen superordiniert sein.

Vollständigkeit:

13

• Ein (Teil-)Satz gilt als unvollständig, wenn z.B. in Koordinationen, elliptischen

Konstruktionen, Infinitiv- oder Partizipialkonstruktionen argumenthafte nominale oder

prädikative verbale Ausdrücke nicht realisiert sind. (Teil-)Sätze in Pro-drop-Sprachen

sind deshalb nur dann als „pro dropped und unvollständig“ zu klassifizieren, wenn

Auslassungen dieser Art vorliegen. Ansonsten sind sie als „pro dropped und

vollständig“ zu klassifizieren. Partizipialsätze haben beispielsweise keine Subjekte, so

dass eine pro-drop-Klassifizierung nicht applizierbar ist. Abgesehen davon können

auch sie vollständig oder unvollständig sein.

ref. Rahmen:

• In manchen der untersuchten Sprachen wird formal und mit Skopus über den (Teil-

)Satz markiert, ob dieser (Teil-)Satz bestimmte Aspekte des Diskurses fortschreibt

oder nicht.

Modus (nicht zu verwechseln mit der verbalen Kategorie):

• Unter Modus ist die formal angezeigte oder kontextuell zu inferierende illokutionäre

Kraft der Äußerung zu verstehen, die der syntaktischen Struktur zugrundeliegt.

Polarität:

• Enthält der (Teil-)Satz (grammatisch oder lexikalisch) eine Negation mit Skopus über

die durch den (Teil-)Satz ausgedrückte Proposition, ist der Satz als negativ zu

klassifizieren, ansonsten als positiv.

Diathese:

• Da oftmals nicht für ein Wort oder eine Phrase angegeben werden kann, um welche

Art der Diathese es sich handelt, aber man immer sagen kann, ob ein (Teil-)Satz ein

Aktiv-, Passiv- oder sonstiger Satz ist, wird die Kategorie „Diathese“ hier klassifiziert.

Ambiguitäten:

14

KONJKONJ_øVV_øAUXAUX_øMODMOD_øLVLV_øPV_NPPV_NP_øPV_APPV_AP_øPV_VPPV_VP_øPV_SPV_S_øPV_PPPV_PP_øn.b.n.a.n.n.a.

SUBSUB_øLSUBLSUB_øIOIO_øDODO_øOO_øPOPO_øKADJKADJ_øADJADJ_øREFLEXIVUMREFLEXIVUM_øNEGNEG_ø

• Hier kann angegeben werden, wenn ein (Teil-)Satz lexikalische oder eine strukturelle

Ambiguität aufweist. In der Klassifikation muss man sich notwendigerweise für eine

Lesart entscheiden. Mit dieser Angabe wird erfasst, dass es andere Lesarten gibt.

2.1.4 Phrase (Satzglied)

Ungeachtet der Applizierbarkeit des Phrasen-Begriffs auf verschiedene syntaktische

Hierarchieebenen sollen hier darunter genau die syntaktischen Einheiten verstanden – und

segmentiert – werden, die die verbalen oder (adpositional begleiteten) nominalen Teile von

Verb-Komplement-Strukturen darstellen. In einigen modernen Grammatiken und der

klassisch-lateinischen Grammatik sind die (adpositional begleiteten) nominalen Einheiten

durch Wer oder Was, Wessen, Wem oder Was, Wen oder Was, Wo, Wohin, Woher, Womit,

Wann, Wie lange, Von wem usw. erfragbar. Die Erfragbarkeit soll hier nur als Diagnose für

den Phrasen-/Satzgliedstatus dienen, nicht für die konkrete syntaktische Funktion. Gemäß den

Erwägungen aus Kapitel 1 ist die Phrase diejenige Größe, die hinsichtlich der meisten

Kategorien klassifiziert wird, wobei diese z.T. komplexe Ausprägungen haben.

• (SUB: Subjekt, LSUB: logisches Subjekt, IO:

indirektes Objekt, DO: direktes Objekt, PO:

präpositionales Objekt/Prapositionalobjekt, O: Objekt,

KADJ: Komplement-Adjunkt, ADJ: Adjunkt, PVXP:

Prädikativum mit XP-Status, AUX: Auxiliar, MOD:

Modalverb, LV: light verb, V: Verb, KONJ:

Konjunktion, Einleiter, NEG: Negation, X_ø:

phonetisch/graphisch nicht realisierte Funktion).

Zunächst müssen innerhalb der (Teil-)Sätze Phrasen

segmentiert werden, auch solche, die phonetisch/graphisch

nicht realisiert sind (X_ø), aber klassifiziert werden sollen.

Darunter fallen z.B. gedroppte Komplemente aller Art, z.B.

auch 2.Ps. in Imperativsätzen. Diesen Segmenten (worunter auch „ø“ fallen kann) werden

dann syntaktische Funktionen zugeordnet. Auch unter Berücksichtigung des (besonders)

umstrittenen Status von syntaktischen Funktionen sollen diese – falls der folgende

Klassifikationsleitfaden sich als unpraktikabel erweist – weniger als grammatische

Klassifizierung als als heuristisches Hilfsmittel für alle folgenden Klassifikationen verstanden

15

werden (s. Teil II). Dabei sollen dennoch grammatiktheoretisch heikle Annahmen vermieden

werden für den Fall, dass der Leitfaden sich als praktikabel erweist. Die Definitionen der

syntaktischen Funktionen – des „Subjekts“ mehr als der Objekte – orientieren sich zugunsten

der hier erforderlichen typologischen Generalisierbarkeit an van Valin & LaPolla 1997 sowie

van Valin 2001 und 2005.

Demzufolge sind Subjekte (SUB) (eigentlich „privilegierte syntaktische Argumente“) als

Komplemente in einer bestimmten Verb-Komplement-Struktur sowohl

• „pivots which are the omitted NP in a control or conjunction reduction construction or

the matrix-coded NP in a matrix coding construction“ als auch

• „controllers, which are the triggers for verb agreement, the antecedents of reflexives

and the controller of the omitted argument in a conjunction-reduction construction.”

(van Valin 2001: 2121; für Details vgl. van Valin & LaPolla 1997, Kap. (6.2 +) 6.3,

van Valin 2005, Kap. 4).

Für das logische Subjekt (LSUB) beispielsweise von kymrischen Verbalnomen ('sein Gehen',

'Gehen des Mannes') kann derzeit nicht entschieden werden, ob es die obigen Bedingungen

für SUB (teilweise) erfüllt. Es wird daher eindeutig durch die Zuweisung von LSUB

differenziert.

Das indirekte Objekt (IO) soll hier ebenfalls formal charakterisiert werden. Alle im

Folgenden genannten (eingeklammerten) inhaltlich-semantischen Merkmale von IOs dürfen

nicht als verbindliche Diagnostiken für die Ermittlung von IOs verstanden werden, sondern

benennen lediglich Tendenzen im cross-linguistischen Linking, die zusätzlich bei

Zweifelsentscheidungen herangezogen werden können:

• Wenn eine zwei- oder dreistellige Konstruktion ein IO enthält, erkennt man dies

daran, dass die Form und Funktion des IO erhalten bleibt, wenn der Satz passiviert

wird: IO > IO. Zum Vergleich: Wenn ein Satz ein DO enthält, wechselt es Form und

Funktion, wenn der Satz passiviert wird: DO > SUB. (Peter vertraut dem Lehrer. Dem

Lehrer wird vertraut. Peter belügt den Lehrer. Der Lehrer wird belogen.)

• Freie Verwendungen von Kasus obliquus werden als KADJ klassifiziert (s.u.)

(- Das IO trägt in Sprachen mit morphologischen Kasus immer vom Verb

zugewiesenen obliquen Kasus (tritt also niemals in einer PP auf).

1 Für Details vgl. van Valin & LaPolla 1997, Kap. (6.2 +) 6.3; van Valin 2005, Kap. 4.

16

• In ditransitiven Konstruktionen ist das IO eher weglassbar als das DO, ohne dass die

Konstruktion inakzeptabel würde.

• Im Idealfall ist das IO auf den indoeuropäischen Dativ zurückführbar. In jüngeren

Sprachstufen können die Funktionen des ie. Dativs mit denen des Lokativs und/oder

Instrumentals und/oder Ablativs und/oder Genitivs in eine Form zusammengefallen

sein.

• Das IO konkurriert in der sog. Dativalternation mit (hinsichtlich Haben- und

Transferrelationen) lokativen, direktiven oder ablativen (im Sinne von 'von etw. weg')

PPs, d.h. bildet Nahezu-Paraphrasen mit diesen. (Peter sendet Maria Blumen. Peter

sendet Blumen an Maria.)

• Die prototypische semantische Rolle, die ein indirektes Objekt in ditransitiven

Relationen relativ zum Verb trägt, ist die des Proto-Rezipienten. Darunter fallen –

grob gesprochen – die diskreten Rollen Rezipient, Bene-/Malefaktiv und manche

Possessoren.

• Die erste, daraus ableitbare schematische Bedeutung kann also folgendermaßen

beschrieben werden: Bei dreistelligen (und manchen zweistelligen) Verben steht der

Referent des IO in einer konkreten, abstrakten oder metaphorischen Relation des

Habens, Bekommens oder Verlierens zu SUB-V-DO. In dieser Rolle ist der IO-

Referent fast immer belebt. Weil SUB-V-DO oft bereits eine eigenständige Relation

beschreiben, ist das IO gut weglassbar. Dagegen würde SUB-V-IO keine

eigenständige Relation beschreiben. (Peter sendet Maria Blumen. Peter sendet

Blumen. *Peter sendet Maria.))

Von indirekten Objekten müssen direkte Objekte (DO) unterschieden werden.

• Wenn eine zwei- oder dreistellige Konstruktion ein DO enthält, erkennt man dies

daran, dass die Form und Funktion des DO sich ändern, wenn der Satz passiviert wird:

DO > SUB. (Zum Vergleich: Wenn ein Satz ein IO enthält, behält es Form und

Funktion, wenn der Satz passiviert wird: IO > IO. (Peter vertraut dem Lehrer. Dem

Lehrer wird vertraut. Peter belügt den Lehrer. Der Lehrer wird belogen.)

Eine dritte Kategorie bilden (einfache) Objekte (O).

• Greifen die beiden formal basierten Regeln für IOs und DOs (sowie POs, s.u.) nicht,

wird eine NP als O klassifiziert, d.h. eine NP wird dann als O klassifiziert, wenn die

Konstruktion, in der sie auftritt, nicht passivierbar ist, so dass die Form-/Funktions-

Konstanz oder -Veränderung nicht überprüfbar ist. O ist daneben die Kategorie für

nicht-nominale Objekte wie Objekts-VPs oder -sätze

17

Eine Konsequenz, die implizit in den SUB-, IO-, DO- und O-Definitionen ist, dass in

Sprachen mit Einheitskasus, bei denen im Falle der Passivierung (trivialerweise) keine

formale Veränderung des fraglichen Aktiv-Objekts vonstatten geht, geprüft werden muss, ob

sich die betreffende NP im Passiv als SUB im o.g. Sinne klassifizieren lässt. Wenn ja, ist das

Objekt des Aktivsatzes als DO zu klassifizieren, wenn nicht, als IO.

Als Präpositionalobjekt oder präpositionales Objekt (PO) gilt ein solches Objekt,

• das adpositional begleitet ist und dessen nominaler Bestandteil gegebenenfalls durch

die Adposition formdeterminiert ist,

• dessen (a) Auftreten vom Verb gefordert ist, wobei die Form entweder determiniert

(hoffen auf, warten auf) oder indeterminiert ist (wohnen auf/unter/neben/zwischen/…),

• dessen (b) Auftreten nicht (unbedingt) gefordert ist, wobei die Form, wenn es auftritt,

determiniert ist (Ø Ø spenden Ø, Ø Geld Ø spenden, der Wohlfahrt Ø spenden, der

Wohlfahrt Geld spenden, (Geld) an/*über/*auf*/zu*/*nach die/der Wohlfahrt

spenden).

• (- zur Konkurrenz zum IO, s.o. unter IO)

Bisweilen rangieren „zwischen“ Komplementen und Adjunkten sog. „Argument-Adjunkte“.

Diese sollen hier, um die rein formseitige Terminologie beizubehalten, Komplement-

Adjunkte (KADJ) genannt werden.

• KADJ sind wie manche POs nicht vom Verb gefordert.

• Wenn sie auftreten, ist ihre Form durch die Konstruktion erzwungen, d.h. sie bilden

innerhalb der Konstruktion keine Option zu einer alternativen Variante (außer „0“).

Darunter fallen

o Passiv-Agens-Phrasen

o freie Kasus obliqui

o Instrument-Phrasen

o Komitativ-Phrasen

Echte Adjunkte (ADJ) (d.h. ¬Komplement-Adjunkte)

• sind weder gefordert noch jemals formdeterminiert und werden daher nicht mit einer

der wählbaren Kernfunktionen versehen.

• Echte Adjunkte werden nicht hinsichtlich Proto-Rollen und Kausalität klassifiziert.

Prädikative (PVNP, PVAP, PVPP, PVVP, PVS) beschreiben Eigenschaften oder Zustände (in

verschiedenen Aktionsarten) von nominalen (oder satzwertigen) Phrasen/Satzgliedern.

18

• Die Kopulae bilden nur Verbindungsstücke zwischen den Elementen, in ihnen ist

lediglich Identität und Aktionsart lexikalisiert. Als Kopulae kommen in Frage z.B. 'be',

'become', 'remain', 'prove', 'seem'.

• Was prädiziert wird, kann als NP, AP, PP, VP oder S (Teilsatz) auftreten.

Unter den verbalen Elementen bilden die Klassen der Auxiliare (AUX) und Modalverben

(MOD)

• geschlossene Klassen mit festen Mengen an Vertretern.

• Auxiliare sind grammatische Elemente und semantisch (nahezu) leer. Sie spezifizieren

die vom lexikalischen oder Vollverb bezeichnete Eventualität primär hinsichtlich

Tempus/Aspekt/Modus.

• Modalverben spezifizieren die Relation zwischen Subjekt und Vollverb hinsichtlich

des Komplexes „Wunsch“ „Zwang“, „Möglichkeit“ (u. z.T. Epistemizität, d.h.

epistemische Modalität)

Als light Verbs (LV)

• werden diejenigen Verben in Sätzen klassifiziert, in denen Verbalnomen-

Konstruktionen Phrasen-Status besitzen und einen Zustand/Prozess/eine Aktivität

kodieren. Das grammatische Subjekt eines LVs ist das logische/psychologische

Subjekt eines Verbalnomens.

Vollverben (V)

• sind lexikalische Elemente in einer offenen Klasse.

• Wenn finit, verorten sich Vollverben z.T. selbstständig hinsichtlich Tempus/

Aspekt/Modus . Wenn nicht, bilden sie mit AUX oder MOD einen Verbkomplex.

Unter die Klasse der Konjunktionen (KONJ) fallen

• Komplementierer, also satzeinleitende Konjunktionen, sowie

• Konjunktionen im engeren Sinn, also und, oder etc.

Reflexiva (REFLEXIVUM)

• sind vom Verb geforderte Pronomina, die keine semantischen Argumente sind. (Peter

und Maria wundern sich. *Wen wundern Peter und Maria? Sich!)

• sind von gleichlautendenden Pronomina zu unterscheiden, die Argumentstatus haben

(Peter und Maria bewundern sich. Wen bewundern Peter und Maria? Sich

(gegenseitig)!)

Negationen (NEG)

19

Kategorie

0AdjunktAppellativumDemonstrativpronomenIndefinitpronomenInterrogativpronomenKlitikumPräpositionaladverbPropriumRelativpronomenSatzVerbalnomenVPn.b.n.a.n.n.a.

• sind Ausdrücke mit Konstituentenstatus, die Propositionen verneinen (Ich habe Peter

nicht gesehen. Ich habe nicht Peter gesehen. In Ich habe keinen Peter gesehen wird

keinen nicht als NEG klassifiziert.)

Aufgrund der endozentrischen Organisation von

Phrasen/Satzgliedern haben diese Köpfe. Hinsichtlich des

Zusammenhangs von Wortstellung, Kasusmorphologie und

Prominenzskalen kann es von entscheidender Bedeutung sein, ob

Wandel oder Variation an die grammatische Kategorie des

(prinzipiell) nominalen Kopfes der Phrase gebunden ist.

Darum werden diese ebenfalls differenziert.

Zunächst kann ein semantisches Argument formseitig überhaupt

nicht ausgedrückt sein. Aus diversen Gründen ist es somit

phonetisch/graphisch (bei Koordinationen, Ellipsen, Kontroll-,

Infinitiv-, Partizipialkonstruktionen, Fragmenten, pro-drop etc.) performanz-, überlieferungs-

oder sprachsystematisch bedingt „null“.

Klitika sind gebundene, lexikalische, nicht betonbare Morpheme, deren Extension die gleiche

ist wie die von Nomen, d.h. sie referieren potentiell auf die gleichen Entitäten wie

Appellativa.

Unter dem Demonstrativum soll hier das Demonstrativpronomen verstanden werden. In

seiner Artikelverwendung wird es auf Wort-/Morphemebene erfasst (s.u.). Das

Demonstrativum kann anaphorisch und/oder deiktisch auf nominale Referenten referieren,

d.h. auf ko-textuell vorgenannte als auch auf in der Sprechsituation im Raum verortete.

Das Pronomen, genauer: Personalpronomen, obwohl es für alle Arten von Entitäten stehen

kann, ist eine Ersatzform für ein „volles“ Nomen. Es ist nicht gebunden und (mit Ausnahmen)

betonbar. In der ersten und zweiten Person ist es grundsätzlich deiktisch, in der dritten Person

kann es auch anaphorisch verwendet werden.

Das Relativpronomen besitzt in einem Attributsatz Komplement-/Argumentstatus, ist aber

koreferent mit einem nominalen Element des (Teil-)Satzes, in dem das Bezugswort auftritt.

Wenn es flektierbar ist, kann es in Numerus und Genus mit dem Bezugswort kongruieren,

nicht aber im Kasus.

Interrogativpronomen sind solche Fragepronomen, die in Bestimmungsfragen auftreten

(wh-phrases, wer, wohin etc.).

20

Indefinipronomen sind Pronomen wie viele, jemand, alle, man etc.

Präpositionaladverbien sind Adverbien, die Komplementstatus haben. Sie werden als PO

klassifiziert mit der Ausprägung Präpositionaladverb.

Propria umfassen alle Varianten von Eigennamen, die (eigentlich) Exemplare, nicht

Kategorien bezeichnen.

Appellativa bezeichnen dagegen Kategorien, nicht Exemplare (es sei denn, sie werden

dahingehend modifiziert, s. Demonstrativum). Sog. „Stoffe“ sollen hier wie Appellativa

behandelt werden. Der traditionelle Unterschied zu Appellativa kann über die Spezifizität

(Skala 4, s.u.) rekonstruiert werden. Dies ist für Propria viel weniger klar, daher werden sie

zunächst eigens klassifiziert.

Das Verbalnomen besitzt eine nominale Form und ist (theoretisch) deklinierbar, bezeichnet

aber eine/n Zustand, Prozess, Aktivität. Die Tatsache, dass es semantisch Prädikat, aber

syntaktisch auch Komplement sein kann, begründet seine Sonderstellung. Die Phrase, deren

Kopf das Verbalnomen ist, wird entweder als (Teil-)Satz oder als (komplexes) Satzglied

klassifiziert, je nachdem, ob sie satzwertig ('sein Gehen' als Satz) oder satzgliedwertig ('Er tat

ein Gehen'; 'Ein Jagen kommt in seine Gedanken') ist. Als Adjunkte (da eigentlich keine

Wortkategorie) sollen solche Phrasenköpfe klassifiziert werden, deren Phrasen als

Adjunkte/adverbiale Bestimmungen klassifiziert worden sind, und deren Wortart keiner der

anderen entspricht (z.B. Ausdrücke wie dort, gestern, manchmal, vielleicht, aufgrund etc.).

Zuletzt sind noch VP- und S-wertige Satzglieder zu nennen. Wie das Verbalnomen

bezeichnen sie keine Entitäten, aber anders als das Verbalnomen ganze

Situationen/Ereignisse/Zustände/Relationen. VPs werden so behandelt, dass die durch sie

ausgedrückten Prädikat-Argument-Strukturen auch klassifiziert werden.

Manche Kategorien können noch hinsichtlich bestimmter Parameter variieren.

21

0

prolept.nota augens

Klit.

n.b.n.a.n.n.a.

m. Nebensatzo. Nebensatzn.b.n.a.n.n.a.


Pron.

m. Nebensatzo. Nebensatz

n.b.n.a.n.n.a.

prolept.nota augensprolept. & Nebensatznota augens & Nebensatz

m. Attr.satzo. Attr.satz

Prop.

o. alles

n.b.n.a.n.n.a.

Dem.-pron.

App.



V-Nomen



VP S

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

Interrog.-pron.

m. Attr.satz

n.b.n.a.n.n.a.

Indef.-pron.


Präpos.-Adv.


Relat.-pron.

ADJ


0

prolept.nota augens

Klit.

n.b.n.a.n.n.a.



Pron.


n.b.n.a.n.n.a.



Prop.

o. alles

n.b.n.a.n.n.a.

Dem.-pron.

App.



V-Nomen



VP S

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

Interrog.-pron.

m. Attr.satzo. Attr.satzn.b.n.a.n.n.a.

Indef.-pron.


Präpos.-Adv.


Relat.-pron.

ADJ


0

prolept.nota augens

Klit.

n.b.n.a.n.n.a.



Pron.


n.b.n.a.n.n.a.



Prop.

o. alles

n.b.n.a.n.n.a.

Dem.-pron.

App.



V-Nomen



VP S

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

Interrog.-pron.

m. Attr.satz

n.b.n.a.n.n.a.

Indef.-pron.


Präpos.-Adv.


Relat.-pron.

ADJ


0

prolept.nota augens

Klit.

n.b.n.a.n.n.a.



Pron.


n.b.n.a.n.n.a.



Prop.

o. alles

n.b.n.a.n.n.a.

Dem.-pron.

App.



V-Nomen



VP S

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

Interrog.-pron.


Indef.-pron.


Präpos.-Adv.


Relat.-pron.

ADJ


Der erste dieser Parameter bestimmt darüber, ob eine gegebene Kategorie das Bezugswort

eines Attributsatzes ist. Der zweite Parameter bestimmt, ob eine Kategorie formal definit

oder indefinit ist. D.h., hier gilt nicht semantische Definitheit, sondern die Präsenz eines

determinierenden Elements. Der dritte Parameter bestimmt, ob eine der nominalen Kategorien

bereits durch Prolepse (Klitikum an einem anderen Element im Satz) „vorweggenommen“

wurde. Unter nota augens versteht man ein enklitisches Pronomen, dessen Auftreten

Emphase oder Kontrast ausdrückt und/oder dessen Auftreten an die gleichen Bedingungen

gebunden ist wie das Auftreten von Pronomen in pro-drop-Sprachen.

Für verbale Elemente sollen engl. Glossen angegeben werden. Dies erlaubt nachher eine

Systematisierung bzw. Abfragen nach Verbklassen.

22

PA > PP > PLPA > PL > PP

Akkusativ Ergativ

Alignment

1-stellig

PAPRPPPL

2-stellig

3-stellig:

(a)

PA > PR > PPPA > PP > PRPP > PR > PPPP > PP > PRPR > PP > PPPR > PR > PP

(b)

PA > PP > PLPA > PL > PPPP > PP > PLPP > PL > PPPL > PL > PPPL > PP > PL

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

1-stellig

PAPRPPPL

2-stelligPA > PR/PP/PLPL/PP/PR > PAPR > PP/PLPP > PL/PRPL > PR/PPidentische Rollen

3-stellig:

(a)

PA > PR > PPPA > PP > PR

(b)

n.b.n.a.n.n.a. n.b.

n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

0-stellig 0-stelligPA > PR/PP/PLPL/PP/PR > PAPR > PP/PLPP > PL/PRPL > PR/PPidentische Rollenn.b.n.a.n.n.a.

n.b.n.a.n.n.a.

Beim Alignment (= unmarkierte Abfolge der Komplemente eines Verbs) soll zunächst ein

akkusatives und ein ergatives Alignment und dann zwischen null-, ein-, zwei- und

dreistelligen Verben unterschieden werden. Bei einstelligen wird nur die einzige, semantisch

geforderte Proto-Rolle des Verbs angegeben. Bei zweistelligen wird die unmarkierte Abfolge

hinsichtlich der Information spezifiziert, welche Proto-Rolle vor oder nach der anderen Proto-

Rolle realisiert wird. Hinsichtlich dreistelliger Verben wird unterschieden, welche die

Abfolge der zwei Rollen für die Objekte sind: Proto-Rezipient und Proto-Locational sollten

nicht zusammen auftreten können, daher bleiben die jeweils zwei Kombinationen aus Proto-

Patiens und Proto-Rezipient sowie Proto-Patiens und Proto-Locational. Was die Stelligkeit

von Verben betrifft, muss man hier diejenige des Types, nicht die des im aktuellen Satz vor-

gefundenen Verb-Tokens angeben.

Für Sprachen, hinsichtlich derer aufgrund fehlender Daten keine Alignment-Angaben für

Verben gemacht werden können, besteht evntl. die Möglichkeit, auf Basis der gesammelten

restlichen Daten schließlich auch dazu Prädiktionen ableiten zu können. Bei der Alignment-

Kategorie ist zu beachten, dass hier nur als „V“ getaggte Phrasen klassifiziert werden, nicht

nominale Phrasen. Das heißt, Alignment ist ausschließliches Merkmal von Verben.

Zur Kodierung des „Wer tut was mit wem?“ gehört die Information darüber, ob und wenn ja,

womit die verbalen (nicht die anderen) Bestandteile kongruieren. Entscheidend für die

Klassifikation ist die formale Kon-gruenz, d.h. Kongruenz anhand von morphologischen

Markierungen.

23

In Frage kommen

• Kongruenz des Verbs mit einer der syntaktischen Funktionen, worunter auch ein

gedropptes Subjekt fallen kann,

• keine morphologische Kongruenz für den Fall, dass das betreffende Verb infinit ist,

• keine morphologische Kongruenz für den Fall, dass z.B. in einer unpersönlichen

Konstruktion das Verb per default 3.Ps.Sg. aufweist,

• keine Kongruenz, wobei dies dennoch sprachsystematisch regulär ist, z.B. SUB im

Sg., V im Pl. im Kymrischen,

• keine morphologische Kongruenz, aber semantische. Dabei ist wieder anzugeben,

welche die syntaktische Funktion ist, mit deren Kopf-Referenten das Verb kongruiert,

• keine morphologische Kongruenz und semantisch ambig.

Möglicherweise relevant für

die Fragestellungen sind die

Positionen von Phrasen

bezüglich topologischer

Felder. Letztere ergeben sich durch die Stellungsmöglichkeiten von finiten Verben in einer

Sprache. Die Positionen vor, nach und zwischen den möglichen Stellungen finiter und

infiniter Verben machen die eigentlichen topologischen Felder aus. Bei der Entwicklung eines

topologischen Feldermodells sind im Allgemeinen besonders relevant

24

• die Anzahl der Phrasen/Satzglieder, die jeweils vor, nach und zwischen dem finiten

und infiniten Verb stehen können,

• die Frage, ob eine Adjazenzregel für finite und infinite Verbteile besteht (Aux/Mod +

Vinfin);

o wenn ja, besitzt die Sprache keine Klammerstruktur, d.h. die verbalen

Bestandteile können kein „Mittelfeld“ einklammern,

o wenn nein, ist eine Klammerstruktur vorhanden.

• VVF: Vorvorfeld, VF: Vorfeld; LK: linke Klammer; MF: Mittelfeld; RK: rechte

Klammer; NF: Nachfeld, RAF: rechtes Außenfeld

Erklärungsbedürftig sind VVF, RAF und LK & RK. VVF und RAF sind nicht dadurch

differenziert, dass verbale Elemente sie trennen. Sie sind eher durch den Unterschied von

geschriebener und gesprochener Sprache, von (kodifizierter) Norm und Gebrauch, von

Kompetenz und Performanz bestimmt. Das Vorvorfeld und das rechte Außenfeld sind der

„left detached position“ bzw. „right detached position“ in van Valins (2005) syntaktischer

Struktur sehr ähnlich; sie dienen mehr oder weniger zur Erfassung derselben sprachlichen

Phänomene, nämlich syntaktisch eher isolierten Voranstellungen und Nachträgen

(Korrekturen, nachträgliche Ergänzungen etc.). Auch Mehrfachauswahl ist möglich für den

Fall, dass eine diskontinuierliche Konstituente auf verschiedene Felder verteilt steht und per

Tag + Connect verbunden wird. Für einige Sprachen sind „Satztopologien“ bisher nicht

konsensfähig oder nicht vorgeschlagen worden. Für diese Sprachen besteht eventuell die

Möglichkeit, anhand der aus den anderen Klassifikationskategorien entstehenden Ergebnissen

Feldermodelle abzuleiten.

Von zentraler Bedeutung für viele der untersuchten Sprachen ist die Kategorie „Kasus“.

„Kasus“ ist dabei eins der prominenten formalen Mittel, anhand derer die konkreten

semantischen Relationen zwischen Prädikaten und Argumenten in Verb-Komplement-

Strukturen kodiert werden. Die Sprache von „Kasus“ soll folgendermaßen konkretisiert

werden:

• Kasus als Kasuskategorien „sind abstrakte Einheiten der linguistischen

Beschreibung. Sie bezeichnen Paradigmen, Klassen von [F]ormen, die füreinander

einsetzbar sind.“ (Dürscheid 1999: 2). In genau diesem Sinn kann man von

„Nominativen“, „Ablativen“ usw. sowie „Kasussystemen“ verschiedener

Sprachen/Varietäten sprechen.

25

• Kasusträger sind zunächst diejenigen lexikalischen Einheiten (inkl. „0“), die

Kasusmorphologie tragen können. Kasusträger besitzen unstrittig intrinsische

semantische Merkmale. Allein oder durch Kongruenz mit anderen Elementen (z.B. in

Kasus, Numerus, Genus) bilden die Kasusträger auf einer nächsten

Beschreibungsebene Phrasen/Satzglieder.

• Kasusformen sind die formalen Manifestationen von Kasuskategorien in Form von

Morphemen. Sie bilden Paradigmen. Der semantische Status von Kasusformen ist

umstritten. Hier soll die Form definiens einer Kasuskategorie sein. Kasusformen treten

in den untersuchten Sprachen auf in Form von

o Flexionsmorphemen an nominalen Ausdrücken (d.h. am Nomen selbst),

o Flexionsmorphemen an Ausdrücken, die nominale Ausdrücke determinieren/

modifizieren (d.h. an Determinierern u./o. Adjektivattributen),

o Morphemen an Elementen, die semantisch Prädikate sind, z.B. am Verb, und

die syntaktisch Phrasenköpfe sind.

o Nom: Nominativ, Gen: Genitiv, Dat: Dativ, Akk: Akkusativ, Vok: Vokativ,

Abl: Ablativ, Instr: Instrumental, Erg: Ergativ, All:Allativ, Obl: Oblativ, E-

kasus: Einheitskasus)

Neben dem Kasus einer Nominalphrase, d.h. konkret

der/n Kasusform/en, die (ein) Kasusträger

trägt/tragen, kann das Verb auch eine Adposition

regieren, die wiederum den Kasus einer NP regiert.

Es müssen also adverbale und adpositionale Kasus

unterschieden werden. Beide Kategorien werden

dabei unmittelbar bzw. mittelbar vom Verb regiert.

Die Adpositionen werden zum Zweck der

semantischen Differenzierbarkeit sprachspezifisch

als types gesammelt.

Eine besondere Schwierigkeit der Kasusformen-Klassifikation besteht darin, dass für viele

Sprachen in vielen Sprachstufen sowie in ihren Varietäten die Kasusparadigmen zu einem

hohen Grad schon vor der Klassifikation bekannt sein müssen, um konkrete Formen als

Instanzen von Kasuskategorien erkennen zu können. Dies ist aber nur sehr eingeschränkt der

Fall. Die Kategorie der Kasusform muss also wie z.T. diejenigen des Alignments und der

topologischen Felder als „in Entwicklung“ begriffen werden: Die Kasusform (nebst

Kasuskategorien) kann im günstigsten Fall

26

• einerseits durch distributionelle Analyse der Formen eines oder mehrerer hinsichtlich

der anderen Kategorien vollständig klassifizierten Texte(s) konstruiert werden und

• andererseits mit Bezug auf bekannte historische Kasussysteme konstruiert werden.

Sofern möglich, sollen für einen gegebenen nominalen Ausdruck alle Kasuskategorien

genannt werden, auf die die Form potentiell zutrifft, d.h. unabhängig vom Syntagma und der

Verbvalenz. Damit soll die eventuelle Unterspezifiziertheit der Formseite vollständig erfasst

werden.

Syntaktische Funktionen, Kasus-, Alignment- und Skaleninformationen sind auch gemeinsam

nicht in der Lage, die semantische Rolle, die ein Element in einer syntaktisch kodierten

Relation einnimmt, zu spezifizieren. Trotz der Pluralität der vorhandenen Rollendefinitionen

und -listen soll hier eine unkomplizierte und theoretisch dennoch tragfähige Klassifikation

von nominalen Ausdrücken hinsichtlich semantischer Rollen vorgenommen werden.

Semantische Rollen sind Generalisierungen über semantische Merkmale von Argumenten von

Prädikaten, und zwar in Abhängigkeit von der Semantik der Prädikate. D.h., obwohl der

Schütze eines Schießen-Ereignisses und der Esser eines Essens-Ereignisses körperlich groß

sein können, steht diese Eigenschaft in keinem logischen Zusammenhang zu den beiden

Prädikaten – Schießen und Essen finden auch unabhängig von Größe statt. Dagegen finden sie

nicht unabhängig von der Kapazität ihrer Träger zur Selbstbewegung und zum zielgerichteten

Handeln statt. Letztere Eigenschaften bilden sog. entailments von Prädikaten (d.h.: Immer

wenn Prädikat P, dann Eigenschaft f in Argument A; wenn nicht f in A, dann nicht P).

Überlegungen wie diese haben in der Vergangenheit zur Formulierung diverser Rollen

geführt. Hier soll von den Annahmen ausgegangen werden,

• dass Äußerungen in der Regel nicht mehr als dreistellige Relationen, bisweilen auch

vierstellige Relationen kodieren und

• dass die Annahme von entsprechend vielen – stark generalisierenden – semantischen

Rollen daher ausreicht.

Die Charakterisierung der folgenden Proto-Rollen

orientiert sich an den Ansätzen von Dowty (1991),

Primus (1999, 2006) und van Valin (2002, 2005). An

Dowty und Primus orientiert sie sich insofern, als die

Proto-Rollen über die semantischen Eigenschaften

„diskreter“ semantischer Rollen in Prototypen-ähnlicher Weise generalisiert (z.B. über

Agens, Instrument, Causer). An van Valin erinnert sie insofern, als die Generalisierungen

27

zunehmend feinkörnige Differenzierungen neutralisieren (z.B. die zwischen einem „Sender“,

einem öffnenden Schlüssel und einem tötenden Autounfall). Die folgende Tabelle zeigt, über

welche traditionellen, diskreten Rollen die Proto-Rollen Agens, Rezipient, Patiens und

Locational generalisieren.

[Abbildung zur Erklärung; keine Kategorien + Ausprägungen]

Die schematischen, von den Proto-Rollen abgedeckten Argument-Bedeutungen in

Abhängigkeit vom jeweiligen Prädikat können folgendermaßen charakterisiert werden:

A Proto-Agens:

1. verursacht die vom Prädikat verkörperte Eventualität, (a) entweder als erste Ursache

oder (b) als intermediäre;

2. falls ersteres, ist es möglicherweise auch eine als willentlich kategorisierte

Verursachung.

3. Bei Abwesenheit von Verursachung gilt ausschließlich das Kriterium der

Willentlichkeit, bzw. der zugeschriebenen Willentlichkeit, Kontrollausübung oder

Verantwortlichkeit.

B Proto-Rezipient:

1. Die vom Prädikat verkörperte Eventualität ist konkret oder metaphorisch, oft im Sinne

eines Transfers oder einer Besitzrelation; damit das Prädikat zutrifft, ist dann

Beteiligung im Sinne von Ko-Agentivität des PR nötig. Bsp.: Er bekommt ein Buch.

Er gratuliert ihr. Sie schenkt ihm ein Buch. Sie besitzt/hat/braucht ein Buch.

2. Die Eventualität kann auch handlungstheoretische Relevanz für ihn tragen, ohne dass

er kausal involviert ist, darunter ihm nützen oder schaden, zusagen oder nicht zusagen.

Bsp.: Papa kauft ihm ein Auto. Das Glas fällt ihm herunter.

3. Der PR ist Träger von Wahrnehmungen (als Perceiver), Gedanken (als Cognizer)

und Gefühlen (als Emoter). Als solcher weist er reduzierte Agentivität auf. In einem

28

anderen Sinn weist er reduzierte (d.h. weniger affiziert) Patientivität auf, indem seine

mentalen Zustände nicht unbedingt gewollt sind. In einer solchen Relation zwischen

dem PR und dem Stimulus findet kein Zustandswechsel statt, d.h. die Relation ist

statisch, der mentale Zustand ist von keiner anderen Entität verursacht. Bsp.: Das

Buch gefällt ihr. Sie fürchten sich. Er sieht einen Fuchs. Er denkt an ihn.

Die Charakteristika von (B1)–(3) bringen es mit sich, dass zur inhärenten Semantik

des Rollenträgers gehört, dass er prototypisch belebt ist.

C Proto-Patiens:

1. die Rolle von den Dingen, die sich konkret oder metaphorisch nicht selbstverursacht

bewegen und dabei selbst auch nichts verursachen, entweder in intransitiven,

transitiven oder ditransitiven Relationen (s. B1). Bsp.: Die Katze stinkt. Er kickt sie

durchs Fenster. Er schickt ihr einen Kondolenzbrief.

2. die Rolle von den Dingen, die von einer Eventualität betroffen sind, wobei B1–3

nicht zutreffen (d.h. hinsichtlich des Prädikat-Entailments ist die Entität nicht

zukünftiger Possessor bezüglich einer Transferrelation (B1); hinsichtlich des Prädikat-

Entailments besitzt die Relation für die Entität keine handlungstheoretische Relevanz

(B2); hinsichtlich des Prädikat-Entailments ist die Entität nicht Cognizer/

Perceiver/Emoter (B3)). Bsp.: Sie liest ein Buch. Das geht ihn nichts an. Sie

verschweigen ihm die Wahrheit.

3. die Rolle von Cognizers/Perceivers/Emoters, wobei diese Erfahrungen sich durch

eine Zustandsveränderung erst einstellen oder aufhören, indem sie verursacht werden

(daher „C“-Cognizer/-Emoter/-Perceiver für „verursacht“) d.h. die Relation ist nicht

statisch, sondern dynamisch. Bsp.: Sie ängstigen ihn zu Tode. Das Gewitter hat sie

erschreckt. Hans schreckt auf.

Die Charakteristika von (C1)–(3) bringen es mit sich, dass die PP-Rolle indifferent

gegenüber Belebtheit ist.

D Proto-Locational:

1. die Rolle des Wo?, Woher?, Wohin?, Wann? und Wie lange? der vom Prädikat

verkörperten Eventualität. Als solche steht PL in Opposition zu PA, PR und PP.

2. Zu PA steht PL in Opposition, wenn PA zugleich Ort, Quelle oder Ziel einer

Eventualität ist. Wenn die fragliche Entität in einer solchen Relation akzeptabel so

modifiziert werden kann, dass Agentivität impliziert ist, handelt es sich um ein PA.

Wenn nicht, um ein PL. Bsp.: In Peter nimmt eine Postsendung an ist Peter Ziel (PL)

der Bewegung. Agentivität ist in akzeptabler Weise impliziert, wenn man den Satz

29

entsprechend modifizieren kann: Peter nimmt (absichtlich/*unabsichtlich) eine

Postsendung an. Peter ist daher PA.

3. Zu PR steht PL in Opposition, weil viele Transferrelationen Aspekte sowohl von

Besitzrelationen als auch von simplen räumlichen Relationen aufweisen. Prädikate

können den einen oder anderen Aspekt betonen. Je nachdem variieren ihre

Entailments. Transfer-Besitzrelationen sind durch die Belebtheit, physische

Beteiligung und Ko-Agentivität des „Zielpunkts“ des Transfers restringiert (→PR),

Bsp.: Er erzählt ihr die Geschichte. Sie schickt ihm das Buch. Für rein räumliche

Transfer-Relationen besteht diese Restriktion nicht (→PL), Bsp.: Er faxt die

Geschichte an sie. Sie schickt das Buch an ihn. Bei diesen ist die „Entität“ oft ein Ort.

Ein Ort kommt als PR nicht in Frage. (Er schickt *Frankfurt/Holger einen Brief.) Ist

nicht klar, ob es sich bei einer belebten Entität um ein PR oder PL handelt, ist zu

überlegen, ob der Satz noch akzeptabel ist, wenn die Entität sich nicht beteiligt im

Sinne von Ko-Agentivität (Nicht-Beteiligung, →PL); oder ob die Entität notwendig

kausal involviert ist, so dass eine Haben-Relation notwendig zustande kommt (wenn

ja, →PR). Als simple Regel könnte man formulieren: Ist ein Personen-Ausdruck durch

einen Ortsausdruck ersetzbar, trägt die Person die PL-Rolle. Ist ein

Personenausdruck nicht durch einen Ortsausdruck ersetzbar, handelt es sich

höchstwahrscheinlich um ein PR. Aber: Ob ein Ortsausdruck durch einen

Personenausdruck ersetzbar ist, hat dagegen keine Aussagekraft.

4. In einer ähnlichen Opposition wie zu PR steht PL zu PP, nämlich hinsichtlich C2.

Die Regel soll sein: Orte können im Unterschied zu Objekten nicht kausal affiziert

sein, da Orte relativ zu menschlichen Größenverhältnissen nicht als in der

Wahrnehmung abgegrenzte Objekte auftreten. Bsp.: Peter sieht [PPMaria] an. Peter

sieht in [PLden Wald] hinein. Peter ruft [PPMaria]. Peter ruft nach [PLMaria]. Peter

bemalt [PPdie Wand] mit Blumen. Peter malt Blumen auf [PLdie Wand]. Menschen

können in der Vorstellung über ihre eigenen Größenverhältnisse hinausgehen, indem

sie aus vorgestellten Szenen „herauszoomen“ und auf diese Weise Entitäten, die im

Normalfall Orte wären (z.B., wenn ‚Tetsuhiro in [PLder Stadt] ist‘, zu Objekten

machen, die kausal affizierbar sind, (z.B., wenn Tetsuhiro in seiner Vorstellung aus

der Stadt herauszoomt und von oben beobachtet, wie ‚[PPdie Stadt] von Godzilla

zerstört wird‘). Menschen können also, je nachdem, welche Beobachterposition sie in

der Vorstellung relativ zu einer Entität einnehmen, diese als Ort oder als Objekt

konstruieren.

30

Metaphorische Ausdrücke sind raumkognitiv aufzulösen (die Idee ist, dass alle Metaphern

sich letztlich der senso-motorisch basierten Ausdrücke bedienen): Die Fee verwandelt [PPden

Zauberer] in [PLeine Unke]. Meronymische Ausdrücke werden nach der Semantik ihrer

assoziierten Referenten klassifiziert. Bsp: In Der Leberschaden sitzt im Wartezimmer wird

Der Leberschaden klassifiziert wie die Person, für die der Ausdruck steht (hier: PA), nicht für

die Semantik eines Leberschadens.

S- und VP-Komplemente tragen meistens die Rolle Proto-Patiens (Peter sagt, das sei

Quatsch), können aber auch Proto-Locational (Peter wohnt, wo der Pfeffer wächst) tragen

oder indeterminiert sein (In Marburg zu wohnen gleicht im Nirgendwo zu wohnen). Bei

Kopulaverben werden im wesentlichen Eigenschaften, darunter auch räumliche und zeitliche

Situiertheit prädiziert. Bei nicht-raumzeitlichen Prädikationen soll die Rolle Proto-Patiens an

das Subjekt vergeben werden (Peter ist Schreiner. Peter ist geschickt), bei raumzeitlichen die

Rolle Proto-Locational (Peter bleibt in Marburg, Das Fest war gestern). Den verschiedenen

Prädikativa wird keine Proto-Rollen zugeordnet, da sie lediglich Identität zu etwas

ausdrücken, das bereits klassifiziert wird.

Die o.g. Kriterien reichen hin, um alle Komplementtypen, die potentiell gemeinsam in einem

Satz auftauchen, hinsichtlich ihrer semantischen Rollen distinkt zu klassifizieren. (Echte

Adjunkte werden nicht hinsichtlich Proto-Rollen klassifiziert.) Eine Ausnahme bleibt: In

einem Satz kann ein (echtes) Agens-Komplement zusammen mit einem Instrument-

Komplement(-Adjunkt) auftreten. Beide würden als PA klassifiziert werden. Die distinkte

Klassifizierung bietet zwar Vorteile, ist aber nicht zwingend nötig. Es spricht nichts dagegen,

zwei Komplemente mit der gleichen Proto-Rolle zu klassifizieren. Ihre Distinktivität – sie

tragen ja nicht gleich zum „Wer tut was mit wem?“ bei – ist durch die Kausalstruktur (s.u.)

und die Funktionszuweisung (s.o.) eindeutig erfasst.

Die semantische-Rollen-Informationen zu Argumenten genügen gemeinsam mit der formalen

Spezifizierung noch immer nicht, um alle möglicherweise relevanten Faktoren für die

übergeordnete Fragestellung zu versammeln. Innerhalb der kognitiv-funktionalen Linguistik

wird die Kausalstruktur einer Eventualität als zentrales Determinans von semantischen

Rollen und diese wiederum als Steuerungsfaktoren ihrer sprachlichen Umsetzung gesehen.

Dies hat sich vor allem in der generativen Tradition nicht durchgesetzt. Dort werden

thematische Rollen nicht konsistent in Abhängigkeit von kausalen Erwägungen definiert.

Beide Ansätze haben ihre Grenzen, weswegen hier die Stärken beider vereinigt werden sollen.

Eine Charakterisierung semantischer Rollen von Argumenten soll komplementiert werden

31

durch eine Charakterisierung ihres kausalstrukturellen Status. Die Kausalstruktur hat

annähernd Skala-Status, indem die Werte, die einer Entität innerhalb einer Eventualität

zugeordnet werden

können,

verschiedene

Prominenz

ausdrücken.

Prominenz ergibt

sich hier aus der Rolle, die eine Entität in einer Situation/einem Ereignis einnimmt, und zwar

relativ zu den Polen Verursachung und Effekt. Die Einheiten ergeben sich aus einer Synopse

derjenigen Faktoren, die in der theoretischen Literatur im Zusammenhang vor allem mit

Transitivität (z.B. Hopper & Thompson 1980, Jackendoff 1990) diskutiert werden, und

denjenigen, die auf der Basis der Arbeiten von Talmy (1988) zu force dynamics mittlerweile

weit über die kognitive Linguistik hinaus Bedeutung gewonnen haben. Die Logik folgt dabei

derjenigen der wahrgenommenen physischen Kraftübertragung. Kausalität wird damit

rekonstruiert als eine physische Kraft („force“), die von einer Entität an eine andere Entität

(an eine andere Entität) (an eine andere Entität) (…) weitergegeben wird.

• Verursacher ist diejenige Entität, die eine andere Entität durch physische

Kraftausübung affiziert oder einen Zustandswechsel in dieser Entität hervorbringt. Der

Zustand des Verursachers selbst ist dabei (anscheinend) nicht selbst verursacht. In der

Regel sind dies „echte“, d.h. willentliche Agenten, Naturgewalten, aber auch Ma-

schinen. (Peter zerschlägt das Fenster. Peter trifft das Fenster. Der Hagel zerschlägt

das Fenster.)

• Verursacher & Verursachter zugleich sind solche Entitäten, die force auf andere

Entitäten ausüben (mit oder ohne Zustandsveränderung) und deren Zustand dabei

selbst durch force eines Verursachers verursacht ist. Dies entspricht der klassischen

thematischen Rolle des Instruments. (Der Stein zerschlägt das Fenster (weil Peter ihn

geworfen hat).)

• Symmetrisch verursacht/0-affiziert sind solche Entitäten in Zuständen, Prozessen,

Aktivitäten, die entweder symmetrische Relationen ausdrücken (Peter gleicht/ähnelt

seinem Vater; Peter ist wie sein Vater) oder solche, in denen keine physische

Kraftübertragung (force) vorhanden ist. (Peter kennt seinen Vater nicht).

• Ausdrücke, die auf Informationen jeglicher Art referieren, haben hinsichtlich

Kausalität einen problematischen Status und sollen von physischen Entitäten getrennt

32

klassifiziert werden. Grammatische Objekte von Verben, die propositionale

Einstellungen ausdrücken (z.B. eine Geschichte glauben/kennen/anzweifeln) sowie

von Verben des Sagens (z.B. die Antwort sagen/eine Geschichte erzählen) sollen als

Information klassifiziert werden.

• Die restlichen Einheiten applizieren auf Entitäten, die physisch betroffen, d.h. affiziert

sind;

o „positiv affiziert“ ist eine solche Entität, die in irgendeiner Weise so durch

force affiziert wird, dass sich ihr Zustand nicht ändert. Die Art der Affizierung

ist als positiv für die affizierte Entität zu bewerten. Die Einheit „positiv

affiziert“ soll auch für Arten der Affizierung ohne Zustandswechsel verwendet

werden, bei denen „positiv“ vs. „negativ“ nicht zu entscheiden ist (Peter sucht

ihm einen Job.).

o „negativ affiziert“ ist eine solche Entität, die in irgendeiner Weise so durch

force affiziert wird, dass sich ihr Zustand nicht ändert. Die Art der Affizierung

ist als negativ für die affizierte Entität zu bewerten (Peter tritt ihm in den

Hintern.).

o „positiv affiziert mit Zustandsveränderung“ ist gegeben, wenn eine Entität in

irgendeiner Weise so durch force affiziert wird, dass sich ihr Zustand ändert.

Die Art der Affizierung ist als positiv für die affizierte Entität zu bewerten

(Peter hilft ihm auf die Beine.). Die Einheit „positiv affiziert mit

Zustandsveränderung“ soll auch für Arten der Affizierung mit

Zustandswechsel verwendet werden, bei denen „positiv“ vs. „negativ“ nicht zu

entscheiden ist (Er hat das Brot aufgegessen).

o „negativ affiziert mit Zustandsveränderung“ ist gegeben, wenn eine Entität in

irgendeiner Weise so durch force affiziert wird, dass sich ihr Zustand ändert.

Die Art der Affizierung ist als negativ für die affizierte Entität zu bewerten

(Peter schlägt ihn grün und blau.)

1. Richtlinien für die Anwesenheit von Verursachern und affizierten Entitäten:

a) In der Art und Weise, wie wir über Kausalität sprechen, können sowohl Objekte als auch Ereignisse/Zustände

als Verursacher bzw. affizierte Entitäten fungieren:

[Ursache=EreignisDie schlechte Formulierung des Abschnitts] hat [Affiziertes=Ereigniseine Neuformulierung] erfordert.

[Ursache=ObjektDer Metzger] hat [Affiziertes=Objektdie Schweinehälfte] zerlegt.

[Ursache=ZustandDie brüchigen Gleise] haben [Affiziertes=Objektden Zug] zum Entgleisen gebracht.

[Ursache=ObjektEin Mann] hat [Affiziertes=Ereignisdie Zentrifugierung] erfunden.

33

Der Vorschlag ist, in der Datenbank nur die objekthaften Entitäten hinsichtlich Kausalität zu klassifizieren in

Abhängigkeit davon, ob sie plausiblerweise im gegebenen Ereignis force ausüben. Zustände/Ereignisse können

kein force ausüben. Das würde bedeuten:

Die schlechte Formulierung des Abschnitts: n.a.; eine Neuformulierung: n.a.

Der Metzger: Verursacher; die Schweinehälfte: pos. aff. u. Zust.veränderung

Die brüchigen Gleise: n.a.; den Zug: neg. aff. u. Zust.veränderung; Entgleisen: n.a.

Ein Mann: Verursacher; die Zentrifugierung: n.a.

b) Das heißt auch, dass ein Objekt in der Regel nicht seinen eigenen Zustand verursacht, es sei denn, es wirkt auf

sich selbst ein. In Peter tanzt ist Peter kein Verursacher. Aber in Peter tanzt sich in Trance ist Peter (=früherer

Peter) der Verursacher und sich (=späterer Peter) positiv affiziert mit Zustandsveränderung (Trance: n.a.)

2. Was ist mit metaphorischen und metonymischen Ausdrücken?2

a) Der Vorschlag ist, metaphorische Ausdrücke so zu klassifizieren wie nicht-metaphorische Ausdrücke. Bsp.:

metaphorisch: [VerursacherPeter] hat [pos.aff+Zust.veränd.mich] auf [0-affdie Idee] gebracht [0-aff.ø] zu studieren. Warum ist

das metaphorisch? Weil jmd. auf eine Idee bringen ein nicht-sensomotorisch basiertes Ereignis beschreibt, das

mit den sprachlichen Mitteln senso-motorisch basierter Sachverhalte beschrieben wird wie jmd. auf einen Berg

bringen. Wichtig dabei ist, dass der Unterschied zwischen metaphorischen und nicht-metaphorischen

Äußerungen über die Skalenwerte differenziert wird: jmd. auf [locationeinen Berg] bringen vs. jmd. auf [abstracteine

Idee] bringen.

b) Bei metonymischen Ausdrücken wird nicht der Referent dieses Ausdrucks, sondern der kognitiv assoziierte

klassifiziert (Also in Der Leberschaden sitzt in Zimmer 3 wird der Leberschaden so klassifiziert wie der kognitiv

mit ihm assoziierte „Träger“, d.h. irgendeine im Diskurs identifizierbare Person. Während der Leberschaden eher

ein Zustand ist, ist sein „Träger“ ein Objekt und würde als 0-affiziert (sie/er sitzt im Wartezimmer) klassifiziert.

3. Was ist unter einer Zustandsveränderung zu verstehen?

Eine Zustandsveränderung in einer Entität ist gegeben, wenn sich in dem durch die Äußerung ausgedrückten

Ereignis ein oder mehrere Merkmale dieser Entität ändern, hervorgebracht werden oder aufhören zu bestehen.

Auch Ortswechsel sind Zustandswechsel.

4. Erste Hilfe für kausalstrukturelle Notfälle

Schritt 1: Bestimme die Aktionsart der fraglichen Konstruktion

2 Metapher: Eine nicht senso-motorisch verankerte konzeptuell-semantische Domäne wird mit den sprachlichen

Mitteln einer anderen, senso-motorisch verankerten konzeptuell-semantischen Domäne beschrieben: Sein Tod

hat uns schwer getroffen. Die psychische „Betroffenheit“ der Referenten von uns wird mit den Mitteln echter

physischer Affiziertheit (treffen) ausgedrückt, weil beide Domänen strukturelle Ähnlichkeiten aufweisen.

Metonymie: Ein Referent wird mit einem Ausdruck versprachlicht, der auf eine konzeptuell assoziierte Entität

referiert: z.B. der Mann mit Leberschaden, der beim Arzt im Wartezimmer 3 sitzt mit dem Ausdruck der

Leberschaden (sitzt in Zimmer 3). Anders als bei der Metapher besteht hier keine Ähnlichkeit zwischen dem

Mann und dem Leberschaden, sondern eine kontingente kognitive Assoziation zwischen zwei Entitäten.

34

Relevante Aktionsarten:

a. Atelisch state (i): be sick, be tall, be dead, love, know, believe, have

Atelisch activity (ii): march, walk, roll (the intransitive versions); swim, think, rain, read, eat

b. Telisch achievement (i): pop, explode, collapse, shatter (intransitive)

Telisch accomplishment (ii): melt, freeze, dry (the intransitive versions); learn, receive

Telisch active accomplishment (iii): devour, walk to the store, eat the pizza

c. kausative Gegenstücke zu den genannten

Test für die telisch/atelisch-Unterscheidung:

a. Atelische Ereignisse haben keinen inhärenten Endpunkt. Sie können also modifiziert werden mit adverbialen

Bestimmungen wie für alle Ewigkeit, für viele Jahre/Monate/Stunden. Dabei darf aber keine iterative Lesart

entstehen. Wenn eine iterative Lesart entsteht, handelt es sich wahrscheinlich um ein telisches oder

semelfaktives Ereignis. Dieser Test sollte für telische Verben semantische Anomalien verursachen (#Er verzehrte

das Brötchen für viele Jahre --> telisch; #Das Licht flackerte für alle Ewigkeit --> semelfaktiv).

b. Telische Ereignisse haben einen inhärenten Endpunkt. Sie können also modifiziert werden mit adverbialen

Bestimmungen wie innerhalb von wenigen Jahren/Monaten/Stunden/Minuten/ Augenblicken. Dieser Test sollte

für atelische Verben semantische Anomalien verursachen (#Er war innerhalb von wenigen Jahren krank).

Test für die state/activity-Unterscheidung:

a. Activities können durch Adverbien wie heftig, gewaltsam, energisch, mit Mühe usw. modifiziert werden (Er

rollt sich mit Mühe den Berg hinunter). Dies ist nicht möglich für states (#Er ist gewaltsam groß).

Test für die achievement/accomplishment-Unterscheidung:

a. Achievements sind nicht durch Adverbien modifizierbar, die eine langsame Geschwindigkeit eines Ereignisses

spezifizieren (#Der Luftballon ist langsam geplatzt). Sie sind lediglich durch solche Adverbien modifizierbar, die

augenblickliche Zustandsänderungen implizieren (Der Luftballon ist plötzlich/in diesem Augenblick geplatzt).

b. Accomplishments können umgekehrt durch Adverbien modifiziert werden, die langsame Geschwindigkeiten

oder den allmählichen Eintritt eines Zustandswechsels ausdrücken (Das Eis ist langsam geschmolzen). Achtung:

Der Achievement-Test kann auch für Accomplishments funktionieren, der umgekehrte Fall ist ausgeschlossen.

Test für active accomplishment:

a. Active accomplishments liegen vor, wenn sowohl der Activity-Test als auch der Accomplishment-Test

funktionieren.

Test für Kausativität:

a. Die infragestehende Konstruktion ist paraphrasierbar als x wirkt physisch3 so auf {x, y} ein, dass {P, ø} {x, y,

z} verbt/geverbt ist/wird.

3 Beachte Metaphern-Regelung.

35

Peter streicht die Hauswand --> 'Peter wirkt so auf die Hauswand ein, dass die Hauswand gestrichen ist/wird'

(Kausativität gegeben) (Achtung: Telizität ambig)

Peter denkt an seine Oma --> #'Peter wirkt so auf seine Oma ein, dass an die Oma gedacht ist/wird' (Kausativität

nicht gegeben)

Peter bringt nichts aus der Ruhe --> ' (Nicht) etwas wirkt so auf Peter ein, dass Peter beunruhigt ist/wird'

(Kausativität gegeben)

Peter sprach zu ihnen: „Fürchtet euch nicht!“ --> 'Peter wirkt so auf 3pl ein, dass zu 3pl „Fürchtet euch nicht“

gesagt ist/wird'

Achtung: (i) Dieser Test ist kein Test für Telizität. (ii) Die Paraphrase darf keine Prädikate enthalten, die nicht in

der fraglichen Konstruktion bereits ausgedrückt (wenn auch inkorporiert) sind.

Schritt 2: Nun, da Du die Aktionsart bestimmt hast, führe Dir die logische Struktur deiner Konstruktion

vor Augen. Verwende die folgenden logischen Strukturen für Aktionsarten (vereinfacht):

States und Activities sind basal, alles andere wird aus ihnen aufgebaut.

activity (x) pred‘

state (x) pred‘

Telizität (x) BECOME pred‘

Atelizität [BECOME-Prädikat abwesend]

Verursachung (x) FORCE{x, y}

accomplishment (x) BECOME pred‘

achievement (x) BECOME pred’

active accomplishm. (x) BECOME pred‘

caus. state (x) FORCE {x, y} pred’ {z, ø}

caus. activity (x) FORCE {x, y} pred’ {z, ø}

caus. accomp. (x) FORCE {x, y} BECOME pred’ {z, ø}

caus. achievement (x) FORCE {x, y} BECOME pred’ {z, ø}

caus. act. accomp. (x) FORCE {x, y} BECOME pred’ {z, ø}

Schritt 3: Weise Kausalrollen an die Argumente in der logischen Struktur zu

Regel 1: Klassifiziere ein Element in der logischen Struktur, das links von FORCE steht, als Verursacher

(Ausnahme unter (2)).

Regel 2: Klassifiziere ein Element in der logischen Struktur, von dem aus links und rechts FORCE steht, als

Verursacher & Verursachtes.

Regel 3: Klassifiziere ein Element in der logischen Struktur, das rechts von FORCE steht, als affiziert

(Ausnahme unter (2), (4)).

Regel 4: Klassifiziere ein Element in der logischen Struktur, das links von BECOME steht, als affiziert mit

Zustandsveränderung

- Ausnahme: Wenn „(x) activity-pred‘ & (x) BECOME pred‘“, dann x = 0-affiziert4

4 Diese Ausnahme bedeutet: Wenn ein Objekt durch eigene Aktivität seinen Zustand/Ort wechselt, ist er nicht

als affiziert mit Zustandswechsel zu klassifizieren.

36

Regel 5: Klassifiziere Elemente, auf die (1)–(4) nicht zutreffen, als 0- bzw. symmetrisch affiziert oder als

Information.

Beispiele:

a. atelisch state

The boy is afraid.

(boy) afraid’ Regel 5

b. atelisch activity

The soldiers marched in the field.

(soldiers) march’ & (soldiers) be-at’ (field) Regel 5

c. causative state

The dog frightens/scares the boy. (VORSICHT: ambig, könnte auch caus. achievem. sein)

(dog) FORCE (boy) scared’ Regel 1, Regel 3

(dog) FORCE (boy) BECOME scared’ Regel 1, Regel 4

d. Achievement:

The balloon popped.

(balloon) BECOME popped’ Regel 4

e. Causative achievement:

The cat popped the balloon.

(cat) FORCE (balloon) BECOME popped’ Regel 1, Regel 4

[f. Semelfactive:

The light flashed.

(light) flash’ Regel 5

g. Causative semelfactive:

The conductor flashed the light.

(conductor) FORCE (light) flash’] Regel 1, Regel 3

h. Accomplishment:

The ice melted.

(ice) BECOME melted’ Regel 4

i. Causative accomplishment:

The hot water melted the ice.

(hot water) FORCE (ice) BECOME melted’ Regel 1, Regel 4

j. Activity:

The soldiers marched in the field.

(soldiers) march’ & (soldiers) be-at’ (field) Regel 5

k. Causative activity:

The sergeant marched the soldiers in the field.

(sergeant) FORCE (soldiers) march’ & (soldiers) be-at’ (field) Regel 1, Regel 3

l. Active accomplishment:

The soldiers marched to the field.

37

(soldiers) march’ & (soldiers) BECOME be-at’ (field) Regel 4 (Ausnahme)

m. Causative active accomplishment:

The sergeant marched the soldiers to the field.

(sergeant) FORCE march’ (soldiers) & (soldiers) BECOME be-at (field) Regel 1, Regel 4

n. causative active accomplishment

Jason cut off the Medusa’s head with a knife.

(Jason) FORCE (knife) FORCE (head) BECOME be-off’ Regel 1, 2, 4

o.

Peter sent his brother to London

(Peter) FORCE (brother) BECOME be-at’ (London) Regel 1, 4, 5

p.

Peter sent his brother a letter

(Peter) FORCE (letter) BECOME be-at’ (brother) & (brother) BECOME have’ (letter) Regel 1, 4, 5

Diejenigen Phrasentypen, die hinsichtlich Proto-Rollen klassifiziert werden, werden auch

hinsichtlich Kausalstruktur klassifiziert. Dies sind alle nominalen Phrasen (inkl. PO),

ausgenommen echte Adjunkte (ADJ) und Prädikativa.

Zuletzt fehlen noch diejenigen Informationen, die nicht Teil des sprachlichen Zeichens sind,

d.h. die weder in der Form einer Äußerung vorhanden sind, noch kausal mit den inhaltlich-

semantischen Entailments eines Prädikats verbunden sind. Diese funktionalen Informationen

– so die These – helfen im Sprachverstehen dabei, formale und inhaltlich-semantische

Einheiten einander zuzuordnen.

38

Die diversen, in der Literatur vorgeschlagenen und unter verschiedenen Bezeichnungen

kursierenden „Belebtheits“hierarchien vereinen oftmals Einheiten, deren

Definitionsmerkmale entweder grammatische, semantische, diskurs-pragmatische,

informationsstrukturelle oder spezfizitätsbezogene sind. Stellvertretend sei hier diejenige von

Silverstein (1976) genannt: Personalpronomina der 1. und 2. Person > Personalpronomina der

3. Person > Eigennamen > menschliche Nomen > belebte Nomen > unbelebte Nomen >

zählbare Nomen > Kontinuativa > abstrakte Nomen. In dieser Form kann eine

„Belebtheits“hierarchie – zu verstehen als Chiffre für die verschiedenartigen Skalen – aber

keine Aufschlüsselung der formalen, inhaltlich-semantischen und funktionalen Beiträge zum

Sprachverstehen leisten. Aus diesem Grund muss die Belebtheitshierarchie bereits vor der

Analyse dekomponiert werden. Ihre Wortarteninformationen – eine formales Merkmal –

wurden daher bereits aus der Silverstein-Hierarchie extrahiert. Sie finden sich oben in diesem

Kapitel unter „grammatische Kategorie“.

• Informationen über die Person, speziell der Unterschied zwischen der ersten und

zweiten gegenüber der dritten Person können über den diskurs-pragmatischen

Unterschied zwischen Sprechaktpartizipanten (SAP) und Nicht-Sprachaktpartizipanten

rekonstruiert werden.

• Informationen über intrinsische semantische Merkmale der Einheiten bezüglich ihrer

Belebtheit im engeren Sinne des Ausdrucks lassen sich auf einer entsprechenden

39

semantischen Skala anordnen. (Zum Unterschied zwischen „inanimate object“ und

„location“ siehe „Proto-Locational“, Absatz (4).)

• Die sog. accessibility hierarchy erfasst keine der Einheiten der Silverstein-

Hierarchie. Dies leisten bereits die anderen drei Skalen und die grammatischen

Kategorien. Stattdessen ist sie in der Lage, die relative Akzessibilität der Einheiten der

Silverstein-Hierarchie z.T. zu motivieren. Warum sollte auch ein Proprium „belebter“

sein als ein Nomen, das einen Menschen bezeichnet? Die Antwort bildet das Konzept

der accessibility, d.h. etwa „Abrufbarkeit von Referenten nominaler Ausdrücke im

Diskurs aus verschiedenen Gedächtniskomponenten“. Die These ist, dass

Sprachen die Mittel konventionalisiert haben, anhand derer auf im Diskurs leicht

abrufbare, mittelschwer abrufbare und schwer abrufbare Referenten zugegriffen

werden kann. Diese Mittel bilden dabei nicht die accessibility selbst, sondern

markieren nur den Grad der Abrufbarkeit. Abrufbarkeit dagegen ist die Eigenschaft

von Referenten im Diskurs. Die Abrufbarkeitsmarker finden sich in der Skala und

können als Strategien des sprachlichen Referierens auf dinghafte Referenten im

Diskurs verstanden werden, relativ zu deren Akzessibilität. (Die folgende Abbildung

kombiniert Ideen aus Ariel 1988, 1991 und 2008.) Abweichend von Ariel rangiert am

linken Pol „indefinite description“. Diese Einheit dient für neue, in den Diskurs

eingeführte Referenten. Diese sind per definitionem nicht akzessibel.5

indefinite description > full name + modifier > full name > long definite description > short definite description > last name > first name > distal demonstrative (+ modifier) > proximal demonstrative (+ modifier) > distal demonstrative > proximal demonstrative > stressed pronouns > unstressed pronouns > clitic pronouns > verbal person > zeros

keine/geringe Akzessibilität hohe Akzessibilität

aus Langzeitgedächtnisabgerufen

aus Arbeitsgedächtnisabgerufen

A president > Joan Smith, the president > Joan Smith > The president of the United States > The president > Smith > Joan > That president > This president > That > This > SHE > she > herself > [nominate]s > 0

[Abbildung zur Erklärung; keine Kategorien + Ausprägungen]

5 „Short definite description“: Der Ausdruck enthält ein oder zwei Inhaltsswörter. „Long definite description“:

Der Ausdruck enthält drei oder mehr Inhaltswörter. Die nominalen Ausdrücke müssen jeweils definit sein.

Die Skala hat keine gesonderte Einheit für Varianten wie Joe, the janitor oder Smith, the president. Formal sind

diese Ausdrücke weniger akzessibel als sowohl „first names“ als auch „last names“, sind aber höhergradig

akzessibel als „full names“. Da sie nur zwei Inhaltswörter enthalten, wären sie also als „short definite

descriptions“ + zu klassifizieren.

40

a) Zählbarkeit und Individuiertheit können in einer vierten, einer Spezifizitäts-Skala,

kombiniert erfasst werden. Diese tragen auch zur Differenzierung der Semantik

vonzählbaren Nomen und Kontinuativa bei. Wichtig dabei ist Folgendes: Alle

Menschenhaben prinzipiell die gleichen Fähigkeiten, Entitäten in der Wahrnehmung

abzugrenzen (betrifft Individuiertheit) und gegebenenfalls zu zählen (betrifft

Zählbarkeit). Die sprachlichen Ausdrucksformen in verschiedenen Sprachen variieren

bei den Ausdrücken für bestimmte Entitäten darin, ob sie die Individuiertheit und

Zählbarkeit von bestimmten Entitäten fordern (die obige Fähigkeit muss aktualisiert

werden) oder nicht fordern (die obige Fähigkeit muss nicht aktualisiert werden). Die

wichtigsten Ausdrucksstrategien, die Individuierung und Zählen auf der Seite des

Interpreten fordern, sind Quantifizierer (alle, manche, wenige, viele, keine Steine),

Determinierer (*Wasser, das Wasser, Steine, die Steine), sowohl Sg.- als auch Pl.-

Formen für einen Ausdruck (Stein/Steine, *Wasser/Wasser), Klassifizierer (ein Bund

Petersilie, ein Glas Wasser). Die Anwesenheit von solchen Strategien bei einem

Ausdruck erzwingen auf der Seite eines Interpreten, sich die betreffenden Entitäten als

solche zu vergegenwärtigen, die er/sie zählen könnte. Die aktuelle oder systematische

Abwesenheit solcher Strategien (engl. information, russ. карто́шка ‚Kartoffeln

(koll.)‘) negieren nicht die Fähigkeit zur Abgrenzung und zum Zählen, sondern

erzwingen diese nicht vom Interpreten und lassen ihm/ihr in gewissem Maß offen, was

er/sie konzeptualisiert. Die Klassifikation von betreffenden Ausdrücken sollen sich

daher an den folgenden Leitfragen orientieren:

o bezüglich Individuiertheit: Wird die Entität sprachlich als individuiert oder

nicht individuiert konstruiert? Wenn ich die Äußerung interpretiere, bringt sie

mich dazu, mir ein abgegrenztes Objekt vorzustellen? (Wenn ja:

+individuiert.) Individuiertheit erfasst also die Opposition „1 vs. ¬1“;

o bezüglich Zählbarkeit: Gegeben die sprachliche Form, durch die die Entität im

Satzkontext ausgedrückt ist: Bringt sie mich dazu, dass ich mir sie als

abgegrenzte Menge von mehreren individuierten Objekten vorstelle (nicht

individuiert & zählbar) (z.B. Sie macht Peter viele Komplimente) oder bringt

sie mich dazu, dass ich mir eine nicht abgegrenzte Menge vorstelle, von der ich

nicht sagen kann, wieviel davon gegeben ist oder wie lange sie eine Rolle spielt

(nicht individuiert & nicht zählbar) (z.B. Er trinkt Bier.). Zählbarkeit erfasst

also die Opposition „Masse vs. abgegrenzte Menge“. Ein möglicher Test für

Zählbarkeit ist der folgende: Gegeben eine Äußerung mit einem hinsichtlich

41

Spezifizität problematischen Ausdruck, der ein nomen continuativum

enthält: Ändert sich Wahrheitsgehalt der Äußerung, wenn ich mir

vorstelle, dass ich den Referenten des Massennomens in der Mitte zerteile?

(Bsp.: Peter hat Salz über die Tischkante geschoben. Ich stelle mir vor, Peter

schiebt nur die Hälfte davon über die Tischkante. Ändert sich dann der

Wahrheitsgehalt der Äußerung? nein. Bsp.: Peter hat Maria viel Geld gegeben.

Ich stelle mir, vor, Peter gibt Maria nur die Hälfte des Geldes. Ändert sich dann

der Wahrheitsgehalt der Äußerung? ja, bzw. kann nicht ausgeschlossen

werden. Bsp.: Peter hat Maria Fahrräder geschenkt: Fahrräder kein

Massennomen/nomen continuativum, daher: Fahrräder nicht individuiert, aber

zählbar. Peter hat Maria Salz geschenkt: bei halber Menge Salz: trotzdem

gleicher Wahrheitsgehalt) Damit gilt: Veränderter Wahrheitsgehalt:

zählbar; Gleicher Wahrheitsgehalt: nicht zählbar.

o individuiert: trifft auf Entitäten zu, die in der Äußerung als einzelne,

abgrenzbare Objekte (nicht „mass“ auf der semantischen Skala) konstruiert

werden. Beispiele für individuierte Entitäten: Gib mir mal [individ.das Wasser].

Er hat ihr [individ.das Salz] gereicht. Er hat ihr [individ.die Information] gegeben,

dass… . Er hat ihr gesagt, [individ.dass er sie mag]. Godzilla hat [individ.die Stadt]

zerstört.

o nicht individuiert und zählbar: trifft auf eine Anzahl von Entitäten > 1 zu, die

aber dennoch Objektcharakter haben und abgrenzbar sind (nicht „mass“ auf

der semantischen Skala): Beispiele: Könnten sie uns [nicht individ.&zählb.ein paar

Bier] an den Tisch bringen. Er hat ihr [nicht individ.&zählb.so manches Buch]

geschenkt. Er hat ihr [nicht individ.&zählb.die Informationen] gegeben, dass… . Er

hat ihr [nicht individ.&zählb.eine Handvoll Kartoffeln] auf den Teller gelegt. Er hat

[nicht individ.&zählb.alle Murmeln] verschluckt.

o nicht individuiert und nicht zählbar: Gib mir mal [nicht individ.&¬zählb.Wasser]. Er

hat ihr [nicht individ.&¬zählb.Salz] gereicht. He gave her [nicht

individ.&¬zählb.information] about Paul. Sie ernten [nicht individ.&¬zählb.Kartoffeln].

Somit ist die sog. Belebtheitshierarchie domänenspezifisch dekomponiert. Alle später aus der

Datenbank abfragbaren Korrelationen „der“ Belebtheitshierarchie mit formalen und

inhaltlich-semantischen Merkmalen können damit auch auf die Einheiten der jeweiligen

Domänen-Skalen bezogen werden, was für die Überprüfung des Status der

„Belebtheits“hierarchie von entscheidender Bedeutung sein kann.

42

2.1.6 Satzgliedteil

Satzgliedteile werden innerhalb von (nominalen) Phrasen/Satzgliedern getaggt. Sie besitzen

den Status von Modifizierern. Sie können lediglich hinsichtlich zweier Aspekte für die

Klassifikation auf Phrasenebene relevant sein: erstens hinsichtlich der Frage, ob sie selbst

Verb-Komplement-Strukturen enthalten, die erfasst und klassifiziert werden müssen, nämlich

in dem Fall, dass sie VP- oder teilsatzwertig sind; zweitens sind Modifizierer von nominalen

Ausdrücken mit verantwortlich für deren Abrufbarkeitsgrad (s. accessibility hierarchy).

Letzteres erfordere keinerlei weitere Analysen. VP- oder Teilsatzwertigkeit erfordert eine

Binnenklassifizierung dieser VPs oder Teilsätze. Diese erfolgt genau wie die Klassifikation

einer VP mit Komplementstatus bzw. eines Teilsatzes (s. zusätzliche Parameter bei

„grammatische Kategorie“ in 2.1.5). In allen anderen Fällen sind Satzgliedteile auf Wort-

/Morphemebene zu klassifizieren.

2.1.7 Wort/Morphem

Diverse Gründe machen eine Klassifikation auf Wort- bzw. Morphemebene notwendig, z.B.

Person-, Numerus- oder Genusinformation für die Entstehung von Synkretismen, die Frage,

ob ein Verb finit oder infinit, aktiv oder passiv usw. ist. Die so erfassten Informationen

bewahren möglicherweise vor zu generellen Aussagen bei bestimmten Datenbankanfragen.

Die Wortartenklassifikation orientiert aus Gründen der Übersichtlichkeit an der folgenden

Klassifikation:

43

flektierbar¬flektierbar

Wort

konjugiert &¬dekliniert

deklinierbar

nominal modifizierend/determinierend

AdjektivPoss.pron.AdverbArtikelQuantifiziererDem.artikelKonjunktionKomplementierer

PartikelPerfektivpartikelReflexivpartikelKonjunktionNegationAdpositionExistenzpartikelPräverbVerbalpartikel

Vollverb_finLight Verb_finAuxiliar_finModalverb_finKopula_finVerb. subst._konj

konjugiert & dekliniert

Vollverb_nonfinLight Verb_nonfinAuxiliar_nonfinModalverb_nonfinKopula_nonfinVerbalnomen_dekl

AppellativumKontinuativumAbstraktumPropriumPronomenNota augensDem.pronomenRel.pronomenIndef.pronomenInterrog.pron.

......

...

...

...

Jedes Element, das auf Wortebene

segmentiert wurde und

klassifiziert werden soll, ist

zunächst prinzipiell entweder

flektierbar oder nicht

flektierbar. Wenn ersteres, ist es

möglicherweise konjugiert und

nicht dekliniert, d.h. es trägt eine

Konjugationsform (und sei es die

Nennform), in der es nicht

deklinierbar ist. Oder es ist

deklinierbar, d.h. nicht

konjugierbar. Wenn es deklinierbar

ist, ist es entweder nominal oder

modifizierend bzw. determinierend.

Oder es ist konjugiert und dekliniert

gleichzeitig, d.h. ein Element liegt in einer Konjugationsform vor, die deklinierbar ist und dekliniert ist (inkl. Nennform). Ist das zu klassifizierende

Element nicht flektierbar, wird es der Klasse der nicht flektierbaren Elemente zugeordnet.

Jede der vier Klassen – konjugiert und nicht dekliniert, deklinierbar, konjugiert und dekliniert, nicht flektierbar – hat genau wie das Wort in der

obigen Struktur eine komplexe, hierarchische Substruktur, die sozusagen die obige Verästelung fortsetzt. Dies ist durch „…“ angedeutet. Jedes auf

Wortebene zu klassifizierende Element wird auf jeder Hierarchieebene von „oben nach unten“ durchklassifiziert. Die folgenden Abbildungen führen

die obige Baumstruktur fort.

44

Person Modus TempusGenus/Diathese

KlasseKonjug.

123IcIImIIfIIImIIIf1 Rf2 Rf3 Rf

Num

SgDuPl

Ind.Konj.1Konj.2Opt.Imp.JussivPräkat.Energ.Subj.Prog.Infinit.Partizip

PräsensPräs. habit.PräteritumPast Imp.ImperfektImpfkt. subj.PerfektDopp-Perf.Plq.perf.FuturFutur IFutur IIPlq.prät.wa-yiqtolSuff-konjug.Präf-konjug.

AktivPassivAntipassivMittelReflexivImpersonal

Aspekt

...

konjugiert & ¬dekliniert

Wortart

Vollverb_finLight Verb_finAuxiliar_finModalverb_finKopula_finVerb. subst._konj

...

Formtyp 2

...

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

[sum-mativ]

[sum-mativ]

Formtyp 3

len. rel.nas. rel.n.b.n.a.n.n.a.

Die Abbildung führt unter den flektierbaren Elementen die konjugierten und nicht deklinierten fort. Das zu klassifizierende Element wird hier

ausführlich sub-klassifiziert und zwar hinsichtlich bestimmter Kategorien: Unter der Kategorie Wortart erscheinen hier naturgemäß verbale

Elemente. Die Kategorie Formtyp 2 betrifft ausschließlich das Aramäische. Dort kann ein verbales Element mit einem Zusatz versehen sein, dessen

45

Distributionsbedingungen geklärt werden sollen. Fürs Aramäische soll die Voreinstellung hier das

Nichtauftreten dieses Elements sein. Für alle anderen Sprachen wird die Voreinstellung „nicht applizierbar“

sein. Person umfasst alle möglichen Personen, die in der konkreten Form des Verbs (morphologisch)

ausgedrückt sein können. Die Kategorie Numerus betrifft alle möglichen Numeri, die durch eine konkrete

Verbform (morphologisch) ausgedrückt sein können. Die Kategorie Modus betrifft den formal (d.h.

morphologisch) markierten Modus der in Frage stehenden Form. Das gleiche gilt für Tempus und

Genus/Diathese.

Die Kategorie Klasse Konjugation enthält sprachspezifisch sortiert alle verbalen Stammklassen. Für

manche Sprachen besteht hier gegebenenfalls die Voreinstellung „nicht applizierbar“. In Sprachen, in

denen Aspekt grammatisch oder lexikalisch im Verb kodiert ist, stehen perfektiver, neutraler und

imperfektiver Aspekt mit evntl. weiteren

Ausprägungen zur Auswahl. Beispiele für

inchoativen, terminativen, punktellen und

durativen Aspekt sind erblühen, verblühen,

blitzen und blühen.

46

Die folgende Abbildung geht in der Baumstruktur wieder nach oben unter den „flektierbar“-Knoten und führt die deklinierbaren Elemente fort.

Als deklinierbar (und dabei nicht konjugierbar) sind hier nominale und modifizierende/determinierende Elemente bestimmt. Diese beiden Typen

von deklinierbaren Elementen teilen sich die meisten, aber nicht alle Kategorien, hinsichtlich derer sie spezifiziert werden müssen. Dies ist durch

die Überkreuzzuordnungen markiert. Streng genommen ersetzt die Abbildung zwei Abbildungen, jeweils eine für die beiden Subtypen der

Kategorie „deklinierbar“. Unter den Kategorien nominal < Wortart und modifzierend/determinierend < Wortart erscheinen konsequenterweise

47

KlasseDekl.

aôiuanônînrntWurz.stsw

Aram. Dt. Heth. Ir. Kymr. Pers.

r¬r

oā

ioiāiī

uDipht.Gutt.Dent.Nas.rsKons.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a. n.b.

n.a.n.n.a.

n.b.n.a.n.n.a.

aaiauei-subu-subi-adju-adjnntrr/nlstn.b.n.a.n.n.a.

nominale bzw. modifizierende und determinierende Wortarten. Definitheit betrifft den an dem/durch das nominale/n Element oder dem/das

determinierende/n / modifizierende/n

Element markierten Definitheitsstatus

des Elements. Die Form betrifft

bestimmte Merkmale bestimmter

nominaler und det./mod. Elemente,

vorrangig pronominaler. Vor allem

Letztere können frei oder gebunden

(klitisch) und wenn gebunden,

unterschiedlich affigiert auftreten. In

allen vier Eventualitäten können sie

jeweils einfach, betont, reduplizierend

oder konjunkt auftreten.Unter Lenition wird die Lenisierung von wort-initialen Konsonanten

erfasst, sofern sie syntaktisch oder semantisch relevante Distinktionen markiert. Für die

Klassifikation der Kasus gilt das gleiche wie für die Phrasen-/Satzglied-Klassifikation: Sie

betrifft Kasusformen und sofern möglich, sollen für einen gegebenen Ausdruck alle Kasuskategorien genannt werden, auf die die Form potentiell

zutrifft, d.h. unabhängig vom Syntagma. Die Kategorie Klasse Deklination enthält sprachspezifisch sortiert alle Stammklassen nominaler, det. u.

mod. Ausdrücke. Für manche Sprachen besteht hier gegebenenfalls die Voreinstellung „nicht applizierbar“. Für die Kategorien Person, Numerus

und Genus gilt im Prinzip das gleiche, was oben bereits gesagt wurde: Person umfasst alle möglichen Personen, die in der konkreten Form

ausgedrückt sein können. Die Kategorie Numerus betrifft alle möglichen Numeri, die durch eine konkrete Form ausgedrückt sein können. Die

Kategorie Genus betrifft alle möglichen Genera, die durch eine konkrete Form ausgedrückt sein können. Die Kategorie Komparation erfasst

schließlich die Steigerungsform, in der ein steigerbares Element auftritt.

48

Die folgende Abbildung geht in der Baumstruktur wieder nach oben unter den „flektierbar“-Knoten und führt die konjugierten und deklinierten

Elemente fort.

WortklasseV nonfin

Person Modus TempusGenus V./Diathese KlasseNum

SgDuPl

AktivPassivAntipassivMittelReflexivImpersonal

Aspekt

...

konjugiert & dekliniert

InfinitivSupineGerundGerundivPartizip

Kasus Genus

NomGenDatAkkVokAblInstrErgAllOblE-kasus

Mask.Fem.Neut.Ut.Comm.

Komparation

Pos.Komp.Superl.Äquat.

...

Wortart

Vollverb_nonfinLight Verb_nonfinAuxiliar_nonfinModalverb_nonfinKopula_nonfinVerbalnomen_dekl

123IcIImIIfIIImIIIf1 Rf2 Rf3 Rf

Ind.Konj.1Konj.2Opt.Imp.JussivPräkat.Energ.Subj.Prog.Infinit.Partizip

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

[sum-mativ]

[sum-mativ]

[sum-mativ]

PräsensPräs. habit.PräteritumPast Imp.ImperfektImpfkt. subj.PerfektDopp-Perf.Plq.perf.FuturFutur IFutur IIPlq.prät.wa-yiqtolSuff-konjug.Präf-konjug.

[sum-mativ]

49

¬flektierbar

Partikel Perfektivpartikel Reflexivpartikel Konjunktion Comp. Negation Adposition...

Existenz-partikel

Präverb n.b.n.a.n.n.a.

Verbal-partikel

Klasse

Konjug.

aôiuanônînrntWurz.stsw

Dekl.

Aram. Dt. Heth. Ir. Kymr. Pers. Aram. Dt. Heth. Ir. Kymr. Pers.

r¬r

aaiauei-subu-subi-adju-adjnntrr/nlst

neut.impf.

GDKtDtGtKGt(N)

stsw jsw ōsw ēPr-Präs.Suppl.

a(1)a(2)a(3)b(1)b(2)h(1)h(2)h(3)

oā

ioiāiī

uDipht.Gutt.Dent.Nas.rsKons.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a. n.b.

n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

In diese Klasse fallen alle Wörter, die einen verbalen

Stamm haben, die aber in einer nonfiniten (inkl.

Nennform) auftreten (Wortklasse V nonfin), die sie z.T.

deklinierbar machen. Charakteristikum dieser Wörter ist

damit, dass sie hinsichtlich Kategorien klassifiziert

werden müssen, die sich aus denen für konjugierbare

Ausdrücke und denen für deklinierbare Ausdrücke

zusammensetzen. Alle Kategorien wurden daher bereits

oben besprochen. Bezüglich der Kategorie „Klasse“, sei

angemerkt,

dass hier

vorsichtshalber sowohl die Konjugations- als auch die Deklinationsklassen aufgenommen sind.

Die Kategorie Aspekt wiederholt diejenige aus der Klasse der konjugierten und nicht deklinierten

Ausdrücke.

Schließlich gibt es noch die nicht

flektierbaren Wörter. Sie bilden

notwendigerweise eine

Restkategorie, deren Mitglieder

durch kaum ein Merkmal vereint

50

Adposition

Aram. Dt. Heth. Ir. Kymr. Pers.

ØʔytwtLytʕlʔl

durchbisfürohneentlanggegenumbeimitseitauszunach vonhinterannebenaufunter

bērōnparrōnbēdandarazabarfrāzpadīragjudabāzhandēmānērfrōddurcēwasnādandarciyōnnazd(īk)abarēdkaulparrōn

azōpadhambadīzpadisāyhammistrāytāabāgbēpas(īy)pēštar(ist)tārōnēnyāmayānpērāmōnazērmanāg

zwischenvorinübergegenüberinmittenringsumwegentrotzwährendgemäßaußerhalbum … herumaußer

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

n.b.n.a.n.n.a.

...

n.b.n.a.n.n.a.

anda andan Appanarha handas istarna iwar katta kattan man mahhan para pariyanparranda peran sara ser tapusza

...

...

werden. Die „Töchter“ des „nicht flektierbar“-Knotens sind daher auch die Wortarten selbst.

Mit Konjunktion sind

logische Junktoren

gemeint wie und oder

oder, für die gilt: „Wenn

a Konjunktion b, dann b

Konjunktion a. Dies gilt

nicht für „Comps“ (=

Komplementierer), die

asymmetrisch

„jungieren“ und

meistens Hauptsätze mit

Nebensätzen, die sie

meistens einleiten. Weil

Präpositionen noch

einmal bezüglich des

Syntax/Semantik-

Linkings eine

herausgehobene

Stellung einnehmen, werden diese gesondert erfasst, nach Sprachen und nach Präpositionstypen geordnet (hier: Auszug).

51

II Anwendung

Die Anwendung erfolgt über den REDE-Server: www.regionalsprache.de

Das Datenbanktool ist hier erreichbar: http://www.regionalsprache.de/loewe/main.aspx

Teil I hat in die Konzeption und Funktionsweise von ReffMech eingeführt, die

sprachübergreifenden Kategorien mit ihren Ausprägungen charakterisiert sowie die

sprachspezifischen Ausprägungen differenziert. Teil II nähert sich der Anwendung des

Konzepts. Diese umfasst alle Aktivitäten von der Entscheidung für eine gegebene Quelle bis

zur vollständigen Klassifikation eines Textes und der Form von möglichen anschließenden

Suchanfragen. Kapitel 3 und 4 stellen diese Aktivitäten aus genereller Perspektive und in

chronologischer Reihenfolge ihrer praktischen Durchführung dar. Kapitel 5 zeigt, wie die

Anwendung des Konzepts technisch umgesetzt ist und Kapitel 6 erläutert die Funktionsweise

von Suchanfragen.

3 Eingabe, Bearbeitung, Segmentierung & Klassifikation

Es gibt vier Typen von Arbeitsschritten.

1. Die Eingabe von Informationen zur Quelle/zum Text,

2. die Segmentierung von Textmaterial in Einheiten verschiedener Größe,

3. die Bearbeitung segmentierten Materials für die folgende Klassifikation und

4. die Klassifikation der zuvor segmentierten Einheiten.

Die Schritte (s. Graphik) von der Klassifikation des Textes bis (einschließlich) zur

Segmentierung in Clauses erfolgt immer zuerst und immer gleich. Nachdem der Text

klassifiziert, das Original des Textes und eine Übersetzung (optional) eingegeben wurde, kann

der Originaltext bearbeitet werden (s.u.). Anschließend werden Sätze getaggt, d.h.

segmentiert. Ist dies geschehen, muss man zunächst Teilsätze segmentieren und

klassifizieren.6 Danach können wahlweise Phrasen oder Wörter segmentiert und klassifiziert

werden.

6 Die Datenbank macht derzeit Fehler, wenn man Clauses nach Wörtern segmentiert. Das kann zum Löschen

der Wörter führen. Die Fehlerbehebung ist in Arbeit.

52

SatzSegmentierung

Text*Klassifikation

Text*Eingabe Original

Text*Eingabe Übersetzung (optional)

Text*Bearbeitung (optional)

Wort/MorphemSegmentierung

TeilsatzKlassifizierung

Phrase/SatzgliedSegmentierung

Phrase/SatzgliedKlassifizierung

Wort/MorphemKlassifizierung

TeilsatzSegmentierung

Die verschiedenen Beschreibungsebenen

sind dabei die syntaktischen

Größeneinheiten, wie sie in Kap. 2.1.1 bis

2.1.6 besprochen wurden. Die einzige

Ebene, die bereits „vorsegmentiert“ (daher

*), ist diejenige des ediert oder anders

vorliegenden Texts, da die äußeren Grenzen

des Textes unabhängig von (unseren)

linguistischen Eingriffen bereits bestehen.

Alle anderen syntaktischen Ebenen müssen –

mehr oder weniger überlappend mit der

vorliegenden Form der Texte – erst

„hergestellt“ werden.

3.1 Prozedere: einfaches Beispiel

Der Satz lautet: und hɜn gsagt, miɐ sollə də koffɐ nur nicht zuschickə oder dabhaltə.

53

Nachdem man bestätigt hat, einen Text bearbeiten zu wollen, gelangt man zur

Quellenauswahl. Als Quelle stehen die unter der Text-Ebene präsentierten Einheiten zur

Auswahl. Bei „Name/ID“ ist zu beachten, dass Texte in Einheiten zerteilt werden können.

Dafür muss hinter die ID des Textes eine Sigle angehängt werden. Lautet die ID eines Textes

z.B. ZWN76 und soll dieser Text in fünf Schritten bearbeitet (segmentiert & klassifiziert)

werden, müssen die IDs ZWN76_t1 bis ZWN76_t5 heißen. Es ist möglich, die fünf Teile

nachträglich zu einer Datei ZWN76 zusammenzufügen. Weitere Autographien und Editionen

können hinzugefügt werden. Nach Speichern geht’s weiter.

54

Der nächste Schritt ist, Sprache, Sprachstufe, Sprachstufe II (diachron) und Dialekt

auszuwählen.

Mit Speichern geht’s weiter.

Als nächstes können genaue Angaben zu Informanten gemacht werden, falls vorhanden.

Falls nicht kann es ohne Speichern weiter gehen. Falls Informationen zu Informanten

angegeben werden, unbedingt Speichern wählen!

Nun kann die Textsorte angegeben werden. Dies ist ein Textfeld. Textsortenbezeichnungen

sollten arbeitsgruppenintern abgesprochen werden.

55

Mit Speichern geht’s weiter.

Nun kann es an die Bearbeitung und Auswertung der Sprachdaten gehen. Zunächst kann

die Originalfassung des Textes eingegeben oder in das Texfeld kopiert werden. Das kann

der Text einer Edition sein, eine unbearbeitete Quelle, Transkripte von Sprachdaten oder

Ähnliches. Dieser Text ist wohl derjenige, auf den sich die zuvor eingegebene

bibliographische Angabe sowie Name/ID des Textes beziehen. Behalten Sie den Text in einer

Zwischenablage. Er muss im übernächsten Schritt noch einmal eingefügt werden.

Die Originalfassung wird dann gespeichert.

56

Im folgenden Schritt (hier nicht abgebildet) besteht die Möglichkeit, eine Übersetzung des

Textes zu speichern.

Die Originalfassung ist in den allermeisten Fällen für die Auswertung ungeeignet. Daher muss

sie bearbeitet werden, um sie für die Segmentierung und Klassifikation vorbereitet werden.

Dies kann im Schritt „Text editieren“ erfolgen. Die Bearbeitung besteht prinzipiell aus a)

Hinzufügungen und b) Tilgungen. Hinzugefügt werden können Nullelemente („ø“) und

57

Sternchen („*“) (s.u.), getilgt werden können Textsegmente, die überflüssig sind und die

Daten für die jeweiligen Zwecke nicht verfremden (d.h. die Entfernung von Material darf

nicht dazu führen, dass etwas vom übrigen Material anders klassifiziert würde als im Fall der

Anwesenheit des getilgten Materials). Zu beachten ist, dass die Bearbeitung des Materials –

wenn nicht hier – auch auf Clause-Ebene erfolgen kann. Letzteres ist zu empfehlen, daher

bleibt im obigen Screenshot das Material unbearbeitet.

Exkurs: Zur Bearbeitung des Textmaterials

Alle Regeln in Kurzform:

Die Bearbeitung findet idealiter anhand der „Erweiterungen hinzufügen“-Funktion beim

Arbeitsschritt „Taggen der Clauses“ statt.

1. Nullelemente können an eine beliebige Stelle im Clause gesetzt werden (aber später als

synt. Funktion „_ ø“ klassifizieren!)

2. Platzhalter für abhängige Clauses werden immer unmittelbar vor dem ersten Element des

abhängigen Clauses eingefügt.

3. Wenn durch das Hinzufügen von „*“ diskontinuierliche Clauses oder Phrasen entstehen,

muss man diese mit der Tag+Connect-Funktion auf Clause- bzw. Phrasenebene

zusammenführen.

Allgemeines zur Bearbeitung des Textmaterials

1. Phonetisch/graphisch im Quellentext nicht realisierte, aber für den Forschungszweck

dennoch wichtige Elemente können mit dem Symbol „ø“ in den Text eingefügt werden, z.B.

gedroppte Subjekte, etwa bei Imperativen und Pro-drop, oder die Agens-Phrase im Passiv.

Das Einfügen von Nullelementen hat zwei wichtige Konsequenzen:

(a) Steht das Nullelement für eine Konstituente/ein Satzglied, ist bei der Klassifikation

seiner syntaktischen Funktion die Variante mit „_ø“ zu wählen (z.B. SUB_ ø). (Das ist

deshalb wichtig, da nicht realisierte Elemente streng genommen auch keine Position in

einem Satz haben. Um später die relativen Positionen von Elementen zueinander

abfragen zu können, muss man die Nullelemente von den phonetisch/graphisch

realisierten Elementen unterscheiden. Eine Abfrage über relative Positionen von

Elementen zueinander muss eine Abfrage über SUB, V, DO etc. sein. SUB_ ø, V_ ø,

DO_ ø etc. müssen in solchen Anfragen ausgelassen werden.)

b) Die zweite Konsequenz ist, dass auf der Wortebene diese Elemente nicht als Wörter

erkannt und mitgezählt werden.

58

2. Für Clauses, die von anderen Clauses oder von Elementen in einem anderen Clause

abhängig sind, müssen Platzhalter eingefügt werden: das Symbol „*“. Der Grund dafür ist,

dass man einen Clause nicht zugleich als syntaktische Funktion innerhalb eines

übergeordneten/gleichgeordneten Matrixsatz klassifizieren und ihn selbst in Satzglieder

zerlegen kann. Wenn aber ein Platzhalter „*“ eingefügt wird, kann dieser stellvertretend die

syntaktische Funktion des infragestehenden Clauses in einem weiteren Clause repräsentieren.

Der eigentliche (abhängige) Clause kann so auch weiter zerlegt und selbst in

Satzglieder/Phrasen zerlegt werden.

a) Clauses sind von anderen Clauses abhängig, wenn sie in einem

übergeordneten/gleichgeordneten Clause eine Satzgliedfunktion einnehmen ([SUBDass

Grammatik kompliziert ist,] weiß jeder; Klaus kommt nicht, [ADJdenn er hat den Zug

nicht bekommen]). Das Sternchen „*“ (Setzungsregeln s.u.) ist Platzhalter für den

abhängigen Clause im unabhängigen Clause und wird wie jedes andere Satzglied auch

klassifiziert.

b) Clauses können aber von Elementen in einem anderen Clause abhängig sein, ohne dort

eine Satzgliedfunktion einzunehmen. Sie fungieren dann nur als Satzgliedteile

([SUBPeter, [der gerne trinkt,]] wird dann unausstehlich; [SUBDer Professor (wurde

verurteilt,) [dem unlautere Methoden vorgeworfen wurden]].

Zur Setzung von „ø“ und „*“ bei der Bearbeitung

1. Nullelemente („ø“)

Die Regel zur Setzung der Nullelemente ist denkbar einfach: Setze es irgendwo in den Clause.

(Es bietet sich natürlich aus Nachvollziehbarkeitsgründen an, es an eine Stelle zu setzen, an

der man das Element tatsächlich erwarten würde, wäre es realisiert. Dies gilt insbesondere

dann, wenn mehr als ein Nullelement in einen Clause eingefügt werden muss.)

Das folgende Beispiel dient zur Illustration.

59

Die Originalfassung wurde gespeichert und die Arbeitsschritte des Übersetzung Einfügens

und Text Editierens (durch Speichern) übersprungen. Nun gelangt man zum Schritt „Taggen

der Sätze“. Dort setzt man die Tag-Zeichen und betätigt „Speichern -> Clauses taggen“.

Irgendwann gelangt man zum Arbeitsschritt „Taggen der Clauses“ von „Und dann ist viel

gesungen worden“. Hier können nun die Editierungs-Schritte ausgeführt werden, die anfangs

übersprungen wurden. Es soll eine Nullstelle für die Agensphrase des Passivs eingefügt.

60

werden. Dafür setzt man „ø“ an eine beliebige Stelle, z.B. diejenige, an der man das Element

tatsächlich erwarten würde.

Anschließend betätigt man „Erweiterungen hinzufügen“. Das System speichert die

Änderungen (gesondert vom „Originaltext“).

Nun setzt man die Tag-Zeichen (falls nötig) und betätigt „Clause taggen“.

61

Irgendwann wird man auf der Phrasenebene zum Taggen und zur Klassifikation von „ø“

gelangen. Wichtig ist hier, dem Element eine syntaktische Funktion mit dem Suffix „_ø“

zuzuweisen. Dann können dem Element keine formseitigen oder Positionseigenschaften

zugewiesen werden außer der Tatsache, dass es phonetisch/graphisch „null“ ist. (Die Abfrage

von relativen Abfolgen darf später nur solche syntaktischen Funktionen einbeziehen, die das

Suffix „_ø“ nicht besitzen! Das ist auch der Grund, aus dem die Nullelemente an eine

beliebige Stelle gesetzt werden können.)

2. Platzhalter („*“)

Das Sternchen ist der Platzhalter für einen abhängigen Clause in der Funktion, die er in dem

entsprechenden nichtabhängigen Clause einnimmt. Die Regel zur Setzung ist ebenfalls sehr

einfach: Setze das „*“ immer unmittelbar vor das erste Element des abhängigen Clauses.

Es folgen drei Illustrationen

1. abhängiger Clause nach nichtabhängigem Clause

2. abhängiger Clause vor nichtabhängigem Clause

3. abhängiger Attribut-Clause adjazent zu Kopf-Konstituente

4. abhängier Attribut-Clause nichtadjazent zu Kopf-Konstituente

1. abhängiger Clause nach nichtabhängigem Clause

62

Der Originaltext lautet: … ist traurig. Peter weint, weil Sandra ihn verlassen hat. Er ist

aber…. Wir springen zum Schritt „Taggen der Sätze“ und setzen dort die Tag-Zeichen.

Weiter mit „Speichern -> Clauses taggen“. Angelangt beim kritischen Satz (Peter weint…)

müssen wir nun Erweiterungen einfügen, d.h. hier den Platzhalter für den Nebensatz nach der

Regel: unmittelbar vor das erste Element des abhängigen Clause. Danach „Erweiterungen

hinzufügen“.

63

Nun werden Tag-Zeichen gesetzt, und zwar zwischen das „*“ und das erste Element des

abhängigen Clause. (Damit sagt man der Datenbank, dass das Sternchen mit den Elementen

Peter weint, einen Clause bildet.)

Weiter mit „Clause taggen“.

Auf Phrasenebene muss „*“ natürlich als Satzglied/Phrase getaggt werden. Gelangt man zu

seiner Klassifikation, kann man es nun als Adjunkt mit der Kategorie S(atz) im Mittelfeld

klassifizieren.

64

2. abhängiger Clause vor nichtabhängigem Clause

Der Originaltext lautet: … ist traurig. Weil Sandra ihn verlassen hat, weint Peter. Er ist

aber…. Wir springen zum Schritt „Taggen der Sätze“ und setzen dort die Tag-Zeichen.

Weiter mit „Speichern -> Clauses taggen“. Angelangt beim kritischen Satz (Weil Sandra

ihn…) müssen wir nun Erweiterungen einfügen, d.h. hier den Platzhalter für den Nebensatz

65

nach der Regel: unmittelbar vor das erste Element des abhängigen Clause. Danach

„Erweiterungen hinzufügen“.

Nun werden Tag-Zeichen gesetzt. Hier ist zu beachten, dass die Datenbank nun wissen muss,

welche Elemente zu welchem Clause gehören. „*“ gehört zum Clause weint Peter. Der

Nebensatz steht zwischen beiden. Wir haben es also mit einem diskontinuierlichen

nichtabhängigen Clause zu tun. Es müssen also zwei Tag-Zeichen gesetzt werden, (wieder)

eines zwischen das Sternchen und das erste Element des abhängigen Clause und eines

zwischen das letzte Element des abhängigen Clause und den darauf folgenden Teil des

nichtabhängigen Clause.

66

Nun muss man der Datenbank sagen, dass „*“ und weint Peter. einen Clause bilden. Dazu

dient die „Tag+Connect“-Funktion.

Hier weist man „*“ die gleiche Partner-ID zu wie weint Peter. Klick auf „Aktualisieren“

(wichtig!) und auf „Fertig“.

67

Fertig ist der (diskontinuierliche) Clause. Auf Phrasenebene läuft es weiter wie bei Beispiel 1.

3. abhängiger Attribut-Clause adjazent zu Kopf-Konstituente

Der Originaltext lautet: … ist traurig. Peter, der notorischer Fremdgänger ist, ist traurig. Er

ist aber…. Wir springen zum Schritt „Taggen der Sätze“ und setzen dort die Tag-Zeichen.

68

Weiter mit „Speichern -> Clauses taggen“. Angelangt beim kritischen Satz (Peter, der…)

müssen wir nun Erweiterungen einfügen, d.h. hier den Platzhalter für den Nebensatz nach der

Regel: unmittelbar vor das erste Element des abhängigen Clause. Danach „Erweiterungen

hinzufügen“.

Nun werden Tag-Zeichen gesetzt. Hier ist wieder zu beachten, dass die Datenbank nun wissen

muss, welche Elemente zu welchem Clause gehören. „*“ gehört zum Clause Peter,… ist

traurig, denn es zeigt dort an, dass Peter attributiv erweitert und eine „schwere“ NP ist. Wir

haben es also wieder mit einem diskontinuierlichen nichtabhängigen Clause zu tun. Es

müssen also zwei Tag-Zeichen gesetzt werden, (wieder) eines zwischen das Sternchen und

das erste Element des abhängigen Clause und eines zwischen das letzte Element des

abhängigen Clause und den darauf folgenden Teil des nichtabhängigen Clause.

69

Nun muss man der Datenbank sagen, dass Peter, * und ist traurig. einen Clause bilden. Dazu

dient die „Tag+Connect“-Funktion. Peter, * erhält die gleiche Partner-ID wie ist traurig.

„Aktualisieren“ und dann „Fertig“.

Das Resultat ist die Zusammenführung der beiden Hauptsatzbestandteile.

70

Auf Phrasenebene ist nun zu beachten, dass „*“ keinen Satzgliedstatus hat, sondern nur

zusammen mit Peter eine Konstituente bildet.

Beim Klassifizieren der Phrase äußert sich dies nur bei zwei Kategorien: „Kategorie-

Ausprägung“ und „Skala inf.strukt.“.

71

4. abhängier Attribut-Clause nichtadjazent zu Kopf-Konstituente

Der Originaltext lautet: … durchaus perfide. Der Professor war anwesend, der seine Daten

gefälscht hatte. Er musste…. Wir springen zum Schritt „Taggen der Sätze“ und setzen dort die

Tag-Zeichen.

72

Weiter mit „Speichern -> Clauses taggen“. Angelangt beim kritischen Satz (Der Professor

war…) müssen wir nun Erweiterungen einfügen, d.h. hier den Platzhalter für den Nebensatz

nach der Regel: unmittelbar vor das erste Element des abhängigen Clause. Danach

„Erweiterungen hinzufügen“.

Nun werden Tag-Zeichen gesetzt. Hier ist wieder zu beachten, dass die Datenbank nun wissen

muss, welche Elemente zu welchem Clause gehören. Das ist hier einfach, denn bis

einschließlich „*“ handelt es sich um einen Clause, danach um einen weiteren. Das Tag-

Zeichen kommt daher (wieder) zwischen das letzte Element des einen Clause und das erste

Element des anderen Clause.

73

Weiter mit „Clause taggen“. Der resultierende (unahbängige) Clause ist Der Professor war

anwesend, *. Wenn wir auf Phrasenebene fortfahren und diesen Clause in Phrasen

segmentieren, sieht das so aus:

Hier fällt jetzt natürlich auf, dass „*“ kein Satzglied/keine Phrase ist, sondern nur zusammen

mit Der Professor ein(e) solche(s) bilden kann. Das bedeutet, hier haben wir nun eine

Diskontinuität auf Phrasenebene. Wieder muss die Datenbank wissen, welche Elemente zu

74

einer Phrase/einem Satzglied gehören. Auch hier hilft die Tag+Connect-Funktion. Wir

müssen Der Professor die gleiche ID geben wie „*“.

Das Resultat ist eine (diskontinuierliche) Phrase Der Professor … *, die man als „schwere“

Konstituente wie in Bsp. 3 klassifizieren kann.

Simple Beispiele in Kurzform

Nebensatz:

Text: Peter schimpft Maria, weil sie immer zu spät kommt. Das gefällt Maria nicht.

Sätze taggen: Peter schimpft Maria, weil sie immer zu spät kommt. #Das gefällt Maria nicht.

Bearbeitung: Peter schimpft Maria, *weil sie immer zu spät kommt.

Clauses taggen: Peter schimpft Maria, *#weil sie immer zu spät kommt.

Phrasenebene, 1. clause: Peter: SUB; schimpft: V; Maria: DO; *: Adjunkt

Phrasenebene, 2. clause: weil: Konj; sie: SUB; immer: Adjunkt; zu spät: Adjunkt; kommt: V.

Nebensatz:

Text: Peter schimpft Maria, weil sie immer zu spät kommt und weil sie seine Brillle kaputt machte.

Sätze taggen: Peter schimpft Maria, weil sie immer zu spät kommt und weil sie seine Brille kaputt machte. Das

gefällt Maria nicht.

Bearbeitung: Peter schimpft Maria, *weil sie immer zu spät kommt und *weil sie seine Brille kaputt machte. Das

gefällt Maria nicht.

Clauses taggen: Peter schimpft Maria, *#weil sie immer zu spät kommt #und *#weil sie seine Brille kaputt

machte.

75

Tag + Connect: [Peter schimpft Maria, *] + [und *]

Phrasenebene, 1. clause: Peter: SUB; schimpft: V; Maria: DO; *: Adjunkt; und: Konj; *: Adjunkt

Phrasenebene, 2. clause: weil: Konj; sie: SUB; immer: Adjunkt; zu spät: Adjunkt; kommt: V.

Phrasenebene, 3. clause: usw...

Attributsatz:

Text: Peter, der gestern besoffen war, ist heute schon wieder besoffen. Das gefällt ihm.

Sätze taggen: Peter, der gestern besoffen war, ist heute schon wieder besoffen. #Das gefällt ihm.

Bearbeitung: Peter, *der gestern besoffen war, ist heute schon wieder besoffen.

Clauses taggen: Peter, *#der gestern besoffen war #ist heute schon wieder besoffen.

Tag + connect: [Peter, *] & [ist heute schon wieder besoffen]:

Phrasenebene, 1. clause: Peter *,: SUB; ist: AUX; heute: Adjunkt usw. ...

Phrasenebene, 2. clause: der: SUB; gestern: Adjunkt; usw. ...

Bsp. 4. Aramäische Partizipial-Clauses:

Text: Peter, dem Lande Licht bringend, sprang aus dem Fenster.

Bearbeitung: Peter, * dem Lande Licht bringendø, sprang aus dem Fenster. Das gefällt uns nicht.

Sätze taggen: Peter, * dem Lande Licht bringendø, sprang aus dem Fenster. #Das gefällt uns nicht.

Clauses taggen: Peter *, #dem Lande Licht bringendø, #sprang aus dem Fenster.

Tag + connect: [Peter,] * + [sprang aus dem Fenster.]:

Phrasenebene, 1. clause: Peter *,: SUB; sprang: V; aus dem Fenster: PO

Phrasenebene, 2. clause: dem Lande # Licht# bringend#ø

dem Lande: IO; Licht: DO; bringend: V; ø: LSUB

Exkurs Ende

Wurden Bearbeitungen vorgenommen, geht es weiter mit „Editierten Text speichern“. Der

nächste Schritt ist, Sätze zu segmentieren/taggen mithilfe des Einfügens von Tag-Zeichen

(#).

76

• Abgesehen von „#“ darf nichts mehr am Text hinzugefügt, verschoben oder getilgt

werden (auch keine Leerzeichen).

• Weder das erste noch das letzte Zeichen im Textfeld dürfen Tag-Zeichen sein. Nur

zwischen Sätze werden sie gesetzt.

• Das Tag-Zeichen wird immer direkt vor ein Segment gesetzt (Peter schläft. #Maria

tanzt.)

Im Screenshot befindet sich nur ein Satz, daher werden keine Tag-Zeichen gesetzt. Weiter

geht’s mit „Speichern → Clauses taggen“ (Wörter sollen hier später getaggt werden.)

Nun werden also Teilsätze/Clauses segmentiert. Zuvor soll aber die Bearbeitung des

Textmaterials vorgenommen werden. Dafür steht die Funktion „Erweiterungen hinzufügen“

zur Verfügung. Zuerst müssen Elemente hinzugefügt oder getilgt werden (s.o.). Im Screenshot

wurden einige Symbole hinzugefügt: Das erste „ø“ steht für ein ausgelassenes Subjekt aus

dem vorangegangenen Satz (nicht abgebildet). Die anderen „ø“ sind durch eine koordinierte

Struktur mit Auslassung motiviert. Sie stehen für [miɐ] [sollə] [də koffɐ] [nur nicht]. Das „*“-

Symbol ist der Platzhalter für einen Nebensatz ohne einleitende Konjunktion, der mit miɐ

beginnt, vor das daher der Platzhalter eingefügt wird. (Wenn der Satz uninteressant ist oder

aus anderen Gründen gar nicht bearbeitet werden soll, kann man mit „nächster Satz“ auch

einfach zum nächsten Satz übergehen.)

77

Mit „Erweiterungen hinzufügen“ werden die Änderungen in die Datenbank geschrieben.

Anschließend (!) werden Tag-Zeichen für Teilsätze gesetzt, d.h. im Screenshot hinter „*“.

Mit „Clause taggen“ wird die Segmentierung übernommen. Im nächsten Schritt kann der

Clause in weitere Clauses zerlegt werden oder man kann auf Phrasen-Ebene weitermachen.

Hier steht Letzteres an. Daher geht es mit „Phrasen Modus“ weiter.

Beim Taggen von Phrasen müssen zunächst die Tag-Zeichen gesetzt werden.

78

Dies muss mit „Phrasen taggen“ bestätigt werden. Es geht dann mit der Klassifikation der

soeben getaggten Phrasen weiter. Im Screenshot ist dies beispielhaft für die „leere“

Konstituente gezeigt. (Die „*“-Konstituente würde als O mit Kategorie S klassifiziert

werden.)

Sind alle Phrasen eines Clauses klassifiziert, muss der Clause selbst noch klassifiziert werden.

79

Nach dem Speichern gelangt man so in den nächsten Clause und das Prozedere beginnt von

Neuem.

3.2 Prozedere: weiteres Beispiel

Das folgende Beispiel ist auch in der Datenbank einsehbar, indem man nach Textsorte

„Lexikoneintrag“ sucht. Auch die einzelnen Phrasen wurden klassifiziert. Der Satz lautet:

Ausgehend von dieser Datenbasis stellt sich für die zeitliche Dimension des Klimabegriffs die

Frage, wie wechselhaft das Wetter ist, und welche Schwankungen daher die meteorologischen

Größen aufweisen, welche das Wetter hinreichend beschreiben.

80

Sätze taggen

Erweiterungen hinzufügen und Clauses taggen

81

Phrasen taggen

Clause klassifizieren

82

Phrasen taggen


83

Erweiterungen hinzufügen und Clauses taggen

Phrasen taggen

84


Clauses taggen

85

Phrasen taggen


86

Phrasen taggen


87

Clause klassifizieren (Datenbankleiche)

3.3 FAQs:

1. Relativpronomen, -partikel

• Fehlende relativsatzeinleitende Konjunktionen werden nicht ergänzt.

• Bei dem, was in einem gegebenen Relativsatz realisiert ist, muss unterschieden

werden zwischen

o Relativpartikeln: Sie besitzen keinen Komplementstatus, sind nicht referentiell

und flektieren i.d.R. nicht. Sie können als KONJ getaggt werden; und

o Relativpronomen: Sie besitzen Komplementstatus, sind referentiell und können

flektieren, je nach der syntaktischen Funktion, die sie einnehmen.

2. „Erweiterungen hinzufügen“

• Diese Funktion kann angewendet werden, um Erweiterungen hinzuzufügen, die für die

Eingabe, Segmentierung und Klassifikation von Clauses nötig sind. Die „Erweiterung“

kann dabei durch Hinzufügungen oder Tilgungen von Material oder durch die

Hinzufügung von „*“ und „Ø“ realisiert werden. Der Vorteil, die letztgenannten

Elemente bei diesem Arbeitsschritt hinzuzufügen, liegt darin, dass sie dann nicht mehr

88

Merkmale des Texts sind, sondern der jeweiligen Clauses. Sätze bzw. Clauses, die

nicht klassifiziert werden sollen, aber als Bestandteil eines kohärenten Textes

miterfasst werden sollen, sind so in der Datenbank, müssen aber nicht

bearbeitet/editiert werden.

3. Koordinationen

• Koordinierte Verben (Prädikate) werden in zwei Verb-Komplement-Strukturen zerlegt

und als zwei V-Komp-Strukturen analysiert: Peter schreit und heult. → Peter schreit

und Ø heult → Peter schreit #und Ø heult.

• Koordinierte nominale Elemente zu einem Verb brauchen, wenn sie gleiche

referentielle Merkmale haben, nicht aufgelöst zu werden: Peter und Maria schreien.

→ [SUB Peter und Maria] schreien.

• Koordinierte nominale Elemente zu einem Verb müssen zerlegt und als zwei Verb-

Komplement-Strukturen analysiert werden, wenn sie ungleiche referentielle Merkmale

haben: Ich mag Peter und seine Verwandtschaft nicht. → Ich mag Peter Ø[nicht] #und

Ø[ich] Ø[mag] seine Verwandtschaft nicht. (Dieser Satz ist zudem strukturell ambig:

Ich mag Peter. Ich mag seine Verwandtschaft nicht. vs. Ich mag Peter nicht. Ich mag

seine Verwandtschaft nicht.)

5. Infinitivsätze

• werden bei der Textbearbeitung und bei der Klassifikation behandelt wie Nebensätze.

(Grund: Sie bilden eigenständige Verb-Komplement-Strukturen.)

3.4 Prozedere: sprachspezifisch

3.4.1 Richtlinien für die Textbearbeitung: TP 6

1. Wie verfahren wir damit, dass die Zwirner-Transkripte standardsprachliche Varianten

des Dialektmaterials der Aufnahmen sind?

Die Transkripte werden (etwa ausschnittsweise) in ein Word-Dokument kopiert. Der

bearbeitete Text kann dann beim enstprechenden Arbeitsschritt in die Datenbank

kopiert werden. Das Zwirner-Transkript ist nicht nur das Original des bearbeiteten

Dokuments, sondern soll auch als Übersetzung in der Datenbank gespeichert werden.

Die Aufnahme muss dann mit dem Transkripttext abgeglichen werden. Dabei müssen

Korrekturen im Text dann vorgenommen werden, wenn sie für unsere übergeordnete

89

Fragestellung relevant sind bzw. wenn sie relevant hinsichtlich einer oder mehrerer

der Kategorien sind, bezüglich derer wir unsere Daten klassifizieren. Die Korrekturen

werden anhand des SAMPA-Zeichensatzes vorgenommen:

http://www.phon.ucl.ac.uk/home/sampa/german.htm

Es müssen transkribiert werden

- alle Suppletivformen (vollständig),

- die Flexionsmorphologie von

- Substantiven (Stammvokale und Endungen),

- Adjektiven (Endungen),

- Determinierern (komplett. Nur fürs Alemannische (!) wird nicht zw. stimmhaft und

stimmlos unterschieden, d.h. Dentale der Artikel werden bei den alemannischen

Transkriptionen immer als <d> wiedergegeben.),

- Verben (Stammvokale und Endungen – aber nur grob, um die Formen des

Paradigmas auseinander halten zu können. Dialektgrammatiken können konsultiert

werden.),

- Präpositionen (grob; wichtig für Kasus und ggf. Artikel und weil oft andere Typen

als in der Standardsprache),

- Präfixe (werden nur korrigiert, wenn die falschen Typen (z.B. <auf> anstatt <ab>) in

der Zwirner-Transkription vorliegen. <ge> ignorieren wir.)

- Lexeme, die von der Standardsprache abweichen, sollen transkribiert werden.

(Zwirner-Transkripte nicht immer zuverlässig.)

Weitere Richtlinien, die Form betreffend:

- Die Großschreibung muss in Kleinschreibung geändert werden, da große lat.

Buchstaben phonetische Implikationen in SAMPA haben. (Großschreibung, wenn von

SAMPA gefordert.)

- silbische Segmente wie [n], [l] etc. wird wie in Sampa vorgesehen von uns als <=n>,

<=l> etc. transkribiert.

- Bei Unsicherheiten bezüglich der Transkription können die entsprechenden Stellen

mit “[ ]” markiert werden. Die Klammern müssen allerdings entfernt werden, bevor

der Text in die Datenbank eingespeist wird.

Was nicht transkribiert werden muss:

90

- <w> bleibt auch <w>, weil die Realisierung phonemisch irrelevant ist. (Zwirner-

Transkript <will>, phonetisch [vIl] realisiert, wird von uns <wIl> transkribiert.)

- Partizipien (überhaupt – es sei, die wären plötzlich flektiert…)

- Adverbien/Adjunkte

Mögliche Ansprechpartner bei sprachspezifischen Transkriptionsproblemen sind:

- fürs Alemannische:

- Fr. Elsässer (im Haus)

- Oliver Schallert (im Haus)

fürs Nordniederdeutsche:

- Christoph Purschke (im Haus)

- Manuela Lanwermeyer (im Haus)

- Michael Elmentaler (Kontakt über LOEWE-Mitarbeiter herstellen)

- Robert Langhanke (Kontakt über LOEWE-Mitarbeiter herstellen)

2. Was gilt in der gesprochenen Sprache als Satz?

Als Satz gilt eine vollständige Verb-Komplement-Struktur. Eine Verb-Komplement-

Struktur ist beispielsweise immer dann unvollständig, wenn der Sprecher eine Struktur

nicht zu Ende führt und/oder eine neue Struktur anfängt oder wenn eine Konstruktion

nicht als vollständige Verb-Komplement-Struktur identifizierbar ist. Solche

Abschnitte sind nicht auswertbar und können einfach aus dem Textfeld gelöscht

werden, sofern sie dabei umgebende vollständige Verb-Komplement-Strukturen (also

Sätze) unberührt lassen. Koordinationen wie Peter schreibt und raucht können als ein

Satz mit zwei Hauptsatz-clauses klassifiziert werden. Zwei koordinierte Hauptsätze

ohne Auslassung können als zwei Sätze getaggt werden: Peter schreibt# und Hannah

schimpft. Andererseits ist Peter hat gehört, dass Hannah schimpft ein Satz, da dass

Hannah schimpft Objekt zum Verb des Hauptsatzes ist und damit eine Verb-

Komplement-Struktur vervollständigt, was das ganze per definitionem zum Satz

macht. Typische Gesprächspartikel wie Ja, Ja nu, Also u.v.a. können aus dem Text

gelöscht werden.

3. Wie sehen bibliographische Angaben für Zwirner-Aufnahmen aus?

91

Quellenauswahl: „Korpus“

Bibliographie der Publikation: „Zwirner-Korpus“

Name/ID: z.B. „ZW1F3…“ + „…_sn“* + „…_tn“+

* Wenn bei der Zwirner-Aufnahme mehrere DialektsprecherInnen involviert sind,

müssen die Transkripte nach Sprechern aufgeteilt werden. Pro zu klassifizierendem

Text soll nur ein Sprecher vorkommen. Daher ist an die ID der Zwirneraufnahme noch

die Information _sn (Sprecher Nummer 1–n) anzuhängen (etwa „zw1f3_s1“. Der

andere Teil der Aufnahme (bei zwei Sprechern) wird dann unter „zw1f3_s2“

gespeichert Als Übersetzung kann in der Datenbank aber das Original Zwirner-

Transkript gespeichert werden (damit der Kontext bekannt ist)). + Die meisten Transkripte sind zu lang, um sie auf einmal zu bearbeiten. Daher werden

wir „turn“weise vorgehen. Die sprachlichen Beiträge der Interviewten sind in den

Transkripten meistens als S2 klassifiziert. Der erste Beitrag von S2 ist sein erster Turn.

Daher ist an die ID der Zwirneraufnahme noch die Information _tn (Turn Nummer 1–

n) anzuhängen (falls Interview nicht auf einmal vollständig klassifizierbar), z.B.

„zw1f3_t1“.

Im Fall eines Dialogs und bei der Aufteilung einer Aufnahme in mehrere Turns wird

man mehrere Texte in die Datenbank speichern, z.B.:

ZW479_s1_t1

ZW479_s1_t2

ZW479_s1_t3

und

ZW479_s2_t1

ZW479_s2_t2

ZW479_s2_t3

und

ZW479_s3_t1

ZW479_s3_t2

ZW479_s3_t3

...

Mit „Jahr der Entstehung des Sprachstoffs“ ist das Jahr der jeweiligen Aufnahme

gemeint.

92

3.5 Symbole

Symbol Verwendung Beispiel

...#... Segment (nicht am Anfang und am Ende

eines Strings setzen, sondern nur innerhalb

davon)

* Platzhalter für doppelt zu klassifizierende

Segmente, z.B. Nebensätze, die als Phrasen

des Matrixsatzes und ihrerseits als clauses

klassifiziert werden müssen

Peter *, der oft träumt, hat

geschlafen.

Peter sagt *, dass er träumt.

ø phonetisch/graphisch nicht realisiertes,

dennoch zu klassifizierendes Segment

ø lo veo '[ich] sehe es'

\…\ Hinzufügungen bei

Ellipsen/Koordinationen/…

Ich habe große Lust und du

auch +hast+ +große+ +Lust+

\…%...%\ Asymmetrien bei

Ellipsen/Koordinationen/…, die Tilgungen

erfordern

Ich habe keine Lust und du

auch nicht +hast+ +keine+

+Lust+ +%nicht%+

[…] Lücke im Text aufgrund von Verwitterung,

Verfall und anderen Schäden

weil d[…]ön war

<…> hinzuzufügen, addendum

(…) Auflösung von Abkürzungen

P(ost) S(criptum)

{…} zu tilgen, delendum

n.b. (blaue

Färbung)

Voreinstellung eines Wertes für eine

Klassifikationskategorie

[summativ] Die Kategorie lässt mehrere Werte für eine

Kategorie zu, die alle – summativ –

angegeben werden können sollen

93

4. Datenbankanfragen (Frank Nagel)

Eine Anfrage hat folgende allgemeine Form:

declare <Declaration>

select <ObjectNavList>

where <BoolExpr>

Dabei müssen declare, select und where genau so in der Anfrage vorkommen. Die Worte

in spitzen Klammern sind hingegen Platzhalter, die noch ersetzt werden müssen. Bei

der <Declaration> werden Variablennamen eingeführt, die in <ObjectNavList> und

<BoolExpr> benutzt werden können. Für jede Variable muss ein Typ angegeben werden,

wodurch bestimmt wird, welche Operatoren im Rest der Anfrage zulässig sind und welche

Werte die Variable annehmen kann. Diese Werte sind immer Datensätze aus der Datenbank.

Eine Anfrage wird wie folgt vom System interpretiert: Belege jede der Variablen der Reihe

nach mit den möglichen Werten, wie sie in der Datenbank enthalten sind. Für diese

Variablenbelegung werte die <BoolExpr> aus. Falls für diese Belegung der Ausdruck wahr

ist, berechne eine Zeile, wie sie in <ObjectNavList> angegeben ist, und liefere sie zurück.

Beispiel declare Phrase ph

select ph

where true

Hier wird eine Variable mit Namen ph und dem Typ Phrase deklariert. Da der boolsche

Ausdruck nicht von der Phrase abhängt, sondern immer wahr ist, liefert diese Anfrage jede

Phrase zurück, die in der Datenbank vorhanden ist. Andere Typen sind hier möglich, wie z.B.

Sentence, Clause oder Word.

Typen und Deklaration

Jeder zu deklarierenden Variablen wird ein Typname vorangestellt, gefolgt vom

Variablennamen. Ein Variablenname muss mit einem lateinischen Buchstaben beginnen und

kann dann weitere Buchstaben, Ziffern und den Unterstrich enthalten

(z.B. ph1, phrase1,Ph_1). Es können beliebig viele Variablen deklariert werden. Die

Deklarationen sind durch Kommata voneinander zu trennen.

94

Zu beachten ist, dass Wörter, die bereits eine andere Bedeutung haben, nicht mehr als

Variablennamen verwendet werden dürfen. Das heißt, select, where und Phrase sind

Beispiele für illegale Variablennamen. Folgende Typen für Variablen sind erlaubt:

• Text

• Sentence

• Clause

• Phrase

• Word

• ClauseClassification

• PhraseClassification

• WordClassification

Die Typen Sentence, Clause, Phrase und Word werde ich im folgenden zusammengefasst

als Intervall bezeichnen.

Die aufgelisteten Typen sind zusammengesetzte Typen. Sie enthalten eine Reihe von

Attributen, auf die mittels des Punkt-Operators zugegriffen werden kann.

Beispiel declare Text t

select t.language

where true

Es wird immer gewährleistet, dass alle Intervallvariablen mit Werten aus dem selben Text

belegt werden. Durch Deklaration einer Textvariable und Formulierung von Anforderungen

an diese können die möglichen Belegungen für Intervallvariablen weiter eingeschränkt

werden.

Beispiel declare Text t, Sentence s

select s

where t.language = 'Aramäisch'

Diese Anfrage liefert nur Sätze aus aramäischen Texten zurück.

Die Attribute haben bis auf wenige Ausnahmen den Typ String oder Liste von Strings.

Attribute vom Listentyp sind mittels '[]' hinter dem Attributnamen in der folgenden Auflistung

gekennzeichnet.

• Text o textSort

95

o textEdited o translation o language o languageLevel1 o languageLevel2 o languageLevel3 o dialect

• Sentence o text

• Clause o text o classification (Typ ClauseClassification)

• Phrase o text o classification (Typ PhraseClassification)

• Word o text o classification (Typ WordClassification)

• ClauseClassification o sentenceType o mode o completeness o polarity o referentialContext o diathese o notifications[]

• PhraseClassification o syntacticFunction o protoRole o causalStructure o scaleDiscoursePragmatic o scaleSemeantic o scaleInformationStructural o scaleSpecificity o category o categoryValues o agreement o agreementValues[] o caseForm o caseFormValues[] o alignment o alignmentLevel1 o alignmentLevel2 o alignmentValue o topologicalField[] o verbGloss

• WordClassification o wortart o klasseVFinit o klasseVNonfinit o klasseDekl

96

o klasseKonjug o formtyp2 o formtyp3 o person[] o numerus[] o tempus o aspekt[] o aspekt2 o form o form2 o lenition o kasus[] o genus o komparation o adposition o modus[] o genusVerbi o definitheit o bemerkungen

Weil der Zugriff auf die Klassifikation häufiger auftritt, kann man dieses Attribut auch in der

Deklaration verwenden:

Beispiel declare

Clause c,

ClauseClassification cc = c.classification

select

c

where

cc.sentenceType = 'Hauptsatz'

and cc.mode = 'deklarativ'

Bei den meisten dieser Attribute ist durch die Eingabe die Menge der möglichen Werte

vorgegeben. Diese sind deshalb als Hilfe bei der Eingabe unterhalb des Eingabefeldes

aufgelistet. Durch Klicken auf die Einträge werden diese am Ende des Textfeldes eingefügt.

Struktur der Ergebnisliste

Dem Schlüsselwort select folgend muß man eine komma-separierte Liste angeben, die

definiert, welche Werte die Anfrage zurückliefern soll. Hier sind alle Variablennamen und

alle Attribute erlaubt, auf die man mit dem Punkt-Operator zugreifen kann.

Zusätzlich kann man direkt nach dem select das Wort distinct einfügen, um Duplikate aus

der Ergebnisliste zu streichen.

97

Beispiel declare Text t

select distinct t.language

where true

Boolscher Ausdruck

Der boolsche Ausdruck ist strukturell sehr ähnlich dem, was auch in SQL zur Verfügung

steht, nur deutlich eingeschränkter. Es stehen die Operatoren and, or und not zur Verfügung.

Zusätzlich können die Klammern ( und ) gesetzt werden, um den Ausdruck zu strukturieren.

Des weiteren existieren folgende Operatoren:

Operatoren für String-Attribute

Wie oben bereits in den Beispielen verwendet, kann man diese Attribute auf Gleichheit testen.

Dies funktioniert mit Strings, aber auch zwischen zwei verschiedenen String-Attributen:

Beispiel declare

Clause c, Clause c2

select

c.classification.sentenceType, c, c2

where

c < c2 and

c.classification.sentenceType = c2.classification.sentenceType

Um Oder-Anfragen zu vereinfachen, gibt es einen in-Operator, der testet, ob ein String-

Attribut in der folgenden Liste von Strings enthalten ist:

Beispiel declare

Phrase ph1

select

ph1, ph1.classification.syntacticFunction

where

ph1.classification.syntacticFunction in ['AUX', 'AUX_ø']

Zusätzlich gibt es noch einen Operator, der mit regulären Ausdrücken arbeitet. Dieser eignet

sich für die Texte und die Bemerkungen zur Klassifikation der Wortebene, wo die möglichen

98

Werte keinen Vorgaben entsprechen müssen. In seiner einfachsten Form kann man testen, ob

der String in dem Attribut enthalten ist:

Beispiel declare Clause c

select c

where c.text ~ 'such'

Die folgenden Zeichen [ ] ( ) { } | ? + - * ^ $ \ . haben in regulären Ausdrücken

eine Sonderbedeutung, die dazu dient, kompliziertere Suchmuster zu erzeugen. Wenn man

nach genau diesen Zeichen suchen will, dann muss man ihnen ein Backslash voranstellen.

Beispiel declare Sentence s

select s

where s.text ~ '\[nu=z\]'

Hier ist noch ein einfaches Beispiel, wo nach verschiedenen Formen von Jhesus gesucht wird.

Das Wort kann mit einem Klein- oder Großbuchstaben anfangen und sowohl mit s als auch

mit m enden:

Beispiel declare Sentence s

select s

where s.text ~ '[Jj]hesu[sm]'

Detaillierte Informationen zu den regulären Ausdrücken finden sich in der Dokumentation

von PostgreSQL.

Operatoren für Attribute vom Typ Liste von Strings Hier kann man nur mittels des in-Operators testen, ob ein String in der Liste enthalten ist. Beispiel declare Phrase ph

select ph

where 'SUB dropped' in ph.classification.agreementValues

Operatoren für Intervalle

99

Bei diesen Objekten kann man testen, wie sie relativ zueinander angeordnet sind. Der

Ausdruck intervall1 < intervall2 bedeutet dabei, dass intervall1 vor intervall2 im

Text steht. Analog dazu kann man auch den Operator > verwenden.

Beispiel declare

Text t, Sentence s1, Sentence s2

select

s1, s2

where

t.language = 'Hethitisch' and s1 < s2

Die hierarchische Struktur, die durch das Taggen entsteht, kann mit den zwei Operatoren

parent und ancestor untersucht werden. Der Ausdruck clause1 parent phrase1 ist nur wahr,

wenn phrase1 direkt durch Taggen von clause1 entstanden ist. Der Ausdruck sentence1 ancestor

phrase1 ist wahr, wenn phrase1 Teil von sentence1 ist. Dabei ist egal durch wie viele

Zwischenschritte phrase1 entstanden ist.

Beispiel declare Sentence se1, Clause cl1, Clause cl2

select se1, cl1, cl2

where se1 ancestor cl1 and se1 ancestor cl2

and cl1.classification.sentenceType = 'Hauptsatz'

and cl2.classification.sentenceType = 'Relativsatz'

and cl1 < cl2

Wenn man in obigem Beispiel statt ancestor den Operator parent benutzt, dann werden deutlich

weniger Ergebnisse zurückgeliefert.

Aktualisierungen

• Bei Texten kann jetzt auch auf den Quellennamen zugegriffen werden.Z.B.:

declare Text t

select t.sourceName

where t.sourceName ~ 'Pwyll'

• Für einen schnellen Überblick bei Elementen, die durch Tag+Connect entstanden sind

gibt es jetzt ein Attribut connectedTexts bei Clauses und Phrasen. Dieses Attribut

enthält durch Komma abgetrennt die Textteile aller mit dem aktuellen Objekt durch

'Tag+Connect' verbundenen Intervalle.

100

declare

Text t, Clause c

select distinct c.connectedTexts

where

t.language = 'Aramäisch'

and c.text = '*'

• Analog zum '='-Operator gibt es jetzt einen '!='-Operator. ('nicht gleich')

• Analog zum 'in'-Operator gibt es jetzt einen 'not in'-Operator.

• Es gibt zwei neue Operatoren 'local parent' und 'local ancestor'. Diese Operatoren

liefern weniger Resultate zurück als die ursprünglichen Operatoren, wenn in der

Ahnenreihe mit Tag+Connect gearbeitet wurde.

• Zur Abkürzung kann statt 'c.classification' jetzt auch 'c.cln' geschrieben werden, wobei

'c' ein Intervall ist.

• Die freien Textfelder mit den Bemerkungen können jetzt auch in Abfragen

verwendet werden. Sie können als 'c.cln.remarks' oder 'c.cln.bemerkungen' abgerufen

werden. Dies gilt für alle drei Typen: Clauses, Phrasen und Wörter, sinnvollerweise

zusammen mit dem '~'-Operator. Beispiele:

declare Clause c

select c.cln.remarks

where c.cln.remarks ~ '.'

liefert jede Bemerkung, die mindestens ein Zeichen enthält.

declare Word w

select w.cln.remarks

where w.cln.remarks ~ '(also possible)|(auch möglich)'

liefert jede Bemerkung die 'also possible' oder 'auch möglich' enthält.

101

'|' ist der Oder-Operator im regulären Ausdruck und die Klammern sind notwendig

damit der Oder-Operator weiß, wie weit er gelten soll.

• Das Zählen in den Ergebnissen funktioniert wie folgt: Zwischen dem 'declare'- und

dem 'select'-Teil kommt eine weitere Zeile der Form

'count <Name, der auch im 'select-Teil' vorkommt> in'.

Z.B.:

declare

Text t, Clause c, Phrase phS, Phrase phO, Phrase phV

count phS.classification.scaleSemantic in

select

distinct c, phS.classification.scaleSemantic

where

t.languageLevel2 = 'Althochdeutsch'

and c.classification.sentenceType in ['Hauptsatz', 'Nebensatz (finit)', 'Relativsatz']

and 'ambig (strukturell)' not in c.classification.ambiguity

and c local ancestor phS and c local ancestor phO

and phS.classification.syntacticFunction in ['SUB', 'SUB_ø']

and phO.classification.syntacticFunction in ['DO', 'IO', 'O']

and phS < phO

• Es gibt jetzt eine weitere Variante von COUNT, die folgendermaßen funktioniert:

count separate <Namen, die auch im 'select-Teil' vorkommen> in

Damit können die Ausprägungen verschiedener erkmale *unabhängig* voneinander

gezählt werden. Z.B.:

declare

Text t, Clause c, Phrase phV, Phrase phS, Phrase phO

count separate

phS.cln.protoRole, phS.cln.causalStructure, phS.cln.scaleSemantic,

phO.cln.protoRole, phO.cln.causalStructure, phO.cln.scaleSemantic

102

in

select c.text, phS.cln.protoRole, phS.cln.causalStructure, phS.cln.scaleSemantic,

phO.cln.protoRole, phO.cln.causalStructure, phO.cln.scaleSemantic

where c local ancestor phV and c local ancestor phS and c local ancestor phO

and phO.cln.syntacticFunction = 'DO'

and phV.cln.verbGloss = 'speak'

and t.languageLevel2 = 'Mittelhochdeutsch'

• Abfrage-Ergebnisse können als CSV-Datei heruntergeladen werden. Der

Zeichensatz ist UTF-8. Dies ist beim Import in andere Programme evtl. anzugeben.

Die Original-Abfrage steht als Erstes mit in der Datei, durch '#' am Anfang der Zeile

markiert. Beim Import in R kann man das als Kommentarzeichen definieren und

dementsprechend ignorieren.

• Es gibt jetzt einen Gleichheitstest für die Merkmale mit Mehrfachauswahl. Z.B.:

declare Phrase p

select distinct p.cln, p.cln.caseFormValues

where 'n.b.' in p.cln.caseFormValues

and not [ 'n.b.' ] = p.cln.caseFormValues

Literaturhinweise

Ariel, Mira (1988): Referring and accessibility. Journal of Linguistics, 24, 65–87.

[http://journals.cambridge.org/action/displayAbstract?fromPage=online&aid=2733432]

Ariel, Mira (1991): The function of accessibility in a theory of grammar. Journal of

Pragmatics, 16, 443–463.

[http://www.sciencedirect.com/science/article/pii/037821669190136L]

Ariel, Mira (2008): Pragmatics and grammar. Cambridge: Cambridge University Press.

103

Dowty, David (1991): Thematic proto-roles and argument selection. Language, 67/3, 547–

619. [http://www.jstor.org/stable/10.2307/415037]

Dürscheid, Christa (1999): Die verbalen Kasus des Deutschen. Untersuchungen zur Syntax,

Semantik und Perspektive. Berlin/New York: de Gruyter.

Hopper, P. J./Thompson, S. A. (1980): Transitivity in grammar and discourse. Language, 56,

251–299. [http://www.jstor.org/stable/10.2307/413757]

Jackendoff, Ray (1990): Semantic Structures. Cambridge: MIT Press.

Primus, Beatrice (1999): Cases and thematic roles. Tübingen: Niemeyer.

Primus, Beatrice (2006): Mismatches in semantic-role hierarchies and the dimension of role

semantics. In: Bornkessel, I./Schlesewsky, M./Comrie, B./Friederici, A. D. (Hrsg.): Semantic

role universals and argument linking. Theoretical, typological

and psycho-/neurolinguistic perspectives. Berlin: de Gruyter, 53–87.

Silverstein, M., (1976): Hierarchy of features and ergativity. In: Dixon, R. M. W. (Hrsg.):

Grammatical categories in Australian languages. Proceedings of the 1974 A.I.A.S. Biennial

Conference. Canberra: A.I.A.S., 112–171.

Talmy, Leonard (1988): Force dynamics in language and cognition. Cognitive Science, 12/1,

49–100. [http://www.sciencedirect.com/science/article/pii/0364021388900080]

van Valin, Robert D. jr. (2001): An introduction to syntax. Cambridge: Cambridge University

Press.

van Valin, Robert D. jr. (2002): Semantic macroroles in Role and Reference Grammar.

[http://linguistics.buffalo.edu/people/faculty/vanvalin/rrg/vanvalin_papers/SemMRsRRG.pdf]

van Valin, Robert D. jr. (2005): Exploring the syntax-semantics interface. Cambridge:

Cambridge University Press.

van Valin, Robert D. jr./LaPolla, Randy J. (1997): Syntax. Structure, meaning and function.

Cambridge: Cambridge University Press.

Abkürzungen

Abkürzung Bedeutung

n.b. nicht bearbeitet

n.a. nicht applizierbar

n.n.a. noch nicht applizierbar

theoretischer leitfaden zur verwendung der reffmech-datenbank

Documents