Form und Funktion prosodischer Grenzen
in deutscher Spontansprache
Modul H2
Benno Peters - IPDS Kiel
15. Mai 2008
Einleitung
• Zwei DFG-Projekte:– Lautmuster deutscher Spontansprache– Prosodische Phrasierung in deutscher
Spontansprache
• Empirische Untersuchungen zur internen phonetischen Struktur prosodischer Phrasen und zu deren Delimitation
• Die phonetische Form der syntagmatischen Gliederung in prosodische Phrasen ist durch zwei phonetische Mechanismen bestimmt:
– phonetische Kohäsion im Inneren von Phrasen
– phonetische Separierung zwischen prosodischen Phrasen
• Kohäsive Merkmale (interne Struktur)– globale melodische Muster (Hutmuster,
Downstep/Deklination) – Kontinuität von Phonation, Register
Sprechgeschwindigkeit
• Separierende Merkmale (Delimitation)– melodische Brüche / starke melodische Bewegungen– Pausen/Atmen– F0-Reset– segmentelle Längung– Änderung von Phonationstyp
Sprechgeschwindigkeit, Register
• Prosodische Grenzen in natürlichen Gesprächen sind in drei funktionalen Zusammenhängen beobachtbar– im Inneren von Redebeiträgen als Ausdruck der
inhaltlich und syntaktisch motivierten Gliederung von Äußerungen
– am Ende von Redebeiträgen, oft mit einer auf die Sprecher-Hörer-Interaktion ausgerichteten phonetischen Struktur
– bei unflüssiger Sprechweise entstehen oft starke prosodische Einschnitte, die Planungsvorgänge seitens des Sprechers widerspiegeln
Grundfragen der Untersuchung
• Welche phonetischen Merkmale finden sich an prosodischen Grenzen?
• Können phonetische Klassen prosodischer Grenzen herausgearbeitet werden?
• Können diese phonetischen Klassen mit funktionalen Klassen assoziiert werden?
Grundfragen der Untersuchung
• Welche Rolle spielen phonetische Merkmale an prosodischen Grenzen bei der Einschätzung des Gesprächsfortgangs durch Hörer?
• Gibt es eine Korrelation zwischen der Stärke der phonetischen Separierung und inhaltlich-pragmatischen Strukturen? (z.B. starke Separierung am Ende inhaltlicher Blöcke oder am Ende von Redebeiträgen)
Grundfragen der Untersuchung
• Es werden also Bezüge hergestellt zwischen– der phonetischen Struktur von
Produktionsdaten– der inhaltlich-pragmatischen Struktur der
Produktionsdaten– der Wahrnehmung und funktionalen
Einordnung durch Hörer
Ziel
Klassifikationssystem für Phrasen-grenzen unterschiedlicher phonetischer Ausprägung, das eine Form-Funktions-Beziehung widerspiegelt
Methoden I - Die Datenbasis
• Terminabsprachen des Kiel Corpus (11 Dialogsitzungen mit 22 Sprechern, 2,5 Stunden, 25.000 Wörter)
• Video-Task (6 Dialoge mit 12 Sprechern, 1,5 Stunden, 13.500 Wörter)
Methoden IVideo-Task oder das Daily Soap Szenario
• Vorteile– hohe akustische Qualität, Kanaltrennung– VP realisieren nicht, dass das Ziel des Versuchs die
Sprachdatenerhebung ist– keine Eingriffe durch Versuchsleiter in die Dialoge– Alltagssprache mit großer Natürlichkeit, komplexe
Interaktion
• Nachteil– wenig Kontrolle über linguistische Strukturen in den
Daten
Methoden IVideo-Task oder das Daily Soap Szenario
• Hörbeispiel 1
• Hörbeispiel 2
• Hörbeispiel 3
Methoden IIPhonetische Analyse der Produktionsdaten
Methoden IIPhonetische Analyse der Produktionsdaten
• Was kann labelbasiert analysiert werden?– Melodische Muster (KIM/PROLAB) – F0-Reset an prosodischen Grenzen– Pausen/Atmungsphasen und deren Dauer– Segmentdauern an Phrasengrenzen werden mit
Segmentdauern in phrasenfinalen Reinem verglichen
Methoden IIPhonetische Analyse der Produktionsdaten
• Ableitung phonetischer Merkmalsbündel für jede etikettierte prosodische Grenze im Korpus
• Beispiel: 2._P250_+R_L3– 2. = stark fallende melodische Bewegung– P250 = Pause von 250ms – +R = F0-Reset– L3 = Längungsstufe des phrasenfinalen
Reims
Methoden III Funktionale Zuordnung phonetischer Merkmale
• Grundfrage: Wie komme ich von der formalen Beschreibung der phonetischen Merkmale zu einer funktionalen Zuordnung?
• Zwei sich ergänzende Verfahren:– funktionale Interpretation der Korpusdaten– Perzeptionsexperimente
Methoden IIIInterpretation der Produktionsdaten
• Steht die prosodische Grenze am Ende eines inhaltlichen Abschnitts oder innerhalb eines inhaltlichen Abschnitts?
Methoden IIIPerzeptionsexperimente
• Nachbildung der phonetischen Variabilität über Resynthesen
• Funktionale Bewertungen durch naive Hörer
• Kontextfreie Präsentation soll Effekte des phonetischen Signalisierungssystems „freilegen“
Methoden IIIPerzeptionsexperimente
• Übertragung der im Korpus beobachteten phonetischen Merkmale in Stimuli für Perzeptionsexperimente
• Ausgangssatz: „Das ist ja nun nicht so angenehm.“
• Zwei Parameter gehen in die Resynthesen ein:– melodische Bewegung am Phrasenende– Längung am Phrasenende
Methoden IIIPerzeptionsexperimente
Methoden IIIPerzeptionsexperimente
• Welche Fragen sollen den Versuchspersonen gestellt werden?– Sprecherwechsel
– Wird der Sprecher nach der Äußerung noch weiter sprechen?
– Sprechflüssigkeit– Hört sich die Äußerung zögerlich an?
Methoden IIIPerzeptionsexperimente
• Welche Fragen sollen den Versuchspersonen gestellt werden?– Sprecherwechsel
– Wird der Sprecher nach der Äußerung noch weiter sprechen?
– Sprechflüssigkeit– Hört sich die Äußerung zögerlich an?
Methoden IIIPerzeptionsexperimente
• Wie können die Urteile der VP erhoben werden?– forced choice?– Antwortskalen?
• Equal Appearing Interval Scale (Thurston 1929)
• Visual Analogue Scale (Maxwell 1978)
Methoden IIIPerzeptionsexperimente
0 1 2 3 4 5 6
0 1 2 3 4 5 6
Hört sich die Äußerung zögerlich an?
Ja Nein
Wird der Sprecher nach dem Satz noch weitersprechen?
Ja Nein
Methoden IVZusammenfassung
• Datenerhebung
• Labelbasierte phonetische/akustische Korpusanalyse
• Interpretation einer großen Anzahl von Redebeiträgen
• Perzeptionsexperimente
• Enges Netzwerk in der Konzeption der Arbeitsschritte und in der Interpretation der gesamten Ergebnisse
Exkurs Sprechflussstörungen
Der Entstehung von Sprechflussstörungen liegen unterschiedliche Ursachen zugrunde. Folgende Probleme können zu einer unflüssigen Sprechweise führen:
● Phonetische Versprecher: Während des Sprechens kann es zu Lautvertauschungen, Fehlartikulationen und anderen artikulatorischen Problemen kommen.
Exkurs Sprechflussstörungen
● Syntaktische Versprecher: Ein bereits zum Teil ausgesprochener Satz enthält agrammatische Strukturen oder lässt sich nicht sinnvoll ohne eine Verletzung grammatischer Regeln fortsetzen.
Exkurs Sprechflussstörungen
● Inhaltliche Versprecher: Ein Wort, das nicht der Intention des Sprechers entspricht, wird versehentlich ganz oder zum Teil ausgesprochen und eine Korrektur wird notwendig. In diese Kategorie fallen auch die sog. Freudschen Versprecher (Freud 1901/1971).
Exkurs Sprechflussstörungen
● Wortfindungsprobleme: Ein Wort, das eigentlich bekannt ist, kann nicht rechtzeitig aus dem Gedächtnis abgerufen werden.
● Syntaktische Planungsprobleme: Eine korrekte syntaktische Fortsetzung kann nicht so schnell geplant werden, dass die derzeitige Äußerung flüssig fortgesetzt werden kann.
Ergebnisse ILabelbasierte Korpusanalyse
• In 93% aller analysierten turninternen Phrasengrenzen konnte mindestens eines der folgenden Merkmale automatisch extrahiert werden
– phrasenfinale Längung (66,2%)– F0-Reset (63%)– Pause oder Atmen (38,3%)– stark fallende oder starke steigende melodische
Bewegung (36% stark fallend, 2% stark steigend)
Ergebnisse ILabelbasierte Korpusanalyse
• In mehr als 55% aller Fälle treten zwei oder mehr Merkmale gemeinsam auf.
• Die häufigsten Kombinationen sind:– Längung + F0-Reset– Längung + Pause + F0-Reset– Längung + Pause + starke tonale Bewegung
Ergebnisse ILabelbasierte Korpusanalyse
• Turnfinale prosodische Grenzen zeigen zu 63,8% stark fallende melodische Bewegungen und zu 10,3% stark steigende Konturen
• Phrasenfinale Längung tritt in 74,3% der Fälle auf (turnintern: 66,2%)
• Hauptunterschied zwischen turnintern und turnfinal liegt im Parameter melodische Bewegung. Aber: auch turnintern viele stark fallende Konturen
Ergebnisse II
Interpretation • Vergleich der phonetischen Merkmale an
turninternen Grenzen im Inneren und am Ende inhaltlicher Blöcke – Pausen
• innerhalb: 26,6%
• am Ende: 68,8%
– Starke tonale Bewegungen
• innerhalb: 20%
• am Ende: 75%
Ergebnisse II Interpretation
• Das Auftreten von Längung und F0-Reset unterscheidet sich kaum zwischen prosodischen Grenzen innerhalb und am Ende inhaltlicher Blöcke– Längung: 80% vs. 73,4%– F0-Reset: 66,7% vs. 75%
Ergebnisse II Interpretation
• Ergebnis: In den Korpusdaten gibt es einen Zusammenhang zwischen phonetischer und inhaltlicher Kohäsion.
• Prototypische prosodische Grenzen im Inneren inhaltlicher Blöcke haben als separierende Merkmale finale Längung und F0-Reset. Prototypische Grenzen am Ende inhaltlicher Blöcke weisen zusätzlich noch eine Pause und eine starke tonale Bewegung auf.
Ergebnisse II Interpretation
• Damit gleicht die typische prosodische Grenze am Ende inhaltlicher Blöcke in ihrer phonetischen Struktur der turnfinalen prosodischen Grenze.
Ergebnisse IIIPerzeptionstests
Ergebnisse IIIPerzeptionstests
Ergebnisse IIIPerzeptionstests
Turnübergabeerwartung
0
1
2
3
4
5
6
-8ht -4ht -0ht +4ht +8ht
Faktor 0
Faktor 1,4
Faktor 1,8
Faktor 2,2
Ergebnisse IIIPerzeptionstests
Wahrgenommene Sprechflüssigkeit
0
1
2
3
4
5
6
-8ht -4ht -0ht +4ht +8ht
Faktor 0
Faktor 1,4
Faktor 1,8
Faktor 2,2
Ergebnisse IIIPerzeptionstests
• Deutliche funktionale Bindung der Kontur für die Signalisierung von Turnübergaben
• Kaum funktionale Bindung der Dauerstruktur in diesem Bereich
• Aber: große Sensibilität der VP für Dauerstruktur• Segmentelle Längungen werden mit unflüssiger
Sprechweise assoziiert. D.h. es gibt eine funktionale Bindung von Längung bei der Signalisierung von Sprechflussstörungen
Zusammenfassung
• Große Variabilität• Starke Überschneidungen in der
phonetischen Form der funktionalen Klassen• Keine 1:1-Beziehungen von Form und
Funktion• Aber: funktionale Bindung der melodischen
Muster sowohl in Bezug auf inhaltliche Gliederung, als auch hinsichtlich der damit eng verbundenen Dialogsteuerung.
Zusammenfassung
• Es können prototypische phonetische Realisierungen für die verschiedenen Funktionen herausgearbeitet werden
• Das phonetische System funktioniert immer in Ergänzug durch syntaktische und inhaltliche Informationen
• Erweitertetes Konzept der Merkmalsbündelung
Klassifikationssysteme
• Erstellung eines funktional orientierten Klassifiktionssystems auf der Basis von prototypischen phonetischen Strukturen für die Bereiche
• turninterne prosodische Grenzen
• turnfinale prosodische Grenzen
• prosodische Grenzen in unflüssiger Sprache
Dem phonetischen Signalisierungssystem liegt kein striktes 1:1-Verhältnis zwischen Form und Funktion zugrunde.
Die Ergebnisse deuten eher auf eine unterstützende Funktion der phonetischen Komponente hin, die erst in Kombination mit syntaktischen und semantischen Strukturen zu eindeutigen interaktionalen Funktionalisierungen führt.
Turninterne prosodische Grenzen
Ausblick
Turnfinale prosodische Grenzen