prominenz und rhythmus

Prominenz und Rhythmus

Klaus J. Kohler

IPDS, Kiel

Kolloquium WS2007/87. November 2007ff

Was konstituiert Rhythmus?

• regularisierte Abfolge prominenter und weniger prominenter Silben (siehe Einleitung zum Hörexperiment)

• prominent = gehörsmäßig hervortretend

• Welche phonetischen Parameter verantwortlich?– 1f

– 2f

– 1r

– 2rf

– 3rf

– 3d

– 3e

Begriffsbestimmungen zu Akzent und Prominenz linguistisch, messphonetisch, perzeptorisch

• linguistisch– Wortakzent: August, übersetzen– Satzakzent: Anna hat eine Email abgeschickt.– emphatischer Akzent– rhythmische Muster: Jambus, Trochäus, Dactylus

• messphonetisch– f0– Dauer– Energie

° dB

• perzeptorisch– harmonische Tonhöhe: Halbtöne, Tonheit: mel Bark– wahrgenommene Lautdauer– Lautstärke: phon, Lautheit: sone– Prominenz: syntagmatische Kontraste, gebildet aus

Tonhöhen-, Dauer- und Lautheitswahrnehmung– messphonetische Korrelate der 3 auditiven Faktoren

für Prominenz (f0, Dauer, dB) signalisieren auch Tonregister, Sprechgeschwindigkeit, Lautstärke° Wahrnehmung synthetisch erzeugter Muster kann

auf zwei Ebenen dekodiert werden° siehe Ergebnisse des Hörtests

Skalierung der Prominenz

• 1. Hörexperiment– Originalstimulus

– erste Silbe dupliziert

– gelängt, 1.15, ebenes f0 124 Hz

Manipulation des Tonhöhenverlaufs

Manipulation der Dauer

• zweite Silbe in 3 Schritten zu 10% gelängt und gekürzt– die letzten 4 Perioden von Längung ausgenommen

Manipulation der Energie

• 3 Zeitpunkte in zweiter Silbe– Anfang des Plosivs– nach Plosivburst– Vokalende

• in CoolEdit Amplituden-Einhüllende über dem zweiten Vokal manipuliert– 1. Punkt 100%, 2., 3. Punkt in 1dB-Schritten nach

oben und nach unten

Kombination von Pitch- und Dauer- sowie von Pitch- und Amplitudenmanipulation

• 7 Tonhöhenmuster, einschl. eben• 6 Dauern• 6 Amplituden• jeweils 5 Wiederholungen• 7 x 6 x 5 = 210 Stimuli in einem Dauerset und 210

Stimuli in einem Amplitudenset • separat randomisiert und in zwei Hörtests präsentiert• Amplitudenset zuerst

Hypothesen

• Erhöhen oder erniedrigen von Pitch, Energie und Dauer im zweiten ba gegenüber dem Referenzstimulus erhöht oder erniedrigt die Prominenz gegenüber dem ersten ba.

• In der Kombination von Pitch und Energie bzw. Dauer ändert sich der Umkipppunkt mit dem Tonhöhenmuster.

• Pitch hat den stärksten, Energie den schwächsten Effekt.

Nomenklatur

• drei Komponenten im Namen:pitch p22, p21, p01, p00, p11, p12, p14

energy Auswahl von 6 ause22, e21, e00, e11, e12, e13, e14, e15, e16

duration Auswahl von 6 ausd24, d23, d22, d21, d00, d11, d12, d13

Variable Amplitude Envelope on Pitch Patterns: flat-falling p01 and rising-falling p21-p22

0

10

20

30

p01e21d

00

p01e00d

00

p01e11d

00

p01e12d

00

p01e13d

00

p01e14d

00

p21e11d

00

p21e12d

00

p21e13d

00

p21e14d

00

p21e15d

00

p21e16d

00

p22e11d

00

p22e12d

00

p22e13d

00

p22e14d

00

p22e15d

00

p22e16d

00

Pitch and Amplitude Envelope

Re

sp

on

se

s

2nd syll prom

1st syll prom

Variable Amplitude Envelope on Pitch Patterns: flat p00 and falling p11-p14

0

10

20

30

p0

0e

22

d0

0

p0

0e

21

d0

0

p0

0e

00

d0

0

p0

0e

11

d0

0

p0

0e

12

d0

0

p0

0e

13

d0

0

p1

1e

22

d0

0

p1

1e

21

d0

0

p1

1e

00

d0

0

p1

1e

11

d0

0

p1

1e

12

d0

0

p1

1e

13

d0

0

p1

2e

22

d0

0

p1

2e

21

d0

0

p1

2e

00

d0

0

p1

2e

11

d0

0

p1

2e

12

d0

0

p1

2e

13

d0

0

p1

4e

23

d0

0

p1

4e

22

d0

0

p1

4e

21

d0

0

p1

4e

00

d0

0

p1

4e

11

d0

0

p1

4e

12

d0

0

Pitch and Amplitude Envelope

Re

sp

on

se

s

2nd syll promi

1st syll prom

Variable Duration on Pitch Patterns: flat-falling p01, rising-falling p21-p22

0

10

20

30

p01e00d

23

p01e00d

22

p01e00d

21

p01e00d

00

p01e00d

11

p01e00d

12

p21e00d

22

p21e00d

21

p21e00d

00

p21e00d

11

p21e00d

12

p21e00d

13

p22e00d

22

p22e00d

21

p22e00d

00

p22e00d

11

p22e00d

12

p22e00d

13

Pitch and Duration

Re

sp

on

se

s

2nd syll prom

1st syll prom

Variable Duration on Pitch Patterns:flat p00, falling p11-p14

0

10

20

30

p0

0e

00

d2

3

p0

0e

00

d2

2

p0

0e

00

d2

1

p0

0e

00

d0

0

p0

0e

00

d1

1

p0

0e

00

d1

2

p1

1e

00

d2

3

p1

1e

00

d2

2

p1

1e

00

d2

1

p1

1e

00

d0

0

p1

1e

00

d1

1

p1

1e

00

d1

2

p1

2e

00

d2

3

p1

2e

00

d2

2

p1

2e

00

d2

1

p1

2e

00

d0

0

p1

2e

00

d1

1

p1

2e

00

d1

2

p1

4e

00

d2

4

p1

4e

00

d2

3

p1

4e

00

d2

2

p1

4e

00

d2

1

p1

4e

00

d0

0

p1

4e

00

d1

1

Pitch and Duration

Re

sp

on

se

s

2nd syll prom

1st syll prom

Zusammenfassung der Ergebnisse (6 Vpn)

• Pitch + Energie– Progression der Prominenz von zweiter zu erster

Silbe für p22 – p21 – p01 – p11 – p12 – p14– kein Progressionsmuster für Energiezunahme/

abnahme innerhalb einer Tonklasse– Pitch ist verantwortlich für die perzeptive

Skalierung der Prominenz in diesen Stimuli– aber es zeigt sich eine Skalierung in der Klasse

p00 (ebenes Muster) von e22 nach e13

• Pitch + Dauer– entsprechende Progession über die Tonklassen

hinweg– keine interne Progression– gilt auch für p00

° überwiegend Prominenz auf erster Silbe• Interpretation der Ergebnisse

– Manipulation der Einhüllenden und der Dauer nur in der zweiten Silbe bringt Interferenz mit den Perzeptionsebenen Lautstärke und Sprechtempo

– Implementation deutscher Sprachproduktion > Perzeption muss beide Silben verändern

Neues Experiment – Experiment 2

• Pitch p21, p01, p00, p11, p14– nach den Ergebnissen des ersten Tests kann p22 durch

keinen anderen Parameter zum Umkippen gebracht werden

– die Unterschiede in Dauer oder Energie müssten so groß sein, dass wieder die anderen Perzeptionsebenen intervenieren

– p11 und p14 bilden ein kontrastives Paar, daher p12 und p13 zunächst ausgeklammert, um Zahl der Stimuli zu begrenzen

p00

p21

p01

p11

p14

• Dauer– +20%-20%, +10%-10%, 0-0, -10%+10%, -20%+20%– p21 +25-25, nicht -20%+20%– p14 -25+25, nicht +20-20– 5 Stimuli pro Serie

• Energie– 4 Punkte

(1) Anfang Stimmhaftigkeit (2) Mitte erster Vokal(3) Mitte zweiter Vokal(4) Ende Stimmhaftigkeit

– Einhüllende systematisch verändert an diesen Punkten° (1), (2) 126% (+2dB), 112% (+1dB), 79% (-2dB),

70% (-3dB)° komplementär (3), (4) 70%, 79%, 112%, 126%° p21 nicht 70–126, 79–112, aber 100–89, 126-56° p14 nicht 126 – 70, aber 56 – 128° 5 Strimuli pro Serie, incl. Original

(1) (2) (3) (4) 126112100897970

• Anzahl der Stimuli pro Testserie– 5 Pitch * 5 Dauer/Energie * 5 Wiederh. = 125 * 2

Variable Amplitude Envelope on Flat f0 and Variable Pitch (new exp)

0

15

30

45

60

75

90

p0

0e

12

d0

0

p0

0e

11

d0

0

p0

0e

00

d0

0

p0

0e

21

d0

0

p0

0e

22

d0

0

p1

4e

00

d0

0

p0

0e

00

d0

0

p1

1e

00

d0

0

p0

1e

00

d0

0

p2

1e

00

d0

0

Amplitude (left) - Pitch (right)

Re

sp

on

se

s (

ab

s)

2nd

1st

Variable Amplitude Envelope on Pitch Patterns: flat p00, falling p14, p11, p01, rising-falling p21 (new exp)

0

15

30

45

60

75

90

p14e11d

00

p14e00d

00

p14e21d

00

p14e22d

00

p14e24d

00

p11e12d

00

p11e11d

00

p11e00d

00

p11e21d

00

p11e22d

00

p00e12d

00

p00e11d

00

p00e00d

00

p00e21d

00

p00e22d

00

p01e12d

00

p01e11d

00

p01e00d

00

p01e21d

00

p01e22d

00

p21e14d

00

p21e12d

00

p21e11d

00

p21e01d

00

p21e00d

00

Pitch and Amplitude

Re

sp

on

se

s (

ab

s)

2nd

1st

Variable Duration on Flat f0 and VariablePitch (new exp)

0

10

20

30

40

50

60

70

80

90

p00e00d

12

p00e00d

11

p00e00d

00

p00e00d

21

p00e00d

22

p14e00d

00

p00e00d

00

p11e00d

00

p01e00d

00

p21e00d

00

Duration (left) - Pitch (right)

Re

sp

on

se

s (

ab

s)

2nd

1st

Variable Duration on Pitch Patterns: Flat p00, falling p14, p11, p01, rising-falling p21 (new exp)

0

10

20

30

40

50

60

70

80

90

p14e00d

12

p14e00d

11

p14e00d

00

p14e00d

21

p14e00d

23

p11e00d

12

p11e00d

11

p11e00d

00

p11e00d

21

p11e00d

22

p00e00d

12

p00e00d

11

p00e00d

00

p00e00d

21

p00e00d

22

p01e00d

12

p01e00d

11

p01e00d

00

p01e00d

21

p01e00d

22

p21e00d

13

p21e00d

12

p21e00d

11

p21e00d

00

p21e00d

21

Pitch and Duration

Re

sp

on

se

s (

ab

s)

2nd

1st

Ergebnisse: 18 Vpn für Energie, 19 für Pitch

• Kein prinzipieller Unterschied zum 1. Exp.– Pitch zeigt einen Effekt– Dauer und Energie nur marginale Effekte– selbst bei ebenem Pitch eher zufällige Antworten,

was bedeuten kann, dass gleichbleibender Tonverlauf gleiche Prominenzwahrnehmung hervorruft, die dann zu zufälligen Antworten führt, weil Hörer nicht "gleich" urteilen können

– große Streuung zwischen Vpn, daher verdecken die Gruppenergebnisse individuelle Strategien

2_dur p00e00d00 p00e00d11 p00e00d12 p00e00d21

Gr1-1 0 5 0 4 1 4 0 5

Gr1-2 1 4 3 2 4 1 2 3

Gr1-3 2 3 3 2 3 2 2 3

Gr2-1 3 2 2 3 2 3 2 3

Gr2-2 4 1 3 2 4 1 2 3

Gr2-3 5 0 5 0 5 0 4 1

Gr2-4 1 4 0 4 0 4 0 5

Gr2-5 5 0 5 0 5 0 5 0

Gr3-1 2 3 2 3 2 3 1 4

Gr3-2 4 0 5 0 5 0 4 1

Gr3-3 3 2 3 2 5 0 2 3

Gr3-4 0 5 0 5 1 4 0 5

Gr4-1 4 1 3 2 4 1 5 0

Gr4-2 5 0 5 0 5 0 5 0

Gr4-3 3 2 4 1 3 2 2 3

Gr4-4 4 1 3 2 2 3 2 3

Gr4-5 3 2 3 2 4 1 3 2

Gr4-6 5 0 3 2 5 0 5 0

Gr4-7 5 0 5 0 5 0 5 0

Total 59 35 57 36 65 29 51 44

• offenbar kein einheitliches Entscheidungskriterium für Prominenz in derartigen Experimenten– Kategorie ist den Vpn vielleicht nicht klar– sie können sich auf unterschiedliche Parameter

konzentrieren, sowohl von Hörer zu Hörer als auch von Wiederholung zu Wiederholung, was zu großer Variabilität führt

– Skalierung der Prominenz ist auf diesem Wege der kategorialen Klassifikation nicht erreichbar, wenn so viele stärker und schwächer differenzierte Stimuli gemischt werden

• Drei Möglichkeiten– Kategorisierung, aber nur mit drei Serien, die auch

nur in einem Parameter variiert werden° 7 Pitch-Werte, e00 d00° 7 Energiewerte, p00 d00° 7 Dauerwerte, p00 e00° ergibt bei 5 Wiederholungen 105 Stimuli° also starke Verkürzung des Tests

– Pfitzinger's phonometrische perzeptuelle Skalierung, nach der Hörer einen numerischen Wert der 2. vs. der 1. Silbe zuordnen und die zu bewertenden Stimuli entlang einer geraden Linie anordnen° die Hörer definieren also ihr Kriterium selbst,

ohne dass es ihnen verbalisiert vorgesetzt wird ° aus der Anordnung lassen sich Ähnlichkeiten

ableiten° die drei Parameter werden zunächst einzeln

variiert

– Prominenz wird abgeleitet aus der Wirkung auf Rhythmuswahrnehmung° Silbenketten ba werden durch f0, Dauer und

Energie systematisch gruppiert° Hörer sollen entscheiden, ob ein 1er- 2er- oder

3er-Rhythmus vorliegt° darüber hinaus, ob er anschwellend oder

abschwellend ist (Jambus, Trochaeus, Daktylus)• also neue Experimentserien

Experiment 3

• Je 1 Serie für Pitch, Energie und Dauer mit 7 Stufen– Pitch-Muster p14, p13, p12, p11, p01, p21, p22,

wie in den ersten beiden Experimenten– Dauer nur im zweiten Vokal verändert, auf p00

° wie in Exper1, letzten 4 Perioden ausgenommen° keine komplementäre Kürzung/Längung in 1./2.

Silbe, wie in Exper2° keine Veränderung des mittleren Konsonanten,

da Längung Zögerungseffekte hervorruft° -10%, 0, 10%, 20%, 30%, 40%, 50%

– Energie als Amplitudeneinhüllende manipuliert° auch nur für die 2. Silbe, wie in Exper1° 4 Punkte festgelegt in Stimulus p00

¶Beginn des 1. Vokals 100%

¶Beginn des mittleren Konsonanten 100%

¶Mitte des 2. Vokals: 100%, +1dB=112%, +2dB=126%, +3dB=141%, +3.5dB=150%, -1dB=89%, -2dB=79%

¶Ende der Stimmh. 100% bzw. 89%, 79%

• Drei Gruppen von Vpp– Gruppe 1

° 8 Vpp° Reihenfolge Pitch, Energie, Dauer

– Gruppe 2° 8 Vpp° Reihenfolge Energie, Dauer, Pitch

– Gruppe 3° bislang nur 2 Vpp, 1 Vp hat fast nur 1. Silbe ° Reihenfolge Dauer, Energie, Pitch

• Ergebnisse– starker Pitcheffekt– schwächerer, aber deutlicher Dauereffekt– kein Energieeffekt– Positionseffekt in der Experimentabfolge

Prominence Perception - Pitch Variable (Exp3)

0

5

10

15

20

25

30

35

40

p1

4e

00

d0

0

p1

3e

00

d0

0

p1

2e

00

d0

0

p1

1e

00

d0

0

p0

1e

00

d0

0

p2

1e

00

d0

0

p2

2e

00

d0

0

Pitch Pattern - Gr1_Gr2

Ab

s. R

es

po

ns

e F

req

ue

nc

ies

2nd syll

1st syll

Prominence Perception - Duration Variable (Exp3)

0

5

10

15

20

25

30

35

40

p0

0e

00

d1

1

p0

0e

00

d0

0

p0

0e

00

d2

1

p0

0e

00

d2

2

p0

0e

00

d2

3

p0

0e

00

d2

4

p0

0e

00

d2

5

Duration Pattern - Gr1_Gr2

Ab

s. R

es

po

ns

e F

req

ue

nc

ies

2nd syll

1st syll

Prominence Perception - Amplitude Envelope Variable (Exp3)

0

5

10

15

20

25

30

35

40

p0

0e

12

d0

0

p0

0e

11

d0

0

p0

0e

00

d0

0

p0

0e

21

d0

0

p0

0e

22

d0

0

p0

0e

23

d0

0

p0

0e

24

d0

0

Amplitude Envelope Pattern - Gr1_Gr2

Ab

s. R

es

po

ns

e F

req

ue

nc

ies

2nd syll

1st syll

° für Energie und Dauer bei Vergleich der Gruppen1,2

¶ für beide Parameter über sämtliche Stimuli mehr Antworten für Prominenz auf 1. Silbe, wenn Pitchserie den ersten Teiltest stellte

¶da deutliche Prominenz durch Pitch auf 2. Silbe fehlt, tendiert das Urteil stärker zur 1. Silbe, umso mehr, wenn vorher Pitchtest

° kein Positionseffekt für Pitch° unterstreicht die Robustheit des Parameters

Prominence Perception - all Variables (Exp3)

0

10

20

30

40

50

60

70

80

p1

4e

00

d0

0

p1

3e

00

d0

0

p1

2e

00

d0

0

p1

1e

00

d0

0

p0

1e

00

d0

0

p2

1e

00

d0

0

p2

2e

00

d0

0

p0

0e

12

d0

0

p0

0e

11

d0

0

p0

0e

00

d0

0

p0

0e

21

d0

0

p0

0e

22

d0

0

p0

0e

23

d0

0

p0

0e

24

d0

0

p0

0e

00

d1

1

p0

0e

00

d0

0

p0

0e

00

d2

1

p0

0e

00

d2

2

p0

0e

00

d2

3

p0

0e

00

d2

4

p0

0e

00

d2

5

Stimulus Pattern - Gr1-2

Ab

s. R

es

po

ns

e F

req

ue

nc

ies

2nd syll

1st syll

– in Pitchserie p11 50% Urteile in beiden Gruppen° d.h. die beiden Silben sind gleich prominent° daraus lässt sich folgern, dass p11 besser geeignet

ist für Dauer- und Energiemanipulation° p00 hat bereits ein Bias zur ersten Silbe

¶die Neutralisierung der fehlenden finalen Längung durch Pitchbewegung entfällt

¶muss durch Dauer oder Energie bewirkt werden

¶Dauer wird für 2. Silbe so erst versetzt wirksam

¶gilt umso mehr für Energie, wenn schwächerer Parameter

Experiment 4

Stimuli• Pitch-Serie wie in Exper3: 7 Stimuli• Dauer wieder komplementär in 1. und 2. Silbe verändert,

um globale Geschwindigkeit konstant zu halten– vom Basisstimulus p11e00d00 aus

° 3 Längungs- bzw. Kürzungsstufen um jeweils 10% komplementär in den beiden Silben

° nur Vokaldauer ohne die Plosivlösung , die 1. Periode und die letzten 4 Perioden

° 7 Stimuli

Manipulation des Tonhöhenverlaufs

• Amplitudeneinhüllende ebenfalls komplementär in 1. und 2. Silbe verändert– dynamische Veränderung der Einhüllenden über

jeder Silbe, um globale Lautheit konstant zu halten– für Amplitudenverstärkung lineare Abnahme von

erhöhtem Wert am Vokalanfang auf 100% am Vokalende

– für komplementäre Abschwächung linear von erniedrigtem Wert am Vokalanfang um -1dB am Ende

– lineare Verbindung über den Verschluss

• vom Basisstimulus p11e00d00 aus– 3 1dB-Schritte nach oben bzw. nach unten– komplementär über jeder Silbe– 7 Stimuli

• dieselben Dauer- und Amplitudenmanipulationen über dem monotonen Basisstimulus p00e00d00– jeweils 7 Stmuli

• 5 Stimulusserien mit je 7– 5 Wiederholungen– insgesamt 5*7*5 = 175 Stimuli – in 5 Teiltests für jede jeweils eine Serie

Hypothesen– Der Basisstimulus p11e00d00 hat equiprominente

Silben, daher Zufallsurteil 50%. – Die 6 Pitch Veränderungen bewirken einen

monotonen Übergang von Prominenz auf 1. zu 2. Silbe, der sich in Urteilen abbildet.

– Diese Übergänge finden sich auch in der Dauer- und der Amplitudenserie von p11.

– Der Basisstimulus p00e00d00 zeigt ein Bias zur Prominenz auf der 1. Silbe ° wegen fehlender finaler Längung° die in der Pitchserie durch Tonbewegung

kompensiert wird° aber in p00 ducrh Dauer- bzw. Amplitude erst

ausgeglichen wird° daher Zufallsurteil erst für den nächsten

Stimulus in den beiden Serien bei Verstärkung der Dauer bzw. der Amplitude in der 2. Silbe.

– Die Pitchserie weist den schärfsten Übergang auf.

Durchführung des Hörtests• 2 Gruppen zu je 8 Hörern mit RMG im Studio

– in Gruppe 1 hatten 2 Hörer an einem vorangehenden Rhythmushörtest teilgenommen, in Gruppe 2 waren es 5

n = no previous test, t = test– folgende Gruppenbildungen für Datenanalyse:

Gr1 - Gr2, Gr1n, Gr2n, Gr1t, Gr2t, Grn - Grt– jeweils 5 separate Teiltests in einer Sitzung

° Gruppe 1: p11-Dauer, p11-Amplitude, p00-Dauer p00-Amplitude, Pitch

° Grupp2: Pitch zwischen den p11 und p00-Serien

Prominence Perception Pitch Variable (Exp4)

0

10

20

30

40

50

60

70

80

90

100

p14e00d00p13e00d00

p12e00d00p11e00d00

p01e00d00p21e00d00

p22e00d00

Pitch Pattern - Gr1_Gr2_Grn_Grt

Re

l. R

es

po

ns

e F

req

ue

nc

ies

(%

)

2nd_syll

1st_syll

Prominence Perception Duration Variable on p11 (Exp4)

0

10

20

30

40

50

60

70

80

90

100

p11e00d13p11e00d12

p11e00d11p11e00d00

p11e00d21p11e00d22

p11e00d23

Duration Pattern - Gr1_Gr2_Grn_Grt

Re

l. R

es

po

ns

e F

req

ue

nc

ies

(%

)

2nd_syll

1st_syll

Prominence Perception Amplitude Envelope Variable on p11 (Exp4)

0

10

20

30

40

50

60

70

80

90

100

p11e13d00p11e12d00

p11e11d00p11e00d00

p11e21d00p11e22d00

p11e23d00

Amplitude Envelope Pattern - Gr1_Gr2_Grn_Grt

Re

l. R

es

po

ns

e F

req

ue

nc

ies

(%

)

2nd_syll

1st_syll

Prominence Perception Duration Variable on p00 (Exp4)

0

10

20

30

40

50

60

70

80

90

100

p00e00d13p00e00d12

p00e00d11p00e00d00

p00e00d21p00e00d22

p00e00d23

Duration Pattern - Gr1_Gr2_Grn_Grt

Re

l. R

es

po

ns

e F

req

ue

nc

ies

(%

)

2nd_syll

1st_syll

Prominence Perception Amplitude Envelope Variable on p00 (Exp4)

0

10

20

30

40

50

60

70

80

90

100

p00e13d00p00e12d00

p00e11d00p00e00d00

p00e21d00p00e22d00

p00e23d00

Amplitude Envelope Pattern - Gr1_Gr2_Grn_Grt

Re

l. R

es

po

ns

e F

req

ue

nc

ies

(5

)

2nd_syll

1st_syll

Prominence Perception All Variables (Exp4)

0

10

20

30

40

50

60

70

80

90

100

p1

4e

00

d0

0

p1

2e

00

d0

0

p0

1e

00

d0

0

p2

2e

00

d0

0

p1

1e

00

d1

3

p1

1e

00

d1

1

p1

1e

00

d2

1

p1

1e

00

d2

3

p1

1e

13

d0

0

p1

1e

11

d0

0

p1

1e

21

d0

0

p1

1e

23

d0

0

p0

0e

00

d1

3

p0

0e

00

d1

1

p0

0e

00

d2

1

p0

0e

00

d2

3

p0

0e

13

d0

0

p0

0e

11

d0

0

p0

0e

21

d0

0

p0

0e

23

d0

0

Stimulus Pattern - Gr1-2

Re

l. R

es

po

ns

e F

req

ue

nc

ies

(%

)

2nd_syll

1st_syll

Datenanalyse– "keine Antwort" extrem selten, 5 von 2800

Reaktionen = 0,18%, forced choice funktionierte– Homogenitätstests der Gruppendaten Gr1n, Gr2n,

Gr1t, Gr2t für jeden Teiltest° Chi2 mit einer Ausnahme nicht signifikant° für p00d13-d23, p=0,038

° Gr1n und Gr2n verhielten sich offenbar unterschiedlich, nicht aber Gr1t und Gr2t trotz gleichen Unterschieds in der Positionierung der Pitch-Serie

° und Gr1n und Gr2n verhielten sich bei anderen Serien nicht unterschiedlich

° Ergebnis kann also als Folge einer zufälligen, nicht eruierbaren Faktorenbündelung betrachtet werden

° daher lassen sich für die weitere Analyse alle Gruppendaten zusammenfassen

• Statistisches Testen der Hypothesen muss das Design der Messwiederholungen und der gepaarten Datensätze von denselben Hörern berücksichtigen

• Es würde sich ein Testverfahren ANOVA anbieten mit den systematischen Faktoren 'Testserie' und 'Teststimulus' genestet in dem zufälligen Faktor 'Testperson'– aber die Daten verteilen sich nicht monoton über

die Stimuli einer Serie in den einzelnen Testpersonen

– 5 Antworten/Stimulus sind hierfür nicht ausreichend

– damit entfallen die Intervallskalierung und die Normalverteilung

– also muss nicht-parametrisch getestet werden• multiple Rangvergleiche nach Wilcoxon-Wilcox in

der Version von Dunn-Rankin – die Antworten "1. Silbe prominent" eines jeden

Sprechers für den Basisstimulus p11e00d00 werden verglichen mit der Summe der Antworten zu den 3 linken und der Summe der 3 rechten Stimuli der Serie

– um diese drei Datensätze vergleichbar zu machen, müssen die proportionalen Anteile "1. Silbe" für jeden berechnet werden

– dasselbe Verfahren wird dann auf die anderen 4 Testserien angewandt

– zweiseitiges Testen auf dem 5%-Niveau• Pitch-Serie

– linker vs. rechter Block und rechter Block vs. mittlerer Stimulus sind signifikant

– linker Block vs. mittl. Sti liegt knapp unter der Signifikanzschranke

– bestätigt Schärfe des Übergangs im Diagramm

• p11-Dauer: mittl. Sti vs. linker Block n.s.• p11-Amplitude: mittl. Sti vs. rechter Block n.s.• beide p00-Serien: mitl. Sti vs. linker Block n.s.• aus diesen Resultaten lässt sich folgern

– die linken und rechten Blöcke sind stets signifikant verschieden, d.h. das Antwortverhalten der einzelnen Hörer zeigt in allen Testserien einen signifikanten Übergang von Erstsilben- zu Zweitsilbenprominenz

– in den p00-Serien geht der mittlere Stimulus mit dem linken Block

– in p11-Amplitude mit dem rechten– in der Pitch-Serie ist er am deutlichsten getrennt– in p11-Dauer war dasselbe zu erwarten wie in p11-

Amplitude° aber auch hier Gruppierung mit linkem Block° vielleicht versteckter Positionseffekt: diese

Serie wurde allen Vpp als erste präsentiert° Bias zu "1. Silbe" am Anfang des Experiments

wegen Erwartung initialer Prominenz im Dt.

• zur weiteren Stütze der Ergebnisse multiple Vergleiche– zwischen den mittleren Stimuli in jeder Testserie

Hypothese

p11-Serien sind signifikant verschieden von den p00-Serien in der Positionierung des mittleren Stimulus im Antwortprofil° innerhalb der p11- bzw. p00-Serien keine

Signifikanz° aber signifikante oder knapp signifikante

Trennung zwischen p11e00d00 und p00e00d00 in den verschiedenen Serien

– zwischen dem mittleren Sti in den p11-Serien und dem nächsten Sti nach rechts in den p00-Serien

Hypothese

sie sind nicht signifikant verschieden, weil sie in den jeweiligen Serien den Zufallspunkt repräsentieren° keine Signifikanz, aber p11e00d?? zeigt wieder

eine stärkere Tendenz zur ersten Silbe

– zwischen dem mittleren Sti in den p00-Serien und dem nächsten Stimulus nach links in den p11-Serien

Hypothese

sie sind nicht signifikant verschieden , weil alle den Punkt links vom Zufallspunkt repräsentieren° keine Signifikanz

• sämtliche Hypothesen sind bestätigt

Einbauen von Prominenzmustern in rhythmische Ketten

• Silbenfolgen lassen sich durch Pitch, Dauer oder Amplitude und ihre Kombinationen rhythmisch strukturieren

• als alleiniger Faktor ist Pitch am stärksten• eine monotone ba-Kette liefert keine rhythmische

Struktur und kann durch den Hörer aktiv kognitiv strukturiert werden– sie kann schwanken zwischen Jambus, Trochäus,

Daktylus, Anapäst

• Wenn die Dauerstrukturierung komplementär über zwei Silben(blöcken) vorgenommen wird, dann beeinträchtigt dies nicht die globalere Tempowahrnehmung.– p00e00d00: Vokale 189ms - 189ms– p11e00d00: Vokale 189ms - 189ms– p00e00d12: Vokale 213ms - 161 ms; Distanz 52ms– p00e00d22: Vokale 161ms - 213ms: Distanz 52 ms

• Ist die Dauerstrukturierung nicht komplementär, dann führt eine Verlängerung zur Wahrnehmung einer Tempoverlangsamung, eine Verkürzung zur Tempobeschleunigung, verglichen mit den gleich langen Silben in p00 oder p11 – p00e00d00: Vokale 189ms - 189ms– p11e00d00: Vokale 189ms - 189ms– p00e00-30pc-Exp1: Vokale 189ms - 148 ms;

Distanz 41ms– p00e00d24-Exp3: Vokale 189ms - 238ms: Distanz

49 ms

• Diese Interferenz zwischen Dauer als rhythmischer Strukturfaktor und als Indikator von Sprechtempo zeigt, dass die kognitive Verarbeitung des hereinkommenden Signals auf zwei Ebenen stattfindet– die syntagmatische komplementäre

Dauerstrukturierung indiziert rhythmische Muster, wenn kein anderer Strukturfaktor (Pitch) aktiv ist

– in diesen rhythmischen Mustern findet eine Dauerintegration statt, die das Tempo auf einen Wert setzt, der zwischen prominenter und nicht prominenten Silben liegt

– dieser Wert liegt bei nicht-komplementärer Änderung höher oder tiefer als bei komplementärer

– d.h.in einer nicht komplementär erzeugten Dauerstruktur wird die Abfolge doch komplementär interpretiert

– dann passt die gekürzte/gelängte Silbe in einen anderen Temporahmen

– Es ist die Frage, ob dies ein Charakteristikum sog. akzentzählender Sprachen ist und z.B. in den Romanischen Sprachen andere Bedingungen gelten.

• Entsprechendes gilt für die Interferenz der Energie zur Markierung rhythmischer Einheiten und Lautstärke.– komplementäre Änderung in Exper4

° p00e00d00

° p00e12d00

° p00e22d00– vergleichbare globale Lautsärke

– nicht-komplementäre Änderung in Exper3

° p00e00d00

° p00e12d00-Exp3

¶global leiser

° p00e22d00-Exp3

¶global lauter

prominenz und rhythmus

Documents