tutorat ii multiple korrelation mediator- moderatoranalyse 19.05.2009
TRANSCRIPT
Tutorat IIMultiple Korrelation
Mediator- Moderatoranalyse
19.05.2009
Offene Fragen
Welches Diagramm entspricht am besten folgender Korrelationstabelle?
y x1 x2
y 1 0,25 0,64
x1 1 0,04
x2 1
Multiple Regression
Multiple Regression - 3
Inhalt:
1. Multiple Regression– Strukturgleichung– Regressionskoeffizienten– Quadratsummen und F-Test– Determinationskoeffizient
2. Multiple Korrelation und multiple Regression- Schrumpfungskorrektur- Capitalization of Chance
3. Selektion der Prädiktoren- Einschluss- Schrittweise
Multiple Regression - 4
- Kriterium hängt mehr als einem Prädiktor ab- Zusammenhänge mit vielen Variablen
Beispiel: Erfolg in Statistik II hängt ab von… - Mathematischen Fähigkeiten- Anzahl der Vorlesungs- und Tutoratsbesuche- Anzahl der Arbeitsstunden zu Hause- Motivation / Interesse- IQ- …
Multiple Regression
Multiple Regression - 5
Strukturgleichungen
axby ii ˆ
kikkiii axbxbxby ...23.12211 ...ˆ
Bivariate Regression
Multivariate Regression
– Erweiterung der einfachen linearen Regression
mehrere Prädiktorvariablen
– Bestimmung über die Methode der kleinsten Quadrate
N
ii
N
iii eyy
1
2
1
2)ˆ(
Ziel der Regressionsanalyse
- Bestimmung der Parameter der Regressionsgleichung: b1, b2, b3, a
Interpretation der b-Gewichte:
• Das Vorzeichen gibt die Richtung des Effekts an.
• Der Betrag gibt an, wie stark ein Prädiktor gewichtet wird.
• Aber: Das Gewicht häng von der Skalierung (dem Wertebereich) von x und y ab.
• Einfacher zu interpretieren sind die standardisierten Gewichte (β).
Signifikanztests der multiplen Regression
(1) Wird ein statistisch bedeutsamer Anteil der Varianz des Kriteriums durch alle Prädiktoren gemeinsam aufgeklärt? F-Test
(2) Leisten die einzelnen Prädiktoren einen bedeutsamen Beitrag? t-Tests für alle Prädiktoren
resregtotal SSSSSS
Standardisierte Regressionsgewichte(β – Gewichte)
Multiple Regression - 8
Die Regressionsgerade kann auch in einer standardisierten Form beschrieben werden:
kikkiii axbxbxby ...23.12211 ...ˆ
ikkiiyi zzzz ...ˆ 2211
unstandardisiert:
standardisiert:
Vorteil: Die Beta-Gewichte nehmen nur Werte zwischen -1 und +1 an. Sie können wie Korrelationskoeffizienten interpretiert werden.
Die additive Konstante (a) entfällt, da die zy einen Mittelwert von Null hat.
Multiple Regression - 9
n
iiires
n
iireg
n
iitotal
yySS
yySS
yySS
1
1
1
)²ˆ(
)²ˆ(
)²(
res
reg
resres
regreg
MS
MSF
KN
SSMS
K
SSMS
1
Signifikanztest dermultiplen Regression und Korrelation
Multiple Regression - 10
2
1
/
/
dfSS
dfSSF
res
regGesucht:
total
reg
SS
SSR 2
Signifikanztest dermultiplen Regression und Korrelation
Bekannt:
F soll aus R² berechnet werden!
1df
n)Prädiktoreder (Anzahl df
:mit
,/1
/
/
/
2
1
22
12
2
1
kN
k
dfR
dfR
dfSS
dfSSF
res
regemp
Signifikanztest - Beispiel
Multiple Regression - 11
Y X1 X2
Y 1.0 .45 .60
X1 1.0 .30
X2 1.050
44.
66.2
21.
21.
N
R
R
xxy
xxy
/1
/
22
12
dfR
dfRFemp
46.18.012
.22
47/56.
2/44.empF
18.347;2 NdfZdfkritF
Zähler-Freiheitsgrade
Nenner-Freiheitsgrade
Es besteht ein bedeut-samer Zusammenhang zwischen dem Kriterium und den Prädiktoren
Übung I:
Eine multiple Korrelation mit 4 Prädiktoren und 47 Probanden ergibt einen Wert von
r = 0.40. Ist der Zusammenhang statistisch bedeutsam? Begründet eure Antwort.
R²= 0.16
Femp = 2;
F(4/42)=2.61 => n.s
Weil Fkrit> Femp …
Übung II
(a) Berechnet den emp. F-Wert(b) Ist das Ergebnis statistisch bedeutsam?(c) Wie viele Prädiktoren wurden verwendet?(d) Wie viele Probanden nahmen an der
Untersuchung teil?
Modell Quadrat
summe
df Mittel der Quadrate
F Signifikanz
1Regression
Residuen
ges
30.198
7.661
37.859
15
46
61
2.013
.167
.000
Multiple Regression - 14
Korrigiertes R²
R überschätzt Populationszusammenhang!• Die Vorhersage in einer Stichprobe überschätzt Vorhersage
in anderen Stichproben bzw. in der Population• Je kleiner die Stichprobe und je größer die Anzahl der
Prädiktoren desto größer die Überschätzung von R²
Multiple Regression - 15
Korrigiertes R²
Schrumpfungskorrektur nach Olkin & Pratt:
22 ²)1(2
²)1(2
31ˆ R
KNR
KN
NR
40.)50(.17
2)50(.
15
171ˆ 22
R
Beispiel: k=3; N=20; R² = .50
Multiple Regression - 16
Multiple Regression - Vorgehen
Mögliche Strategien:
1. Hypothesengeleites Vorgehen: Einschluss
2. Hierarchische Regressionsanalysen• Vorwärts-Selektion• Rückwärts-Eliminieren• Schrittweise Vorgehen
Problem: welche und wie viele Prädiktoren sollen für die Vorhersage ausgewählt werden?
=> immer ein „sparsames“ Vorgegehen wählen, weil eine große Prädiktormenge eine Überschätzung von R² fördert.
Multiple Regression - 17
Multiple Regression - Vorgehen
EinschlussA priori Auswahl der aufzunehmenden Prädiktoren
(aufgrund von Vorwissen oder Theorie)
Vorteile:– Hypothesengeleitetes Vorgehen– Keine Capitalization of Chance
Nachteile:– Möglicherweise Aufnahme von mehr Prädiktoren als unbedingt
erforderlich (Prädiktoren, die keinen signifikanten Beitrag leisten)Dies kann zu einer Verringerung des F-Wertes führen (wegen der größeren Anzahl der Zähler-Freiheitsgrade), und damit die Teststärke verringern.
– Möglicherweise werden wichtige Prädiktoren „übersehen“ bzw. „vergessen“
Multiple Regression - 18
Hierarchische RegressionsanalysenPost hoc werden die am besten passenden Prädiktoren emp. bestimmt
Vorteile:– Minimum an Prädiktoren– Exploratives Vorgehen möglich.
Nachteile:– Capitalization of Chance wg. Bevorzugung hoch
korrelierender Prädiktoren– Kein hypothesengeleitetes Vorgehen
Multiple Regression - Vorgehen
Vorwärts-Selektion
• Aus einer Menge möglicher Prädiktoren wird der Prädiktor mit der höchsten Validität zuerst aufgenommen.
• Unter den verbleibenden Prädiktoren wird immer derjenige ausgewählt, der den größten Teil der verbleibenden Varianz aufklärt (=höchste inkrementelle Validität).
• Wenn kein Prädiktor die aufgeklärte Varianz signifikant erhöht,ist die endgültige Auswahl gefunden.
Rückwärts-Eliminierung
• Zunächst werden alle Prädiktoren eingeschlossen
• Dann wird immer der Prädiktor weglassen, der am wenigsten zur Vorhersage beiträgt
• Wenn der Ausschluss eines Prädiktors zu einer signifikanten Reduktion der aufgeklärten Varianz führen würde, wird der Selektionsprozess abgebrochen
Multiple Regression - 21
Schrittweise Selektion:• Es wird abwechseln ein Vorwärts- und ein Rückwärtsschritt durchgeführt.
• Dadurch werden Variablen, die im Kontext neu aufgenommener Prädiktoren keine Varianz mehr aufklären, im Nachhinein wieder entfernt.
• Diese Schritte werden so lange wiederholt, bis eine optimale Vorhersage gefunden ist.
Multiple Regression - Vorgehen
1. Weitere Regressionsanalysen
Mediatoranalyse:
Wird der Zusammenhang von X und Y durch M vermittelt?
Moderatoranalyse:
Wird der Zusammenhang von X und Y durch M beeinflusst?
Mediatoranalyse
• Annahme zur Kausalität kann gemacht werden (wirkt etwas direkt oder indirekt)
• man untersucht, wie etwas wirkt
• Schaubild an Tafel
Mediatoranalyse Vorgehen
1. Schritt: Regression von Y auf X. (Regression der Note auf die Motivation) Y = b X + a Nur wenn sich ein signifikanter Zusammenhang zwischen Y und X zeigt (b ≠ 0), kann eine Mediation vorliegen.
2. Schritt: Regression von M auf X.(Regression der Lerndauer auf die Motivation) M = b X + a
b ≠ 0, sonst keine Mediation 3. Schritt: Regression von Y auf M.(Regression der Note auf die Lerndauer)
Y = b M + a b ≠ 0, sonst keine Mediation
4. Schritt: Regression von Y auf X und M.(Regression der Note auf die Lerndauer und die Motivation)
Y = b1X + b2 M + a
Ergebnis Mediatoranalyse
= 0: „Vollständige Mediation“
| |> 0, aber kleiner als in Schritt 1: „partielle Mediation“
gleich wie in Schritt 1: Keine Mediation
• Man unterscheidet einen partiellen Mediator-Effekt von einem vollständigem Mediator-Effekt
• Ein partieller Mediator-Effekt liegt dann vor, wenn Z von X und zugleich Y von Z beeinflusst wird, aber X zudem auch einen direkten Effekt auf Y ausübt
• Ein totaler Mediator-Effekt liegt hingegen vor, wenn der Effekt von X auf Y komplett durch Z interveniert wird und kein direkter Effekt mehr zwischen X und Y besteht (komplette Effekt der M auf die Note wird über Lerndauer vermittelt)
yxb ,
Mxb ,
Mxb ,
Moderatoranalyse
• Merkmalausprägung in der Moderatorvariablen bestimmt die Stärke der Prädiktion bei der Vorhersage der Variablen Y durch eine Variable X
• Unterschied zur Mediatoranalyse Moderator wirkt auf b-Gewichte der Regression, nicht auf aV, oder wird auch nicht von uV beeinflusst
Bsp.: Zusammenhang von verbaler Intelligenz (x) und Gedächtnisleistung (y) hängt vom Alter (z) ab
(Abbildung anfertigen)
Moderatoranalyse- Vorgehen1. Schritt: z-Transformation von X und M
2. Schritt: Berechnung eines neuen Prädiktors: P = z(X) ∙ z(M).
3. Schritt: Berechnung einer Regression von Y auf z(X), z(Y) und P
Interpretation des Regressionsgewichts von P:
• b> 0 (sig): Je größer M, desto höher (positiver) die Steigung der ursprünglichen Regressionsgeraden
• b< 0 (sig) : Je größer M, desto geringer (negativer) die Steigung der ursprünglichen Regressionsgeraden
• b≈0 (n.s.): Keine Moderation des Zusammenhangs von X und Y durch M.
Übungen:
Modell Quadrat
summe
df Mittel der Quadrate
F Signifikanz
1Regression
Residuen
ges
24.115
???
38.389
3
???
64
8.038
???
??? .000
Lösung:
Modell Quadrat
summe
df Mittel der Quadrate
F Signifikanz
1Regression
Residuen
ges
24.115
14.274
38.389
3
61
64
8.038
0.234
34.350 .000