17.06.2009
1
methodenlehre ll – Faktorenanalyse
• Faktorenanalyse
Thomas Schäfer | SS 2009 1
methodenlehre ll – Faktorenanalyse
• Faktorenanalyse nach Spearman
• Variablen zur Beschreibung von Intelligenz
Entwicklung der Faktorenanalyse
Thomas Schäfer | SS 2009
• Hauptkomponentenanalyse (Pearson, Hotelling)
2
17.06.2009
2
methodenlehre ll – Faktorenanalyse
• Grundidee:Durch die Analyse des Zusammenhangs zwischen messbaren Variablen ist es möglich, nicht direkt messbare „latente Variablen“ oder Faktoren
Die Faktorenanalyse
g , „aufzuspüren
• 2 Arten von Verfahren
– Hauptachsenanalyse („common factor analysis“): Faktoren können nur einen Teil der in den Variablen enthaltenen Varianz erklären
– Hauptkomponentenanalyse (principal component analysis, PCA): Faktoren erklären im Prinzip die in den Variablen enthaltene Varianz
Thomas Schäfer | SS 2009
pvollständig
• Vorgehensweise explorativ vs. konfirmatorisch
3
methodenlehre ll – Faktorenanalyse
• Ziele der FA:– Identifikation latenter Merkmale– Reduktion von Daten (aus vielen Items wenige Faktoren machen)
Die Faktorenanalyse
( g )– Reduktion von Redundanzen (Interkorrelationen) zwischen einzelnen
Variablen (siehe korrelierte Prädiktoren in der Regression)
• Anwendungsgebiete– Psychologie und Soziologie (z.B. Fragebogenkonstruktion,
Theoriekonstruktion)– Wirtschaft
Thomas Schäfer | SS 2009
– Neuronale Netze (Bild‐ und Klangverarbeitung)
4
17.06.2009
3
methodenlehre ll – Faktorenanalyse
Die Faktorenanalyse ‐ Beispiel
Thomas Schäfer | SS 2009 5
methodenlehre ll – Faktorenanalyse
Optimierungskriterium
„Kleinste Quadrate“ PCA
7
8
9
10
11
Y-W
erte
7
8
9
10
11
Y-W
erte
Thomas Schäfer | SS 2009 6
X-Werte0 5 10 15 20
4
5
6
Y
0 5 10 15 204
5
6
X-Werte
17.06.2009
4
methodenlehre ll – Faktorenanalyse
Beispiel: Intelligenztest
Faktor 1 Faktor 2
Thomas Schäfer | SS 2009 7
methodenlehre ll – Faktorenanalyse
Beispiel: Intelligenztest
ER
Thomas Schäfer | SS 2009 8
17.06.2009
5
methodenlehre ll – Faktorenanalyse
Beispiel: Intelligenztest
ZNZN
Thomas Schäfer | SS 2009 9
methodenlehre ll – Faktorenanalyse
Beispiel: Intelligenztest
SCH
Thomas Schäfer | SS 2009 10
17.06.2009
6
methodenlehre ll – Faktorenanalyse
Beispiel: Intelligenztest
GR
Thomas Schäfer | SS 2009 11
methodenlehre ll – Faktorenanalyse
Beispiel: Intelligenztest
GW
Thomas Schäfer | SS 2009 12
17.06.2009
7
methodenlehre ll – Faktorenanalyse
Wichtige Kennwerte
Faktorladung (ajk): Korrelation einer Variable j mit ihrem Faktor k
Faktorwert (Fki): Wert einer Person/eines Objekts i auf einem Faktor k.
a to adu g (ajk) o e at o e e a ab e j t e a to
Eigenwert eines Faktors (sk2): Summe der (Faktor‐) Ladungsquadrate aller Variablen für Faktor k(Ladungsquadrat ~ Determinationskoeffizient ~ gemeinsame Varianz)
Relative Bedeutsamkeit eines Faktors: Anteil des Eigenwerts an Gesamtvarianz
Thomas Schäfer | SS 2009 13
(Gesamtvarianz = Anzahl der Variablen, da Variablen in PCA z‐transformiert werden und sz = sz2 = 1).
Kommunalität einer Variable j (hj2): Summe der Faktorladungsquadrate dieser Variable (Varianzanteil einer Variable, der durch alle Faktoren erklärt werden kann)
methodenlehre ll – Faktorenanalyse
Wichtige Kennwerte
Thomas Schäfer | SS 2009 14
17.06.2009
8
methodenlehre ll – Faktorenanalyse
Die explorative FaktorenanalyseIn den vielen beobachteten Variablen sollen einige wenige Dimensionen (Faktoren) gefunden werden, welche die Korrelationen zwischen den
2 Arten der Faktorenanalyse
Variablen möglichst gut beschreiben.Die explorative Faktorenanalyse ist in diesem Sinne ein modell‐ oder hypothesengenerierendes Verfahren.
Die konfirmatorische FaktorenanalyseAusgangspunkt ist ein bereits bestehendes Modell, in welchem die Anzahl der Faktoren und strukturellen Beziehungen unter ihnen als bereits bekannt angenommen werden Ziel dieses Verfahrens ist es anhand von
Thomas Schäfer | SS 2009
angenommen werden. Ziel dieses Verfahrens ist es, anhand von Stichprobendaten die freien Parameter dieses Modells zu schätzen und das Modell empirisch zu überprüfen.
Die konfirmatorische Faktorenanalyse ist also ein modell‐ oder hyposentestendes Verfahren.
15
methodenlehre ll – Faktorenanalyse
Schritte bei der Faktorenanalyse
(1) Variablenauswahl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitäten
(4) Zahl der Faktoren
Thomas Schäfer | SS 2009 16
(5) Faktorinterpretation
(6) Bestimmung der Faktorwerte
17.06.2009
9
methodenlehre ll – Faktorenanalyse
Beispiel: Dimensionen von Musikpräferenz
Musical style
Pop
Classical
Rock
Jazz
Folk
Hip hop
Techno
Metal
(1) Variablenauswahl und Errechnung der Korrelationsmatrix
Metal
Blues
Punk
Beat-music
Reggae
R ’n’ B
Soul
House
Rock ’n’ roll
CountryRap
R'n'BHip HopGospel
MetalSwing
SoulSka
BluesReggae
PunkJazz
Rock'n'RollPop
ClassicalAlternative
Rock
Thomas Schäfer | SS 2009 17
Rap
Swing
Gospel
Ska
Alternative
Dance
Gothic
Trance
Beat MusicFolk
TechnoTranceDanceHouse
CountryGothic
Rap
0 1 2 3 4 5 6 7Mean Preference
methodenlehre ll – Faktorenanalyse
Beispiel: Dimensionen von Musikpräferenz
(1) Variablenauswahl und Errechnung der KorrelationsmatrixKorrelationen
1 ,047 -,001 -,203 ,088 -,184 ,306 -,219 -,217 -,061 -,039 ,349 -,117 ,454 -,167 ,005 -,289 ,407 ,129 -,126 ,322 -,217 -,138 -,061,321 ,981 ,000 ,064 ,000 ,000 ,000 ,000 ,199 ,412 ,000 ,014 ,000 ,000 ,922 ,000 ,000 ,007 ,008 ,000 ,000 ,004 ,198
446 444 446 440 444 442 441 442 443 441 439 445 439 444 445 445 437 438 439 444 401 437 433 444047 1 282 006 162 324 058 117 064 603 289 041 017 023 137 299 194 064 305 004 191 332 532 082
Korrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach Pearson
Alternative
Blues
Alternative Blues Country Dance Folk/Volksm Gospel Gothic Hip Hop House Jazz Klassik Metal Pop Punk Rap Reggea R'n'B Rock Rock'n'Roll Schlager Ska Soul Sw ing Techno
Musical style
Pop
Classical
Rock
Jazz
Folk
Hip hop
Techno
Metal,047 1 ,282 -,006 ,162 ,324 -,058 ,117 -,064 ,603 ,289 -,041 -,017 -,023 ,137 ,299 ,194 ,064 ,305 ,004 ,191 ,332 ,532 -,082,321 ,000 ,894 ,000 ,000 ,198 ,009 ,160 ,000 ,000 ,360 ,698 ,609 ,002 ,000 ,000 ,157 ,000 ,928 ,000 ,000 ,000 ,068444 503 502 491 499 498 487 498 490 496 495 500 495 496 500 498 482 494 496 501 417 490 487 501
-,001 ,282 1 ,174 ,292 ,172 -,051 ,035 -,051 ,107 ,043 -,035 ,177 ,062 ,095 ,136 ,065 ,179 ,307 ,283 ,090 ,173 ,231 -,068,981 ,000 ,000 ,000 ,000 ,257 ,440 ,263 ,017 ,333 ,436 ,000 ,169 ,033 ,002 ,154 ,000 ,000 ,000 ,067 ,000 ,000 ,127446 502 505 493 502 500 490 500 492 498 497 503 496 499 502 500 484 496 498 503 419 492 488 503
-,203 -,006 ,174 1 ,059 ,152 -,063 ,252 ,585 ,005 ,026 -,115 ,321 -,143 ,274 ,105 ,315 -,183 -,084 ,180 ,005 ,262 ,102 ,486,000 ,894 ,000 ,193 ,001 ,167 ,000 ,000 ,915 ,569 ,010 ,000 ,002 ,000 ,020 ,000 ,000 ,064 ,000 ,924 ,000 ,026 ,000440 491 493 494 491 489 482 489 486 487 486 492 486 489 491 489 476 485 487 492 413 484 478 492,088 ,162 ,292 ,059 1 ,033 ,160 -,083 -,008 ,101 ,062 ,072 -,038 ,058 -,040 ,085 -,055 ,058 ,074 ,284 ,140 ,014 ,072 -,007,064 ,000 ,000 ,193 ,467 ,000 ,066 ,866 ,024 ,168 ,105 ,399 ,195 ,368 ,058 ,225 ,195 ,102 ,000 ,004 ,755 ,115 ,873444 499 502 491 503 499 488 498 490 496 495 501 494 497 500 498 482 495 496 502 416 490 486 501
-,184 ,324 ,172 ,152 ,033 1 -,052 ,235 ,090 ,314 ,258 -,144 ,303 -,132 ,223 ,345 ,463 ,058 ,195 ,139 ,124 ,596 ,430 -,099,000 ,000 ,000 ,001 ,467 ,253 ,000 ,048 ,000 ,000 ,001 ,000 ,003 ,000 ,000 ,000 ,201 ,000 ,002 ,011 ,000 ,000 ,027442 498 500 489 499 502 487 497 489 495 494 499 493 495 499 497 482 494 495 500 418 490 485 500,306 -,058 -,051 -,063 ,160 -,052 1 -,256 -,139 -,144 ,032 ,529 -,156 ,334 -,193 -,121 -,275 ,173 ,037 -,020 ,151 -,224 -,069 ,098,000 ,198 ,257 ,167 ,000 ,253 ,000 ,002 ,002 ,480 ,000 ,001 ,000 ,000 ,007 ,000 ,000 ,413 ,653 ,002 ,000 ,132 ,031441 487 490 482 488 487 491 486 481 485 483 489 482 487 488 487 473 483 484 489 411 480 474 489
-,219 ,117 ,035 ,252 -,083 ,235 -,256 1 ,341 ,156 -,025 -,252 ,260 -,086 ,773 ,413 ,572 -,138 ,045 ,046 ,070 ,411 ,184 ,150,000 ,009 ,440 ,000 ,066 ,000 ,000 ,000 ,000 ,578 ,000 ,000 ,056 ,000 ,000 ,000 ,002 ,315 ,305 ,154 ,000 ,000 ,001442 498 500 489 498 497 486 502 489 495 494 499 494 496 499 498 482 493 496 500 415 489 486 500
-,217 -,064 -,051 ,585 -,008 ,090 -,139 ,341 1 ,065 ,029 -,174 ,131 -,162 ,356 ,155 ,282 -,254 -,128 ,092 -,054 ,216 ,051 ,634,000 ,160 ,263 ,000 ,866 ,048 ,002 ,000 ,152 ,520 ,000 ,004 ,000 ,000 ,001 ,000 ,000 ,005 ,041 ,269 ,000 ,266 ,000443 490 492 486 490 489 481 489 493 487 486 491 485 489 491 491 477 484 486 491 415 482 478 491
-,061 ,603 ,107 ,005 ,101 ,314 -,144 ,156 ,065 1 ,422 -,179 -,044 -,129 ,209 ,309 ,220 -,102 ,090 ,019 ,179 ,345 ,566 ,018,199 ,000 ,017 ,915 ,024 ,000 ,002 ,000 ,152 ,000 ,000 ,333 ,004 ,000 ,000 ,000 ,024 ,047 ,666 ,000 ,000 ,000 ,683441 496 498 487 496 495 485 495 487 500 493 497 491 493 498 496 479 491 493 498 415 487 483 498
-,039 ,289 ,043 ,026 ,062 ,258 ,032 -,025 ,029 ,422 1 -,049 ,017 -,105 ,059 ,112 ,136 -,079 ,073 ,060 ,028 ,233 ,322 ,021,412 ,000 ,333 ,569 ,168 ,000 ,480 ,578 ,520 ,000 ,279 ,704 ,020 ,186 ,012 ,003 ,080 ,107 ,182 ,575 ,000 ,000 ,637439 495 497 486 495 494 483 494 486 493 499 496 491 492 497 495 478 490 492 497 413 487 482 497,349 -,041 -,035 -,115 ,072 -,144 ,529 -,252 -,174 -,179 -,049 1 -,226 ,525 -,146 -,113 -,324 ,405 ,149 -,052 ,146 -,297 -,197 -,008,000 ,360 ,436 ,010 ,105 ,001 ,000 ,000 ,000 ,000 ,279 ,000 ,000 ,001 ,012 ,000 ,000 ,001 ,245 ,003 ,000 ,000 ,862445 500 503 492 501 499 489 499 491 497 496 504 496 498 501 499 484 495 497 502 418 491 487 502
-,117 -,017 ,177 ,321 -,038 ,303 -,156 ,260 ,131 -,044 ,017 -,226 1 -,108 ,232 ,051 ,402 ,195 ,111 ,257 -,076 ,420 ,157 ,033,014 ,698 ,000 ,000 ,399 ,000 ,001 ,000 ,004 ,333 ,704 ,000 ,016 ,000 ,259 ,000 ,000 ,014 ,000 ,124 ,000 ,001 ,470439 495 496 486 494 493 482 494 485 491 491 496 498 492 496 493 479 489 492 496 412 485 481 496,454 -,023 ,062 -,143 ,058 -,132 ,334 -,086 -,162 -,129 -,105 ,525 -,108 1 -,021 ,055 -,227 ,420 ,279 -,019 ,347 -,217 -,052 -,021,000 ,609 ,169 ,002 ,195 ,003 ,000 ,056 ,000 ,004 ,020 ,000 ,016 ,644 ,222 ,000 ,000 ,000 ,678 ,000 ,000 ,251 ,643444 496 499 489 497 495 487 496 489 493 492 498 492 500 498 496 480 492 494 498 417 487 484 498
Korrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)N
Blues
Country
Dance
Folk/Volksm
Gospel
Gothic
Hip Hop
House
Jazz
Klassik
Metal
Pop
Punk
Metal
Blues
Punk
Beat-music
Reggae
R ’n’ B
Soul
House
Rock ’n’ roll
Country
Thomas Schäfer | SS 2009 18
-,167 ,137 ,095 ,274 -,040 ,223 -,193 ,773 ,356 ,209 ,059 -,146 ,232 -,021 1 ,420 ,578 -,083 ,107 ,109 ,066 ,441 ,260 ,228,000 ,002 ,033 ,000 ,368 ,000 ,000 ,000 ,000 ,000 ,186 ,001 ,000 ,644 ,000 ,000 ,066 ,017 ,015 ,175 ,000 ,000 ,000445 500 502 491 500 499 488 499 491 498 497 501 496 498 504 500 483 495 497 502 419 491 487 502,005 ,299 ,136 ,105 ,085 ,345 -,121 ,413 ,155 ,309 ,112 -,113 ,051 ,055 ,420 1 ,417 ,074 ,264 ,100 ,465 ,443 ,378 ,011,922 ,000 ,002 ,020 ,058 ,000 ,007 ,000 ,001 ,000 ,012 ,012 ,259 ,222 ,000 ,000 ,102 ,000 ,026 ,000 ,000 ,000 ,804445 498 500 489 498 497 487 498 491 496 495 499 493 496 500 502 483 493 495 500 418 489 486 500
-,289 ,194 ,065 ,315 -,055 ,463 -,275 ,572 ,282 ,220 ,136 -,324 ,402 -,227 ,578 ,417 1 -,083 ,026 ,130 ,024 ,735 ,317 ,054,000 ,000 ,154 ,000 ,225 ,000 ,000 ,000 ,000 ,000 ,003 ,000 ,000 ,000 ,000 ,000 ,070 ,563 ,004 ,624 ,000 ,000 ,238437 482 484 476 482 482 473 482 477 479 478 484 479 480 483 483 486 477 480 484 409 477 472 484,407 ,064 ,179 -,183 ,058 ,058 ,173 -,138 -,254 -,102 -,079 ,405 ,195 ,420 -,083 ,074 -,083 1 ,485 ,067 ,232 ,007 ,021 -,185,000 ,157 ,000 ,000 ,195 ,201 ,000 ,002 ,000 ,024 ,080 ,000 ,000 ,000 ,066 ,102 ,070 ,000 ,138 ,000 ,875 ,646 ,000438 494 496 485 495 494 483 493 484 491 490 495 489 492 495 493 477 498 491 496 412 485 481 496,129 ,305 ,307 -,084 ,074 ,195 ,037 ,045 -,128 ,090 ,073 ,149 ,111 ,279 ,107 ,264 ,026 ,485 1 ,209 ,311 ,115 ,375 -,138,007 ,000 ,000 ,064 ,102 ,000 ,413 ,315 ,005 ,047 ,107 ,001 ,014 ,000 ,017 ,000 ,563 ,000 ,000 ,000 ,011 ,000 ,002439 496 498 487 496 495 484 496 486 493 492 497 492 494 497 495 480 491 500 498 412 487 483 498
-,126 ,004 ,283 ,180 ,284 ,139 -,020 ,046 ,092 ,019 ,060 -,052 ,257 -,019 ,109 ,100 ,130 ,067 ,209 1 ,048 ,142 ,177 ,033,008 ,928 ,000 ,000 ,000 ,002 ,653 ,305 ,041 ,666 ,182 ,245 ,000 ,678 ,015 ,026 ,004 ,138 ,000 ,329 ,002 ,000 ,459444 501 503 492 502 500 489 500 491 498 497 502 496 498 502 500 484 496 498 505 417 492 488 503,322 ,191 ,090 ,005 ,140 ,124 ,151 ,070 -,054 ,179 ,028 ,146 -,076 ,347 ,066 ,465 ,024 ,232 ,311 ,048 1 ,129 ,255 -,040,000 ,000 ,067 ,924 ,004 ,011 ,002 ,154 ,269 ,000 ,575 ,003 ,124 ,000 ,175 ,000 ,624 ,000 ,000 ,329 ,008 ,000 ,415401 417 419 413 416 418 411 415 415 415 413 418 412 417 419 418 409 412 412 417 419 413 409 417
-,217 ,332 ,173 ,262 ,014 ,596 -,224 ,411 ,216 ,345 ,233 -,297 ,420 -,217 ,441 ,443 ,735 ,007 ,115 ,142 ,129 1 ,485 -,009,000 ,000 ,000 ,000 ,755 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,875 ,011 ,002 ,008 ,000 ,851437 490 492 484 490 490 480 489 482 487 487 491 485 487 491 489 477 485 487 492 413 494 481 492
-,138 ,532 ,231 ,102 ,072 ,430 -,069 ,184 ,051 ,566 ,322 -,197 ,157 -,052 ,260 ,378 ,317 ,021 ,375 ,177 ,255 ,485 1 -,006,004 ,000 ,000 ,026 ,115 ,000 ,132 ,000 ,266 ,000 ,000 ,000 ,001 ,251 ,000 ,000 ,000 ,646 ,000 ,000 ,000 ,000 ,894433 487 488 478 486 485 474 486 478 483 482 487 481 484 487 486 472 481 483 488 409 481 490 488
-,061 -,082 -,068 ,486 -,007 -,099 ,098 ,150 ,634 ,018 ,021 -,008 ,033 -,021 ,228 ,011 ,054 -,185 -,138 ,033 -,040 -,009 -,006 1,198 ,068 ,127 ,000 ,873 ,027 ,031 ,001 ,000 ,683 ,637 ,862 ,470 ,643 ,000 ,804 ,238 ,000 ,002 ,459 ,415 ,851 ,894444 501 503 492 501 500 489 500 491 498 497 502 496 498 502 500 484 496 498 503 417 492 488 505
-,050 -,036 -,047 ,524 -,020 ,005 ,146 ,117 ,561 ,015 ,126 ,010 ,092 -,009 ,169 ,053 ,073 -,180 -,120 ,085 ,005 ,052 ,002 ,763,303 ,436 ,307 ,000 ,674 ,918 ,002 ,011 ,000 ,744 ,006 ,829 ,048 ,853 ,000 ,250 ,116 ,000 ,010 ,067 ,915 ,266 ,971 ,000427 468 470 466 468 467 462 467 466 465 464 469 463 468 469 469 460 464 465 469 403 462 460 469
Korrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)NKorrelation nach PearsonSignifikanz (2-seitig)N
Rap
Reggea
R'n'B
Rock
Rock'n'Roll
Schlager
Ska
Soul
Sw ing
Techno
Trance
Rap
Swing
Gospel
Ska
Alternative
Dance
Gothic
Trance
17.06.2009
10
methodenlehre ll – Faktorenanalyse
Beispiel: Dimensionen von Musikpräferenz
(1) Variablenauswahl und Errechnung der Korrelationsmatrix
Prüfung auf lineare Zusammenhänge (per LOWESS)
Musical style
Pop
Classical
Rock
Jazz
Folk
Hip hop
Techno
MetalMetal
Blues
Punk
Beat-music
Reggae
R ’n’ B
Soul
House
Rock ’n’ roll
Country
Thomas Schäfer | SS 2009 19
Rap
Swing
Gospel
Ska
Alternative
Dance
Gothic
Trance
methodenlehre ll – Faktorenanalyse
• Prüfung auf lineare Zusammenhänge
• Bei Variablen, die stark miteinander korrelieren, wird unterstellt, dass sie eine gemeinsame Dimension haben. Umgekehrt wird angenommen, dass
(1) Variablenauswahl und Errechnung der Korrelationsmatrix
eine gemeinsame Dimension haben. Umgekehrt wird angenommen, dass miteinander nur schwach korrelierende Variablen keinen gemeinsamen Faktor haben. Enthält die Korrelationsmatrix nur sehr geringe Korrelationskoeffizienten, lohnt eine Faktorenanalyse nicht, da keine gemeinsamen Faktoren gefunden werden können. Um diese Überprüfung statistisch abzusichern wurden einige Testverfahren entwickelt, die von SPSS ausgegeben werden. In der Regel reicht aber auch eine Prüfung auf lineare Zusammenhänge mit Hilfe einer Streudiagrammatrix und Lowess‐
Thomas Schäfer | SS 2009
Kurven.
20
17.06.2009
11
methodenlehre ll – Faktorenanalyse
(2) Extraktion der Faktoren
Aufteilung der standardisierten Varianz einer Variablen:
Basismodell der Faktorenanalyse:
s2 = 1.00hi2 ui2
li12 li22 li32 lik2 bi2 ei2
s2 = standardisierte Varianz einer Variablen
hi2= Kommunalität, durch die Faktoren erklärter Varianzanteil
Thomas Schäfer | SS 2009 21
i ,
lik2 = quadrierte Faktorladungen (Varianzanteile einer Variablen auf den jeweiligen Faktoren)
methodenlehre ll – Faktorenanalyse
(2) Extraktion der Faktoren
Jeder Beobachtungswert einer Ausgangsvariablen x lässt sich als eine
Basismodell der Faktorenanalyse:
Linearkombination mehrerer (hypothetischer) Faktoren beschreiben.
Wert einer Person Faktorladung der Variable j Faktorwert der Person usw.auf einer Variable j auf Faktor 1 auf Faktor 1
Thomas Schäfer | SS 2009 22
Diesen Wert für jede Person zu 100% vorherzusagen klappt nur, wenn so viele Faktoren extrahiert werden, wie es Variablen gab.Ziel ist aber die Dimensionsreduktion.
Die Faktorenanalyse ist immer ein Kompromiss zwischen möglichst wenigen Faktoren und möglichst viel Genauigkeit (Varianzaufklärung).
17.06.2009
12
methodenlehre ll – Faktorenanalyse
(2) Extraktion der Faktoren
Korrelationen lassen sich als Vektordiagramme darstellen.Dabei entspricht jeder Korrelation ein Winkel zwischen den Vektoren (M).
Thomas Schäfer | SS 2009 23
methodenlehre ll – Faktorenanalyse
(2) Extraktion der Faktoren
Resultierender Vektor = Faktor
Thomas Schäfer | SS 2009 24
17.06.2009
13
methodenlehre ll – Faktorenanalyse
(3) Bestimmung der KommunalitätenDie Kommunalitäten müssen am Anfang geschätzt werden.
Für die Praxis spielt die Bestimmung der Kommunalitäten (insbesondere bei höherer Variablenzahl) aber eine eher untergeordnete Rolle. 2 generelle Möglichkeiten:
1) Kommunalität: R2m-1
Der multiple Korrelationskoeffizient der Variable Xi mit allen anderen Variablen X1 … Xm-1.Hauptachsenanalyse
2) Kommunalität von 1: es erfolgt keine Schätzung der KommunalitätHauptkomponentenanalyse
Di b id M d ll t h id i h i ht h i h b th ti h!
Thomas Schäfer | SS 2009 25
Die beiden Modelle unterscheiden sich nicht rechnerisch, aber theoretisch!
Hauptachsenanalyse: Wie lässt sich die Ursache bezeichnen, die für die hohen Ladungen dieser Variablen auf diesem Faktor verantwortlich ist?
Hauptkomponentenanalyse: Wie lassen sich die auf einem Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen?
methodenlehre ll – Faktorenanalyse
(4) Zahl der Faktoren
Da ebenso viele Faktoren extrahiert werden können, wie Variablen in die Analyse eingegangen sind, muss man die Anzahl der brauchbaren Faktoren bestimmen. Dabei
Der Kompromiss: wenige Faktoren – viel Varianzaufklärung
g g gwerden nur solche Faktoren ausgewählt, die möglichst viel Varianz auf sich vereinen ‐ also einen hohen Eigenwert haben.
Screeplot6
5
4
1) ScreeplotBeim „Geröllhang“ werden die Faktoren nach der Größe ihrer Eigenwerte angeordnet. Am Fuße liegen die unwirksamen und den Hang bilden die signifikanten Faktoren. Danach wären also zwei Faktoren bedeutsam.
Thomas Schäfer | SS 2009
2) Kaiser‐KriteriumNach Kaiser sollte jeder signifikante Faktor einen Eigenwert größer 1 haben, damit er mehr Varianz enthält als eine einzelne standardisierte Variable.
Kaiser‐Kriterium
26
Faktor1110987654321
Eigenw
ert
3
2
1
02) InterpretierbarkeitInhaltliche Interpretierbarkeit der Faktoren
17.06.2009
14
methodenlehre ll – Faktorenanalyse
(4) Zahl der Faktoren
Erk lärte Ges amtvarianz
5,452 21,806 21,806 3,078 12,310 12,3103,323 13,292 35,099 3,037 12,147 24,4582 468 9 871 44 970 2 978 11 912 36 370
Komponente123
Gesamt % der Varianz Kumulierte % Gesamt % der Varianz Kumulierte %Anfängliche Eigenw erte Rotierte Summe der quadrierten Ladungen
2,468 9,871 44,970 2,978 11,912 36,3701,946 7,785 52,755 2,697 10,786 47,1561,527 6,108 58,863 2,377 9,509 56,6651,325 5,300 64,164 1,875 7,499 64,164,940 3,759 67,923,878 3,510 71,434,796 3,184 74,617,753 3,013 77,630,625 2,501 80,131,557 2,230 82,360,552 2,208 84,568,495 1,978 86,547,459 1,837 88,384,425 1,699 90,083,399 1,596 91,678361 1 446 93 124
3456789101112131415161718
Thomas Schäfer | SS 2009 27
,361 1,446 93,124,350 1,401 94,525,298 1,194 95,719,272 1,089 96,808,247 ,989 97,797,200 ,802 98,598,183 ,731 99,329,168 ,671 100,000
1819202122232425
Extraktionsmethode: Hauptkomponentenanalyse.
methodenlehre ll – Faktorenanalyse
• Benennung der Komponenten bzw. Ursachen nach inhaltlichen Gesichtspunkten.
• Faktorenrotation erhöht die Interpretierbarkeit.
(5) Faktorinterpretation
Kompone ntenmatrixa
,771 ,764 ,696 ,675 ,620 ,410 ,577 ,559 ,524 -,492 ,437 ,502 ,482
,653 ,611
,524
SoulR'n'BRapHip HopSw ingGospelReggeaHouseDanceAlternativeRock'n'RollRockSka
1 2 3 4 5 6Komponente
Rotie rte Komponente nmatrixa
,805 ,769 ,700 ,691
,877 ,872 ,771 ,713 ,770 ,703 ,674 ,662 ,560 -,444
,537 ,410
JazzBluesSw ingKlassikTechnoTranceHouseDancePunkMetalRockAlternativeGothicSka
1 2 3 4 5 6Komponente
Thomas Schäfer | SS 2009 28
, ,423 -,411 ,699 -,516 ,644
-,493 ,497 ,470 ,408 ,459
,551 -,577 -,539 ,528 ,400
,440 ,439 -,489 ,533 ,532
CountryTranceTechnoMetalGothicPunkJazzKlassikPopBluesFolk/VolksmSchlager
Extraktionsmethode: Hauptkomponentenanalyse.6 Komponenten extrahierta.
,727 ,713 ,662 ,818
,446 ,639 ,460 ,628
,518 ,546 ,690 ,674 ,665 ,419 ,457
Hip HopRapReggeaPopSoulR'n'BGospelSchlagerFolk/VolksmCountryRock'n'Roll
Extraktionsmethode: Hauptkomponentenanalyse. Rotationsmethode: Varimax mit Kaiser-Normalisierung.
Die Rotation is t in 7 Iterationen konvergiert.a.
17.06.2009
15
methodenlehre ll – Faktorenanalyse
(5) Faktorinterpretation
Faktorenrotation
VARIMAX ist der am häufigsten verwendete
Interpretation
VARIMAX ist der am häufigsten verwendeteRotationsalgorithmus. Er funktioniert nach demPrinzip: „Maximiere die Varianz der quadriertennormierten Ladungen!“
Thomas Schäfer | SS 2009 29
Eine weitere Aufgabe, die vom Forscher auszuführen ist, ist die Interpretation der gefundenen Faktoren. Dabei kann man sich an der Höhe der Ladungen orientieren. Allgemein werden Ladungen mit einem Wert ≥ 0,5 als bedeutsam angesehen. Der Forscher muss nun nach dem Verbindenden zwischen den Variablen suchen, nach der Dimension, die den Variablen zugrunde liegt.
methodenlehre ll – Faktorenanalyse
(5) Faktorinterpretation
Rotie rte Komponentenmatrixa
,805 ,769
JazzBlues
1 2 3 4 5 6Komponente
A h ll M ik,700 ,691
,877 ,872 ,771 ,713 ,770 ,703 ,674 ,662 ,560 -,444 ,537 ,410 ,727 ,713 ,662
818
Sw ingKlassikTechnoTranceHouseDancePunkMetalRockAlternativeGothicSkaHip HopRapReggeaP
Anspruchsvolle Musik
Elektronische Musik
usw.
Thomas Schäfer | SS 2009 30
,818,446 ,639
,460 ,628 ,518 ,546
,690 ,674 ,665 ,419 ,457
PopSoulR'n'BGospelSchlagerFolk/VolksmCountryRock'n'Roll
Extraktionsmethode: Hauptkomponentenanalyse. Rotationsmethode: Varimax mit Kaiser-Normalisierung.
Die Rotation is t in 7 Iterationen konvergiert.a.
17.06.2009
16
methodenlehre ll – Faktorenanalyse
Überprüfung der Lösungsgüte
• Ausmaß der aufgeklärten Varianz
• Höhe der Ladungen (evtl. Variablen aussondern Faustregel: < 5)
3,078 12,310 12,3103 037 12 147 24 458
Gesamt % der Varianz Kumulierte %Rotierte Summe der quadrierten Ladungen
aussondern, Faustregel: <.5)
• Inhaltliche Plausibilität
• Stabilität der Lösung (bei Replikationen)
• Rückrechnung der Korrelationsmatrix
bei f Faktoren:(axk, ayk: Ladungen der Variablen x und y auf Faktor k)
3,037 12,147 24,4582,978 11,912 36,3702,697 10,786 47,1562,377 9,509 56,6651,875 7,499 64,164
Thomas Schäfer | SS 2009 31
∑==
f
kykxkxy aar
1
Je besser Korrelationsmatrix reproduziert werden kann, desto besser ist Faktorenlösung
methodenlehre ll – Faktorenanalyse
Rückrechnung der Korrelationsmatrix
∑==
f
kykxkxy aar
1
53.22.)04.(73.74. =×−+×=rxy
Thomas Schäfer | SS 2009 32
17.06.2009
17
methodenlehre ll – Faktorenanalyse
• Jede Person bzw. jedes Objekt besitzt Messwerte auf den beobachteten Ausgangsvariablen. Hat man nun einen oder mehrere gut interpretierbare Faktoren gefunden, werden dann Werte einer Person auf diesen Faktoren
(6) Bestimmung der Faktorwerte
g ,berechnet. Das sind die Faktorwerte einer Person.
• Haben wir die Hauptkomponentenmethode durchgeführt, können die Faktorenwerte direkt berechnet werden.
• (Bei der Hauptachsenanalyse müssen die Werte geschätzt werden. SPSS bietet dafür mehrere Möglichkeiten )
Thomas Schäfer | SS 2009
bietet dafür mehrere Möglichkeiten.)
33
methodenlehre ll – Faktorenanalyse
1. Findet Anwendung bei den sog. Messmodellen in Strukturgleichungsmodellen
Konfirmatorische Faktorenanalyse
Thomas Schäfer | SS 2009
2. oder bei der Überprüfung von Theorien (z.B. bei Fragebögen)
34
17.06.2009
18
methodenlehre ll – Faktorenanalyse
Vigilance
Ich ziehe gern alle Alternativen in Betracht.Ich versuche die Nachteile aller Alternativen herauszufinden.Ich überlege, wie ich Entscheidungen bestmöglich treffen kann.Wenn ich mich entscheiden muss, möchte ich gern viele Informationen sammeln.Bevor ich mich entscheide versuche ich mir über meine Ziele klar zu werden
Konfirmatorische Faktorenanalyse ‐ Beispiel
Decision Making QuestionnaireDMQ soll 4 Faktoren (= 4 Entscheidungsstile) liefernBevor ich mich entscheide, versuche ich mir über meine Ziele klar zu werden.
Ich bin sehr vorsichtig, bevor ich mich entscheide.
Buckpassing
Ich vermeide es Entscheidungen zu treffen.Ich treffe keine Entscheidungen, solange ich nicht wirklich muss.Ich ziehe es vor andere entscheiden zu lassen.Ich übernehme nicht gern die Verantwortung für Entscheidungen.Wenn eine Entscheidung von mir oder von einer anderen Person getroffen werden kann, lasse ich die andere Person entscheiden.Ich ziehe es vor Leute entscheiden zu lassen, die sich besser auskennen.
Procrastination
Ich vergeude viel Zeit mit Belanglosigkeiten, bevor ich zu einer endgültigen Entscheidung komme.Wenn ich eine Entscheidung getroffen habe, dauert es eine Weile, bis ich auch danach handele.Wenn ich eine Entscheidung treffen muss, warte ich ziemlich lang, bevor ich anfange darüber nachzudenken.Ich schiebe Entscheidungen auf bis es zu spät ist
Thomas Schäfer | SS 2009
Ich schiebe Entscheidungen auf, bis es zu spät ist.Ich schiebe Entscheidungen auf die lange Bank.
Hypervigilance
Immer wenn ich vor einer schwierigen Entscheidung stehe, bin ich skeptisch, ob ich eine gute Lösung finden kann.Wenn ich Entscheidungen treffen muss, fühle ich mich immer, als wäre ich einem enormen Zeitdruck ausgesetzt.Die Möglichkeit, dass irgend etwas schief gehen könnte, führt dazu, dass ich sofort nach einer anderen Alternative suche.Ich kann nicht klar denken, wenn ich eine Entscheidung in Eile treffen muss.Wenn ich eine Entscheidung getroffen habe, verbringe ich viel Zeit damit mich davon zu überzeugen, dass sie richtig war.
35
methodenlehre ll – Faktorenanalyse
Konfirmatorische Faktorenanalyse ‐ Beispiel
Anders als bei der explorativen FA wird bei der konfirmatorischen FA eine theoretisch erwartete Struktur
b d b d k dvorgegeben und getestet, ob diese Struktur mit den Daten vereinbar ist.
Dabei schaut man sich alle Faktorladungen an und prüft, welche Items gegebenenfalls eliminiert werden müssen (bei Ladungen unter .5)
Thomas Schäfer | SS 2009 36
Solche Analysen sind nur mit Programmen wie AMOS durchführbar.
17.06.2009
19
methodenlehre ll – Faktorenanalyse
Vigilanz
allte Alternativen in Betracht ziehen (V)6 ,57
vor Entscheidung Klarheit über Ziele (V)5 ,10
Überlegen, wie Entscheidungen bestmöglich... (V)41,00
sehr vorsichtig vor Entscheidung (V)3 ,14
viele Informationen sammeln (V)2 1,00
Nachteile aller Alternativen herausfinden (V)1-,04
nicht gern Verantwortung übernehmen (BP)7-,17
Buckpassing
andere entscheiden lassen (BP)12 ,74
andere Person entscheiden lassen (BP)11 -,12
Entscheidungen vermeiden (BP)10,64
keine Entscheidungen, wenn nicht unbedingt nötig (BP)9 ,65
Leute entscheiden lassen, die sich besser auskennen (BP)8 ,39
nicht gern Verantwortung übernehmen (BP)7-,06
Procrastinationaufschieben bis es zu spät ist (P)16
warten mit Nachdenken (P)15,60
auf die lange Bank schieben (P)14 ,67
Zeit mit Belanglosigkeiten vergeuden (P)13,59
,74
-,11
,18
,57
Thomas Schäfer | SS 2009 37
Handlung nach Entscheidung dauer (P)17 ,50
aufschieben bis es zu spät ist (P)16 -,09
Hypervigilanz
skeptisch ob gute Lösung möglich (HV)22 ,58
viel Zeit für Überzeugungsarbeit, dass Entscheidung richtig (HV)21,45
andere Alternative weil etwas schiefgehen könnte (HV)20,52
enormer Zeitdruck (HV)19 ,67
nicht klar denken, wenn in Eile (HV)18,21
,56
methodenlehre ll – Faktorenanalyse
Faktorenanalyse (PCA) mit SPSS
Thomas Schäfer | SS 2009 38