forschungsmethodik ii mag.rer.nat. m. kickmeier-rust karl...
TRANSCRIPT
KolmogorovKolmogorov--SmirnovSmirnov--TestTest
Forschungsmethodik II
Mag.rer.nat. M. Kickmeier-Rust
Karl-Franzens-Universität Graz
1
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov-- Smirnov TestSmirnov Test
�Andrei Nikolajewitsch Kolmogorov
− * 25.4.1903 - † 20.10.1987
2
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov-- Smirnov TestSmirnov Test
�Wladimir Iwanowitsch Smirnov
−* 10.6.1887 - † 11.2.1974
3
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
EinleitungEinleitung
�Statistischer Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen
�zwei Zufallsvariablen die gleiche Verteilung �zwei Zufallsvariablen die gleiche Verteilung besitzen
�eine Zufallsvariable einer Wahrscheinlichkeitsverteilung folgt
(Kolmogorov- Smirnov- Anpassungstest)
4
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
EinleitungEinleitung
�NVT als Voraussetzung für viele statistische Verfahren
�Überprüfung mittels KSA
5
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
EinleitungEinleitung
�Kolmogorov- Smirnov: n <50
�n >50: Chi- Quadrat
�Nichtparametrischer Test− stabil
−unanfällig
6
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov-- SmirnovSmirnov-- TestTest
�Stetig verteilte metrische Merkmale
�Diskrete Merkmale
�Rangskalierte Merkmale�Rangskalierte Merkmale
�Weniger Trennschärfe
7
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov-- SmirnovSmirnov-- TestTest
�NullhypotheseH0: Fx(x) = F0(x)
�AlternativhypotheseH1: Fx(x) ≠ F0(x)
8
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov-- SmirnovSmirnov-- TestTest
�p < 0.05: − keine Normalverteilungkeine Normalverteilung
− Zahlenreihen stammen nicht aus derselben Verteilung
9
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test Test ––Berechnung per HandBerechnung per HandBerechnung per HandBerechnung per Hand
10
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
BspBsp. für . für händischehändische BerechnungBerechnung
8 Zeitangaben (= n), die auf Normalverteilung geprüft werden sollensollen
200, 198, 390, 215, 171, 160, 150, 224
11
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
x z Ф(z) f d
1. Tabelle aufstellen
x = die zu testenden Werte
z = z-Werte
Ф(z) = Flächenstücke unter
VorgehensweiseVorgehensweise
Ф(z) = Flächenstücke unter
Normalverteilungskurve
f = gleiche Abstände der
Flächenstücke
d = absolute Differenzen
12
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
VorgehensweiseVorgehensweise
x
150
160
1712. Werte in eine
aufsteigende Reihenfolge 171
198
200
215
224
390
bringen
200, 198, 390, 215, 171,
160, 150, 224�
13
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
3. dazugehörige z-Werte
ausrechnen
VorgehensweiseVorgehensweise
x z Ф(z)
150 -0.84 0.200
160 -0.70 0.242
171 -0.56 0.288
4. gemäß der z-Tabelle
Flächenstücke unter der
Normalverteilungskurve
Ф(z) ermittelten
171 -0.56 0.288
198 -0.20 0.421
200 -0.18 0.429
215 0.02 0.508
224 0.14 0.556
390 2.32 0.990
14
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
Flächenstücke unter der
Normalverteilungskurve sollten bei idealer
Normalverteilung gleiche Abstände haben:
VorgehensweiseVorgehensweise
f
0.125
0.250
0.375
erzeugt durch Division mit Fallzahl n ( = 8 )
5. f berechnen
f = i/n i = 1, …, n
0.500
0.625
0.750
0.875
1.000
15
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
6. Berechnung der
absoluten
Differenzen:
VorgehensweiseVorgehensweise
Ф(z) f d
0.200 0.125 0.075
0.242 0.250 0.008
0.288 0.375 0.087Differenzen:
d = ІФ(z) - fІ
0.421 0.500 0.079
0.429 0.625 0.196
0.508 0.750 0.242
0.556 0.875 0.319
0.990 1.000 0.010
16
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
x z Ф(z) f d
150 -0.84 0.200 0.125 0.075
160 -0.70 0.242 0.250 0.008
171 -0.56 0.288 0.375 0.087
VorgehensweiseVorgehensweise
198 -0.20 0.421 0.500 0.079
200 -0.18 0.429 0.625 0.196
215 0.02 0.508 0.750 0.242
224 0.14 0.556 0.875 0.319
390 2.32 0.990 1.000 0.010
17
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
VorgehensweiseVorgehensweise
Ф(z) f d
0.200 0.125 0.075
0.242 0.250 0.008
0.288 0.375 0.087
Maximum dieser
Differenzen (a) =
Prüfgröße beim
Kolmogorov-0.421 0.500 0.079
0.429 0.625 0.196
0.508 0.750 0.242
0.556 0.875 0.319
0.990 1.000 0.010
Kolmogorov-
Smirnov-Test
a = 0.319
18
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
Maximum dieser Differenzen (a) = Prüfgröße beim Kolmogorov-Smirnov-Test
a = 0.319
VorgehensweiseVorgehensweise
a = 0.319
� kritischen Wert ermitteln:− in Tabelle nachschauen (bei n = 8)
19
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
Kritische WerteKritische Werten kritischer Wert
3 0.708
4 0.624
5 0.563
6 0.5196 0.519
7 0.483
8 0.454
9 0.430
10 0.409
11 0.391
12 0.375
20
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
Maximum dieser Differenzen (a) = Prüfgröße beim Kolmogorov-Smirnov-Test
a = 0.319
VorgehensweiseVorgehensweise
� in Tabelle nachschauen (bei n = 8)
kritischer Wert = 0.454
a < acrit � normalverteilt21
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test Test mit SPSSmit SPSSmit SPSSmit SPSS
22
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS
� Menüpunkt ANALYSIEREN
�Aus den Alternativen �Aus den Alternativen NICHTPARAMETRISCHE TESTS wählen
�Auswahlpunkte, die sich rechts öffnen,K-S BEI EINER STICHPROBE wählen
23
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS
�Testvariable auswählen, welche auf Normalverteilung überprüft werden.
Achtung: links unten unter Testverteilung darauf achten, dass der Testverteilung darauf achten, dass der Punkt Normal angewählt ist.
� OK anklicken
�Bildschirmausgabe wie folgende:
24
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS
25
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS�Hier sind für uns die folgenden Werte
wichtig:
N (in diesem Falle 8), Extremste Differenzen (0,320) und Asymptotische Differenzen (0,320) und Asymptotische Signifikanz.
�Nun vergleichen wir diese beiden ersten Werte mit einer Tabelle für den Kolmogorov-Smirnov-Test.
26
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS
�Die nachfolgende Tabelle gibt bei einer 5 % Irrtumswahrscheinlichkeit Grenzwerte für Irrtumswahrscheinlichkeit Grenzwerte für Stichproben an, bei denen n zwischen 1-35 liegt.
27
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS
28
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS
�Wir suchen nun den Wert für N = 8 und sehen dort die Zahl 0,454.
�Falls die Extremste Differenz in unserem Rechenbeispiel diesen Wert überschreitet, liegt mit 95 % Wahrscheinlichkeit keine Normalverteilung vor.
29
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS
� In unserem Fall haben wir jedoch eine Extremste Differenz von nur 0,32. Das Ergebnis wird am Besten so Ergebnis wird am Besten so interpretiert, dass die theoretische Annahme einer Standardverteilungnicht verworfen werden muss.
30
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS�Auch unser Wert für die Asymptotische Signifikanz ist weit größer als der Grenzwert 0,05.
�Dieser würde besagen, dass nur in 5 % aller Fälle eine derartige Verteilung aller Fälle eine derartige Verteilung wirklich normalverteilt ist. Ein Wert von 0,02 wäre hingegen deutlich kleiner, daher würde die Annahme einer Normalverteilung verworfen werden (auf dem 5 % Signifikanzniveau).
31
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS
�Da unser Wert jedoch deutlich darüber liegt, kann die Hypothese einer Normalverteilung auf diesem Normalverteilung auf diesem Signifikanzniveau nicht verworfen werden.
32
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS
�Achtung:
Der Kolmogorov-Smirnov-Testbenötigt, v.a. bei kleinen Stichproben, benötigt, v.a. bei kleinen Stichproben, extreme Abweichungen von einer Normalverteilung, um auf höheren Signifikanzniveaus die Annahme einer Normalverteilung zu verwerfen.
33
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
KolmogorovKolmogorov--SmirnovSmirnov--Test mit Test mit SPSSSPSS
�SPSS Syntax
NPAR TEST/K-S (normal) = variable .
34
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser
Vielen DankVielen Dankfür Ihre für Ihre für Ihre für Ihre
Aufmerksamkeit!Aufmerksamkeit!
Lisza Gaiswinkler, Daniela Gusel, Tanja
Schlosser 35