grundlagen sportwissenschaftlicher forschung deskriptive ... · universität zu kiel institut für...

35
Universität zu Kiel Institut für Sportwissenschaft Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik Dr. Jan-Peter Brückner [email protected] R.216 Tel. 880 4717

Upload: ngothu

Post on 18-Aug-2019

214 views

Category:

Documents


0 download

TRANSCRIPT

Universität zu Kiel Institut für Sportwissenschaft

Grundlagen sportwissenschaftlicher Forschung Deskriptive Statistik

Dr. Jan-Peter Brückner

[email protected]

R.216Tel. 880 4717

Universität zu Kiel Institut für Sportwissenschaft

Deskriptive Statistik - Ziele

• Beschreiben der Daten• Zusammenfassen der Daten• Überblick über die Daten• Datenanalyse• Fehlerprüfung/Plausibilitätsprüfung

Universität zu Kiel Institut für Sportwissenschaft

Beispiel

83349910293xj

10987654321j

Eine Stichprobe von N=10 Schüler absolviert einen Fitness-Test.Die Leistung X wird mit 0 (schlechte Fitness) bis 10 Punkten (sehr gute Fitness) bewertet

Rohdaten (Beispiel 1):

sortierte Rohdaten:

10999843332xi

10987654321i

Universität zu Kiel Institut für Sportwissenschaft

Deskriptive Statistik - Kennwerte

• Häufigkeiten und Häufigkeitsverteilung• Maße der zentralen Tendenz• Streuungsmaße• Zusammenhangsmaße• Unterschiedsmaße

Universität zu Kiel Institut für Sportwissenschaft

Häufigkeit

N

ahaf

)()( =

)(ah axi =Häufigkeit für (i = 1, 2, 3, … N)

Absolute Häufigkeit

Relative Häufigkeit

Universität zu Kiel Institut für Sportwissenschaft

Häufigkeitsverteilung

h(p)

0

1

2

3

4

0 1 2 3 4 5 6 7 8 9 10

131131h(p)

109876543210p

0,10,30,10000,10,30,100f(p)

p: Punkte im Fitness-Test

Universität zu Kiel Institut für Sportwissenschaft

Maße der zentralen Tendenz

Modalwert, Median, Arithmetisches Mittel: Wann welcher Wert? Arithmetisches Mittel:• bei Intervallskalierung• symmetrische Verteilungbei Verallgemeinerungen von der Stichprobe auf die Grundgesamtheit • bei Verallgemeinerungen von der Stichprobe auf die GrundgesamtheitMedian:• bei Ordinalskalierung• bei Extremwerten• bei Abweichungen von der NormalverteilungModalwert (Modus):• bei Ordinalskalierung• bei mehrgipfligen Verteilungen• grober Überblick

Universität zu Kiel Institut für Sportwissenschaft

Maße der zentralen Tendenz

• Arithmetisches Mittel, Mittelwert• Median• Modalwert (Modus)

Universität zu Kiel Institut für Sportwissenschaft

Summenzeichen

n

n

i

i xxxxx ++++=∑=

...321

1

Universität zu Kiel Institut für Sportwissenschaft

Arithmetisches Mittel - Mittelwert

∑=

=N

i

ix xN

M1

1

• Auch: AM oder x• erfordert Intervallskalenniveau• keine Aussage über die Verteilung/Abweichungder Einzelwerte

10999843332xi

10987654321i

660*10

1 ==xM

Beispiel:

Universität zu Kiel Institut für Sportwissenschaft

Median - Modus

• Median Md:50% der Werte liegen über,50% der Werte unter dem Median.

• Modus Mo (auch: Mod):Häufigster Wert der Verteilung

Wo liegen Median und Modus im Verhältnis zum Mittelwert??? � Symmetrie der Verteilung (Schiefe)

Universität zu Kiel Institut für Sportwissenschaft

h(p)

0

1

2

3

4

0 1 2 3 4 5 6 7 8 9 10

Md=5

M=4,6 Mo=5Mo=6

Universität zu Kiel Institut für Sportwissenschaft

h(p)

0

1

2

3

4

0 1 2 3 4 5 6 7 8 9 10

h(p)

0

1

2

3

4

0 1 2 3 4 5 6 7 8 9 10

6=M

Beispiel 1:

Beispiel 2:

Universität zu Kiel Institut für Sportwissenschaft

Streuungsmaße

• Range• Perzentilen• Varianz• Standardabweichung• Variationskoeffizient

Universität zu Kiel Institut für Sportwissenschaft

Spannweite

minmax xxRange −=• erfordert Intervallskalenniveau• Anfällig gegenüber Ausreißern• Insbesondere angeben bei Personendaten (Alter,…)

Beispiel 1:

xmax = 10

xmin = 2

Range = 10 – 2 = 8

Beispiel 2:

xmax = 7

xmin = 5

Range = 7 – 5 = 2

Universität zu Kiel Institut für Sportwissenschaft

Varianz

)²(1

²1

x

N

i

i MxN

SDX −= ∑=

• Auch: SD², s², Var(X)• SD² ist immer positiv• Extremwerte haben einen besonders großen Einfluss

Summe der Abweichungs-quadrate

Universität zu Kiel Institut für Sportwissenschaft

Standardabweichung

²XX SDSD =

)²(1

1

x

N

i

i MxN

SDX −= ∑=

• Auch: s• Extremwerte haben einen besonders großen Einfluss• Achtung: In Statistiksoftware wird häufig durch N-1 geteilt!Diese Berechnung ist nur sinnvoll, wenn die Stichprobe zurSchätzung der Varianz/Standardabweichung auf Populations-ebene genutzt wird!

Universität zu Kiel Institut für Sportwissenschaft

Var(X) = 9,494169994499916(xi-M)²

043332-2-3-3-3-4xi-M

M = 66010999843332xi

Summe10987654321i

1,34,9)( ≈== XVarSDX

Beispiel 1:

Universität zu Kiel Institut für Sportwissenschaft

h(p)

0

1

2

3

4

0 1 2 3 4 5 6 7 8 9 10

h(p)

0

1

2

3

4

0 1 2 3 4 5 6 7 8 9 10

6=M

Beispiel 1:

Beispiel 2:

SD=3,1

SD=0,8

Universität zu Kiel Institut für Sportwissenschaft

Normalverteilung

SD=15

2*SD

4*SD

Universität zu Kiel Institut für Sportwissenschaft

Variationskoeffizient

X

X

MSDXV =)(

Ist die Standardabweichung hoch oder niedrig?� Standardisierung am Mittelwert:

� Vergleichen der Streuungen von unterschiedlichskalierten Variablen

Universität zu Kiel Institut für Sportwissenschaft

z-Standardisierung

X

Xii

SDMxz −=

Wie stark weicht ein Wert xi im Vergleich zu anderen Wertenvom Mittelwert ab?� Standardisierung an Mittelwert und Standardabweichung:

� Vergleich verschiedener Werte xi und xj (Person i mit Person j)� Vergleich der Merkmalsausprägungen xi und yi einer Person i auf verschiedenenVariablen X und Y

Universität zu Kiel Institut für Sportwissenschaft

h(p)

0

1

2

3

4

0 1 2 3 4 5 6 7 8 9 10

h(p)

0

1

2

3

4

0 1 2 3 4 5 6 7 8 9 10

6=M

Beispiel 1:

Beispiel 2:

SD=3,1

SD=0,8

z= (5-6)/3,1 = -0,32

z= (5-6)/0,8 = -1,25

Universität zu Kiel Institut für Sportwissenschaft

Kovarianz

„Gemeinsame Varianz“ zweier Variablen X und Y:

In wiefern ist X hoch ausgeprägt, wenn Y hoch (niedrig) ausgeprägt ist?

wöchentliche Sportstunden

Lebens-zufriedenheit

Beispiel aus der Einheit „Untersuchungsplanung“:

Universität zu Kiel Institut für Sportwissenschaft

Kovarianz

„Gemeinsame Varianz“ zweier Variablen X und Y:

In wiefern ist X hoch ausgeprägt, wenn Y hoch (niedrig) ausgeprägt ist?

Testleiter 1

Testleiter 2

Beispiel zur Objektivität eines Tests:

Universität zu Kiel Institut für Sportwissenschaft

Kovarianz

„Gemeinsame Varianz“ zweier Variablen X und Y:

In wiefern ist X hoch ausgeprägt, wenn Y hoch (niedrig) ausgeprägt ist?

Test

Retest/

Paralleltest

Beispiel zur Reliabilität eines Tests:

Universität zu Kiel Institut für Sportwissenschaft

Kovarianz

„Gemeinsame Varianz“ zweier Variablen X und Y:

In wiefern ist X hoch ausgeprägt, wenn Y hoch (niedrig) ausgeprägt ist?

Test

Kriterium

Beispiel zur Validität eines Tests:

Universität zu Kiel Institut für Sportwissenschaft

Kovarianz

)()(1

),(1

yi

N

i

xi MyMxN

YXCOV −−= ∑=

„Gemeinsame Varianz“ zweier Variablen X und Y:

• COV(X,Y) ist von Var(X) und Var(Y) abhängig• Interpretation nur unter Berücksichtigung von Var(X) und Var(Y) möglich

Universität zu Kiel Institut für Sportwissenschaft

Korrelationskoeffizient

)(*)(

),(,

YVARXVAR

YXCOVr YX =

YX SDSD

YXCOV

*

),(=

• Auch: r oder Kor(X,Y)• Wertebereich: -1 ≤ r ≤ 1• r > 0: positiver Zusammenhang• r = 0: kein Zusammenhang• r < 0: negativer Zusammenhang• Voraussetzung: Intervallskalenniveau

Standardisierung der Kovarianz an der Varianz von X und Y:

Universität zu Kiel Institut für Sportwissenschaft

Korrelationskoeffizient

)(*)(

),(),(,

YVARXVAR

YXCOVYXKORr YX ==

YXYX

SDSD

YXCOVYXKORr

*

),(),(, ==

Universität zu Kiel Institut für Sportwissenschaft

Korrelationskoeffizient

)²(1

*)²(1

)()(1

11

1,

y

N

i

ix

N

i

i

yi

N

i

xi

YX

MyN

MxN

MyMxN

r

−−

−−=

∑∑

==

=

)(*)(

),(,

YVARXVAR

YXCOVr YX =

)²(*)²(

)()(

11

1,

y

N

i

ix

N

i

i

yi

N

i

xi

YX

MyMx

MyMxr

−−

−−=

∑∑

==

=

Universität zu Kiel Institut für Sportwissenschaft

Berechnung des Korrelationskoeffizienten

1,071,41Wurzel

1,331,142,004,23,0M

8,006,8312,002518Summe

3,673,364,001,832,00656

-0,170,031,00-0,171,00445

0,830,691,000,831,00544

0,170,031,00-0,17-1,00423

1,171,361,00-1,17-1,00322

2,331,364,00-1,17-2,00311

(xi-M)*(yi-M)(yi-M)²(xi-M)²yi-Mxi-M

wöch.Sport-

stunden

Lebens-zufrieden-

heiti

YX

r = = 0,881,33

1,41 * 1,07 SD SD Cov

Universität zu Kiel Institut für Sportwissenschaft

Testgütekriterien

Hauptgütekriterien Nebengütekriterien

Objektivität (anwenderunabhängig) • Durchführung

• Auswertung

• Interpretation

NormierungVergleichbarkeit

Nicht-Verfälschbarkeit

Reliabilität (zuverlässig) • Paralleltest

• Retest• Innere Konsistenz (Testhalbierung)

Ökonomie

Nützlichkeit

Zumutbarkeit

Validität (gültig) • inhaltlich / Experten

• Konstrukt

• kriterienbezogen

Fairness

Universität zu Kiel Institut für Sportwissenschaft

Beurteilung von Testkennwerten

niedrig mittel hoch

Schwierigkeit >.80 .80-.20 <.20

Trennschärfe

(korrigiert)<.30 .30-.50 >.50

Objektivität (Auswerter)

<.60 .60-.90 >.90

Reliabilität <.80 .80-.90 >.90

Validität(unkorrigiert)

<.40 .40-.60 >.60

Eichstichprobe N<150 150<N<300 N>300

(Fisseni, 1997, S. 124)

Universität zu Kiel Institut für Sportwissenschaft

AUFGABE

N=5 Schüler werden zu Ihren Sportnoten und zur Einstellung zum Sport (0: sehr negative Einstellung; 5: sehr positive Einstellung) befragt:

Berechne jeweils M, SD, Var, Range und Md sowie Kov und r für den Zusammenhang der beiden Variablen! (Einschl. Rechenweg!)

Abgabe bis Di, 05.06., 10:15 him Fach von J.-P. Brücknermit Angabe des Namens, und des Tutors und Tutoriums (rechts oben)

22354Einstellung

43221Sportnote

54321i