09.12.13 1
TRANSCRIPT
09.12.13
1
VL Methodenlehre I WS13/14 Schäfer
DAS THEMA: TABELLEN UND ABBILDUNGEN • Standardisierung von Daten • Darstellung von Daten in Texten,
Tabellen und Abbildungen
VL Methodenlehre I WS13/14 Schäfer
Standardisierung von Daten • z-Standardisierung • Standardnormalverteilung
09.12.13
2
• Ausgangspunkt: einzelne Messwerte und Kennwerte lassen sich schwer
vergleichen, wenn sie von verschiedenen Messinstrumenten stammen
• Beispiel: Tim hat im Abitur in Bayern 620 Punkte, Mia im Abitur in
Sachsen 640 Punkte à ist Mia wirklich besser, wenn wir wissen, dass
das Abitur in Sachsen etwas leichter war?
• Lösung: Daten auf eine einheitliche Skala transformieren
• eine Transformation berücksichtigt immer Lage und Streuung von
Verteilungen
• bei der z-Transformation bekommt jede Person einen neuen Wert
zugewiesen, der nun vergleichbar (standardisiert) ist:
DIE Z-STANDARDISIERUNG
VL Methodenlehre I WS13/14 Schäfer
z-‐Wert absolute Differenz zum Mi:el rela&viert an der Streuung
• z-Werte bilden eine standardisierte Skala
• sie haben immer einen Mittelwert von 0 und eine SD von 1
• die Verteilung der z-Werte sieht daher immer gleich aus
• sind die Rohwerte normalverteilt, ergibt die z-Verteilung eine
Standardnormalverteilung:
DIE STANDARDNORMALVERTEILUNG
VL Methodenlehre I WS13/14 Schäfer
Standardabweichung
Prozente
z-‐Werte
09.12.13
3
• jedem z-Wert kann ein bestimmter Flächenanteil der SNV zugeordnet
werden
• der Flächenanteil entspricht der Auftretenswahrscheinlichkeit für diesen
Wert und alle kleineren Werte
zurück zum Beispiel – wir brauchen M und SD der beiden Bundesländer:
und können dann die z-Werte bestimmen:
à beide sind überdurchschnittlich
à Tim hat aber – im standardisierten Vergleich – die bessere Leistung
erreicht
DIE STANDARDNORMALVERTEILUNG
VL Methodenlehre I WS13/14 Schäfer
à wenn der z-Wert von Tim etwa 75% der Fläche der Verteilung
abschneidet, heißt das, dass nur etwa 25% aller Schüler besser waren als er
DIE STANDARDNORMALVERTEILUNG
VL Methodenlehre I WS13/14 Schäfer
Mia Tim
09.12.13
4
• neben der z-Standardisierung gibt es weitere Standardisierungs-
Möglichkeiten à so entstehen entsprechend andere Verteilungen
• auch die IQ-Verteilung ist eine standardisierte Verteilung mit M = 100
und SD = 15
DIE STANDARDNORMALVERTEILUNG
VL Methodenlehre I WS13/14 Schäfer
VL Methodenlehre I WS13/14 Schäfer
Darstellung von Daten in Texten, Tabellen und Abbildungen • Texte und Tabellen • Abbildungen
09.12.13
5
• wenige deskriptive Daten lassen sich gut im Fließtext beschreiben
• liegen mehr Daten vor, bietet sich eine übersichtliche Darstellung in
Tabellen an
• auch hier werden Lage- und Streuungsmaße angegeben
• in Manuskripten werden Tabellen nach APA-Richtlinien formatiert:
TEXTE UND TABELLEN
VL Methodenlehre I WS13/14 Schäfer
MusiksFl M SD
Klassik 2,9 1,1
Rock 4,1 0,8
Rap 3,3 1,2
TEXTE UND TABELLEN
VL Methodenlehre I WS13/14 Schäfer
09.12.13
6
• auch in Abbildungen sollten Lage- und Streuungsmaße enthalten sein
ABBILDUNGEN
VL Methodenlehre I WS13/14 Schäfer
ABBILDUNGEN
VL Methodenlehre I WS13/14 Schäfer
09.12.13
7
alternative Darstellungsmöglichkeiten (siehe Inferenzstatistik):
Liniendiagramm ...mit Fehlerbalken
ABBILDUNGEN
VL Methodenlehre I WS13/14 Schäfer
mit Standardfehlern Fehlerplots
Beginnt die Beschriftung der Y-Achse bei 0?
LÜGEN MIT ABBILDUNGEN
VL Methodenlehre I WS13/14 Schäfer
09.12.13
8
Zeigt die Y-Achse gleich große Intervalle?
LÜGEN MIT ABBILDUNGEN
VL Methodenlehre I WS13/14 Schäfer
TEIL 4: EXPLORATIVE DATENANALYSE
VL Methodenlehre I WS13/14 Schäfer
09.12.13
9
VL Methodenlehre I WS13/14 Schäfer
DAS THEMA: GRAFISCHE DATENANALYSE • Darstellung von Verteilungen • Darstellung von Zusammenhängen
zwischen Variablen
VL Methodenlehre I WS13/14 Schäfer
Darstellung von Verteilungen • Boxplot • Stamm-und-Blatt-Diagramm
09.12.13
10
• Mittelwert und SD liefern recht idealisierte Darstellungen, da sie
symmetrisch- oder normalverteilte Daten zugrunde legen
• für die Darstellung von Auffälligkeiten (Schiefe, Ausreißer) eignen sich
daher andere Maße besser
• verwendet man die verzerrungs-resistenten Maße Median und IA, erhält
man ein Boxplot
BOXPLOT
VL Methodenlehre I WS13/14 Schäfer
BOXPLOT
VL Methodenlehre I WS13/14 Schäfer
Median IA Whiskers
Wo liegen die Whiskers? 1. BesFmmen der Zäune: IA x 1,5 nach oben und untern an die Box antragen 2. diejenigen echten Werte suchen, die auf der Seite der Box am nächsten dran liegen
IA = 19-‐14 = 5 IAx1,5 = 7,5 oberer Zaun: 19+7,5 = 26,5 unterer Zaun: 14-‐7,5 = 6,5 oberer Whisker: 21 unterer Whisker: 12
wichtige Informationen: • Wie lang ist die Box? à Höhe der Streuung • Wo liegt der Median innerhalb der Box? à
Symmetrie/Schiefe der Verteilung • Liegen Werte außerhalb der Whiskers? à Ausreißer
(werden durch Sterne oder Kreise dargestellt)
09.12.13
11
BOXPLOT UND HÄUFIGKEITSVERTEILUNG
VL Methodenlehre I WS13/14 Schäfer
BOXPLOT UND HÄUFIGKEITSVERTEILUNG
VL Methodenlehre I WS13/14 Schäfer
09.12.13
12
à bei schiefen Verteilungen liefern Boxplots wesentlich bessere Aussagen
über die Streuung als die SD
à außerdem bleiben Ausreißer unberücksichtigt
BOXPLOT UND STANDARDABWEICHUNG
VL Methodenlehre I WS13/14 Schäfer
• zeigt jeden einzelnen Wert einer Verteilung
• hilft schiefe oder ungewöhnliche Verteilungen (z.B. multimodale) zu
identifizieren
STAMM-UND-BLATT-DIAGRAMM
VL Methodenlehre I WS13/14 Schäfer
Häufigkeit von Werten die Blä:er zeigen die Einerstelle oder die Nachkommastelle jeweils für eine Person
der Stamm zeigt die Dezimalstelle oder die Zahl vor dem Komma
z.B. eine Person mit dem Wert 2,3 (oder 23)
09.12.13
13
Beispiel für ein back-to-back Stamm-und-Blatt-Diagramm
STAMM-UND-BLATT-DIAGRAMM
VL Methodenlehre I WS13/14 Schäfer
VL Methodenlehre I WS13/14 Schäfer
Darstellung von Zusammenhängen zwischen Variablen • Streudiagramm • Sonnenblumendiagramm • Bubble-Plot • Streudiagramm-Matrix
09.12.13
14
um den Zusammenhang von Variablen zu visualisieren, kann man Werte
von Personen auf beiden Variablen in ein gemeinsames Diagramm
einzeichnen à Streudiagramm
à das Diagramm zeigt eine Punktewolke, die etwas über das
Vorhandensein und die Stärke des Zusammenhangs verrät
STREUDIAGRAMM
VL Methodenlehre I WS13/14 Schäfer
• je „dünner“ die Punktewolke – also je mehr sie sich um eine gedachte
Linie konzentriert – desto stärker der Zusammenhang
• außerdem kann der Zusammenhang
positiv oder negativ sein
• seine Größe lässt sich durch den
Korrelationskoeffizienten ausdrücken
STREUDIAGRAMM
VL Methodenlehre I WS13/14 Schäfer
unkorreliert
schwach positiv stark positiv
schwach negativ stark negativ
09.12.13
15
• der Zusammenhang kann auch kurvi-linear sein
STREUDIAGRAMM
VL Methodenlehre I WS13/14 Schäfer
• Streudiagramme können nur mit Daten ab Intervallskalenniveau
konstruiert werden
• die Variablen können dabei auch nur 2 Ausprägungen haben (siehe
Intervallskalenniveau bei dichotomen Variablen)
STREUDIAGRAMM
VL Methodenlehre I WS13/14 Schäfer
1 – weiblich 2 – männlich
09.12.13
16
• liegen in einem Streudiagramm viele Werte aufeinander, kann die Interpretation schwierig werden
• Abhilfe schafft das Sonnenblumendiagramm, in dem die Anzahl
übereinander liegender Werte durch Blütenblätter dargestellt wird
à besonders sinnvoll, wenn eine der Variablen nur wenige Ausprägungen
hat
SONNENBLUMENDIAGRAMM
VL Methodenlehre I WS13/14 Schäfer
Durchschni:snote
• eine dritte Variable kann in Streudiagrammen eingefügt und durch die
Größe der Punkte (Bubbles) codiert werden à Bubble-Plot
BUBBLE-PLOT
VL Methodenlehre I WS13/14 Schäfer
Bubbles = soziale Kompetenz
09.12.13
17
• der Zusammenhang mehrerer Variablen kann auch mit Hilfe mehrerer
normaler Streudiagramme in einer Matrix dargestellt werden
STREUDIAGRAMM-MATRIX
VL Methodenlehre I WS13/14 Schäfer
LITERATUR
VL Methodenlehre I WS13/14 Schäfer
• Hussy, W., Schreier, M. & Echterhoff, G. (2010). Forschungsmethoden in
Psychologie und Sozialwissenschaften. Heidelberg: Springer.
• Schäfer, T. (2010). Statistik I. Deskriptive und Explorative Datenanalyse.
Wiesbaden: Springer VS.
• Sedlmeier, P. & Renkewitz, F. (2013). Forschungsmethoden und Statistik: Ein
Lehrbuch für Psychologen und Sozialwissenschaftler. München: Pearson.