teil i: empirische sozialforschung 2. planung und ablauf einer empirischen untersuchung

Teil I: Empirische Sozialforschung

2. Planung und Ablauf einer empirischen Untersuchung

Phasen einer empirischen Erhebung

D o ku m e n ta tion

D a te n au fbe re itun g u ndD a ten a na lyse

D a te ne rhe bu ng

P lan u ng un d V orb ere itu ngd e r E rhe bu ng

F o rm u lie run g un d P rä z is ie ru ngd e s Fo rsch u n gsp ro b le m s

Phase 1

Phase 4

Phase 2

Phase 3

Phase 5

Phase 1: Formulierung und Präzisierung des Forschungsproblems

Was genau möchte ich wissen ?

• Zunächst zu unterscheiden: selbst initiierte Forschung oder Auftragsforschung

• Deskriptive Studie oder hypothesenprüfende Studie?

• Bei deskriptiver Studie: Bei genau welcher Grundgesamtheit sollen welche Merkmale gemessen werden?

• Bei hypothesenprüfender Studie: Präzise Formulierung der Hypothese

Wichtig bei Hypothesen: Wähle die Hypothese mit dem Ziel, dass sie zur Ablehnung gebracht wird.

Es geht um die Falsifikation, nicht um die Bestätigung von Hypothesen.

Bsp.: Man will die Vermutung untersuchen, ob der Abiturnotendurchschnitt von der beruflichen Stellung des Vaters abhängt.

Hypothese: Der Abiturschnitt ist unabhängig von der beruflichen Stellung des Vaters

Gegenhypothese: Der Abiturschnitt ist nicht unabhängig von der beruflichen Stellung des Vaters

Es kommt zur Ablehnung der Hypothese (und damit zur Annahme der Gegenhypothese), wenn das Beobachtungsmaterial in signifikantem Widerspruch zur Hypothese steht.

Kommt es nicht zur Ablehnung, so bedeutet es nicht, dass die Hypothese bestätigt ist. Es bedeutet nur, dass die Beobachtungsdaten für eine Ablehnung nicht ausreichen.

Es gibt vier Möglichkeiten, wie (unbekannte) Realität und Testentscheidung zusammentreffen können:

H0 ist richtig H0 ist falsch

H0 beibehalten okFehler 2. Art (ß-Fehler)

H0 verwerfen Fehler 1. Art (a-Fehler) ok

Vorgehen in der Praxis: Zunächst Vorgabe des Fehlers 1. Art (z.B. α =5% oder α=1%). Den verbleibenden Spielraum nutzt man, um den Fehler 2. Art so gering wie möglich zu halten. Gegenstand der Testtheorie in der analytischen Statistik

Fehler 1. Art: Hypothese wird abgelehnt, obwohl richtig („Schuldspruch, obwohl unschuldig“ in der Regel schwerwiegend.Fehler 2. Art: Hypothese wird angenommen, obwohl falsch („Freispruch mangels Beweisen“, aber kein Beweis für Unschuld)

Fehler 1. Art und Fehler 2. Art

Beispiel zu Hypothesen und Fehlern 1. und 2. ArtEin Forscher habe einen Bluttest zur Aufdeckung (Diagnose) einer schwerwiegenden neurologischen Krankheit entwickelt. Anhand von 20 Probanden (Versuchspersonen) soll dieser Test erprobt werden.

Hypothese: Das Ergebnis des Bluttests ist unabhängig von der neurologischen Erkrankung

Gegenhypothese: Das Ergebnis des Bluttests ist nicht unabhängig von der neurologischen Erkrankung

Vier denkbare Konstellationen zwischen Test und (unbekannter) Wirklichkeit

Fall 1: Das Testergebnis reicht nicht aus, um die Hypothese abzulehnen (Enttäuschung für den Forscher)

1.1 Der Bluttest ist tatsächlich zur Diagnostik ungeeignet (Testergebnis und Wirklichkeit stimmen überein).

1.2 Der Bluttest ist zur Diagnose tatsächlich geeignet, was jedoch durch den Test nicht erkannt wurde, d.h. Hypothese wird nicht zur Ablehnung geführt. (Fehler 2. Art)

Fall 2: Die Beobachtungswerte reichen aus, um die Hypothese abzulehnen (bahnbrechender Durchbruch für den Forscher)

2.1 Der Bluttest ist tatsächlich zur Diagnostik geeignet (Testergebnis und Wirklichkeit stimmen überein).

2.2 Der Bluttest ist ungeeignet zur Diagnostik, wurde aber durch den Test als geeignet erkannt (Fehler 1. Art, schwerwiegend)

Phase 2: Planung und Vorbereitung der Erhebung

• Definition der Begriffe

• Konzeptspezifikation

• Operationalisierung (Messung, Skalen)

• Definition der Grundgesamtheit

• Umfang der Stichprobe

• Art der Stichprobenziehung (Auswahlverfahren, s. folgende Folien...)

Phase 2: Planung und Vorbereitung der Erhebung

Grundgesamtheit = target population

Vollerhebung oder Stichprobe?

Vollerhebung: Alle Elemente der Grundgesamtheit werden untersucht

Teilerhebung (Stichprobe): Es wird nur eine Teilmenge der Grundgesamtheit untersucht.

n Ziehungen Berechnung der Stichprobensta-tistiken

Berechnung der Stichprobenstatistiken

GrundgesamtheitStichprobe

Anforderungen an die Stichprobenkonstruktion

1. Verkleinertes Abbild der Grundgesamtheit

2. Klar definierte Grundgesamtheit

3. Definition eines Stichprobenelements

4. Angebbares Auswahlverfahren

Die Auswahlverfahren sind dahingehend zu verproben,

inwieweit sie die o.g. vier Kriterien erfüllen.

Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 268







Die Stichprobe muss die Verteilungsstruktur der Grundgesamtheit für alle Variablen, die untersucht werden sollen, in verkleinerter Form wiedergeben.

Grundgesamtheit

Stichprobe







Es muss absolut klar sein, wer zur Grundgesamtheit gehört und wer nicht.Vage Grundgesamtheiten bedeuten:

a) Die Menge der Elemente, für die die Stichprobenergebnisse gültig sein sollen, ist nicht eindeutig abgrenzbar.

b) Es ist nicht entscheidbar, aus welcher Erhebungsgrundgesamtheit die Stichprobe gezogen werden soll.

Alle Personen über 18 Jahre, mit deutscher Staatsangehörigkeit undErstwohnsitz in Deutschland

Alle Personen über 18 Jahre, die zum Zeitpunkt der Untersuchung inDeutschland gemeldet sind.

So ? Oder so ?







Es muss eindeutig feststellbar sein, ob ein Element der Grundgesamtheit zur Stichprobe gehört oder nicht. Dies ist wichtig, damit bei Elementen mit gleicher Benennung entschieden werden kann, welches der Elemente für die Stichprobe ausgewählt wurde und welches nicht.

„Ziehe vom Zufallsstart aus jede 50.te Adresse, notiere die laufende Nummer,Dann den Namen und dann dieAdresse. Vergleiche, ob die laufendeNummer schon gezogen worden ist“

Name lfd. NummerSchmitz, Karl 114Schmitz, Karl 115







Es muss feststellbar sein, nach welchem Verfahren eine Stichprobe zustande gekommen ist, da die unterschiedlichen Verfahren spezifische Vor- und Nachteile haben.

Grundgesamtheit = … Stichprobenverfahren = …

Erhebungsgrund-gesamtheit = …

5489 Adressen - 1560 Verweigerung - 278 keine Zeit 3651 realisierte

Interviews

Auswahlverfahren (Stichprobentechniken)

w illkü rlich e A u sw a h lb e w u ßte A usw a h lQ u ote n au sw a h l

n ich t zu fa llsge s teu e rteA u sw a h lve rfah ren

u n e ing e sch rä nk te Zu fa llsa u sw a h lsys te m a tische Z u fa llsa usw a h lm e h rs tu fige A u sw a h lK lu m p e n stichp ro beG e sch ich te te S tich pro be

zu fa llsg es teu e rteA u sw a h lve rfah ren

(W a h rsche in lich ke itsa u sw a h l)

A u sw a h lve rfah ren

Jedes Element der Grundgesamtheit hat eine bestimmte Chance, in die Stichprobe aufgenommen zu werden.

Jedes Element der Grundgesamtheit hat die gleiche Chance, in die Stichprobe aufgenommen zu werden.

Willkürliche Auswahl

• Der Interviewer greift sich nach Belieben an einem beliebigen Ort und zu einem beliebigen Zeitpunkt Personen (oder Ereignisse) heraus, die er befragt bzw. beobachtet. (z.B. Befragung wartender Fahrgäste an einer Haltestelle).

• Keine der vier genannten Anforderungen an die Stichprobenkonstruktion ist erfüllt. Die Stichprobe kann kein verkleinertes Abbild einer definierten Grundgesamtheit sein, da weder die Grundgesamtheit angebbar ist noch die Stichprobenelemente genau definiert sind. Auch die Stichprobenelemente werden willkürlich festgelegt.

• Schlussfolgerung: Willkürliche Auswahlen sind für statistisch-kontrollierte wissenschaftliche Aussagen wertlos.

Bewußte Auswahl Auswahlen werden planvoll und aufgrund vorheriger Überlegungen gezielt vorgenommen.

Beispiele: - Es werden nur „Experten“ zu einem bestimmten Thema befragt (Expertengespräche)

- Es kommen nur „durchschnittliche“ Fälle in die Auswahl (z.B. 4-Personen-Haushalte mittleren Einkommens)

Eignung: Analysen mit eng eingegrenzten Fragestellungen oder Vorklärungen in bislang wenig erforschten Bereichen

Variante 1: Typische Auswahl

Man analysiert nur die Elemente der Grundgesamtheit, die als besonders typisch für die Grundgesamtheit angesehen werden.

Prinzip einfach, aber problematisch (was heißt „typisch“?, setzt Kenntnisse über GG voraus etc.)

Variante 2: Auswahl nach dem Konzentrationsprinzip („Abschneideverfahren“)

Beschränkung der Erhebung auf Fälle, die besonders „ins Gewicht fallen“.

Beispiel: Untersuchungsziel = Umsätze in der Bauwirtschaft; Beschränkung auf Erhebung der Unternehmen mit mehr als 19 Beschäftigten (=15% der Unternehmen)Grund: Sie machen 75% des Umsatzes aus. Durch Erhebung lediglich 15% der Bauunternehmen erfaßt man 75% des Umsatzes. Die anderen werden „abgeschnitten“ (Vorgehen in der amtlichen Statistik).

Quotenauswahl

• Sehr große Bedeutung bei Markt- und MeinungsforschernGrund: Quotenauswahl wirtschaftlicher als kostspielige Wahrscheinlichkeitsauswahl

• Prinzip: Stichprobe wird nach vorgegebenen Regeln gezogen. Diese Regeln sind von den Interviewern zu erfüllen. Man versucht die Stichprobe so zu konstruieren, daß die Quote in

der Stichprobe im Hinblick auf die ausgewählten Merkmale (z.B. Geschlecht, Alter, Berufsstellung, Region etc.) der Merkmalsverteilungen der Grundgesamtheit entsprechen.

• Ziel: Schaffung eines verkleinerten, kongruenten Abbilds der Grundgesamtheit („repräsentativ“).

• Voraussetzung: Kenntnisse über die Grundgesamtheit

• Quoten können einfach oder kombiniert seinz.B.: 30% Beamtinnen und 70% Beamte, wobei der Anteil der Beamten/innen an den

Erwerbstätigen 15% betragen soll etc.

• In der Praxis: Jeder Interviewer erhält eine persönliche Quotenanweisung. Sie legt fest, wieviel Personen mit welchen Merkmalen oder Merkmalskombinationen zu befragen sind (siehe

nächste Folie)

Gesamtbevölkerung

Geschlecht

Männlich 49,2%

Weiblich 50,8%

Alter

14-19 Jahre 7,8%

20-29 Jahre 14,3%

30-39 Jahre 14,9%

40-49 Jahre 19,5%

50-59 Jahre 15,7%

60-69 Jahre 13,1%

70 Jahre und älter 14,6%

Beispiel Altersquoten/ CATI Stichprobe17

In der Telefonbefragung werden jeweils 900 Personen (evtl. abhängig von der Bewohnerzahl im Untersuchungsgebiet) rekrutiert und befragt, die folgende Kriterien erfüllen: •100 % Erwachsene, die in ihrem Haushalt für den Einkauf zuständig sind50 % Centerkunden50 % Nichtkunden des Centers

„Mythos“ der repräsentativen StichprobeMarkt- und Meinungsforscher sprechen gerne vom „repräsentativen Stichproben“.

In der Statistik ist der Begriff der „repräsentativen Stichprobe“ oder „Repräsentativbefragung“ kein Fachbegriff. Er ist vielmehr ein Schlagwort, das als „Gütesiegel“ für die Befragung dienen soll.

Z.B. „Auf der Basis einer Repräsentativbefragung von 2000 Bundesbürgern...“ Man will damit ausdrücken, daß bestimmte Merkmale in der Stichprobe (Geschlecht, Alter etc.) in derselben Häufigkeit vorkommen wie in der Grundgesamtheit.

Um eine Untersuchung auf ihre Güte beurteilen zu können, benötigt man:

1. Angabe des Auswahlverfahrens

2. Angabe der Ausschöpfungsquote (=Rücklaufquote in%)

3. Angabe der Zahl der realisierten Interviews (Anzahl)

4. Angabe der Erhebungsmethode (telefonisch, persönliche Befragung)

5. Angabe des Fragetextes mit Antwortkategorien

6. Bei Quotenauswahl: Angabe der Quotenmerkmale

Merke: Zur Beschreibung einer empirischen Untersuchung reicht es keinesfalls aus zu sagen, die Erhebung sei repräsentativ. Es bedarf der o.g. Punkte zur

Charakterisierung.

Reine Zufallsauswahl (Einfache Zufallsstichproben)

Bedingungen:

1. Die Auswahlwahrscheinlichkeit für alle Elemente der Grundgesamtheit ist identisch und größer als 0.

2. Die Auswahl erfolgt in einem einstufigen Auswahlverfahren.

3. Die Elemente werden unabhängig voneinander gezogen.

„Idealtypus“ statistischer Auswahlverfahren, da entsprechende statistische Regeln zum Schluß auf die Grundgesamtheit existieren; in der Praxis schwierig umsetzbar.

• klassische Zufallsstichprobe: Lotterie

• auch angewandt: systematische Zufallsauswahl (z.B. jeder 100. Einer Liste o.ä.)

• Praxis: Listenauswahl, wenn alle Elemente der Grundgesamtheit existieren (via Zufallszahlen), z.B. RDD (Random Digit Dialing)

• Bei persönlichen Interviews: Gebietsauswahl und dann Begehungsanweisungen (Random Route). Bsp.: „Gehen Sie von der Startadresse nach links bis zu nächsten Kreuzung, dann rechts abbiegen und auf diesem Weg jeden 6. Haushalt notieren“.

• Zufallsauswahl innerhalb eines Haushalts: „Schwedenschlüssel“ (kish-selection-grid):

1 2 3 4 5 6 7 81 1 2 4 2 4 5 8

HaushaltsgrößeZufallszahlen

ausgedruckt auf Fragebogen; z.B. 3-Personen-Haushalt älter als 18 Jahre: Befragung des zweitältesten Mitglieds.

Mehrstufige Auswahl

Die Zufallsauswahl erstreckt sich über mehrere Ebenen.

Bsp.: Zweistufige GemeindestichprobeErste Stufe: Zufallsauswahl von 50 GemeindenZweite Stufe: 40 Adressen pro Gemeinde per RandomErgebnis: Zweistufige Zufallsstichprobe von 2.000 Personen.

In der Praxis bei Wahlprognosen üblich: Dreistufige Auswahl

1. Stufe: Auswahl von Stimmbezirken2. Stufe: Auswahl von Haushalten im Stimmbezirk per Random Route3. Stufe: Zufallsauswahl der zu befragenden Person im Haushalt per Schweden-Schlüssel

Wichtiger Spezialfall: PPS-Samples (Probability proportional to size)

Auf der ersten Stufe werden Gemeinden proportional zur Bevölkerungszahl ausgewählt (d.h. Auswahlwahrscheinlichkeit für größere Gemeinden höher als für kleinere Gemeinden)

Zusammenfassung Auswahlverfahren – Vorteile und Nachteile

Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 304-305

Willkürliche Auswahl (nicht zufallsgesteuert)

Vorteile:

• Nach den Ansprüchen wissenschaftlich durchgeführter Sozialforschung gibt es keine Vorteile dieses Verfahrens.

Nachteile:

• Erfüllt keine der vier Anforderungen einer guten Stichprobenkonstruktion. Für wissenschaftliche Zwecke nicht verwendbar.



Bewusste Auswahl (nicht zufallsgesteuert)

Vorteile:

• Geringer Aufwand, somit auch geringe Kosten

• Detaillierte Sammlung über besonders „interessante“ Fälle möglich

• Einsatz in explorativen Vorstudien angemessen und notwendig

Nachteile:

• Kenntnisse über die Struktur der Grundgesamtheit absolut notwendig, da sonst nicht entscheidbar, welche Fälle als „besonders interessant“ oder „wichtig“ bewertet werden sollen.

• Repräsentativität bewusster Stichproben ist nicht gesichert.

• Statistische Kontrolle des Auswahlfehlers ist nicht möglich.



Quotenauswahl (nicht zufallsgesteuert)

Vorteile:

• Billigeres und schnelleres Verfahren als zufallsgesteuerte Verfahren. Wird sehr häufig von Marktforschungsinstituten verwendet.

• Repräsentativität wird von anwendenden Instituten als hoch eingeschätzt.

Nachteile:

• Vorkenntnisse über Verteilung der Quotierungsmerkmale sind unverzichtbar.

• Verzerrungen der Stichprobe durch nicht kontrollierte Auswahlen von Personen durch die Interviewer möglich.

• keine statistische Berechnung des Auswahlfehlers möglich.



Einfache Zufallsauswahl (zufallsgesteuert)

Vorteile:

• Keine Kenntnisse über Grundgesamtheit notwendig.

• Auswahlfehler kann statistisch berechnet werden.

• Repräsentativität für alle Merkmale und Merkmalskombinationen im Rahmen zufälliger Schwankungen gesichert.

Nachteile:

• Ausfälle können meistens nur durch bewusst ausgewählte Fälle ersetzt werden. Dies verletzt das Prinzip der Zufallsauswahl.

• Durch Vorbereitung und längere Durchführung entstehen hohe Kosten.

• Seltene Extremgruppen weisen häufig zu geringe Fallzahlen auf.



Geschichtete Auswahl (zufallsgesteuert)

Vorteile:

• Teilgruppen können mit gleichen Anteilen wie in der Grundgesamtheit erhoben werden.

• Interessante Randgruppen können durch disproportionale Schichtung stärker berücksichtigt werden.

• Verringerung des Schätzfehlers

• Verringerung des Stichprobenumfang möglich (schnellere Durchführung, geringere Kosten).

• Nachteile:

• Kenntnisse über die Schichtungsmerkmale notwendig.

Phase 3: Methoden der Datenerhebung

Formen der Befragung:- das persönliche „Face-to-face“-Interview- das telefonische Interview- die schriftliche Befragung („questionnaire“)

- Onlinebefragung

1. Einstellungen bzw. Bewertungen (zumeist Ratingskala für Statements)(„Hartz IV ist ein wirksames Instrument zur Bekämpfung der Arbeitslosigkeit“: stimme überhaupt nicht zu, stimme eher nicht zu, unentschieden, stimme zu, stimme voll zu)

2. Überzeugungen = subjektive Aussagen über Fakten(zumeist ja/nein, Alternativfragen oder offene Fragen); („Sind Sie von der Wirksamkeit von Hartz IV überzeugt?“ ja – nein. Wie viele Menschen in Deutschland gehen Schwarzarbeit nach? – Zahl angeben)

3. Verhalten – Häufigkeit, Dauer und Art von Handlungen in der Vergangenheitoder zukünftige Verhaltensabsichten(Wie oft haben Sie innerhalb der letzten 365 Tage bei Onlineshops eingekauft?)

4. Sozialstatistische Merkmale – allgemeine stat. Angaben wie Alter, Einkommen etc.

Methoden der Datenerhebung: Befragung, Beobachtung, Inhaltsanalyse

Bewertung der Umfragemethoden (I)

• Schriftliche Befragung:– Wenige Befrager befragen viele Befragte– Befragung kann beantwortet werden wenn dafür Zeit ist– Bildmotive können integriert werden, Videos nicht– Aufwendige Dateneingabe per Hand– Keine Randomisierungen möglich

• Face-to-face• Onlinebefragung• Cati (Telefonbefragung)

Bewertung der Umfragemethoden (II)

• Schriftliche Befragung• Face-to-face:

– Direkter Kontakt mit Interviewer– Nachfragemöglichkeit bei offenen oder schwer verständlichen

Fragen – hohe Durchhaltebereitschaft der Befragten– Großer Rekrutierungsaufwand– Aufwendige Dateneingabe per Hand– Hoher Kostenaufwand– Randomisierungen sind abhängig vom Interviewer

• Onlinebefragung• Cati (Telefonbefragung)

Bewertung der Umfragemethoden (III)

• Schriftliche Befragung• Face-to-face• Onlinebefragung:

– Schnelle Datenerhebung und Datenlieferung– Daten sind bereits digital erfasst– Computergesteuerte Randomisierung– Häufig schlechte Datenqualität bei offenen Fragen– Hohe Abbrecherquoten– Spaßantworten wegen fehlender Interviewkontrolle– Oftmals schlechte Qualität des Panels

• Cati (Telefonbefragung)

Bewertung der Umfragemethoden (IV)

• Schriftliche Befragung• Face-to-face• Onlinebefragung• Cati (Telefonbefragung):

– Schnelle Erhebung– Niedrige Kosten– Es werden auch mobile Menschen erreicht– Es kann kein Stimulusmaterial (Bilder, Filme, Anzeigen)

vorgelegt werden– Hohe Abbrecherquoten

Phase 4: Datenaufbereitung und Datenanalyse

Aufgabe der Statistik (siehe folgende Ausführungen zu SPSS und Excel)

Phase 5: Dokumentation

nicht zu unterschätzen !

vollständige und verständliche Dokumentation der Forschungsergebnisse in einem Ergebnisbereicht

Prüfung der Anfangshypothesen und Bewertung ihrer Gültigkeit

Datenanalyse mit SPSS

Einführung in den Umgang mit SPSS

SPSS starten

• Beim Start von SPSS beachten Sie bitte den Unterschied zwischen der Variablenansicht und der Datenansicht

• In der Variablenansicht definieren Sie neue oder bestehende Variablen, fügen Wertelabels hinzu oder bestimmen fehlende Werte

• In der Datenansicht können Sie die Daten bearbeiten

Datenmatrix in SPSS erstellen

• Erstellen der Variablen in der Variablenansicht– Name– Typ– Variablenlabel– Wertelabels (wichtig)– Fehlende Werte (wichtig)– Messniveau & Rolle (unwichtig)

• Dateneingabe in der Datenansicht

Skalenniveaus• Nominalskala:

– Geschlecht oder Geburtsort– Nur vergleichende Statistiken möglich: Häufigkeiten, Kreuztabellen– Mehr oder weniger

• Ordinalskala:– Schulnoten oder Zufriedenheitsfragen– Mittelwerte (Klassendurchschnitt) lassen sich berechnen– Besser oder schlechter

• Skala:– Alter, Einkommen oder Absatzzahlen– Abstände sind interpretierbar– Mathematische Berechnung können durchgeführt werden, z.B.

Regressionen– Der Absatz steigt bei sinkenden Durchschnittspreisen

Skalenniveaus in SPSS

• Für die tägliche Arbeit mit SPSS spielt die korrekte Einstellung des Mess- oder Skalenniveaus keine Rolle und dient nur der Orientierung des Benutzers

• Gleiches gilt für die Rolle, diese Information muss nicht eingegeben werden

Codierung offener Fragen

• Kernaussagen herausarbeiten• Unterschiedliche Formulierungen eines

Themas verdichten• Aussagetendenzen beachten und beibehalten• Wichtige Einzelaussagen beachten• Gegebenenfalls erneut verdichten

Mehrfachantworten

• Fragen in denen Mehrfachantwortmöglichkeiten möglich sind können nicht direkt statistisch ausgewertet werden

• Eine Lösung ist es alle Antwortmöglichkeiten mit 0-1 als einzelne Variablen im Vorfeld der Befragung zu codieren

• SPSS bietet auch die Möglichkeit Mehrfachantworten zu definieren und automatisch dichotome Variablen zu erzeugen

• Diese können dann über Häufigkeitsauszählungen ausgewertet oder über Kreuztabellen miteinander verglichen werden

Wertelabels

• Bei eigenen Datenerhebungen müssen Nominal- und Ordinalskalierte Variablen gelabelt werden

• Klare Bezeichnungen erleichtern später die Auswertung und deren Interpretation

Öffnen Testdaten

• Öffnen Sie bitte den Übungsdatensatz „Häufigkeiten“

• Hinweis: Erleichtern Sie sich grundsätzlich die Arbeit in dem Sie eine zusätzliche Variable „Sortierung“ erstellen in der die Variablen in Ihrer ursprünglichen Form von 1 bis x durchnummeriert werden

Häufigkeiten

• Einfachste Form von statistischen Auswertungen

• Wichtiges Verfahren um einen ersten Überblick über den Datensatz zu bekommen, Ausreißer zu identifizieren und mögliche Fehler zu finden

• Übersicht über offene Antworten

Häufigkeiten: Statistik

• Berechnung einfacher Statistischer Maße:– Perzentile: Interessant zur Aufteilung einer

Variablen in eine vorgegebene Anzahl von Gruppen (Beispiel Datensatz Häufigkeiten Alter)

– Lagemaße: • Mittelwert: Arithmetisches Mittel • Median: Trennwert nach 50% der Befragten/Daten• Modalwert: Häufigster vorkommender Wert

Häufigkeiten: Statistik

• Berechnung einfacher Statistischer Maße:– Streuung:

• Standardabweichung: Wurzel der Varianz, sagt wie eng um den Mittelwert die Daten liegen (+)

• Varianz: Quadrierter Abstand vom Mittelwert (-)• Spannweite: Abstand größter und kleinster Wert

– Verteilung: Beschreibung der Symmetrie der Daten im Verhältnis zur Normalverteilung

Data Clearance

• Behandlung fehlender Werte• Überprüfung der Daten auf Ausreißer und

mögliche Fehleingaben• Methode: Häufigkeiten oder Grafiken

(Balkendiagramm) über alle Variablen– Häufigkeitsauswertung der Variable Fernsehen

und Bereinigung der Daten

teil i: empirische sozialforschung 2. planung und ablauf einer empirischen untersuchung

Documents