teil i: empirische sozialforschung 2. planung und ablauf einer empirischen untersuchung
TRANSCRIPT
Teil I: Empirische Sozialforschung
2. Planung und Ablauf einer empirischen Untersuchung
Phasen einer empirischen Erhebung
D o ku m e n ta tion
D a te n au fbe re itun g u ndD a ten a na lyse
D a te ne rhe bu ng
P lan u ng un d V orb ere itu ngd e r E rhe bu ng
F o rm u lie run g un d P rä z is ie ru ngd e s Fo rsch u n gsp ro b le m s
Phase 1
Phase 4
Phase 2
Phase 3
Phase 5
Phase 1: Formulierung und Präzisierung des Forschungsproblems
Was genau möchte ich wissen ?
• Zunächst zu unterscheiden: selbst initiierte Forschung oder Auftragsforschung
• Deskriptive Studie oder hypothesenprüfende Studie?
• Bei deskriptiver Studie: Bei genau welcher Grundgesamtheit sollen welche Merkmale gemessen werden?
• Bei hypothesenprüfender Studie: Präzise Formulierung der Hypothese
Wichtig bei Hypothesen: Wähle die Hypothese mit dem Ziel, dass sie zur Ablehnung gebracht wird.
Es geht um die Falsifikation, nicht um die Bestätigung von Hypothesen.
Bsp.: Man will die Vermutung untersuchen, ob der Abiturnotendurchschnitt von der beruflichen Stellung des Vaters abhängt.
Hypothese: Der Abiturschnitt ist unabhängig von der beruflichen Stellung des Vaters
Gegenhypothese: Der Abiturschnitt ist nicht unabhängig von der beruflichen Stellung des Vaters
Es kommt zur Ablehnung der Hypothese (und damit zur Annahme der Gegenhypothese), wenn das Beobachtungsmaterial in signifikantem Widerspruch zur Hypothese steht.
Kommt es nicht zur Ablehnung, so bedeutet es nicht, dass die Hypothese bestätigt ist. Es bedeutet nur, dass die Beobachtungsdaten für eine Ablehnung nicht ausreichen.
Es gibt vier Möglichkeiten, wie (unbekannte) Realität und Testentscheidung zusammentreffen können:
H0 ist richtig H0 ist falsch
H0 beibehalten okFehler 2. Art (ß-Fehler)
H0 verwerfen Fehler 1. Art (a-Fehler) ok
Vorgehen in der Praxis: Zunächst Vorgabe des Fehlers 1. Art (z.B. α =5% oder α=1%). Den verbleibenden Spielraum nutzt man, um den Fehler 2. Art so gering wie möglich zu halten. Gegenstand der Testtheorie in der analytischen Statistik
Fehler 1. Art: Hypothese wird abgelehnt, obwohl richtig („Schuldspruch, obwohl unschuldig“ in der Regel schwerwiegend.Fehler 2. Art: Hypothese wird angenommen, obwohl falsch („Freispruch mangels Beweisen“, aber kein Beweis für Unschuld)
Fehler 1. Art und Fehler 2. Art
Beispiel zu Hypothesen und Fehlern 1. und 2. ArtEin Forscher habe einen Bluttest zur Aufdeckung (Diagnose) einer schwerwiegenden neurologischen Krankheit entwickelt. Anhand von 20 Probanden (Versuchspersonen) soll dieser Test erprobt werden.
Hypothese: Das Ergebnis des Bluttests ist unabhängig von der neurologischen Erkrankung
Gegenhypothese: Das Ergebnis des Bluttests ist nicht unabhängig von der neurologischen Erkrankung
Vier denkbare Konstellationen zwischen Test und (unbekannter) Wirklichkeit
Fall 1: Das Testergebnis reicht nicht aus, um die Hypothese abzulehnen (Enttäuschung für den Forscher)
1.1 Der Bluttest ist tatsächlich zur Diagnostik ungeeignet (Testergebnis und Wirklichkeit stimmen überein).
1.2 Der Bluttest ist zur Diagnose tatsächlich geeignet, was jedoch durch den Test nicht erkannt wurde, d.h. Hypothese wird nicht zur Ablehnung geführt. (Fehler 2. Art)
Fall 2: Die Beobachtungswerte reichen aus, um die Hypothese abzulehnen (bahnbrechender Durchbruch für den Forscher)
2.1 Der Bluttest ist tatsächlich zur Diagnostik geeignet (Testergebnis und Wirklichkeit stimmen überein).
2.2 Der Bluttest ist ungeeignet zur Diagnostik, wurde aber durch den Test als geeignet erkannt (Fehler 1. Art, schwerwiegend)
Phase 2: Planung und Vorbereitung der Erhebung
• Definition der Begriffe
• Konzeptspezifikation
• Operationalisierung (Messung, Skalen)
• Definition der Grundgesamtheit
• Umfang der Stichprobe
• Art der Stichprobenziehung (Auswahlverfahren, s. folgende Folien...)
Phase 2: Planung und Vorbereitung der Erhebung
Grundgesamtheit = target population
Vollerhebung oder Stichprobe?
Vollerhebung: Alle Elemente der Grundgesamtheit werden untersucht
Teilerhebung (Stichprobe): Es wird nur eine Teilmenge der Grundgesamtheit untersucht.
n Ziehungen Berechnung der Stichprobensta-tistiken
Berechnung der Stichprobenstatistiken
GrundgesamtheitStichprobe
Anforderungen an die Stichprobenkonstruktion
1. Verkleinertes Abbild der Grundgesamtheit
2. Klar definierte Grundgesamtheit
3. Definition eines Stichprobenelements
4. Angebbares Auswahlverfahren
Die Auswahlverfahren sind dahingehend zu verproben,
inwieweit sie die o.g. vier Kriterien erfüllen.
Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 268
Anforderungen an die Stichprobenkonstruktion
1. Verkleinertes Abbild der Grundgesamtheit
2. Klar definierte Grundgesamtheit
3. Definition eines Stichprobenelements
4. Angebbares Auswahlverfahren
Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 268
Die Stichprobe muss die Verteilungsstruktur der Grundgesamtheit für alle Variablen, die untersucht werden sollen, in verkleinerter Form wiedergeben.
Grundgesamtheit
Stichprobe
Anforderungen an die Stichprobenkonstruktion
1. Verkleinertes Abbild der Grundgesamtheit
2. Klar definierte Grundgesamtheit
3. Definition eines Stichprobenelements
4. Angebbares Auswahlverfahren
Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 268
Es muss absolut klar sein, wer zur Grundgesamtheit gehört und wer nicht.Vage Grundgesamtheiten bedeuten:
a) Die Menge der Elemente, für die die Stichprobenergebnisse gültig sein sollen, ist nicht eindeutig abgrenzbar.
b) Es ist nicht entscheidbar, aus welcher Erhebungsgrundgesamtheit die Stichprobe gezogen werden soll.
Alle Personen über 18 Jahre, mit deutscher Staatsangehörigkeit undErstwohnsitz in Deutschland
Alle Personen über 18 Jahre, die zum Zeitpunkt der Untersuchung inDeutschland gemeldet sind.
So ? Oder so ?
Anforderungen an die Stichprobenkonstruktion
1. Verkleinertes Abbild der Grundgesamtheit
2. Klar definierte Grundgesamtheit
3. Definition eines Stichprobenelements
4. Angebbares Auswahlverfahren
Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 268
Es muss eindeutig feststellbar sein, ob ein Element der Grundgesamtheit zur Stichprobe gehört oder nicht. Dies ist wichtig, damit bei Elementen mit gleicher Benennung entschieden werden kann, welches der Elemente für die Stichprobe ausgewählt wurde und welches nicht.
„Ziehe vom Zufallsstart aus jede 50.te Adresse, notiere die laufende Nummer,Dann den Namen und dann dieAdresse. Vergleiche, ob die laufendeNummer schon gezogen worden ist“
Name lfd. NummerSchmitz, Karl 114Schmitz, Karl 115
Anforderungen an die Stichprobenkonstruktion
1. Verkleinertes Abbild der Grundgesamtheit
2. Klar definierte Grundgesamtheit
3. Definition eines Stichprobenelements
4. Angebbares Auswahlverfahren
Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 268
Es muss feststellbar sein, nach welchem Verfahren eine Stichprobe zustande gekommen ist, da die unterschiedlichen Verfahren spezifische Vor- und Nachteile haben.
Grundgesamtheit = … Stichprobenverfahren = …
Erhebungsgrund-gesamtheit = …
5489 Adressen - 1560 Verweigerung - 278 keine Zeit 3651 realisierte
Interviews
Auswahlverfahren (Stichprobentechniken)
w illkü rlich e A u sw a h lb e w u ßte A usw a h lQ u ote n au sw a h l
n ich t zu fa llsge s teu e rteA u sw a h lve rfah ren
u n e ing e sch rä nk te Zu fa llsa u sw a h lsys te m a tische Z u fa llsa usw a h lm e h rs tu fige A u sw a h lK lu m p e n stichp ro beG e sch ich te te S tich pro be
zu fa llsg es teu e rteA u sw a h lve rfah ren
(W a h rsche in lich ke itsa u sw a h l)
A u sw a h lve rfah ren
Jedes Element der Grundgesamtheit hat eine bestimmte Chance, in die Stichprobe aufgenommen zu werden.
Jedes Element der Grundgesamtheit hat die gleiche Chance, in die Stichprobe aufgenommen zu werden.
Willkürliche Auswahl
• Der Interviewer greift sich nach Belieben an einem beliebigen Ort und zu einem beliebigen Zeitpunkt Personen (oder Ereignisse) heraus, die er befragt bzw. beobachtet. (z.B. Befragung wartender Fahrgäste an einer Haltestelle).
• Keine der vier genannten Anforderungen an die Stichprobenkonstruktion ist erfüllt. Die Stichprobe kann kein verkleinertes Abbild einer definierten Grundgesamtheit sein, da weder die Grundgesamtheit angebbar ist noch die Stichprobenelemente genau definiert sind. Auch die Stichprobenelemente werden willkürlich festgelegt.
• Schlussfolgerung: Willkürliche Auswahlen sind für statistisch-kontrollierte wissenschaftliche Aussagen wertlos.
Bewußte Auswahl Auswahlen werden planvoll und aufgrund vorheriger Überlegungen gezielt vorgenommen.
Beispiele: - Es werden nur „Experten“ zu einem bestimmten Thema befragt (Expertengespräche)
- Es kommen nur „durchschnittliche“ Fälle in die Auswahl (z.B. 4-Personen-Haushalte mittleren Einkommens)
Eignung: Analysen mit eng eingegrenzten Fragestellungen oder Vorklärungen in bislang wenig erforschten Bereichen
Variante 1: Typische Auswahl
Man analysiert nur die Elemente der Grundgesamtheit, die als besonders typisch für die Grundgesamtheit angesehen werden.
Prinzip einfach, aber problematisch (was heißt „typisch“?, setzt Kenntnisse über GG voraus etc.)
Variante 2: Auswahl nach dem Konzentrationsprinzip („Abschneideverfahren“)
Beschränkung der Erhebung auf Fälle, die besonders „ins Gewicht fallen“.
Beispiel: Untersuchungsziel = Umsätze in der Bauwirtschaft; Beschränkung auf Erhebung der Unternehmen mit mehr als 19 Beschäftigten (=15% der Unternehmen)Grund: Sie machen 75% des Umsatzes aus. Durch Erhebung lediglich 15% der Bauunternehmen erfaßt man 75% des Umsatzes. Die anderen werden „abgeschnitten“ (Vorgehen in der amtlichen Statistik).
Quotenauswahl
• Sehr große Bedeutung bei Markt- und MeinungsforschernGrund: Quotenauswahl wirtschaftlicher als kostspielige Wahrscheinlichkeitsauswahl
• Prinzip: Stichprobe wird nach vorgegebenen Regeln gezogen. Diese Regeln sind von den Interviewern zu erfüllen. Man versucht die Stichprobe so zu konstruieren, daß die Quote in
der Stichprobe im Hinblick auf die ausgewählten Merkmale (z.B. Geschlecht, Alter, Berufsstellung, Region etc.) der Merkmalsverteilungen der Grundgesamtheit entsprechen.
• Ziel: Schaffung eines verkleinerten, kongruenten Abbilds der Grundgesamtheit („repräsentativ“).
• Voraussetzung: Kenntnisse über die Grundgesamtheit
• Quoten können einfach oder kombiniert seinz.B.: 30% Beamtinnen und 70% Beamte, wobei der Anteil der Beamten/innen an den
Erwerbstätigen 15% betragen soll etc.
• In der Praxis: Jeder Interviewer erhält eine persönliche Quotenanweisung. Sie legt fest, wieviel Personen mit welchen Merkmalen oder Merkmalskombinationen zu befragen sind (siehe
nächste Folie)
Gesamtbevölkerung
Geschlecht
Männlich 49,2%
Weiblich 50,8%
Alter
14-19 Jahre 7,8%
20-29 Jahre 14,3%
30-39 Jahre 14,9%
40-49 Jahre 19,5%
50-59 Jahre 15,7%
60-69 Jahre 13,1%
70 Jahre und älter 14,6%
Beispiel Altersquoten/ CATI Stichprobe17
In der Telefonbefragung werden jeweils 900 Personen (evtl. abhängig von der Bewohnerzahl im Untersuchungsgebiet) rekrutiert und befragt, die folgende Kriterien erfüllen: •100 % Erwachsene, die in ihrem Haushalt für den Einkauf zuständig sind50 % Centerkunden50 % Nichtkunden des Centers
„Mythos“ der repräsentativen StichprobeMarkt- und Meinungsforscher sprechen gerne vom „repräsentativen Stichproben“.
In der Statistik ist der Begriff der „repräsentativen Stichprobe“ oder „Repräsentativbefragung“ kein Fachbegriff. Er ist vielmehr ein Schlagwort, das als „Gütesiegel“ für die Befragung dienen soll.
Z.B. „Auf der Basis einer Repräsentativbefragung von 2000 Bundesbürgern...“ Man will damit ausdrücken, daß bestimmte Merkmale in der Stichprobe (Geschlecht, Alter etc.) in derselben Häufigkeit vorkommen wie in der Grundgesamtheit.
Um eine Untersuchung auf ihre Güte beurteilen zu können, benötigt man:
1. Angabe des Auswahlverfahrens
2. Angabe der Ausschöpfungsquote (=Rücklaufquote in%)
3. Angabe der Zahl der realisierten Interviews (Anzahl)
4. Angabe der Erhebungsmethode (telefonisch, persönliche Befragung)
5. Angabe des Fragetextes mit Antwortkategorien
6. Bei Quotenauswahl: Angabe der Quotenmerkmale
Merke: Zur Beschreibung einer empirischen Untersuchung reicht es keinesfalls aus zu sagen, die Erhebung sei repräsentativ. Es bedarf der o.g. Punkte zur
Charakterisierung.
Reine Zufallsauswahl (Einfache Zufallsstichproben)
Bedingungen:
1. Die Auswahlwahrscheinlichkeit für alle Elemente der Grundgesamtheit ist identisch und größer als 0.
2. Die Auswahl erfolgt in einem einstufigen Auswahlverfahren.
3. Die Elemente werden unabhängig voneinander gezogen.
„Idealtypus“ statistischer Auswahlverfahren, da entsprechende statistische Regeln zum Schluß auf die Grundgesamtheit existieren; in der Praxis schwierig umsetzbar.
• klassische Zufallsstichprobe: Lotterie
• auch angewandt: systematische Zufallsauswahl (z.B. jeder 100. Einer Liste o.ä.)
• Praxis: Listenauswahl, wenn alle Elemente der Grundgesamtheit existieren (via Zufallszahlen), z.B. RDD (Random Digit Dialing)
• Bei persönlichen Interviews: Gebietsauswahl und dann Begehungsanweisungen (Random Route). Bsp.: „Gehen Sie von der Startadresse nach links bis zu nächsten Kreuzung, dann rechts abbiegen und auf diesem Weg jeden 6. Haushalt notieren“.
• Zufallsauswahl innerhalb eines Haushalts: „Schwedenschlüssel“ (kish-selection-grid):
1 2 3 4 5 6 7 81 1 2 4 2 4 5 8
HaushaltsgrößeZufallszahlen
ausgedruckt auf Fragebogen; z.B. 3-Personen-Haushalt älter als 18 Jahre: Befragung des zweitältesten Mitglieds.
Mehrstufige Auswahl
Die Zufallsauswahl erstreckt sich über mehrere Ebenen.
Bsp.: Zweistufige GemeindestichprobeErste Stufe: Zufallsauswahl von 50 GemeindenZweite Stufe: 40 Adressen pro Gemeinde per RandomErgebnis: Zweistufige Zufallsstichprobe von 2.000 Personen.
In der Praxis bei Wahlprognosen üblich: Dreistufige Auswahl
1. Stufe: Auswahl von Stimmbezirken2. Stufe: Auswahl von Haushalten im Stimmbezirk per Random Route3. Stufe: Zufallsauswahl der zu befragenden Person im Haushalt per Schweden-Schlüssel
Wichtiger Spezialfall: PPS-Samples (Probability proportional to size)
Auf der ersten Stufe werden Gemeinden proportional zur Bevölkerungszahl ausgewählt (d.h. Auswahlwahrscheinlichkeit für größere Gemeinden höher als für kleinere Gemeinden)
Zusammenfassung Auswahlverfahren – Vorteile und Nachteile
Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 304-305
Willkürliche Auswahl (nicht zufallsgesteuert)
Vorteile:
• Nach den Ansprüchen wissenschaftlich durchgeführter Sozialforschung gibt es keine Vorteile dieses Verfahrens.
Nachteile:
• Erfüllt keine der vier Anforderungen einer guten Stichprobenkonstruktion. Für wissenschaftliche Zwecke nicht verwendbar.
Zusammenfassung Auswahlverfahren – Vorteile und Nachteile
Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 304-305
Bewusste Auswahl (nicht zufallsgesteuert)
Vorteile:
• Geringer Aufwand, somit auch geringe Kosten
• Detaillierte Sammlung über besonders „interessante“ Fälle möglich
• Einsatz in explorativen Vorstudien angemessen und notwendig
Nachteile:
• Kenntnisse über die Struktur der Grundgesamtheit absolut notwendig, da sonst nicht entscheidbar, welche Fälle als „besonders interessant“ oder „wichtig“ bewertet werden sollen.
• Repräsentativität bewusster Stichproben ist nicht gesichert.
• Statistische Kontrolle des Auswahlfehlers ist nicht möglich.
Zusammenfassung Auswahlverfahren – Vorteile und Nachteile
Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 304-305
Quotenauswahl (nicht zufallsgesteuert)
Vorteile:
• Billigeres und schnelleres Verfahren als zufallsgesteuerte Verfahren. Wird sehr häufig von Marktforschungsinstituten verwendet.
• Repräsentativität wird von anwendenden Instituten als hoch eingeschätzt.
Nachteile:
• Vorkenntnisse über Verteilung der Quotierungsmerkmale sind unverzichtbar.
• Verzerrungen der Stichprobe durch nicht kontrollierte Auswahlen von Personen durch die Interviewer möglich.
• keine statistische Berechnung des Auswahlfehlers möglich.
Zusammenfassung Auswahlverfahren – Vorteile und Nachteile
Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 304-305
Einfache Zufallsauswahl (zufallsgesteuert)
Vorteile:
• Keine Kenntnisse über Grundgesamtheit notwendig.
• Auswahlfehler kann statistisch berechnet werden.
• Repräsentativität für alle Merkmale und Merkmalskombinationen im Rahmen zufälliger Schwankungen gesichert.
Nachteile:
• Ausfälle können meistens nur durch bewusst ausgewählte Fälle ersetzt werden. Dies verletzt das Prinzip der Zufallsauswahl.
• Durch Vorbereitung und längere Durchführung entstehen hohe Kosten.
• Seltene Extremgruppen weisen häufig zu geringe Fallzahlen auf.
Zusammenfassung Auswahlverfahren – Vorteile und Nachteile
Quelle: Kromrey: Empirische Sozialforschung, Opladen 2002, S. 304-305
Geschichtete Auswahl (zufallsgesteuert)
Vorteile:
• Teilgruppen können mit gleichen Anteilen wie in der Grundgesamtheit erhoben werden.
• Interessante Randgruppen können durch disproportionale Schichtung stärker berücksichtigt werden.
• Verringerung des Schätzfehlers
• Verringerung des Stichprobenumfang möglich (schnellere Durchführung, geringere Kosten).
• Nachteile:
• Kenntnisse über die Schichtungsmerkmale notwendig.
Phase 3: Methoden der Datenerhebung
Formen der Befragung:- das persönliche „Face-to-face“-Interview- das telefonische Interview- die schriftliche Befragung („questionnaire“)
- Onlinebefragung
1. Einstellungen bzw. Bewertungen (zumeist Ratingskala für Statements)(„Hartz IV ist ein wirksames Instrument zur Bekämpfung der Arbeitslosigkeit“: stimme überhaupt nicht zu, stimme eher nicht zu, unentschieden, stimme zu, stimme voll zu)
2. Überzeugungen = subjektive Aussagen über Fakten(zumeist ja/nein, Alternativfragen oder offene Fragen); („Sind Sie von der Wirksamkeit von Hartz IV überzeugt?“ ja – nein. Wie viele Menschen in Deutschland gehen Schwarzarbeit nach? – Zahl angeben)
3. Verhalten – Häufigkeit, Dauer und Art von Handlungen in der Vergangenheitoder zukünftige Verhaltensabsichten(Wie oft haben Sie innerhalb der letzten 365 Tage bei Onlineshops eingekauft?)
4. Sozialstatistische Merkmale – allgemeine stat. Angaben wie Alter, Einkommen etc.
Methoden der Datenerhebung: Befragung, Beobachtung, Inhaltsanalyse
Bewertung der Umfragemethoden (I)
• Schriftliche Befragung:– Wenige Befrager befragen viele Befragte– Befragung kann beantwortet werden wenn dafür Zeit ist– Bildmotive können integriert werden, Videos nicht– Aufwendige Dateneingabe per Hand– Keine Randomisierungen möglich
• Face-to-face• Onlinebefragung• Cati (Telefonbefragung)
Bewertung der Umfragemethoden (II)
• Schriftliche Befragung• Face-to-face:
– Direkter Kontakt mit Interviewer– Nachfragemöglichkeit bei offenen oder schwer verständlichen
Fragen – hohe Durchhaltebereitschaft der Befragten– Großer Rekrutierungsaufwand– Aufwendige Dateneingabe per Hand– Hoher Kostenaufwand– Randomisierungen sind abhängig vom Interviewer
• Onlinebefragung• Cati (Telefonbefragung)
Bewertung der Umfragemethoden (III)
• Schriftliche Befragung• Face-to-face• Onlinebefragung:
– Schnelle Datenerhebung und Datenlieferung– Daten sind bereits digital erfasst– Computergesteuerte Randomisierung– Häufig schlechte Datenqualität bei offenen Fragen– Hohe Abbrecherquoten– Spaßantworten wegen fehlender Interviewkontrolle– Oftmals schlechte Qualität des Panels
• Cati (Telefonbefragung)
Bewertung der Umfragemethoden (IV)
• Schriftliche Befragung• Face-to-face• Onlinebefragung• Cati (Telefonbefragung):
– Schnelle Erhebung– Niedrige Kosten– Es werden auch mobile Menschen erreicht– Es kann kein Stimulusmaterial (Bilder, Filme, Anzeigen)
vorgelegt werden– Hohe Abbrecherquoten
Phase 4: Datenaufbereitung und Datenanalyse
Aufgabe der Statistik (siehe folgende Ausführungen zu SPSS und Excel)
Phase 5: Dokumentation
nicht zu unterschätzen !
vollständige und verständliche Dokumentation der Forschungsergebnisse in einem Ergebnisbereicht
Prüfung der Anfangshypothesen und Bewertung ihrer Gültigkeit
Datenanalyse mit SPSS
Einführung in den Umgang mit SPSS
SPSS starten
• Beim Start von SPSS beachten Sie bitte den Unterschied zwischen der Variablenansicht und der Datenansicht
• In der Variablenansicht definieren Sie neue oder bestehende Variablen, fügen Wertelabels hinzu oder bestimmen fehlende Werte
• In der Datenansicht können Sie die Daten bearbeiten
Datenmatrix in SPSS erstellen
• Erstellen der Variablen in der Variablenansicht– Name– Typ– Variablenlabel– Wertelabels (wichtig)– Fehlende Werte (wichtig)– Messniveau & Rolle (unwichtig)
• Dateneingabe in der Datenansicht
Skalenniveaus• Nominalskala:
– Geschlecht oder Geburtsort– Nur vergleichende Statistiken möglich: Häufigkeiten, Kreuztabellen– Mehr oder weniger
• Ordinalskala:– Schulnoten oder Zufriedenheitsfragen– Mittelwerte (Klassendurchschnitt) lassen sich berechnen– Besser oder schlechter
• Skala:– Alter, Einkommen oder Absatzzahlen– Abstände sind interpretierbar– Mathematische Berechnung können durchgeführt werden, z.B.
Regressionen– Der Absatz steigt bei sinkenden Durchschnittspreisen
Skalenniveaus in SPSS
• Für die tägliche Arbeit mit SPSS spielt die korrekte Einstellung des Mess- oder Skalenniveaus keine Rolle und dient nur der Orientierung des Benutzers
• Gleiches gilt für die Rolle, diese Information muss nicht eingegeben werden
Codierung offener Fragen
• Kernaussagen herausarbeiten• Unterschiedliche Formulierungen eines
Themas verdichten• Aussagetendenzen beachten und beibehalten• Wichtige Einzelaussagen beachten• Gegebenenfalls erneut verdichten
Mehrfachantworten
• Fragen in denen Mehrfachantwortmöglichkeiten möglich sind können nicht direkt statistisch ausgewertet werden
• Eine Lösung ist es alle Antwortmöglichkeiten mit 0-1 als einzelne Variablen im Vorfeld der Befragung zu codieren
• SPSS bietet auch die Möglichkeit Mehrfachantworten zu definieren und automatisch dichotome Variablen zu erzeugen
• Diese können dann über Häufigkeitsauszählungen ausgewertet oder über Kreuztabellen miteinander verglichen werden
Wertelabels
• Bei eigenen Datenerhebungen müssen Nominal- und Ordinalskalierte Variablen gelabelt werden
• Klare Bezeichnungen erleichtern später die Auswertung und deren Interpretation
Öffnen Testdaten
• Öffnen Sie bitte den Übungsdatensatz „Häufigkeiten“
• Hinweis: Erleichtern Sie sich grundsätzlich die Arbeit in dem Sie eine zusätzliche Variable „Sortierung“ erstellen in der die Variablen in Ihrer ursprünglichen Form von 1 bis x durchnummeriert werden
Häufigkeiten
• Einfachste Form von statistischen Auswertungen
• Wichtiges Verfahren um einen ersten Überblick über den Datensatz zu bekommen, Ausreißer zu identifizieren und mögliche Fehler zu finden
• Übersicht über offene Antworten
Häufigkeiten: Statistik
• Berechnung einfacher Statistischer Maße:– Perzentile: Interessant zur Aufteilung einer
Variablen in eine vorgegebene Anzahl von Gruppen (Beispiel Datensatz Häufigkeiten Alter)
– Lagemaße: • Mittelwert: Arithmetisches Mittel • Median: Trennwert nach 50% der Befragten/Daten• Modalwert: Häufigster vorkommender Wert
Häufigkeiten: Statistik
• Berechnung einfacher Statistischer Maße:– Streuung:
• Standardabweichung: Wurzel der Varianz, sagt wie eng um den Mittelwert die Daten liegen (+)
• Varianz: Quadrierter Abstand vom Mittelwert (-)• Spannweite: Abstand größter und kleinster Wert
– Verteilung: Beschreibung der Symmetrie der Daten im Verhältnis zur Normalverteilung
Data Clearance
• Behandlung fehlender Werte• Überprüfung der Daten auf Ausreißer und
mögliche Fehleingaben• Methode: Häufigkeiten oder Grafiken
(Balkendiagramm) über alle Variablen– Häufigkeitsauswertung der Variable Fernsehen
und Bereinigung der Daten