lesson 8 spss lab

5

Click here to load reader

Upload: nansouko

Post on 08-Jul-2015

171 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Lesson 8 spss lab

Σελίδα 1 από 5

Analyze - Nonparametric tests - chi square

Μεθοδολογία Εκπαιδευτικής Έρευνας: Ποσοτικές Προσεγγίσεις

Εργαστήριο SPSS Τρίτη, 12-1-2010

Υπεύθυνος Καθηγητής: Παπαπέτρου Σάββας

Εργαστηριακός Συνεργάτης Λαβίδας Κωνσταντίνος

Μη παραμετρικά κριτήρια Το x2 χρησιμοποιείται στον έλεγχο υποθέσεων ποιοτικών δεδομένων (nominal, ordinal), είναι δηλαδή κατάλληλο μόνο για προβλέψεις σχετικά με το πόσοι συμμετέχοντες θα βρεθούν σε κάθε κατηγορία της κατηγορική μεταβλητής. Προσοχή: Ο ερευνητής πρέπει να εξασφαλίσει ότι ένας ικανός αριθμός συμμετεχόντων της έρευνας θα βρεθεί σε κάθε κατηγορία, έτσι σε κάθε κατηγορία θα πρέπει να έχουμε περίπου 20 συμμετέχοντες. 1η περίπτωση Chi square as a’ goodness – of – fit’ test Μπορεί να χρησιμοποιηθεί για να ερμηνεύσει τη συχνότητα κατηγοριών που προέρχονται μόνο από ένα δείγμα (δείκτης καλής προσαρμογής ή καταλληλότητας – chi square as a’ goodness – of – fit’ test) Δραστηριότητα 1η Ένας ερευνητής μελετώντας τον τρόπο που 120 φοιτητές οργανώνουν τη μελέτη τους βρίσκει ότι: Μεθοδική ακανόνιστη Συνδυαστική 51 27 42 Πρόκειται για τυχαίες διαφορές ή πράγματι οι φοιτητές σήμερα οργανώνουν τη μελέτη τους «μεθοδικά»; Το σίγουρο είναι ότι αν οι διαφορές αυτές ήταν τυχαίες θα έπρεπε να είχαμε συχνότητες σε όλες τις περιπτώσεις 40, (Αναμενόμενες συχνότητες – expected frequencies). Πως θα περάσουμε τα δεδομένα; Χρησιμοποιήστε το SPSS καθώς και την (στάθμιση περιπτώσεων – weight cases) για να τοποθετήσετε τον παραπάνω πίνακα συχνοτήτων και να ελέγξετε με το στατιστικό κριτήριο x2 των έλεγχο υποθέσεων στον πληθυσμό του δείγματος. Άσκηση 1η Από το αρχείο δεδομένων gss.sav να ελέγξετε κατά πόσο οι πολίτες του πληθυσμού του δείγματος που μελετάμε είναι ικανοποιημένοι ή όχι από την δουλεία τους (Job Satisfaction).

Page 2: Lesson 8 spss lab

Σελίδα 2 από 5

2η περίπτωση Έλεγχος ανεξαρτησίας μεταξύ δύο κατηγορικών μεταβλητών - chi square as a test of independence. Μπορεί να χρησιμοποιηθεί για να ερμηνεύσει τη συχνότητα κατηγοριών που προέρχονται από δύο ή περισσότερα δείγματα (x2 για ανεξαρτησία) εξετάζοντας αν οι συχνότητες προέκυψαν τυχαία ή συστηματικά. Στην περίπτωση ελέγχου της ανεξαρτησίας μεταξύ δύο κατηγορικών μεταβλητών: θα πρέπει καταρχήν να προσδιορίσουμε εννοιολογικά ποια είναι η ανεξάρτητη μεταβλητή, γραμμές του πίνακα διασταύρωσης και ποια η εξαρτημένη, στήλες του πίνακα διασταύρωσης . Συνήθως ανεξάρτητη μεταβλητή θεωρείται αυτή που προηγείται χρονικά. Στην συγκεκριμένη περίπτωση τον ερμηνευτικό ρόλο των δειγμάτων αντί του μέσου όρου όπως στην περίπτωση ποσοτικών μεταβλητών θα παίξει η σχετική συχνότητα των κατηγοριών της ανεξάρτητης μεταβλητής (τοποθετημένη στην γραμμή του πίνακα διασταύρωσης) ως ποσοστά επί του συνόλου της κάθε γραμμής. Ο έλεγχος χ2 χρησιμοποιείται για να ελέγξει την ανεξαρτησία ή όχι των κατηγορικών μεταβλητών. Ø Δεν δίνει πληροφορίες, για το αν η έλλειψη ανεξαρτησίας αφορά όλο τον

πίνακα ή ένα μόνο τμήμα του. Αυτό το προσδιορίζουμε από τα υπόλοιπα (residuals) κυρίως τα

προσαρμοσμένα (adjusted) τα οποία ακολουθούν κατά προσέγγιση την τυπική κανονική κατανομή, άρα τιμές μεγαλύτερες από 1,96 κατά απόλυτη τιμή οδηγούν με μεγαλύτερη ισχύ στην ένδειξη ανεξαρτησίας. Επίσης τα προσαρμοσμένα υπόλοιπα που έχουν τιμές πάντοτε μεγαλύτερες από τα τυποποιημένα υπόλοιπα (standardized), τα οποία ακολουθούν περίπου την τυπική κανονική κατανομή, με τυπική απόκλιση <=1, έχουν μεγαλύτερη ισχύ από τα τυποποιημένα για την ανάδειξη σημαντικών αποκλίσεων.

Ø Δίνει πληροφορίες, για την ένταση της σχέσης, με μέτρα που βασίζονται στο

x2 στατιστικό όπως (συντελεστής συνάφειας, phi, V του Gramer) αλλά και μέτρα αναλογικής μείωσης του σφάλματος πρόβλεψης όπως (Lambda, συντελεστής αβεβαιότητας) «για παράδειγμα, στην περίπτωση αυτή αν το μέτρο έχει τιμή 0,234, σημαίνει ότι έχουμε 23,4% μείωση του σφάλματος πρόβλεψης της μιας μεταβλητής από την άλλη σε σχέση με το σφάλμα που θα κάναμε αν προβλέπαμε στην τύχη».

Ø Δεν δίνει πληροφορίες, για την φύση της σχέσης, στην περίπτωση δύο κατηγορικών μεταβλητών. Στην περίπτωση δύο μεταβλητών διάταξης έχει νόημα η φύση της σχέσης θετική ή αρνητική και προσδιορίζεται με μέτρα όπως συντελεστής gamma, Tau-b, Tau-c του Kendall και συντελεστής d του Somers.

Page 3: Lesson 8 spss lab

Σελίδα 3 από 5

Προσοχή: Προϋποθέσεις χρήσης του Χ2

Οι αναμενόμενες συχνότητες στα κελιά δεν πρέπει να είναι μικρότερες του 1 και μόνο το 20% των κελιών θα μπορεί να έχει αναμενόμενη συχνότητα κάτω από 5. Λύση στο πρόβλημα αυτό. Συνήθως φροντίζουμε, για να αποφύγουμε το παραπάνω πρόβλημα να παίρνουμε μεγάλο δείγμα τουλάχιστον 20 Χ (κΧν) όπου κ και ν κατηγορίες των δύο κατηγορικών μεταβλητών. Και αν οι προϋποθέσεις δεν ισχύουν; Ø Η διαδικασία που χρησιμοποιείται συνήθως για την ικανοποίηση της

παραπάνω προϋπόθεσης, είναι η συγχώνευση κατηγοριών και δημιουργία ευρύτερων κατηγοριών, με ότι αυτό μπορεί να σημαίνει για την αξιοπιστία της έρευνας.

Ø Διόρθωση Fisher, στις περιπτώσεις που έχουμε πίνακα συνάφειας 2χ2 (δύο κατηγορικές μεταβλητές με δύο κατηγορίες η κάθε μία), σύμφωνα με την ακριβή διαδικασία (exact test) η οποία αποτελεί «διόρθωση του Fisher» δεν υπάρχει πρόβλημα στην χρήση του τεστ ακόμη και αν η παραπάνω προϋπόθεση των αναμενόμενων συχνοτήτων κάτω από 5, δεν ισχύει.

Page 4: Lesson 8 spss lab

Σελίδα 4 από 5

Analyze – Descriptive Statistics – Crosstabs (πίνακας διασταύρωσης)

Δραστηριότητα 2η Ένας ερευνητής θέλει να ελέγξει αν μια μέθοδος διδασκαλίας είναι αποτελεσματικότερη από τον παραδοσιακό τρόπο διδασκαλίας. Επιλέγει δύο τμήματα (ισοδύναμα όσον αφορά τις γνώσεις) από ένα σχολείο και ζητά από έναν δάσκαλο να διδάξει με τον παραδοσιακό τρόπο (42 μαθητές) ενώ αυτός διδάσκει με την νέα μέθοδο διδασκαλίας (44 μαθητές). Μετά την ολοκλήρωση της διδασκαλίας ο ερευνητής υποβάλει και τα δύο τμήματα σε γραπτή δοκιμασία. Τα αποτελέσματα φαίνονται στον παρακάτω πίνακα.

Επίδοση των μαθητών Μέθοδος διδασκαλίας Χαμηλή Μέτρια Υψηλή Σύνολα Νέα Μέθοδος 6 15 23 44 Παραδ. Μέθοδος 10 8 24 42 Σύνολα 16 23 47 86 Οι αναμενόμενες συχνότητες έτσι ώστε να ισχύει η ανεξαρτησία των μεταβλητών

(δηλαδή η μηδενική υπόθεση) υπολογίζονται από τον τύπο: TSG

=*

A (Γ: τιμή στην

αντίστοιχη γραμμή, Σ: τιμή στην αντίστοιχη στήλη, Τ: γενικό σύνολο) Ερωτήσεις Ποια είναι η ανεξάρτητη μεταβλητή και ποια η εξαρτημένη; Γράψτε τις υποθέσεις του προβλήματος. Χρησιμοποιήστε το SPSS καθώς και την (στάθμιση περιπτώσεων – weight cases) για να τοποθετήσετε τον παραπάνω πίνακα συχνοτήτων και να ελέγξετε με το στατιστικό κριτήριο x2 των έλεγχο υποθέσεων στον πληθυσμό του δείγματος. Δραστηριότητα 3η Από το αρχείο δεδομένων «talsmple.sav» μας ενδιαφέρει στην αναζήτηση της πιθανής σχέσης μεταξύ των μεταβλητών βάρος (baros_nn) και ύψος (ypsos_nn) των μαθητών του δείγματος. Αν υπάρχει σχέση, ποια είναι η φύση1 της σχέσης των δύο αυτών μεταβλητών. Άσκηση 2η Από το αρχείο δεδομένων gss.sav να ελέγξετε κατά πόσο οι πολίτες του πληθυσμού του δείγματος που μελετάμε είναι ικανοποιημένοι από την δουλεία τους (Job Satisfaction) σε σχέση με το κατά πόσο αισθάνονται ικανοποιημένοι από την ζωή τους (Is life exciting or dull). Άσκηση 3η

Να χρησιμοποιηθεί το αρχείο gss.sav για να απαντηθούν τα παρακάτω

ερωτήματα:

o Να ελεγχθεί η μηδενική υπόθεση ότι άνδρες και γυναίκες πιστεύουν

στον ίδιο βαθμό ότι υπάρχει μετά θάνατο ζωή (μεταβλητή postlife). Τι

συμπεραίνετε;

1 Π.χ. αύξουσα ή φθίνουσα.

Page 5: Lesson 8 spss lab

Σελίδα 5 από 5

1. Ποια είναι η εξαρτημένη μεταβλητή;

2. Αν η μηδενική υπόθεση «αληθεύει» ποια είναι η καλύτερη

πρόγνωση για το ποσοστό των ανθρώπων που πιστεύουν στη μετά

θάνατο ζωή;

o Να ελεγχθεί κατά πόσο η πίστη στη μετά θάνατο ζωή και το επίπεδο

εκπαίδευσης (μεταβλητή degree) είναι ανεξάρτητες. Ποιο είναι το

συμπέρασμά σας;

o Να εκλεχθεί κατά πόσο η σχέση ανάμεσα στην πίστη στη μετά θάνατο

ζωή και το επίπεδο εκπαίδευσης είναι ίδια για γυναίκες και άνδρες.

o Να ελεγχθεί η μηδενική υπόθεση ότι άνδρες και γυναίκες είχαν τις ίδιες

προτιμήσεις απέναντι στους Perot, Bush και Clinton (μεταβλητή pres92).

(Πρέπει να εξαιρεθούν οι άνθρωποι που ψήφισαν Other.)

o Να ελεγχθεί η υπόθεση ότι η κατανομή της μεταβλητής Ζώδια (zodiac)

κατανέμεται ομοιόμορφα.

Άσκηση 4η

Να χρησιμοποιηθεί το αρχείο salary.sav για να απαντηθούν τα παρακάτω

ερωτήματα:

o Να ελεγχθεί η υπόθεση η ταξινόμηση επαγγελμάτων (jobcat) και οι

ομάδες φύλου με φυλή ( μεταβλητη sexrace) είναι ανεξάρτητες.

1. Τι πρόβλημα συναντάμε με το x2 test στον πίνακα (jobcat) x

(sexrace);

2. Τι μπορείτε να κάνετε ώστε το x2 test να γίνει κατάλληλο;

3. Βασιζόμενοι στον καινούργιο πίνακα τι συμπεραίνετε για τη

μηδενική υπόθεση;