7 (10.10.13) tablas de contingencia con spss

14
En ciencias sociales es muy frecuente recurrir a la tabulación cruzada de los datos cuando además de describir (análisis univa- riable) nos interesa comparar (análisis bivariable). Las Tablas de Contingencia resultan, especialmente indicadas, cuando dispo- nemos de variables nominales o cualitativas, suponiendo que una de ellas depende de la otra (variable independiente y/o explicativa). La elaboración de tablas de contingencia o tablas bivariables no se encuentra estandarizada, basta con que ésta se lea e interprete correctamente. Sin embargo, y dado que el pro- grama estadístico con el que presentamos el capítulo es el SPSS, conviene advertir que éste dispone en las filas la variable depen- diente y en las columnas la variable independiente. El interés en el análisis de tablas de contingencia reside en resumir la información contenida en la tabla midiendo la asocia- ción entre las dos variables que forman la tabla y nunca la rela- ción entre las categorías de las variables. Vamos a obtener uno o varios números (estadísticos) que resumen el contenido informa- tivo recogida en cada una de las celdas que se derivan del cruce de las variables. Por último, y una vez determinado el grado de asociación entre las dos variables, nos resta valorar si ésta es estadísticamente significativa, o lo que es lo mismo, si la asocia- ción o relación arrojada por el estadístico elegido es atribuíble a un error de muestro (dicha relación no es genuina de la pobla- ción que estudiamos), no pudiendo generalizar los resultado obtenidos. El capítulo se estructura en torno a tres puntos, a saber: 1.- Relación de estadísticos de asociación para variables de tipo nominal. 2.- Relación de estadísticos de asociación para variables de tipo ordinal. 3.- Elección y aplicación de una prueba paramétrica de sig- nificación estadística. Capítulo 1 Análisis de Tablas de Contingencia Estadística Informática: casos y ejemplos con el SPSS • 3 • • 3 • 1. Introducción Capítulo 1 Análisis de Tablas de Contingencia

Upload: el-oscar

Post on 28-Nov-2015

61 views

Category:

Documents


2 download

TRANSCRIPT

Encienciassocialesesmuyfrecuenterecurriralatabulacióncruzadadelosdatoscuandoademásdedescribir(análisisuniva-riable)nosinteresacomparar(análisisbivariable).LasTablasdeContingencia resultan, especialmente indicadas, cuando dispo-nemos de variables nominales o cualitativas, suponiendo queuna de ellas depende de la otra (variable independiente y/oexplicativa). La elaboración de tablas de contingencia o tablasbivariablesnoseencuentraestandarizada,bastaconqueéstaseleaeinterpretecorrectamente.Sinembargo,ydadoqueelpro-gramaestadísticoconelquepresentamoselcapítuloeselSPSS,convieneadvertirqueéstedisponeenlasfilaslavariabledepen-dienteyenlascolumnaslavariableindependiente.

El interésenelanálisisde tablasdecontingenciaresideenresumirlainformacióncontenidaenlatablamidiendolaasocia-ciónentrelasdosvariablesqueformanlatablaynuncalarela-ciónentrelascategoríasdelasvariables.Vamosaobtenerunoovariosnúmeros(estadísticos)queresumenelcontenidoinforma-tivorecogidaencadaunadelasceldasquesederivandelcrucedelasvariables.Porúltimo,yunavezdeterminadoelgradodeasociación entre las dos variables, nos resta valorar si ésta esestadísticamente significativa,oloqueeslomismo,silaasocia-ciónorelaciónarrojadaporelestadísticoelegidoesatribuíbleaunerrordemuestro(dicharelaciónnoesgenuinadelapobla-ción que estudiamos), no pudiendo generalizar los resultadoobtenidos.

Elcapítuloseestructuraentornoatrespuntos,asaber:1.- Relacióndeestadísticosdeasociaciónparavariablesde

tiponominal.2.- Relacióndeestadísticosdeasociaciónparavariablesde

tipoordinal.3.- Elecciónyaplicacióndeunapruebaparamétricadesig-

nificaciónestadística.

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática: casos y ejemplos con el SPSS • 3 •• 3 •

1. Introducción

Capítulo 1Análisis de Tablas de Contingencia

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática: casos y ejemplos con el SPSS• 4 •

Parallevaracaboelanálisisdetablasdecontingenciaempe-zamosdefiniendolatablaconlasdosvariablesseleccionadas.

1er paso: Acceder al Cuadro de Diálogo de Tablas deContingenciaseleccionandoEstadísticosDescriptivos:TablasdeContingenciadelMenúPrincipalAnalizar(figura 1).

2ºpaso: Indicar lasdosvariablesquevanaformarlatablade doble entrada recordando que: en las Filas situaremos a ladependiente (D8a GRADO DE PRÁCTICA RELIGIOSA de laqueomitidolosNS/NC)yenlasColumnasalavariableinde-pendiente(Rd3queeselESTADOCIVILrecodificadoendonde:1sonlossolteros;2loscasados;3losdivorciados,separadosyvivenenpareja;4losviudos;y9losNS/NCqueasuvezhansidoeliminados)(figura2).

3erpaso:Unavezqueyatenemosdefinidalarelacióndelasdos variables que suponemos, a priori, asociadas, deberemosseleccionar las medidas de asociación más indicadas según elniveldemedicióndeéstas.Estaopciónseencuentracliqueandosobre el botón de comandoEstadísticos..., situado en la parteinferiordelCuadrodediálogo.Unavezquehemosaccedidoalsubcuadrodediálogo,aparecerántodaslasmedidasdeasocia-cióndisponibles (figura 3). Enelejemploprácticoquerecoge-mosalfinaldelcapítulohemosseleccionadotodaslasmedidasdeasociaciónnominales.Lasventajaseinconvenientesdecadaunodeestosestadísticosaparecenenlasiguienterelación.

1.- Phi: ElcoeficientePhinospermiteevaluarelgradodeasociaciónentredosvariables,pero sóloestanormalizada,esdeciroscilaentre0y1entablasde2X2.Entablasconotrascaracterísticastomavalores>1.EnestoscasoslorecomendableesutilizarelCoeficientedeContingencia.

2.- CoeficientedeContingencia: EstamedidaesunaextensióndePhiparaelcasodetablasmayoresa2X2perotampocoesunamedidanormalizadapara

Figura 1

2. Cuadro de Diálogo de Tablas de Contingencia

3. Estadísticos Nominales

Figura 2

Figura 3

estetipodetablaspuesoscilaentre0paraelcasodenoasocia-ciónyCmax,valorquenuncaalcanzael1.

3.- VdeCramer: LaVdeCramerestambiénunaextensióndelcoeficientePhiperoenestecaso,yadiferenciadelCoeficientedeContingencia,siseencuentranormalizada.LaVdeCrameroscilaentre0y1(valorescercanosa0indicannoasociaciónylospróximosa1fuerteasociación).Elproblemadeesteestadísticoesquetiendeasubestimarelgradodeasociaciónentrelasvariables.

4.- Lambda: Esteestadísticocomparaelerrorcometidoenlaprediccióncuando únicamente se consideran los valores de la variabledependiente,yelerrorcometidoenlaprediccióndeéstaapartirdelconocimientodelosdelaindependiente.

Su versión asimétrica se interpreta como la proporción enquesereduceelerroralpredecirlosvaloresdeunadelasvaria-bles (dependiente) a partir de los de la otra (independiente);mientrasque laversiónsimétricase interpretacomo lapropor-ciónenlaquesereduceelerroralpredecirlosvaloresdecual-quieradelasdosvariablesapartirdelatabladecontingencia.

Sucálculoserealizaenbasealosvaloresmodales(frecuen-ciasmayoresenladistribución),porloqueesunamedidaquesevemuyinfluidaporelsesgoenlasdistribucionesmarginales(sueleser0apesardequeexisteasociaciónentrelasvariables).Tomavaloresentre0,enelcasodenoasociación,y1,encasodefuerteasociación.

5.- Coeficientedeincertidumbre: Esunamedidasemejantealaanteriorencuantoasucon-cepcióndelaasociacióndelasvariables,enrelaciónalacapaci-dadpredictivaylasdisminucióndelerrordedichapredicción.Ladiferenciaestribaensucálculoyaqueenestecasolaexpresióndeestoscoeficientesdependedetoda ladistribuciónynosólodelosvaloresmodales,porloquesólotomaelvalor0encasosde total independencia. Ésta es su ventaja respecto aLambda,peroesmásdifícildeinterpretar.Oscilaentre0y1.Suversiónasimétrica se interpreta como la proporción de incertidumbrereducidaalpredecirlosvaloresdeunavariableapartirdelosdelaotra;mientrasque la versión simétrica se interpreta como laproporcióndeincertidumbrereducidaalpredecirlosvaloresde

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática: casos y ejemplos con el SPSS • 5 •• 5 •

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática: casos y ejemplos con el SPSS• 6 •

cualquierade lasdosvariablesmediante la tabladecontingen-cia.

6.- Kappa: Esunamedidaapropiadacuandosedeseacompararelcom-portamiento de dos variables nominales medidas en la mismaescala.Esdecir,enquemedidasedistribuyendelmismomodoonorespectoaunaterceravariable.Silasvariablesestánfuerte-menterelacionadasesporquetienenelmismocomportamiento,en caso contrario no. En definitiva, mide el grado de acuerdoentrelosvaloresdelasdosvariablesyoscilaentre-1y1.

1.- Gamma: Gammaesunamedidadelgradoytipodeasociaciónentredosvariablescualitativasordinalesqueoscilaentre-1(amedidaqueaumentanlosvaloresdeunavariable,losdelaotradisminu-yen)y1(amedidaqueaumentanlosvaloresdeunavariablelosdelaotratambiénaumentan)El0indicanoasociación.Lades-ventaja de esta medida es que alcanza tales valores aunque laasociaciónnoseatotal,esdecir,tiendeaestarsobrestimada.

2.- DdeSomers: EsunaextensióndeGamma,ysepresentaendosversiones:unasimétricayotraasimétrica.Aligualqueéstatieneelincon-venientedequepuedealcanzarlosvaloresde-1y1aunquenoexistaasociacióntotalentrelasvariables.

3.- Tau-b-deKendall: EsunaextensióndeGammaperopresentalaventajadequealcanzalosvalores-1y1(sóloparatablascuadradas)ensitua-cionesdetotalasociación.

4.- Tau-c-deKendall: Esunacorreccióndelamedidaanteriordemodoquealcan-zalosvalores-1y1inclusoentablasnocuadradas.Elproblemaquepresentaesquetiendeasubestimarlaasociaciónrealentrelasvariables.

5.- Riesgorelativo: EsunamedidasemejanteaOddratio(OR)siendosuprinci-palinconveniente,denoextraersulogaritmo,quenoestánor-

4. Estadísticos Ordinales

malizada.Deestemodo,silasvariablessonindependientes,suvalores1.

Enelsupuestocasoquelosestadísticosseleccionadosmani-festaran relacióny/oasociaciónentre lasvariables,deberemosvalorarsusignificaciónestadística.Aplicandoalgunadelasprue-basdesignificaciónconlasquecontamos(sueleccióndepende-rá,nuevamente,deltipodemediciónconelquesepresentenlasvariables de la tabla) demostraremos si la asociación es unaRelaciónEspuria(exclusivadelamuestraseleccionada)o,delocontrario, una Relación Genuina, y por ello, generalizable alconjuntodelapoblación.

4ºpaso:Unavezmarcadas lasmedidasy/oestadísticosdeasociación,en lamismaventanadeEstadísticosdelCuadrodediálogo de Tablas de Contingencia seleccionaremos la pruebaChi-cuadrado.

1.- Prueba Chi-cuadradodePearson: La prueba Chi-cuadrado la aplicamos para contrastar laHipótesisNula;H0=lasvariablesxeysonindependientes.

Silasignificaciónasociadaaesteestadísticoesmenoróiguala0.05 rechazamos lahipótesisde independencia.LabasedecálculodelaChi-cuadradosonlasdiferenciasentrelasfrecuen-ciasobservadasyesperadas.

2.-RazóndeverosimilitudChi-cuadrado: LarazóndeverosimilitudChi-cuadradoesunaalternativaalestadísticoChi-cuadradocuandoelobjetivoescontrastarlahipó-tesisdeindependenciaentrelasvariables.Ladiferenciaestribaenque en este caso se calcula el cociente entre las frecuenciasobservadasyesperadas.Enestecasotambiénrechazaremoslahipótesisdeindependenciaentrelasvariablescuandolasignifi-cacióndeesteestadísticoseamenoroiguala0.05. La aplicaciónde losdosestadísticospueden llevarnos a lamismaconclusión.Sinembargo,yenaquelloscasosenlosquenoseproduzcaestacoincidencia,elegiremoselestadísticoconunasignificaciónmenor.

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática: casos y ejemplos con el SPSS • 7 •• 7 •

5. Pruebas de significación estadística

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática: casos y ejemplos con el SPSS• 8 •

ParacontinuartrabajandocliqueamosalbotóndeContinuarregresando al cuadro de diálogo principal de Tablas deContingencia.Unavezenéste,yconlafinalidadderecabarlamayorinformaciónrelacionadaconlapruebaquevamosaapli-car,marcamoselbotóndecomandodeCasillasoCeldassegúnla versióndeSPSScon laqueestemos trabajando.Dentrodeeste cuadro de diálogo (figura 4), nos encontramos con tresapartados en los que debemos marcar las opciones que nosinteresan;estoes,elegiremoslascifrasyporcentajesquedesea-mosqueaparezcanencadacasilladelaTabladeResultadosdelanálisisdeContingencia.

• Elprimerodeellos,eslasFrecuencias,yeneste,selec-cionamos los dos tipos de frecuencias: Observadas y Esperadas.

• El segundo, son los Porcentaje, y seleccionamos:Columnas y Total.

• Y en tercer lugar, los Residuos, y seleccionamos: NoTipificados y TipificadosCorregidos. Enlapresentacióndelcapítuloadvertíamosquelasmedidasdeasociaciónsusceptiblesdeseraplicadasreflejabanlarelaciónentrelasvariablesynuncaentrelascategoríasdeéstas.Puesbien, seleccionado los Residuos Corregidos podremosanalizar la relación entre las distintas categorías, de talmaneraquesielresiduotipificadoesgrande(envaloresabsolutos), las categorías correspondientesestarán rela-cionadas.Caberecordarquecuandolosresiduostipifica-dossonmayoresa1,96(95NiveldeConfianza)ó2,58(99 Nivel de Confianza) son significativos e indican eltipo de relación (según el signo) que existe entre lascategoríasimplicadas.

Por último, y como previo paso a la salida definitiva delresultado derivado de las restricciones y peticiones a las quehemossometidoalanálisisdelasTablasdeContingencia(cuadrodediálogoTablasdeContingencia),deberemosespecificarconquéformatoqueremosquesepresenteelresultado.

5ºpaso:LaeleccióndelFormatodetablasderesultadosseencuentra en el último botón de comando situado en la parteinferior del cuadro de diálogo principal.Una vez seleccionadaestaopción,deberemosdecidir elordenconelquequeremos

Figura 4

quesenospresentenlosvaloresdelaescala,debiendodecidirentreensentidoascendente odescendente.

Lalógicaqueacabamosdeexponerparavalorarlarelación,asociaciónydependenciaentredosvariables,puedesererróneaporelhechodequesepuedeestarproduciendounainteracciónentrelasvariables.Cuandosospechemosqueestacircunstanciase produce debemos analizar dicha interacción en la tabla decontingencia.Paraello,elanálisisdescritodebeincluirloquesedenomina neutralización o control de la variable. Esta técnicasóloesadecuadacuandoeltamañodelastablasyelnúmerodecategoríasespequeño.

Nospuedeinteresar,porejemplo,yunavezcomprobadalarelación entre ESTADO CIVIL y GRADO DE PRÁCTICARELIGIOSA, valorar si esta dependencia se mantiene o se vealterada al introducir una tercera variable, denominada en estecaso,variabledecontrol.Dadoqueelanálisisyanoesexclusi-vamente bivariable, pasamos al análisis multivariable de lasTablasdeContingencia.Conelprocesoquedescribimosobten-dremosuncriteriomásapartirdelcualvalorarsilarelaciónini-cialesespuriaogenuina.

Esteprocesoseiniciaunavezquehemosincluidounavaria-blemásenelanálisis.Sepueden introducir tantasvariablesdecontrolcomoseconsiderenoportunasosequierancontrastar.Paraellosuperpondremosendiferentescapaslasvariablesquequeremoscontrolar.Siincluimosenlaprimeracapamásdeunavariable,cadaunadeellassecruzaráindependientementeconelcruceindicadoarriba,obteniendotantascomprobacionescomonúmerodevariablesintroducidas.

Lavariableseleccionadacomovariabledecontrollacoloca-remos en la casilla Capa 1 de 1. En nuestro ejemplo será lavariableSEXO(d1)(figura 5).Enlasalidaderesultadosfinales,apareceelcoeficientedePearsonparacadacategoríadelavaria-bledecontrol.Larelaciónoriginalseráunarelacióngenuina,sidichocoeficiente,paracadaunadelacategoríasdelavariabledecontrol,tieneunasignificaciónpordebajode0.05.Denopro-ducirseestacircunstancia,podemosconcluirenquelarelaciónesespuria.

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática: casos y ejemplos con el SPSS • 9 •• 9 •

6. Neutralización

Figura 5

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática: casos y ejemplos con el SPSS• 10 •

•SánchezCarrión, Juan Javier (1989):Análisis de tablas de contingencia. Madrid, Centro de Investigaciones Sociológicas,nº105,171págs.

En este libro, de una forma clara y muy didáctica, se exponen los principales argumentos ligados al análisis de tablas de contingencia.

•Babbie,Earl(1999):The Basics of Social Research.Londres,WadsworthPublishingCompany (traducidoporJoséFranciscoJavierDávilaMartínez,Fundamentos de la investigación social,Madrid,ThomsonLearning,2000,473págs.).

Éste es otro manual, en este caso con carácter general, que de forma clara expone los principales elementos a considerar en la investigación social. Acompañado de múltiples ejemplos, reales y ficticios, en los capítulos 15 y 16 (Análisis de datos y Estadísticas sociales, respecti-vamente) nos presenta al análisis bivariado de la mano de las tablas de contingencia así como las principales medidas de asociación y pruebas estadísticas de signifi-cación según el tipo de medición de la variable.

•Miguel,Amandode(1997):Manual del perfecto sociólogo.Madrid,Espasa,195págs.

En los capítulos 5 y 6 (Cómo se “lee” una tabla y Cómo se construye un cuadro), también de una forma muy práctica y didáctica se hace referencia a los requisitos a considerar a la hora de organizar los datos una vez con-cluido el trabajo de campo.

•Bisquerra,Rafael(1987):Introducción a la estadística aplicada a la investigación educativa. Un enfoque informático con los paquetes BMDP y SPSS. Barcelona, Promociones yPublicacionesUniversitarias,pp.135-140.

En el capítulo que el autor dedica a la exposición de la prueba chi-cuadrado se recogen los aspectos a conside-rar en el proceso de neutralización.

7. Bibliografía Comentada

Acontinuaciónsepresentanlosresultadosobtenidosalapli-carelanálisisdetablasdecontingencia.Lastablasqueaparecenpretendenfacilitarnoselanálisisrespectoalaposiblerelaciónquese produce entre estado civil y práctica religiosa. En concretoéstasseestructuranentornoadosbloques,asaber:

• Enprimerlugar,yjuntoalaTabladeContingencia(crucede las variables ESTADO CIVIL - PRÁCTICARELIGIOSA)aparecenlaTablaquevaloralabondaddeajusteylaTablaquemide,apartirdelaseleccióndeunaseriedeindicadores,laintensidaddelarelaciónentrelasvariables.

• Ensegundolugar,yconlafinalidaddevalorarsilarela-cióndescritaesespuriaogenuina, se repiteel análisispero introduciendo comovariable de control elSEXO.LaTabladecontingenciaconelcrucedelastresvaria-blesylatablaconlapruebadechi-cuadrodancuentadelprocesodeneutralizaciónllevadoacabo.Secompletalainformaciónconla tablaque indica la intensidadde lasrelaciones(medidasdeasociación)

Caberecordarquelafinalidaddeestatécnicaesladedetec-tarsiexisteonodependenciaentredosvariables.Nuncamidelarelaciónentrecategorías.Siestafueranuestraintencióndebere-mosrecurriralanálisisdecorrespondencias(vercapítulo3).

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática: casos y ejemplos con el SPSS • 11 •

8. Resultados.

8.1. Resumen del procedimiento

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática. Casos y ejemplos con el SPSS• 12 •

8.2. Tabla de contingencia

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática: casos y ejemplos con el SPSS • 13 •

8.3. Bondad de Ajunte

8.4. Medidas de Asociación

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática. Casos y ejemplos con el SPSS• 14 •

8.5. Resumen del procedimiento. NEUTRALIZACIÓN

8.6. Tabla de Contingencia. NEUTRALIZACIÓN

(continúa...)

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática: casos y ejemplos con el SPSS • 15 •

Tabla de Contingencia. NEUTRALIZACIÓN (continuación)

8.7. Bondad de Ajunste. NEUTRALIZACIÓN

C a p í t u l o 1A n á l i s i s d e Ta b l a s d e C o n t i n g e n c i a

Estadística Informática. Casos y ejemplos con el SPSS• 16 •

8.8. Medidas de Asociación. NEUTRALIZACIÓN