tema3 tablas

15
Tema 3 Tablas 3.1. Tablas de contingencia Una vez realizado un estudio descriptivo unidimensional, hemos de extender el procedi- miento al estudio bidimensional. Bidimensionalmente estaremos interesados en encontrar las relaciones entre variables, por ejemplo si tuvi´ eramos dos variables peso y altura, se intentar´ ıa estudiar si existe relaci´ on entre ellas, lo cu´ al es de sobra conocido. El aspecto bidimensional se desarrollar´ a a partir de las tablas de contingencia, que no son as que la extensi´ on del concepto de tabla de frecuencias solo que aplicado a dos variables. Una tabla de contingencia tendr´ a todos los pares de modalidades de las dos variables junto con su frecuencia (en valor absoluto o en porcentaje). En una tabla de contingencia se denominar´ a distribuci´ on marginal a la distribuci´ on de frecuencias de cada una de las variables independientemente de la otra. Adem´ as podremos calcular la distribuci´ on de una variable condicionada a alg´ un valor concreto de la otra variable (distribuci´ on por fila o columna). Tambi´ en existe un important´ ısimo contraste de hip´otesis, denominado contraste de inde- pendencia, mediante el cual se establecer´ a la relaci´ on entre las variables. Este contraste tiene como hip´ otesis nula la independencia (relaci´ on nula) frente a la dependencia (alg´ un tipo de relaci´ on entre las variables). 3.1.1. Distribuciones marginales y condicionadas Aplicaci´ on en SPSS Para obtener una tabla de frecuencias, seleccionaremos los siguientes men´ us: Analizar Estad´ ısticos Descriptivos Tablas de Frecuencias 33

Upload: jose-manuel-masanet-garcia

Post on 16-Apr-2015

115 views

Category:

Documents


0 download

DESCRIPTION

Análisis multivariante

TRANSCRIPT

Page 1: Tema3 Tablas

Tema 3

Tablas

3.1. Tablas de contingencia

Una vez realizado un estudio descriptivo unidimensional, hemos de extender el procedi-miento al estudio bidimensional. Bidimensionalmente estaremos interesados en encontrar lasrelaciones entre variables, por ejemplo si tuvieramos dos variables peso y altura, se intentarıaestudiar si existe relacion entre ellas, lo cual es de sobra conocido.

El aspecto bidimensional se desarrollara a partir de las tablas de contingencia, que no sonmas que la extension del concepto de tabla de frecuencias solo que aplicado a dos variables.Una tabla de contingencia tendra todos los pares de modalidades de las dos variables juntocon su frecuencia (en valor absoluto o en porcentaje).

En una tabla de contingencia se denominara distribucion marginal a la distribucion defrecuencias de cada una de las variables independientemente de la otra. Ademas podremoscalcular la distribucion de una variable condicionada a algun valor concreto de la otra variable(distribucion por fila o columna).

Tambien existe un importantısimo contraste de hipotesis, denominado contraste de inde-pendencia, mediante el cual se establecera la relacion entre las variables. Este contraste tienecomo hipotesis nula la independencia (relacion nula) frente a la dependencia (algun tipo derelacion entre las variables).

3.1.1. Distribuciones marginales y condicionadas

Aplicacion en SPSS

Para obtener una tabla de frecuencias, seleccionaremos los siguientes menus:

AnalizarEstadısticos DescriptivosTablas de Frecuencias

33

Page 2: Tema3 Tablas

34 Tablas

En la Ventana de Analisis elegiremos las variables a analizar, en este caso cruzaremos lavariable EstadoCivil (en filas) y Sexo (en columnas) del fichero de datos Tablas.

3.1.2. Casillas

A continuacion seleccionaremos el boton de Casilla. Esta opcion nos ofrece:

1. Frecuencias :

a) Frecuencias observadas: con ellas obtenemos el valor real de cada par de valores.

b) Frecuencia esperada: es el valor teorico que tuviera que tener cada casilla para quefueran independientes las variables.

2. Porcentajes:

a) Porcentaje por fila: es el valor de cada casilla dividido entre el numero total deindividuos (frecuencia sobre el total de la poblacion).

b) Porcentaje por columna: es el valor de cada casilla entre el total de su columna.Coincide con las distribuciones condicionadas por columna. La ultima columna esla marginal de la variable.

c) Porcentaje por fila: marginal a la variable fila. Valor de cada casilla entre el totalde su fila. La ultima fila es la marginal.

3. Residuos: diferencias entre el valor observado y el esperado.

Nos seran utiles las frecuencias observadas y todos los porcentajes (total, fila y columna).

Figura 3.1: Tabla de frecuencias

Si seleccionamos estas opciones obtenemos la siguiente tabla:

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 3: Tema3 Tablas

35 Tablas

Figura 3.2: Tabla de frecuencias: casilla

Analizando, por ejemplo, la primera casilla, esta sera el cruce de la modalidad Soltero deEstadoCivil frente a Mujer de Sexo y cada valor significa:

1. Recuento: Numero de mujeres solteras, 3.

2. Frecuencia esperada: teniendo en cuenta todos los datos, valor que debiera tener estecruce para existir independencia.

3. % de Estadocivil: cociente entre el valor de la casilla y el total de la fila (3/7). Quieredecir que el 42,9 % de los solteros son mujeres.

4. % de Sexo: cociente entre el valor de la casilla y el total de la columna (3/5). Implicaque el 60 % de las mujeres estan solteras.

5. % del total: cociente de la casilla entre el total de individuos (3/10). Es decir, el 30 %son mujeres y solteras.

6. Residuo: diferencia entre el valor esperado y el observado. (3-3.5).

3.1.3. Estadısticos

Mediante el boton de Estadısticos elegiremos un estadıstico (valor numerico) para la re-solucion del contraste de independencia. El primer paso sera el estudio del tipo de datos delque disponemos, ya que dependiendo de estos, existiran diferentes estadısticos. En algunosestadısticos y medidas se asume que hay unas categorıas ordenadas (datos ordinales) o unosvalores cuantitativos (datos de intervalos o de proporciones). Otros estadısticos son validoscuando las variables de la tabla tienen categorıas no ordenadas (datos nominales). Para los es-tadısticos basados en chi-cuadrado (phi, V de Cramer y coeficiente de contingencia), los datosdeben ser una muestra aleatoria de una distribucion multinomial.

El primer paso sera decidir si existe relacion (dependencia) o no (independencia) entre lasvariables del estudio. Para ello utilizaremos el coeficiente de la chi-cuadrado. El contraste arealizar es:

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 4: Tema3 Tablas

36 Tablas

H0 : Existe independencia, es decir no hay relacion entre las variables

H1 : Existe dependencia entre las variables

El coeficiente Chi-cuadrado de Pearson es el estadıstico usado en el caso que las variablessean de tipo cuantitativo. Existen otros dos contrastes para el estudio de la independenciaque son el contraste de la Razon de Verosimilitudes y por Asociacion Lineal, aunque soloutilizaremos el primero. Para tablas de 2x2 (dos filas y dos columnas) utilizamos el estadısti-co con la correccion de Yates y la prueba exacta de Fisher cuando la frecuencia es menor que 5.

Una vez decidido si existe relacion o no entre los datos tendremos que intentar dar unamedida de esta relacion. Para ello usaremos alguno de los estadısticos siguientes dependiendodel tipo de dato o de las circunstancias en las que nos encontremos.

1. Valores cuantitativos. En este caso usaremos el procedimiento Correlaciones, obteniendo:

a) El coeficiente de correlacion de Spearman (coeficiente de correlacion para muestrasordenadas)

b) El coeficiente de correlacion de Pearson

Ambas medidas tienen una interpretacion semejante, de tal manera que valoresproximos a -1 indican una correlacion lineal fuerte y negativa, valores cercanos a 1fuerte y positiva y valores cercanos a 0 indican la ausencia de correlacion lineal.

2. Valores Nominal. Es decir, categorıas sin orden intrınseco (catolico, protestante o judıo).Dentro de estas podemos elegir:

a) Coeficiente de contingencia, Phi y V de Cramer. Son medidas de asociacion basadasen la chi-cuadrado. El valor siempre esta comprendido entre 0 y 1. El valor 0 indicaque no hay asociacion entre la fila y la columna. Los valores cercanos a 1 indicanque hay gran relacion entre las variables.

b) Lambda. Medidas de asociacion que reflejan la reduccion proporcional en el errorcuando se utilizan los valores de la variable independiente para pronosticar los va-lores de la variable dependiente. Proporciona dos medidas, la simetrica y el testde Goodman y Kraskall simetrico y asimetrico. Un valor igual a 1 significa que lavariable independiente pronostica perfectamente la variable dependiente. Un valorigual a 0 significa que la variable independiente no ayuda en absoluto a pronosticarla variable dependiente. Se usa la simetrica cuando no es posible distinguir entreuna variable independiente y otra dependiente.

c) Coeficiente de incertidumbre. Medida de asociacion que indica la reduccion pro-porcional del error cuando los valores de una variable se emplean para pronosticarvalores de la otra variable. Por ejemplo, un valor de 0.83 indica que el conocimien-to de una variable reduce en un 83 % el error al pronosticar los valores de la otravariable.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 5: Tema3 Tablas

37 Tablas

3. Valores Ordinal. Para las tablas en las que tanto las filas como las columnas contienenvalores ordenados.

a) Gamma. Medida de asociacion simetrica entre dos variables ordinales cuyo valorsiempre esta comprendido entre menos 1 y 1. Los valores proximos a 1, en valorabsoluto, indican una fuerte relacion entre las dos variables. Los valores proximos acero indican que hay poca o ninguna relacion entre las dos variables.

b) d de Somers. Medida de asociacion entre dos variables ordinales que toma un valorcomprendido entre -1 y 1. Los valores proximos a 1, en valor absoluto, indican unafuerte relacion entre las dos variables. Los valores proximos a cero indican que haypoca o ninguna relacion entre las dos variables. La d de Somers es una extensionasimetrica de gamma que difiere solo en la inclusion del numero de pares no empa-tados en la variable independiente. Tambien se calcula una version no simetrica deeste estadıstico.

c) Tau-b de Kendall. Medida no parametrica de la correlacion para variables ordinaleso de rangos que tiene en consideracion los empates. El signo del coeficiente indica ladireccion de la relacion y su valor absoluto indica la magnitud de la misma, de talmodo que los mayores valores absolutos indican relaciones mas fuertes. Los valoresposibles van de -1 a 1, pero un valor de -1 o +1 solo se puede obtener a partir detablas cuadradas.

d) Tau-c de Kendall. Medida no parametrica de asociacion para variables ordinales queignora los empates. El signo del coeficiente indica la direccion de la relacion y suvalor absoluto indica la magnitud de la misma, de tal modo que los mayores valoresabsolutos indican relaciones mas fuertes. Los valores posibles van de -1 a 1, pero unvalor de -1 o +1 solo se puede obtener a partir de tablas cuadradas.

4. Variables nominal y de intervalo. Cuando una variable es categorica y la otra es cuanti-tativa de tal manera que la variable categorica se ha de codificar numericamente.

a) Eta. Medida de asociacion cuyo valor siempre esta comprendido entre 0 y 1. El valor0 indica que no hay asociacion entre las variables de fila y de columna. Los valorescercanos a 1 indican que hay gran relacion entre las variables. Eta resulta apropiadapara una variable dependiente medida en una escala de intervalo (por ejemplo,ingresos) y una variable independiente con un numero limitado de categorıas (porejemplo, genero). Se calculan dos valores de eta: uno trata la variable de las filascomo una variable de intervalo; el otro trata la variable de las columnas como unavariable de intervalo.

5. Otras medidas:

a) Kappa. La kappa de Cohen mide el acuerdo entre las evaluaciones de dos juecescuando ambos estan valorando el mismo objeto. Un valor igual a 1 indica un acuerdoperfecto. Un valor igual a 0 indica que el acuerdo no es mejor que el que se obtendrıapor azar. Kappa solo esta disponible para las tablas cuadradas (tablas en las queambas variables tienen el mismo numero de categorıas).

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 6: Tema3 Tablas

38 Tablas

b) Riesgo. Pata tablas 2x2, una medida del grado de asociacion entre la presencia deun factor y la ocurrencia de un evento. Si el intervalo de confianza para el estadısticoincluye un valor de 1, no se podra asumir que el factor esta asociado con el evento.Cuando la ocurrencia del factor es rara, se puede utilizar la razon de las ventajas(odds ratio) como estimacion del riesgo relativo.

c) McNemar. Prueba no parametrica para dos variables dicotomicas relacionadas. Con-trasta los cambios en las respuestas utilizando la distribucion de chi-cuadrado. Esutil para detectar cambios en las respuestas debidas a la intervencion experimentalen los disenos del tipo .antes-despues”. Para las tablas cuadradas de mayor ordense informa de la prueba de simetrıa de McNemar-Bowker.

d) Estadısticos de Cochran y de Mantel-Haenszel. Los estadısticos de Cochran y Mantel-Haenszel pueden utilizarse para contrastar la independencia entre una variable defactor dicotomica y una variable de respuesta dicotomica, condicionada por los pa-trones en las covariables, los cuales vienen definidos por la variable o variables de lascapas (variables de control). Tenemos que tener en cuenta que mientras que otros es-tadısticos se calculan capa por capa, los estadısticos de Cochran y Mantel-Haenszelse calculan una sola vez para todas las capas.

Ejemplo para ambas variables cuantitativas

Para realizar un ejemplo con ambas variables cuantitativas (numericas) utilizaremos elfichero Ejemplo1. En el intentaremos observar si existe relacion entre las variables Notamediay Edad.

Para ello seleccionaremos los mismos menus que en la seccion 3.1.1 y en el boton de Es-tadısticos marcaremos las pestanas de Chi-cuadrado y Correlaciones.

Figura 3.3: Tablas de contingencia: estadısticos

De los resultados, el primer paso sera comprobar si existe dependencia entre las variableso no. Para ello utilizamos la tabla de Pruebas chi-cuadrado. En ella vemos que el contraste dela Chi-cuadrado proporciona una significacion de 0.229>0.05, por lo que se acepta la hipotesisnula del contraste de existencia de independencia entre las dos variable, es decir, no existe

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 7: Tema3 Tablas

39 Tablas

relacion entre la nota media y la edad del individuo. En este caso no es necesario estudiar lascorrelaciones, puesto que no existe relacion. En el caso contrario, es decir, si hubieramos acep-tado que existıa relacion entre las variables hubieramos estudiado el coeficiente de correlacionde Pearson, en donde si este tuviera valores cercanos a -1 o 1, llegarıamos a la conclusion queexiste relacion lineal.

Figura 3.4: Estadısticos de la chi-cuadrado y correlacion

Ejemplo ambas nominales

En este caso querıamos ver si existe relacion entre dos variables categoricas en las que noinfluye el orden. Utilizaremos el mismo ejemplo, pero usando las variables Sexo y Estado Civil.Al igual que en el caso anterior, lo primero sera comprobar si existe relacion entre las variables.Si estudiamos el contraste de la chi-cuadrado, en este caso obtenemos la siguiente tabla:

Figura 3.5: Estadısticos de la chi-cuadrado

En esta caso al ser la tabla de frecuencias de 2x2 (hombre y mujer frente a soltero y casado)SPSS proporciona ademas del test de la chi-cuadrado, el de Fisher, que en este caso es masadecuado. Ambos procedimientos proporcionan niveles de significacion menores de 0.05, porlo que por ambos metodos aceptarıamos la hipotesis de dependencia o relacion entre variables.

Una vez aceptada esta hipotesis tendremos que intentar describir como es esta relacion. Paraello volvemos a seleccionar el analisis de Tablas de Frecuencias y en Estadısticos marcamoslas opciones de Coeficiente de Contingencia, Phi y V de Cramer, Lambda y Coeficiente deincertidumbre. Los resultados son:

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 8: Tema3 Tablas

40 Tablas

Figura 3.6: Medidas de asociacion

1. Los valores de la Phi, la V de Cramer y el coeficiente de contingencia miden el valor dela asociacion, es decir, si hay una asociacion fuerte o debil. Cuanto mas grande son estosvalores (cercanos a 1) mayor es la asociacion, en los tres casos los valores son altos, porlo que la asociacion sera fuerte.

2. Medidas direccionales. Estas medidas indican como de buenas es cada una de las variablespara pronosticar a la otra. De tal manera que usaremos las medidas simetricas cuandono se pueda o no sepa que variable es mas importante como dependiente. En todos loscasos los valores son altos, lo que significa que nos serıan utiles para realizar predicciones.

Ejemplo ambas ordinales

En este caso usaremos el fichero Encuesta, y las variables nivel de estudios del Padre yde la Madre. Estas variables son claramente ordinales, ya que entre ellas se puede establecerun orden referente al nivel de estudios. Al igual que en los casos anteriores, lo primero seracontrastar si existe asociacion entre las variables y posteriormente, si existe, dar un grado deasociacion.

Figura 3.7: Contraste chi-cuadrado

Al ser la significacion del contraste menor de 0.05, rechazamos la hipotesis de independenciay aceptamos la dependencia, por lo que a continuacion marcaremos todas las medidas deasociacion para medidas ordinales, obteniendo:

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 9: Tema3 Tablas

41 Tablas

Figura 3.8: Medidas de asociacion

Todas estas medidas de asociacion estan comprendidas entre -1 y 1, de tal manera quecuanto mas cercanas esten a los extremos mayor sera la dependencia y si estan cercanos a ceromenor, en todos los estadısticos los valores son grandes o significativos (la significacion es 0)por lo que la asociacion entre las dos variables sera grande.

Ejemplo Nominal y de intervalo

En este caso una variable sera categorica pero codificada numericamente y la otra cuantita-tiva (numerica), por ejemplo, la variable Edad y Relaciones Familiares (categorica codificadacon valores numericos) del fichero Encuesta. Como en los casos anteriores realizaremos elcontraste de independencia y el de asociacion.

Figura 3.9: Medidas de asociacion

En este ejemplo, podemos ver que existe dependencia entre las variables (estadıstico chi-cuadrado) pero que los valores de los estadısticos de asociacion, la eta, son pequenos, por loque asumiremos que existe relacion entre las variables pero no en un grado importante.

3.1.4. Graficos

Si en la ventana del analisis seleccionamos la opcion de Mostrar los graficos agrupadosobtendremos graficos de resumen que nos ayudan a resumir los datos por grupos de casos. Detal manera que SPSS agrupa segun el valor especificado para las Filas mientras que la variableColumna, es la que define las barras dentro de cada grupo de las filas.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 10: Tema3 Tablas

42 Tablas

Por ejemplo, si en el fichero Encuesta, seleccionamos como variable de filas las relacionescon los amigos y en la variable columna las relaciones familiares, obtendremos el siguientegrafico:

Figura 3.10: Graficos

3.1.5. Capas

Si seleccionamos una o mas variables de capas, se generara una tabla de contingencia porcada categorıa de cada variable de capas (variable de control). Por ejemplo, si empleamos unavariable de fila, una variable de columna y una variable de capas con dos categorıas, obten-dra una tabla de doble clasificacion por cada categorıa de la variable de capas. Si solicitamosestadısticos y medidas de asociacion, se aplicaran solo a las tablas de doble clasificacion.

Por ejemplo, con el fichero Encuesta, vamos a obtener la tabla de contingencia de lasRelaciones Familiares frente a la Relacion con los Amigos, pero con una variable de capa, quesera el Sexo:

Figura 3.11: Capas

Podemos ver como se obtiene una tabla en la que las filas aparecen separadas en tantasmodalidades como tiene la variable de capa.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 11: Tema3 Tablas

43 Tablas

3.2. Tablas de respuestas multiples

En el analisis de cuestionarios es muy comun la circunstancia de utilizar conjuntos de res-puestas multiples, los cuales utilizan varias variables para registrar respuestas a preguntas enlas que el encuestado puede ofrecer mas de una respuesta. Los conjuntos de respuestas multi-ples se consideran variables categoricas.

Como ejemplo, utilizaremos el fichero Encuesta2, en el que a 1517 individuos les inves-tigamos el Sexo, la Raza y los problemas mas importantes que han sufrido en los ultimos 12meses, y en esta variable se pueden senalar hasta cuatro respuestas.

Para definir conjuntos de respuestas multiples, elegiremos los menus:

AnalizarTablas

Conjuntos de Respuestas Multiples...

A continuacion seleccionaremos las cuatro sub-variables de respuesta en variables de con-junto, indicaremos si las variables son dicotomicas (si o no) o si tienen categorıas y la nom-braremos (el nombre no puede coincidir con ninguna de las originales), por ejemplo con Dificul.Finalmente pulsaremos Anadir y Aceptar.

Figura 3.12: Respuestas multiples

Al realizarlo correctamente se obtiene una ventana de resultados donde confirma la reali-zacion. Para ello hemos de cumplir las siguientes reglas:

1. Todas las variables del conjunto deben estar codificadas de la misma manera.

2. Las etiquetas de valor se deben utilizar de forma consistente. Si una variable tienedefinidas las etiquetas de valor, todas las demas variables deberan tener el mismo valorasignado a las mismas etiquetas de valor.

3. En los conjuntos de dicotomıas multiples, cualquier etiqueta de variable definida paracada una de las variables del conjunto debe ser exclusiva. Dos o mas variables del conjuntono deben tener la misma etiqueta de variable.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 12: Tema3 Tablas

44 Tablas

Una vez creada la variable tendremos que trabajar con ella; esto sera explicada en elapartado 3.3.2.

3.3. Tablas personalizadas

La opcion de tablas personalizadas nos permite:

1. Crear nuestro propia tabla de contingencia, mucho mas libre y crear una estructura decapas mas clara, ası como la obtencion de estadısticos descriptivos mas amplios sobrecada grupo.

2. Obtener la tabla de frecuencias para respuestas multiples

Para acceder a ellas hemos de seleccionar:

AnalizarTablas

Tablas Personalizadas...

3.3.1. Tabla de contingencia personalizadas

Con esta opcion podemos crear tablas a nuestra medida. Como ejemplo vamos a utilizarel fichero Encuesta2 y vamos a obtener la tabla de contingencia del Sexo (columnas) enfuncion de la Raza (filas). Solo hemos de seleccionar en el listado de variables de la izquierdalas variables con las que trabajar y arrastrarlas hasta el lugar que deseemos.

Figura 3.13: Tablas personalizadas

Una vez seleccionadas las variables podremos establecer los estadısticos de resumen quedeseemos, el orden de la tabla en categorıas y totales.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 13: Tema3 Tablas

45 Tablas

Figura 3.14: Estadısticos de resumen; Categorıas y totales

Estadısticos de contraste

Con la pestana de estadısticos de contraste obtenemos la ventana:

Figura 3.15:

1. Pruebas de independencia (Chi-cuadrado). Esta opcion genera la prueba chi-cuadrado so-bre la independencia para las tablas en las que existe como mınimo una variable categori-ca en las filas y otra en las columnas. Tambien se puede especificar el nivel alfa de laprueba, que debe tener un valor mayor que 0 e inferior a 1.

2. Comparar las medias de columna (pruebas t). Esta opcion genera pruebas por parejassobre la igualdad de las medias de columna, para tablas en las que existe como mınimouna variable categorica en las columnas y una variable de escala en las filas. Podemosseleccionar que los valores p de las pruebas sean corregidas mediante el metodo de Bon-ferroni. Tambien se puede especificar el nivel alfa de la prueba, que debe tener un valormayor que 0 e inferior a 1.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 14: Tema3 Tablas

46 Tablas

3. Comparar las proporciones de columna (pruebas z). Esta opcion genera pruebas porparejas sobre la igualdad de las proporciones de columna para las tablas en las queexiste como mınimo una variable categorica en las columnas y otra en las filas.

Opciones

Con esta pestana podemos:

1. Especificar lo que se visualiza en las casillas vacıas y en las casillas para las que no sepueden calcular estadısticos.

2. Controlar como se van a tratar los valores perdidos en el calculo de los estadısticos delas variables de escala.

3. Establecer los anchos mınimo y/o maximo de las columnas de datos.

4. Controlar el tratamiento de las respuestas duplicadas en los conjuntos de categorıasmultiples.

3.3.2. Tabla de respuestas multiple

Como vimos en el punto 3.2, es muy comun que en el desarrollo de una encuesta se tenganvariables de respuestas multiples, que como ya vimos se pueden agrupar en una. El pasosiguiente sera el de tabular esos resultados. En este caso tabularemos la variable Dificul. Paraello, al igual que en el caso anterior, usaremos la opcion de Tablas Personalizadas. Obteniendola misma ventana que en el caso anterior (ver figura 3.13); en este caso arrastraremos la variableelegida. Tambien en Definir Estadısticos de Resumen seleccionaremos por ejemplo,% del N dela Tabla (frecuencia) y en Categorıas y Tablas que Ordene las categorıas segun la etiqueta.Obteniendo la tabla:

Figura 3.16:

En donde podemos ver la frecuencia de cada modalidad. Finalmente no habrıa mas queseleccionar los estadısticos y opciones que nos interesaran.

3.4. Ejercicios Obligatorios

1. Con el fichero EncuestaUSA, responder a las siguientes cuestiones:

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.

Page 15: Tema3 Tablas

47 Tablas

a) Obtener las tablas de contingencia, realizar el contraste de independencia y en casode existir dependencia dar una medida de esta para las siguientes variables:

1) Sexo y Raza

2) Raza y Region

3) Nivel de Felicidad y Categorıa Ocupacional

4) Nivel de Felicidad y Raza segun el Sexo.

b) Obtener las siguientes variables de respuestas multiples:

1) ProbSalud, formado por Salud1, Salud2, ..., Salud9.

2) Tra, formada por Trabajo1, Trabajo2, ..., Trabajo9.

Para ellas, obtener la tabla de frecuencias unidimensional y bidimensional junto conalgunos estadısticos representativos.

2. El fichero Encuesta, fue pasado a los estudiantes del Instituto de Alhama de Granadacon la intencion de estudiar patrones de comportamiento en el Plan de Prevencion deDrogodependencias del Ayuntamiento de Alhama. El fichero contiene 6 variables: Sexo,Edad, Relacion con los amigos, Relacion con la Familia, Consumo de Tabaco, Alcohol yDrogas.

Estudiar si existen diferentes patrones de comportamiento en el Consumo de Alcohol,Drogas y Tabaco dependiendo del Sexo, Edad, Relaciones Familiares y Relaciones conlos amigos.

ANALISIS MULTIVARIANTE PARA SOCIOLOGOS MEDIANTE SPSS.