sites.google.comsites.google.com/site/vararey/chi-cuadrado.docx · web viewvolvemos al cuadro...

23
1

Upload: hatram

Post on 12-Oct-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

1

Page 2: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

2

Page 3: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

3

Page 4: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

4

Page 5: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

5

Page 6: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

6

Page 7: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

16.4.- CHI-CUADRADO MEDIANTE SPSS

16.4.1.- Prueba de comparación de una repartición observada y otra teórica

Vayamos al ejercicio 16.1 del experimento de Mendel. Como los datos que tenemos no son los 556 guisantes uno por uno, sino las frecuencias en cada una de las categorías, hemos de indicarle al ordenador la forma que lo reconozca. A este respecto introducimos los datos de la siguiente manera, donde la primera variable, llamada guisantes tiene esos 4 valores y la otra variable, denominada frec tiene las frecuencias:

Ponemos nombre a cada una de las categorías de guisantes:

Para asignarle la frecuencia a cada categoría vamos a Datos/Ponderar casos:

7

Page 8: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

Vamos a Descriptivos para comprobarlo:

Para efectuar la prueba estadística correspondiente:

8

Page 9: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

Allí seleccionamos la variable Tipo de guisantes y le indicamos que la repartición es 9:3:3:1:

Los resultados:

Obsérvese que los resultados son coincidentes a los obtenidos manualmente. Allí aceptábamos la Ho porque el valor de 0.47 estaba por debajo del valor de las tablas, pero no pudimos calcular su valor de probabilidad. Podíamos haberlo hecho recurriendo a las tablas on line:

9

Page 10: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

Valor coincidente con el del SPSS.

16.4.2.- Prueba de comparación de varias reparticiones observadas en grupos independientes

Ya que tampoco tenemos aquí todos y cada uno de los 265 sujetos, procedamos a recomponer los datos para adaptarlos al análisis estadístico. En este caso, introduciremos 3 variables: Especialidad, Opinión y las frecuencias correspondientes a las diferentes combinaciones. Obtendremos la siguiente tabla:

Asignamos etiquetas a los valores de la Especialidad:

10

Page 11: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

Y lo mismo respecto la Opinión:

El resultado:

11

Page 12: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

Vamos a Datos/Ponderar casos:

Y ya lo hemos conseguido. Si vamos a los descriptivos:

12

Page 13: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

Si queremos saber cómo se combinan entre ellos:

13

Page 14: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

Damos a Aceptar y el resultado:

Para realizar la prueba de Chi-cuadrado, seguimos en Tablas cruzadas y marcamos Estadísticos, y allí marcamos Chi-cuadrado:

Si queremos las frecuencias esperadas, volvemos de nuevo al cuadro de dialogo anterior de Tablas cruzadas y marcamos Casillas:

14

Page 15: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

Luego:

Obtenemos:

15

Page 16: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

Valores equivalentes a los obtenidos a mano.

El mismo SPSS nos ofrece algunas opciones interesantes, como Porcentajes de fila y Residuos estandarizados corregidos:

16

Page 17: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

El resultado:

El porcentaje por filas nos permite comparar mejor el reparto de frecuencias por especialidad, ya que sus valores tienen la misma escala (sobre 100%). Por ejemplo, los 12 sujetos en Filosofía cuya opinión es regular, parecerían a primera vista menor comparativamente que los 35 de Psicología, sin embargo su porcentaje es del 30% frente el 25.9% de Psicología.

Por otro lado, los residuales corregidos tienen el interés de indicarnos qué casillas contienen valores significativamente distintos de los valores esperados. Son equivalentes a los valores Z de los contrastes conocidos (medias, proporciones...), e indican la discrepancia de un valor frente al esperado (según la Ho) en desviaciones tipo. Si estos valores se encuentran por encima de 1.96 o 2.58, diremos que presentan una diferencia estadísticamente significativa al 0.05 o el 0.01 respectivamente. Por ejemplo, los 35 de Psicología que opinan regular, están a -3.1 desviaciones tipo de lo esperado. Su frecuencia está por debajo de lo esperado de una manera estadísticamente significativa (al 0.01).

17

Page 18: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

16.5.- CHI-CUADRADO SOBRE FICHERO DE DATOS

Para datos transversales lo habitual es trabajar sobre el fichero original de datos y no sobre algunas transformaciones como las frecuencias. Tengamos, en este sentido, el fichero migración.sav que hace referencia a un conjunto de inmigrantes de distintas nacionalidades. Los datos tienen el siguiente formato:

Donde las filas hacen referencia a los sujetos y las columnas a las variables. Supongamos que deseamos cruzar dos variables categóricas, como son género y nacionalidad. A este respecto:

Y aquí:

18

Page 19: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

Seleccionamos Estadísticos y marcamos la Chi-cuadrado:

Volvemos al cuadro anterior y marcamos casillas:

19

Page 20: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

El resultado:

Tabla de contingencia genero * Nacionalidad

38 1 52 9142,6 12,1 36,3 91,0

41,8% 1,1% 57,1% 100,0%-1,4 -5,0 4,9

43 22 17 8238,4 10,9 32,7 82,0

52,4% 26,8% 20,7% 100,0%1,4 5,0 -4,981 23 69 173

81,0 23,0 69,0 173,046,8% 13,3% 39,9% 100,0%

RecuentoFrecuencia esperada% de generoResiduos corregidosRecuentoFrecuencia esperada% de generoResiduos corregidosRecuentoFrecuencia esperada% de genero

Mujer

Hombre

genero

Total

MARROQUI SENEGALES FILIPINONacionalidad

Total

Pruebas de chi-cuadrado

36,868a

2 ,000

173

Chi-cuadrado dePearsonN de casos válidos

Valor gl

Sig.asintótica(bilateral)

0 casillas (,0%) tienen una frecuencia esperada inferior a5. La frecuencia mínima esperada es 10,90.

a.

20

Page 21: sites.google.comsites.google.com/site/vararey/Chi-cuadrado.docx · Web viewVolvemos al cuadro anterior y marcamos casillas: El resultado: Observamos en primer lugar que el valor de

Observamos en primer lugar que el valor de Chi-cuadrado para dos grados de libertad es 36.868, valor muy significativo. Y para interpretar las distintas casillas, vayamos, por ejemplo, a la primera que hace referencia a mujer marroquí. La frecuencia observada es 38 y la esperada 42.6, algo mayor, lo que nos indica que hay una cantidad menor de mujeres de lo que establece la hipótesis nula. Para verlo más claro esta hipótesis nos indica que el porcentaje de mujeres deberá ser del 46.8%, que es la que habría en el supuesto de que los tres grupos (marroquíes, senegaleses y filipinos) pertenecieran a la misma población. No obstante la diferencia no llega a ser estadísticamente significativa, como atestigua el residuo corregido que indica que la diferencia entre la observada y la esperada se encuentra a -1.4 desviaciones típicas, que no rebasa el valor de 1.96 que es el valor crítico a 0.05. Esta circunstancia, es muy diferente a los de la siguiente casilla, correspondiente a mujeres senegalesas, donde sólo hay 1 mujer y se esperan 12.1. En este caso, la distancia entre la observada y la esperada es de 5 desviaciones tipo, valor muy superior a 1.96, por lo que se concluye que esta casilla marca una diferencia significativa. Observando las restantes casillas extraeremos conclusiones semejantes.

21