multivariante con spss

49
2011 MHG APUNTES: TIS II .

Upload: fabianbaires

Post on 08-Aug-2015

125 views

Category:

Documents


5 download

DESCRIPTION

Ejercitacion con SPSS de Mutlivariante especificamente para Sociologia de la Universidad de la Laguna

TRANSCRIPT

Page 1: Multivariante con spss

2011

MHG

APUNTES: TIS II .

Page 2: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

2

1 TABLA DE FRECUENCIAS: Procedimiento estadístico básico, indispensable en el análisis, da información. La primera columna da la

información con los códigos de las variables, que suele ser un valor numérico y va acompañado de la etiqueta. La segunda columna es el “Recuento”, da la frecuencia de cada variable. La tercera columna es el “Porcentaje General”, que divide el número de frecuencia de esa variable entre el total de casos. La cuarta columna nos da el “Porcentaje Válido”, que es el resultado del número de casos de la variable entre el total de casos válidos. Si no hay valores perdidos (NS, NC, perdidos en el sistema por estar en blanco), estas dos últimas columnas quedan igual. Cuando hay valores perdidos, los porcentajes totales y válidos cambian en la tabla de frecuencia. La última columna, “Porcentaje Acumulado”, nos indica las sumas de porcentajes válidos según se añaden variables y nos marca qué variable tiene más peso.

Analizar → Estadísticos Descriptivos → Tabla de Frecuencias → “Seleccionar Variables”.

Edición → Opciones → “Etiqueta de los resultados” (Nombre y Etiqueta) → Etiquetado de titulares” (Nombre y Etiqueta) → Etiquetado de tablas pivote (Nombre y Etiqueta/Valores y etiqueta).

sexo

Frecuencia Porcentaje Porcentaje válido

Porcentaje acumulado

Válidos hombre 1605 39,0 39,6 39,6

mujer 2447 59,5 60,4 100,0

Total 4052 98,5 100,0

Perdidos 9 60 1,5

Total 4112 100,0

GRÁFICA DE BARRAS: Nos da el gráfico en bruto, sin tratamiento de datos. Si se pincha sobre él dos veces, se puede editar. Analizar → Estadísticos Descriptivos → Tabla de Frecuencias → Gráficos → “Gráfico de Barras”.

SINTAXIS DE LA OPERACIÓN: Podemos verla a través de “Archivo de Sintaxis”. Se selecciona todo y se pincha ►y se realiza la misma operación (tabla de frecuencias).

Analizar →Estadísticos Descriptivos → Frecuencias → “Pegar”.

Entonces aparece el lenguaje de comando que se debe seleccionar, para pulsar ►y se genere la operación.

DATASET ACTIVATE Conjunto_de_datos3. FREQUENCIES VARIABLES=p35 /BARCHART FREQ /ORDER=ANALYSIS. AÑADIR VARIABLES: Se realiza en “Vista de variables” y se debe introducir información como nombre, tipo, anchura, decimales, alienación, variables, etc. Los valores perdidos se añaden como “Valores perdidos discretos”, para que queden diferenciados en la Tabla de Frecuencias”. Si las variables no están codificadas, no se pueden meter. Pueden estar codificadas numéricamente, alfabéticamente o de forma alfanumérica. Si se quiere ver el dato sin codificar (no ver el dato código que codifica la variable) sino la propia variable, podremos hacerlo seleccionando en “Vista de Datos”: Ver → Etiquetas de valor.

- Nominales: Valores que sólo tienen sentido como valor de la variable, para identificarla. No tienen sentido matemático (manzana: 1; melón: 2; pera: 3).

- Ordinales: Valores que indican el valor que corresponden a hábitos interiorizados (Alto: 3, Ni bajo ni alto: 2, Bajo: 1). - De escala: Tienen sentido de orden y sentido matemático (escalas de 0 a 10). - Dicotómica: Sólo hay dos únicas respuestas (sexo, sí-no).

Page 3: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

3

En una pregunta en la que se pregunta qué aspecto gusta más y qué menos, aunque haya varias opciones a responder, sólo hay dos variables.

DEPURACIÓN DE DATOS. ERRORES:

- Valores erróneos: Pedir tabla de Frecuencias. - Poner un valor: Válido pero equivocado, donde va 1, poner 2 ó 9.

Si hay datos erróneos en la tabla de frecuencias, podemos buscarlos a través de los prismáticos: Edición → Buscar (Prismáticos), u ordenando los datos: Menú → Datos → Ordenar Casos → “Seleccionar Variable” → “De forma ascendente”.

Casos Nº orden 1 2

4112

Ejemplo: En la variable “Curso” (P3), hemos detectado 2 errores: 8, 8. Casos 2467 y 3590.

curso curso en el que está matriculado

Frecuencia Porcentaje Porcentaje válido

Porcentaje acumulado

Válidos 1 primero 2673 65,0 65,2 65,2

2 segundo 410 10,0 10,0 75,2

3 tercero 554 13,5 13,5 88,7

4 cuarto 398 9,7 9,7 98,4

5 quinto 63 1,5 1,5 100,0

8 2 ,0 ,0 100,0

Total 4100 99,7 100,0

Perdidos 9 12 ,3

Total 4112 100,0

Pedimos la Tabla de Frecuencias de todos los valores menos curso y nº de cuestionario. Se revisan las tablas de frecuencia una a una comprobando si hay errores. Si no hay, se elimina la tabla. Las tablas de frecuencia con errores son:

- P4: 5 errores: 5, 6, 6, 7, ▪ (Perdido por el sistema). - P11: 3 errores: 12, 21, 101. - P15d: 2 errores: 7, 8. - P33: 5 errores: 15, 701, 1650, 1679, 1790. - P35: 7 errores: 7, 7, 7, 7, 7, 7, 7. - P42c: 1 error: 4 (2 veces en la Tabla de Frecuencias). - P42k: 1 error: 5 (2 veces en la Tabla de Frecuencias).

En estos dos últimos casos, no se trata de un 4 y 5 reales, sino de aproximación. Son un 3,5 y un 4,5 (doble click sobre la tabla de frecuencias y pinchar sobre el número). Ocurre porque en la definición de variables, no se definió con decimal, por lo que se redondea. Podemos encontrarlo ordenando ascendentemente y será el primer dato 4 ó 5. También podemos cambiar el diseño de la variable y añadirle decimales, para poder buscar el número exacto (prismáticos). La encuesta ha dado un total de 24 errores (se incluye el valor perdido (▪), buscándolo tras ordenar ascendentemente o con el buscador.

Los errores se pueden visualizar verticalmente, buscándolos en las Tablas de Frecuencias o con el buscador. Una vez depurados los datos, se corrigen comprobándolos con los cuestionarios.

En datos como el sexo, en el que aparece 1 (hombre), 2 (mujer) y 9 (NS-NC), para comprobar si se han cometido errores, se toma una muestra para comprobarlo (el tamaño dependerá del tiempo disponible para hacer la depuración de datos, ya este tipo de revisión lleva mucho tiempo). No es una muestra representativa, se toman algunos al azar, unos 10 cuestionarios. No se debería aceptar más de un 1% de errores.

Page 4: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

4

2 TRATAMIENTO Y ANÁLISIS DE VARIABLES CON VALORES PERDIDOS.

En esta tabla, sólo hay 31 valores perdidos, pero casi no cambia el porcentaje válido, por lo que no pierdo casi información.

En estas tablas, hay 693 y 821 valores perdidos respectivamente, y sí pierdo información, porque los porcentajes válidos cambian.

El tratamiento de análisis depende si las variables son de escala (el SPSS no da una opción mecánica, (aportan procedimiento para transformar directamente los valores perdidos n un valor real) u ordinales (no nos da la opción anterior, sino que se puede optar a tratarlo como nominal (variable felicidad) o como de escala (nota que le da a …).

En la tabla de altura, tenemos 139 valores perdidos. Para transformar estos 139 valores:

Transformar → Reemplazar valores perdidos (sólo sirve para variables de escala o variables ordinales que pueden ser considerados como valores de escala), porque los métodos que se pueden usar sólo son posibles con variables de escala). Al pasar la variable “altura” seleccionada, el SPSS le cambia el nombre directamente “P33_1= SMEAN(P33), aparece el método (media de la serie). Al aceptar, me crea una variable P33_1, con los datos de origen de la P33. Lo que hace el SPSS es coger todos los datos, quitar los perdidos y hacer una media de la serie. El resultado es el dato que tomarán los valores perdidos para que dejen de ser perdidos. Ahora, si le pido la tabla de frecuencias de la variable P33_1 no tengo ningún valor perdido. El valor que ha sustituido los valores 999 es 170.4, porque si vamos a la variable P33 de la primera tabla, buscamos un valor 999 y al final de la tabla aparece el nuevo dato. Además, es el único valor con decimales.

Page 5: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

5

Transformar → Reemplazar valores perdidos (si cambiamos el método a “media de puntos adyacentes”, es decir, de los valores que tengan 999 en dicha pregunta, se toman puntos adyacentes por arriba y por abajo y se hace la media de los cuatro (el número de los puntos adyacentes que se toman se escogen en la ventana de “Transformar” en “Amplitud de los puntos adyacentes”. El resultado (170,3) es el número que sustituye al 999. El mejor método es el más adecuado para la variable que estamos tratando. Para la variable de “Altura”, ninguno de estos métodos es satisfactorio, ya que la media de altura difiere para hombres y mujeres.

EJEMPLO: Altura: 139 casos perdidos:

- Si son hombres (selección de casos): Media o Mediana (si hay valores muy atípicos, pero no es el caso de la variable “Altura”), del grupo de hombres.

- Si son mujeres: Media o mediana (del grupo de mujeres). Pero puede ocurrir que, en esos 139 casos, no sepa si es hombre o mujer, es decir, que también sean valores perdidos porque no han contestado. En tal caso, se hace la media de las dos, que es la media de la serie.

Seleccionamos los datos hombres:

Datos → Selección de Variables → P35=1.

Se nos crea una nueva variable que nos muestra los hombres. Ahora los casos están filtrados por hombres.

Analizar → Estadísticos Descriptivos → Estadísticos → “Seleccionar la media y la mediana.

Media: 178,25, Mediana 179.

Seleccionamos los datos mujeres: P35= 2 la media es 165,19 y la mediana es 165.

Seleccionamos P35=9: Esta selección de casos sólo se activa si previamente voy a la variable sexo e inhabilito el 9 de casos perdidos.

OJO: Como vamos a cambiar datos de la tabla inicial, es preferible hacer un duplicado de la tabla original. Seleccionamos la P33 original completa, y la copiamos al final de la tabla y le ponemos el nombre “Altura_Bis”.

Page 6: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

6

RECODIFICACIÓN CON CONDICIONALES: Si se encuentra un valor H, se le da 179; si es M, 165; y si es 9, 170 (que previamente se ha inhabilitado como valor perdido y que luego volveré a habilitar).

Transformar → Recodificar en las mismas variables → Seleccionamos tabla “Altura_bis” → “Valores antiguos y nuevos”.

En el apartado de antiguo, marcamos “Perdido por el sistema o usuario” o 999 (en valor).

En la casilla de valor nuevo, marcamos 174, y damos a “Añadir” y “Continuar.

Vamos al botón “Si la opción” e indicamos P35=1. Aceptar, y cambiará a los hombres por el valor 174.

Repetimos la operación, le indicamos que el valor nuevo debe ser 165, si cumple la condición de P35=2.

Repetimos la operación, le indicamos que el valor nuevo debe ser 170, y la condición es P35=9.

Page 7: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

7

3 CALCULO DE MEDIA Y MEDIANA EN HOMBRES Y MUJERES.

HOMBRES Datos → Seleccionar Casos → “Seleccionar variable Sexo” → “Si se satisface la condición P35=1”. Analizar → Estadísticos descriptivos → Frecuencias → “Seleccionar Variable Altura” (P33) → Quitar “Mostrar Tabla de Frecuencias” → Estadísticos → Seleccionar “Media” y “Mediana”.

Estadísticos

p33 altura que mide

N Válidos 1572

Perdidos 33

Media 179,61

Mediana 179,00

En la vista de datos, nos aparece una nueva columna “Filter_$” (es preferible cambiarle el nombre para no sobrescribirla). Que son los datos filtrados con 1 (Hombre), 0 (Mujer) y � (Perdido). En una variable nominal, la moda y la mediana son iguales. MUJERES DE 2º CURSO Datos → Seleccionar Casos → “Seleccionar variable Sexo” → “Si se satisface la condición P35=2 & curso=2. Analizar → Estadísticos descriptivos → Frecuencias → “Seleccionar Variable Altura” (P33) → Quitar “Mostrar Tabla de Frecuencias” → Estadísticos → Seleccionar “Media” y “Mediana”.

Estadísticos

p33 altura que mide

N Válidos 285

Perdidos 11

Media 165,44

Mediana 165,00

MUJERES DE SEGUNDO CURSO Y DE CUARTO CURSO Datos → Seleccionar Casos → “Seleccionar variable Sexo” → “Si se satisface la condición P35=2 & (curso=2|4). Analizar → Estadísticos descriptivos → Frecuencias → “Seleccionar Variable Altura” (P33) → Quitar “Mostrar Tabla de Frecuencias” → Estadísticos → Seleccionar “Media” y “Mediana”. │ Significa “o”, porque no se pueden dar los dos casos (estar en 2º y 4º) a la vez. Otra opción sería: (P35=2 & curso=2) │ (P35=2 & curso=4).

Estadísticos

p33 altura que mide

N Válidos 285

Perdidos 11

Media 165,44

Mediana 165,00

Page 8: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

8

MUJERES DE MÁS DE 60 KG DE PESO QUE SE ENCUENTRAN CERCANAS O MUY CERCANAS AL PP Y QUE PUNTÚA A RAJOY CON 6 PUNTOS O MÁS. Datos → Seleccionar Casos → “Seleccionar variable Sexo” → “Si se satisface la condición P35=2 & peso>60 & P15a>=4 & P42a>=6 Analizar → Estadísticos descriptivos → Frecuencias → “Seleccionar Variable Altura” (P33) → Quitar “Mostrar Tabla de Frecuencias” → Estadísticos → Seleccionar “Media” y “Mediana”.

Estadísticos

p33 altura que mide

N Válidos 44

Perdidos 0

Media 167,52

Mediana 168,00

PERSONAS NADA FELICES O TOTALMENTE FELICES CON MENOS DE 50 KG O MÁS DE 70 KG, QUE PIENSAN EN EL FUTURO Y CONOCEN A PAULINO RIVERO Y HAN NACIDO EN CUALQUIER ISLA QUE NO INCLUYA LA GOMERA Datos → Seleccionar Casos → “Seleccionar variable Sexo” → “Si se satisface la condición (P5=1 │P5=4) & (P34<50 │P34>70) & P4=3 & P41g=1 & (P37=1│ P37=2│ P37=4│ P37=5│ P37=6│ P37=7) Analizar → Estadísticos descriptivos → Frecuencias → “Seleccionar Variable Altura” (P33) → Quitar “Mostrar Tabla de Frecuencias” → Estadísticos → Seleccionar “Media” y “Mediana”.

Estadísticos

p33 altura que mide

N Válidos 61

Perdidos 0

Media 167,61

Mediana 167,00

Para el caso de la P37, si pongo los valores 0, 8 y 9 como valores perdidos, me basta poner en la fórmula que P37 es distinto de 3.

Page 9: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

9

4 RECODIFICACIÓN DE VARIABLES

EJEMPLO 1: Variable de origen (P5), Variable de destino (nuevaP5).

(1) Nada feliz (1) No felices (2) Poco feliz (3) Bastante feliz (2) Felices (4) Muy feliz (9) Perdidos (9) Perdidos

Transformar → Recodificar en distintas variables (x,y) → Se pasa variable a recodificar, se pone nombre a la “variable resultado” (P5nueva) y a la “Etiqueta” (Felicidad recodificada). Valores antiguos y nuevos → Indicar valor antiguo, valor nuevo y AÑADIR. 1 → 2 2 → 1 3 thru → 3 9 MISSING→ 9 Ya se ha creado la nueva variable, y en vista de variables le damos caracterización (etiquetas, tipo de variables, valores perdidos, etc.). EJEMPLO 2: Variable de origen: Edad, Variable de destino: Nedad. La variable ha pasado de ser de escala a ser ordinal. 17-19: 1. Lowest thru 19 → 1. (Rango, valor hasta SUPERIOR)- 20-22: 2. 20 thru 22 → 2. 23-25: 3. 23 thru 25 → 3. 26-mayor: 4 26 thru Highest → 4. (Rango, INFERIOR hasta valor). 99: 9 EJEMPLO 3: Variable de origen: Nota a Rajoy, Variable de destino: Nrajoy. 0-4: 0 Suspenso. Lowest thru 4 → o. 5-6: 1 Aprobado. 5 thru 6 → 1. 7-8: 2 Notable. 7 thru 8 → 2. 9: 3 Sobresaliente. 9 → 3. 10: 4 Matrícula. 10 → 4. 99: 9 Perdido. MISSING → 9. ¿Cuántos sobresalientes obtiene Rajoy? 61. Recodificar a Zapatero, ¿Quién obtiene más sobresalientes? Zapatero, 69. ¿Quién obtiene un mayor % válido? Zapatero. EJEMPLO 4: Variable de origen: Altura; Variable de destino: Naltura. HOMBRES MUJERES: 191 o más: (5) Muy alto. 183 o más: 183 thru Highest → 5. 183-190: (4) Alto. 170-182: 170 thru 182 → 4. 178-182: (3) Ni alto ni bajo. 151-169: 151 thru 169 → 3. 160-177: (2) Bajo. 150-161: 150 thru 161 → 2. 167 o menos: (1) Muy bajo. 149 o menos: Lowest thru 149 → 1. 99: 9 Perdido. MISSING → 9. 99: 9 Perdido. MISSING → 9. Si la opción → Incluir si el caso → seleccionar la condición P35 = 1 (hombre) y se introducen los parámetros de hombre. Para la mujer, se introduce la condición P35= 2.

Page 10: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

10

CONVERSIÓN DE VARIABLES CON RECODIFICACIÓN. Variable Nominal: Nominal y Ordinal. Variable Ordinal: Nominal y Ordinal. Variable escala: Nominal, Ordinal y Escala (en menor medida). Recodificación de variable Nominal a Ordinal. P39a: Estudios del padre: Np39a Transformar → Recodificación de distintas variables (X,Y). Seleccionar variables, Valores antiguos y nuevos: 1 Sin Estudios 1 Primarios o menos 1 thru 2 - 1 2 Primarios 3 Secundarios profesionales 2 Secundarios 3 thru 4 - 2 4 Secundarios académicos 5 Universitarios medios 3 Universitarios 5 thru 6 - 3 6 Universitarios superiores 9 Perdidos 9 Perdidos MISSING - 9 P15a: Cercanía al PP: Np15a 1 Muy alejado 1 ó 2 1 thru 2 - 2 2 Alejado 3 Ni cercano ni alejado 3 3 → 3 4 Cercano 5 ó 4 4 thru 5 - 4 5 Muy cercano 9 Perdidos 9 Perdidos MISSING - 9 P42b: Nota de Zapatero (escala subjetiva). No es aconsejable recodificar notas, porque tienen sentido subjetivo. 0 1 Suspenso 0 thru 4 → 1

O Lowest thru 4 → 1

1 2 3 4 5 2 Aprobado 5 thru 6 → 2 6 7 3 Notable 7 thru 8 → 3 8 9 4 Sobresaliente 9 → 4 10 5 Matrícula 10 → 5 99 9 Perdidos Missing → 9 RECODIFICACIÓN CON CONDICIONALES: Hombres: Sexo = 1 191 y más 5 Muy alto 191 thru Highest → 5 185-190 4 Alto 185 thru 190 → 4 175-184 3 Medio 175 thru 184 → 3 165-174 2 Bajo 165 thru 174 → 2 164 y menos 1 Muy bajo Lowest thru 164 → 1 Perdidos 9 Perdidos Missing → 9 Mujeres: Sexo = 2 (Hacer sobre la variable anterior). 182 y más 5 Muy alto 182 thru Highest → 5 170-181 4 Alto 170 thru 181 → 4 160-169 3 Medio 160 thru 169 → 3

Page 11: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

11

153-159 2 Bajo 153 thru 159 → 2 152 y menos 1 Muy bajo Lowest thru 152 → 1 Perdidos 9 Perdidos Missing → 9 60 casos perdidos. MENÚ – TRANSFORMAR:

1) Recodificar en mismas variables (X,X). Cuando ya hemos hecho un duplicado de la variable. No hay variable de origen, sino sólo una variable de destino.

2) Agrupación visual: es una recodificación asistida. No aparecen las variables nominales, ya que sólo es posible con variables ordinales o de escala.

P33. Altura. Si la pinchamos, nos aparece la distribución de la variable. Crear puntos de corte: Seleccionar “Puntos de corte en media y σ seleccionadas, basadas en casos explotados”. Seleccionamos + - 1 σ, por lo que el programa separa en 4 grupos (se crean unas líneas en la distribución, que pueden moverse). Si marcamos “Crear etiquetas”, nos da los valores de cada intervalo separado del grupo. Asignar un “nombre de variable agrupada” (pepino). Al aceptar, se crea una nueva variable, con los valores de la variable ya creados, y como valor perdido, mantiene el valor inicial (999). Si le asignamos + - 2 σ, separa la distribución en 6 grupos: hasta -2 σ, entre -2 y -1 σ, entre -1 y 0 σ, entre 0 y 1 σ, entre 1 y 2 σ, y de 2 σ en adelante. Si seleccionamos la opción “Intervalos: rellenar al menos dos campos”. Posición del primer punto de corte (0,5). Nº Puntos de corte: (3).

Anchura: La asigna el programa conociendo los dos datos anteriores. � � ����� ���� ó��� ��� ��� �� ������º ���� �� �����

HACER DUPLICADO DE LA VARIABLE (CAMBIAMOS EL NOMBRE)

9 → sí y sólo si

CC: 5 PP: 4 PSOE: 4 IU: 4 FNC: 4 OTRO: 4 Hay 693 casos perdidos.

Transformar → Recodificar en mismas variables. Valor antiguo 9 → valor nuevo 1. Si la opción… P42g (nota a Paulino) > P42a (Rajoy) & P42g > P42b (Zapatero) & P42g > P42c (Llamazares). Ahora hay 677 casos perdidos, por lo que 16 casos son votos encubiertos para CC, si nuestro criterio es correcto.

9 → 2 = nota P42a > P42b & P42a > P42c & P42a > P42g. Ahora tenemos 648 casos perdidos, por lo que hay 29 casos que son encubiertos para el PP, si nuestro criterio es correcto.

Transformar → Calcular. IMC ≤ 18 → Anorexia.

IMC = ���� ����

�� !"#� �$�/100� 2

¿Cuántos anoréxicos hay? ¿Cuántos son hombres? ¿Cuántas mujeres? Los de 17 y 18 son, en proporción, ¿más o menos? ¿Cuántas personas tienen peso normal? ¿Y sobrepeso? Etc.

Page 12: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

12

Transformar → Calcular: Variable destino → IMC → tipo y etiqueta → Expresión numérica P34/(P33/100)2. Aceptar (ya está crada la variable IMC.

¿Cuántos son anoréxicos? Datos → seleccionar casos. Si la opción es IMC ≤ 18 = 241 casos. ¿Hombres? 26. ¿Mujeres? 215. (Ver por las tablas de frecuencias de la variable filtrada). 17 y 18 años = 98 casos. Son más en proporción, 17 (8), 18 (90).

Totales: 17: 139 casos. 18: 1032 casos. 98 casos con anorexia. 19 y más: 2874 casos: 130 casos con anorexia.

98/1171: 8,3%. (Es mayor la proporción en jóvenes de 17 y 18 años. 130/2874: 4,52%.

Transformar → Calcular → IMC Mujeres → Si la opción P35=2.

IMC recodificada Variable ordinal 241 1 IMC ≤ 18 = anoréxicos. Lowest thru 18 → 1. 115 2 IMC 18 y 18,5 = insuficientes. 18 thru 18,5 → 2. 2793 3 IMC 18,5001 y 24,9 = normal. 18,5001 thru 24,9 → 3. 330 4 IMC 24,9001 y 26,9 = sobrepeso 1. 24,9001 thru 26,9 → 4. 209 5 IMC 26,9001 y 29,9 = sobrepeso 2. 26,9001 thru 29,9 → 5. 102 6 IMC 29,9001 y máximo = obeso. 29,9001 thru Highest → 9. 322 7 IMC 9 = valor perdido. MISSING → 9.

Page 13: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

13

5 PONDERACIÓN DE CASOS.

- Sexo: o 1220 hombres, 39,7%. o 1859 mujeres, 60,3%.

3070: TOTAL. - Piensa en:

o Pasado: 262. o Presente: 1370. o Futuro: 1438.

EJERCICIO 1. ¿Variarían los valores de la variable P4: Piensa en pasado, presente o futuro, si el archivo de datos tuviese igual nº de hombres que de mujeres? Se hace una simulación (ponderación del archivo) con la variable sexo.

1. Necesito un criterio de ponderación (marcado en la pregunta): “variará si se pondera en igualdad a hombres y mujeres”. Total: 3070/2: 1535.

2. Se tiene que aumentar el % de respuesta de hombres (x valor > que 1). Se tiene que disminuir el % de respuesta de mujeres (x valor < que 1).

3. 1535/1220 (hombres)= Coeficiente de hombres. 1535/1850 (mujeres)= Coeficiente de mujeres.

4. Menú → Transformar → Calcular variable → Nombrar la variable de destino “PONDERACIÓN SEXO”. Su particularidad es en

igualdad, y en Etiqueta ponemos “50% hombres y 50% mujeres” o “Igualdad hombres y mujeres”.

5. Una vez ponderados, ya tienen valor matemático (antes no).

6. Datos → Ponderar casos → mediante “Ponderación en igualdad” (aparece icono de “ponderado” en la esquina inferior derecha”. Coeficiente hombres: 1,26. Coeficiente mujeres: 0,83.

7. Ya ponderado, la variable inicial ha desaparecido del archivo y ahora actúan en igualdad (50%-50%) en números de casos.

8. Se solicita tabla de frecuencias. Las respuestas a la pregunta de si cambiarían las respuestas a pasado, Presente y Futuro, es que sí, si la variable sexo influye, y no, si no influye, y dependiendo del grado de influencia, variará en mayor o menor medida.

9. En el presente siguen pensando los mismos, en el pasado aumentan 3 y en el futuro disminuyen 3. Prácticamente no han variado, or lo que la influencia prácticamente no existe.

EJERCICIO 2: Ponderación de variable “sexo” cuyo criterio de ponderación es una desigualdad en la representación de 60% hombres y 40% mujeres. 1220 hombres, 39,7% → 3070 ▪ 0,6 / 1220. 1850 mujeres, 60,3%% → 3070 ▪ 0,4 / 1850.

1. Menú → Transformar → Calcular variable “Ponderación sexo 60% H, 40% M”. 3070 ▪0,6 / 1220 para los hombres: 1,51 Coeficiente. 3070 ▪0,4 / 1850 para las mujeres: 0,66 Coeficiente.

2. Activamos la ponderación, Datos → ponderar casos mediante “ponderación 60/40”. Si pedimos tabla de frecuencias, los resultados son que en pasado piensan 269, en Presente 1370, y en Futuro 1431. Se mantiene el presente, disminuye en 7 el pasado y aumenta en 7 el futuro. El género no afecta a esta opinión.

Page 14: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

14

EJERCICIO 3: Ponderación por edades. 17-18. 19-22. 23-25.

Recodificar variable edad por rangos (ver apuntes anteriores). Variable newedad. 17-18= 624. 19-22= 1505. 23-25= 941.

1. 17-18: 40% 3070 ▪0,4 / 624 = 1,97 Coeficiente. 19-22: 20% 3070 ▪0,2 / 1505 = 0,41 Coeficiente. 23-125: 40% 3070 ▪0,4 / 941 = 1,30 Coeficiente.

2. Introducimos las fórmulas en Menú → Transformar → Calcular variable.

3. Datos → Ponderar casos mediante

4. Pedimos tabla de frecuencias: no es un cambio importante, por lo que tampoco en este caso es influyente. - Pasado: 275, aumentan 13. - Presente: 1372, aumentan 2. - Futuro: 1423, disminuye 15.

EJERCICIO 4: Ponderación de dos variables a la vez. Edad: 17-18 40% Sexo: Hombres 60% Edad: 19-22 20% Sexo: Mujeres 40% Edad: 23-25 40%

1. Transformar → Calcular variable → Variable de destino. Sexo=1 & Newedad = 1 → (3070▪0,60 / 1220) ▪ (3070 ▪0,40 / 624) = 2,97. Sexo=1 & Newedad = 2 → (3070▪0,60 / 1220) ▪ (3070 ▪0,20 / 1505) = 0,62. Sexo=1 & Newedad = 3 → (3070▪0,60 / 1220) ▪ (3070 ▪0,40 / 941) = 1,97. Sexo=2 & Newedad = 1 → (3070▪0,40 / 1850) ▪ (3070 ▪0,40 / 624) = 1,31. Sexo=2 & Newedad = 2 → (3070▪0,40 / 1850) ▪ (3070 ▪0,20 / 1505) = . Sexo=2 & Newedad = 3 → (3070▪0,40 / 1850) ▪ (3070 ▪0,40 / 941) = .

2. Datos → Ponderar casos. Sacamos tabla de frecuencias. Los datos no han variado mucho, por lo que el sexo y la edad no influyen

en el alumnado universitario. Al hacer una ponderación, es posible que en la tabla de frecuencias final no se especifique el total de casos, pero al aplicar sus condiciones, nos da una estimación aproximada.

Se ha realizado una encuesta a 1000 canarios mayores de 18 años, se les ha preguntado si son felices, y EL SEXO. Según la siguiente tabla, ¿la felicidad depende del sexo? No, porque no hay diferencias de respuestas en los distintos casos.

FELICES NO FELICES HOMBRES 400 100 500 MUJERES 380 120 500 Totales 780 220 1000 Esta tabla es una tabla de 2 * 2, o una tabla categórica dicotómica, doble nominal.

FELICES NO FELICES HOMBRES 200 50 250 MUJERES 420 330 750 Totales 620 380 1000

Page 15: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

15

Al reducir esta tabla a porcentajes, permite la comparación entre las distintas variables.

FELICES NO FELICES HOMBRES 80% 20% 100% MUJERES 56% 44% 100% PONDERACIÓN MÚLTIPLE.

Hombre 50% Curso 1º 1383 40% Mujer 50% Curso 2º 4226 20% Curso 3º 605 20% Curso 4º 493 20% Curso 5º 163 Si actúan ambos solos (sexo) (curso), hay 6 coeficientes, si actúan juntos, hay 8 coeficientes.

PONDERACIONSEXOCURSO.

1) H1º-M1º

)3070▪0,51220 . ▪ )3070▪0,4

1383 . Si P27=1 & curso=1

2) H2º-M2º

)3070▪0,51220 . ▪ )3070▪0,2

426 . Si P27=1 & curso=2

3) H3º-M3º

)3070▪0,51220 . ▪ )3070▪0,2

605 . Si P27=1 & curso=3

4) H4º Y 5º-M4º Y 5º

)3070▪0,51220 . ▪ )3070▪0,2

656 . Si P27=1 & curso=4│5

Si P27=1 & (curso=4 │curso=5) Si P27=1 & curso ≥4 (Si P27=1 & curso=4) & (Si P27=1 & curso=5). La respuesta múltiple se caracteriza porque estudia categorías de respuestas, de la 1 a la 9.

C1 C2 C3 TOTAL Verde 1 9 37 3 49 Azul 2 27 12 9 48 Rojo 3 35 5 10 50 Amarillo 4 3 14 14 31 Naranja 5 9 12 17 38 Celeste 6 8 6 3 17 Marrón 7 3 7 5 15 Violeta 8 1 4 21 26 Negro 9 4 2 16 22 Perdidos 99 1 1 2 4 TOTAL 100 100 100 casos considerados 296 Total de respuesta con sentido estadístico 2 Tipos de respuesta= categoría y dicómica. Cada caso representa 3, 2, 1 color o ninguno, pero tienen que ser diferentes, no puede haber repetición. Los 100 sujetos emiten respuesta porque los casos perdidos no coinciden en los 3 colores. Si los 3 colores aparecen como perdidos, el SPSS elimina el dato. Si sólo aparece en 1 ó 2 colores, lo elimina si nosotros se lo pedimos. Si el sujeto 101 dice 99-99-99, serían 100 casos los

Page 16: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

16

casos considerados y 101 los casos totales. Se puede analizar de dos formas, pero la más interesantes es por totales, es decir 49 de 100 casos dicen que el verde es su color favorito. Analizar → Respuesta Múltiple → Definir conjunto de variables Codificar variables como → Categorías → Rango del 1 al 9 → Nombre: Tricolor. Añadir las variables a Variables del conjunto → AÑADIR → Conjunto de respuestas múltiples. Analizar → Respuesta Múltiple → Tricolor (variable categórica). Porcentaje Porcentaje de casos Verde 5 16,7% 50% Azul 8 26,7% 80% Rojo 8 26,7% 80% Amarillo 2 6,7 20% Naranja 5 16,7 50% Celeste 1 3,3 10% Violeta 1 3,3 10% Total 30 100% 300% No hay valores perdidos EJEMPLO 2º:

Si se toman 100 sujetos que son preguntados por sus 5 canciones favoritas: Tenemos 100 sujetos * 5 respuestas: 500 total de respuestas emitidas. El total de casos es 100. Estos dos datos son la clave para el análisis.

Si un sujeto deja una opción sin contestar, siguen siendo 100 casos, pero 499 respuestas emitidas. El programa nos pregunta si elimina el caso. En caso de que sí, tengo 99 casos.

Si un sujeto no contesta a ninguna de las 5 variables, tengo 99 casos, y 495 respuestas emitidas.

Hay dos formas de analizarlos: Si 50 personas eligen la misma canción:

50/100= Es la opción más habitual.

50/499= Esta opción mide el % de respuesta.

EJEMPLO3º:

Analizar → Respuestas múltiples → definir conjuntos de variables → Pasamos variables “Problema 1, 2 y 3 en Canarias”.

Las variables están codificadas como “Categorías”, por lo que en Rango ponemos 1-29 (porque están categorizadas así en la descripción de variables). Nombre: Pepito. Etiqueta: 3 Problemas de Canarias. Conjunto de respuestas múltiples → AÑADIR→ $Pepito. Pedimos tabla de frecuencias desde Analizar → Respuestas múltiples → Frecuencias, pasamos la variable $Pepito y aceptamos. Resumen de los casos: 3978 casos válidos: Han emitido 1, 2 ó 3 respuestas. 134 casos perdidos: No han emitido ninguna respuesta. El máximo de respuestas posibles: 3978 x 3: 11.934. El mínimo de respuestas posibles: 3978 x 1: 3.978. El total de respuestas emitidas es de 11.236, y como está cercano al nº de respuestas posibles, la mayoría de los casos han dado las 3 respuestas. 1693 citan el Paro como uno de los tres problemas de Canarias. De 3978 → 1693/3978 * 100= 42,6% → Porcentaje de casos. Total → 282,5% → Porcentaje de respuestas emitidas.

Page 17: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

17

VAMOS A ELIMINAR LOS CASOS QUE NO DAN LAS TRES RESPUESTAS: Disminuyen los casos válidos. Aumentan los casos perdidos. El porcentaje de casos llegaría al 300%. Pedimos de nuevo la tabla de frecuencias y marcamos “Excluir los casos según lista dentro de la categoría”. Casos válidos: 3.436. Casos perdidos: 676. Total respuestas emitidas: 3436x3: 10.308. % de respuestas emitidas: 300%. ¿CUÁNTAS PERSONAS CITAN EL TERRORISMO COMO UNO DE LOS TRES PROBLEMAS DE ESPAÑA? 1.194. EL % DE PERSONAS QUE CITA EL TERRORISMO COMO UNO DE LOS TRES PROBLEMAS PRINCIPALES DE ESPAÑA, ¿AUMENTA, BAJA O DISMINUYE, AL EXCLUIR LOS VALORES PERDIDOS? DE 31,1% A 31,9%. RAZONA LA RESPUESTA. La alteración es mínima. En el primer caso: 1194/3840 * 100= 31,1%. En el segundo caso, 1019/3191 *100= 31,9%. Aunque se reduce el total de casos en ambos, en el segundo caso es mayor la disminución. Total 1194= p8a (terrorismo) + p8b (terrorismo) + p8c (terrorismo). 647+312+235 = 1194. La información de la respuesta múltiple no se guarda, así que para guardarla, vamos a Analizar → Respuestas múltiples → Frecuencias → Pegar → se abre un archivo de Sintaxis que podemos guardar. Se selecciona todo y le demos a Play ►.

RESPUESTA MÚLTIPLE CON DICOTOMÍA.

El sentido de las respuestas debe ser igual en todos los casos (sí/no), así como los códigos numéricos que identifican las variables (1,2). Preguntas: Conoce a Rajoy. Conoce a Zapatero. Conoce a Llamazares. Conoce a Rivero. Dicotomía: Valor contado= Sí (cuenta los síes), No (cuenta los noes). Tabla de frecuencias de ambas: Válidos Perdidos Total Sí conoce 3722 390 4112 No conoce 2358 1754 4112 Cuando no excluimos casos, conocer a cualquiera de los cuatro políticos, le coloca en los síes, al igual que si no conoce a alguno, también lo coloca en los noes. Los casos perdidos son los que no contestan a ninguno o contestan no a todos. El 89,4% de la población conoce a Rajoy. El 98,1% de la población conoce a Zapatero. El 48,4% de la población conoce a Llamazares. El 46,6% de la población conoce a Rivero. EDICIÓN → OPCIONES → ETIQUETAS DE LOS RESULTADOS:

Etiquetas de titulares: Nombres y etiquetas // Valores y etiquetas.

Etiquetado de tablas pivote: Nombre y etiquetas // Valores y etiquetas.

(Para que los resultados nos aparezcan con los nombres y las etiquetas, con los valores y las etiquetas de todas las variables).

Page 18: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

18

PONDERACIÓN DE ARCHIVOS:

H: 20% → (3070*0,2) / 1220 = 0,50.

M: 80% → ((3070*0,8) / 1850 = 1,33.

Datos → Ponderar casos → Seleccionar variables nueva → Ponderacionsexo → Ponderación activada indicada en la barra inferior derecha. → Pedir tabla de frecuencias para comprobar que los % están bien.

Con esta ponderación activada, ¿Cuántas personas piensan en el futuro? 1444 personas. ¿Qué porcentaje de personas piensan en el futuro? 47,0%. ¿Y el porcentaje válido? 48,0%. Sin ponderar (40%-60%), 1438 personas piensan en el futuro, con un porcentaje de 46,8% y un porcentaje válido de 47,9%.

PONDERACIÓN MÚLTIPLE:

SEXO:

1220 → 40% → 25% 1850 → 60% → 75%

CURSO:

1º → 20% = 1383. 2º y 3º → 60% = 1031. 4º y 5º → 20% = 656. EDAD: ≤ 19 → 50% = 1021. ≥ 20 → 50% = 2049. PROBLEMA: Hay 71 casos perdidos, por lo que si no se corrige, pueden cambiar los resultados. Podemos introducirlos en ≥ 20 años, o ir caso por caso estudiando qué caracteriza a cada uno para comprobar la edad. En este caso, lo incluimos en la esta edad, quitando el 99 como valor perdido y especifico “No ha valores perdidos”. PONDEROSEXOCURSOEDAD: 2 * 3 * 2= 12 coeficientes posibles. Si no salen 12 valores sino 11, podría ser qporque una combinación no da resultados posibles que cumplan los requisitos. HOMBRES de 1º con ≤ 19 años: P27=1 & curso= 1 & edad ≤ 19 )234353,67

8663 . 5 )234353,68292 . 5 )234353,7

8368 . = 0,42. HOMBRES de 1º con ≥ 20 años: P27=1 & curso= 1 & edad ≥ 20 )234353,67

8663 . 5 )234353,68292 . 5 )234353,7

63:; . = 0,21. HOMBRES de 2º y 3º con ≤ 19 años: P27=1 & curso= 2│curso=3 & edad ≤ 19 )234353,67

8663 . 5 )234353,<8328 . 5 )234353,7

8368 . = 3,34. HOMBRES de 2º y 3º con ≥ 20 años: P27=1 & curso= 2│curso=3 & edad ≥ 20 )234353,67

8663 . 5 )234353,<8328 . 5 )234353,7

63:; . = 1,69.

Page 19: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

19

HOMBRES de 4º y 5º con ≤ 19 años: P27=1 & curso= 4│curso=5 & edad ≤ 19

)234353,67

8663 . 5 )234353,6<7< . 5 )234353,7

8368 . = 0,89. HOMBRES de 4º y 5º con ≥ 20 años: P27=1 & curso= 4│curso=5 & edad ≥ 20 )234353,67

8663 . 5 )234353,6<7< . 5 )234353,7

63:; . = 0,89. MUJERES de 1º con ≤ 19 años: P27=2 & curso= 1 & edad ≤ 19 )234353,47

8973 . 5 )234353,68292 . 5 )234353,7

8368 . = 0,83. MUJERES de 1º con ≥ 20 años: P27=2 & curso= 1 & edad ≥ 20 )234353,47

8973 . 5 )234353,68292 . 5 )234353,7

63:; . = 0,41. MUJERES de 2º Y 3º con ≤ 19 años: P27=2 & curso= 2│curso=3 & edad ≤ 19 )234353,47

8973 . 5 )234353,<8328 . 5 )234353,7

8368 . = 1,69. MUJERES de 2º Y 3º con ≥ 20 años: P27=2 & curso= 2│curso=3 & edad ≥ 20 )234353,47

8973 . 5 )234353,<8328 . 5 )234353,7

63:; . = 3,33. MUJERES de 4º Y 5º con ≤ 19 años: P27=2 & curso= 4│curso=5 & edad ≤ 19 )234353,47

8973 . 5 )234353,6<7< . 5 )234353,7

8368 . = 1,69. MUJERES de 4º Y 5º con ≥ 20 años: P27=2 & curso= 4│curso=5 & edad ≥ 20 )234353,47

8973 . 5 )234353,6<7< . 5 )234353,7

63:; . = 0,87.

Page 20: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

20

6 TABLAS DE CONTINGENCIA:

Analizar → Estadísticos descriptivos → tablas de contingencia En la fila se suele colocar la variable independiente (explicativa de las conductas), como “sexo”, y en las columnas se coloca la variable dependiente, como “se siente feliz”. Dependiendo del tipo de variables (nominales, ordinales), haremos un análisis u otro. Para hacer una mejor comparación, se piden los porcentajes de las filas: Analizar → Estadísticos descriptivos → tablas de contingencia → Casillas → Porcentajes → Filas. Así se pueden comparar más claramente. Si son parecidas, no hay relación. Si distan mucho, sí. Si no varían mucho los porcentajes, no hay grandes variaciones, por lo que la variable felicidad no depende del sexo. < 25.000 25.001-50.000 50.000-75.001 > 75.000 TOTAL H 19 174 48 17 258 M 124 86 6 0 216 143 260 54 17 474

Sexo: Nominal, Salario: Ordinal.

Si la variable salario fuera de escala, no podríamos comprobar si son independientes o no con las tablas de contingencia, ya que sólo es posible realizarlo por bloques.

1) Hay que ponderar primero para que aparezcan los casos: Datos → Ponderar casos mediante → “ncasos”. 2) Analizar → Estadísticos Descriptivos → Tablas de contingencia → Filas (Sexo), Columnas (Salario). Si metiera “ncasos” en

“Capa 1 de 1”, nos crearía tantas tablas de contingencia como categorías. 3) Pedimos los % de las filas: Analizar → Estadísticos Descriptivos → Tablas de contingencia → Casillas: Estos % son muy

distintos en los hombres y en las mujeres, en salario < 25.000, hombres: 7,4; mujeres: 57,4; Total: 30,2. Comprobar los dos grupos con mças peso de información. Si fueran independientes todas tendrían el mismo valor, si no es así, no son independientes, por lo que la variable salario depende del sexo en todas las categorías.

(258 * 143) / 478 = 77,8. → C1F1= Aparecen 19 casos, y como la diferencias es alta, sabemos que hay alta discrepancia.

Analizar→ Estadísticos Descriptivos→ Tablas de contingencia→ Casillas→ “Esperadas”. Se ven las frecuencias si las variables fueran independientes.

Pearson: la discrepancia total (chi cuadrado) = ∑ de cada una de las celdas, de la 1 a la 8. Pedimos los “recuentos esperados” y los “residuos tipificados”. Si el chi cuadrado es alto, hay alta discrepancia.

�=#�>"�?>@� �A��#B�C� 5 =#�>"�?>@� ��D�#�C��6

=#�>"�?>@� ��D�#�C�

�6= ∑ �EFGH5EIHJ�K

EIHJ = �8;�44,9�K

44,9 + �84:�8:8,7�K

8:8,7 + �:9�6;,:�K

6;,: + �84�;,2�K

;,2 + �86:�<7,7�K

<7,7 + �9<�889,7�K

889,7 + �<�6:,<�K

6:,< + �3�4,4�K

4,4 = 154,037 (comprobar)

Aunque aumente el tamaño de los datos, el chi cuadrado no aumentaría, ya que se divide por la frecuencia esperada. El valor más pequeño posible es 0, es decir, coincide lo observado y lo esperado, por lo que no están relacionadas las variables, es decir, son independientes. Si el chi cuadrado aumenta y es muy alto, mayor es la discrepancia y dependientes son las variables.

Si pedimos los gráficos, también podemos comprobar que no son independientes: Analizar → Estadísticos Descriptivos → Tablas de contingencia → “Mostrar los gráficos de barras agrupadas”.

Los residuos muestran la discrepancia entre el valor observado y el valor esperado, que en F1C1 daría negativa: (19-77,8)= -58,8.

Sexo Salario ncasos 1 1 19 1 2 174 1 3 48 1 4 17 2 1 124 2 2 86 2 3 6 2 4 0

Page 21: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

21

Pedimos chu cuadrado: Analizar → Estadísticos Descriptivos → Tablas de Contingencia → Estadísticos → Marcar “Chi cuadrado” → Aceptar → Se puede “suprimir tablas” para que no aparezcan los datos generales y distorsionen la información.

K= (F-1) * (C-1) = (2-1) * (4-1)= 3. Por tanto, el valor crítico es de 7,81 (ver tabla). Si el chi cuadrado es mucho mayor que el valor crítico, es que el salario depende mucho del sexo. Entonces la significación asintética es 0, pero si baja, la significación aumente.

Medimos la intensidad de la relación con el Coeficiente de contingencia: LMK

MKN� = √87:87:N:4: = √87:

<69 = 0,495. Analizar → Estadísticos

Descriptivos → Tablas de contingencia → Coeficiente de Contingencia. Según la tabla, la significación es sustancial.

+ 0,70 Muy fuerte + 0,50 a 0,69 Sustancial + 0,30 a 0,49 Moderada + 0,10 a 0,29 Baja 0,01 a 0,90 Depreciable

Las dos variables no son nominales, pero al tener pocas categorías hemos podido realizar este análisis. Pero si se tuvieran 10, 12 o más categorías, no valdría realizar este análisis.

EJERCICIO: ¿HAY RELACIÓN ENTRE LA CARRERA Y LOS APROBADOS? TABLA DE 3X4.

Psicología Medicina Farmacia Totales Sobresaliente 11 28 22 61 Notable 20 34 30 84 Aprobado 22 8 13 43 Suspenso 6 4 9 19 59 74 74

Notas: Ordinal, Carrera: Nominal, nº casos: Escala.

1ª Pista: El número de alumnos de medicina y Farmacia es el mismo, por lo que si fueran independientes tendrían la misma frecuencia en las distintas notas.

Se piden los porcentajes por filas y se ve cierta discrepancia, se comprueba también el gráfico. Se pide el chi cuadrado: 18,8, grado de libertad 6, con significación por encima del valor crítico, por lo que hay dependencia entre los resultados y las titulaciones.

Coeficiente de contingencia: 0,289, por lo que la significación es baja.

INDICE DE ACUERDO (ÍNDICE KKAPA): Tienen que ser tablas cuadradas, 2x2, 3x3, 4x4, …

Suspenso Aprobado Notable Sobresaliente Total Suspenso 310 35 4 1 350 Aprobado 64 250 10 1 325 Notable 24 12 170 4 210 Sobresaliente 2 3 16 94 115 400 300 200 100 1000

:3352738333 = 140; 2335267

8333 = 97,5; 63356838333 = 42; 8335887

8333 = 11,5

310 + 250 + 170 + 94= 824 casos de coincidencias en notas, el índice de acuerdo es de 0,829, que es el valor máximo de coincidencia. Esto no significa que haya acuerdo, puede ser una casualidad azarosa.

140 + 97,5 + 42 + 94 = 291: Valor posible obtenido por azar.

0,829 – 0,291 =

Page 22: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

22

INDICE DE RIESGO.

Fracaso escolar Estudios padres 1 sí 2 no 1 1 450 1 Primarios 450 775 1225 1 2 775 2 Universitarios 25 275 300 2 1 25 475 1050 1525 2 2 275

Ponderar casos, Analizar, Estadísticos descriptivos, Tablas de contingencia, Filas (Estudios Padres), Columnas (Fracaso Escolar).

Riesgo de Fracaso escolar: sí, estudios primarios: 450/1225 = 0,367

Riesgo de Fracaso escolar: no, estudios universitarios: 25/300 = 0,083

0,367/0,0833 = 4,405 (/1) (Riesgo).

La probabilidad de tener fracaso escolar es de 4,405 veces más en alumnos con padres con estudios primarios que con padres con estudios universitarios. Políticamente, debería corregirse el riesgo con políticas de igualdad.

Riesgo de Fracaso escolar: no, estudios primarios: 775/1225 = 0,632.

Riesgo de Fracaso escolar: no, estudios universitarios: 275/1225 = 0,916

0,632/0,916 = 0,689 (/1)

Por cada alumno que no tiene fracaso escolar, con padres con estudios universitarios, no encuentro uno que no tenga fracaso escolar con estudios primarios.

4,405 / 0,689 = 6,387 Ventajas

Las ventajas generales para un alumno, desde el punto de vista educativo, el contar con padres con estudios universitarios es de 6,387.

Estos riesgos podemos calcularlos de la siguiente forma:

Analizar, Estadísticos descriptivos, Tablas de contingencia, Estadísticos, “Riesgo”.

EJERCICIO DE FUMAR Y PROBLEMAS CARDIOVASCULARES:

Problemas vasculares Tabaquismo 1 sí 2 no 1 1 23 1 Fuman 23 81 104 1 2 81 2 No fuman 9 127 136 2 1 9 32 208 240 2 2 208

Estimación de riesgo

Valor

Intervalo de confianza al 95% Inferior Superior

Razón de las ventajas para tabaquismo tabaquismo (1 fuman / 2 no fuman)

4,007 1,766 9,093

Para la cohorte problemasvasc problemas vasculares = 1 con problemas

3,342 1,615 6,915

Para la cohorte problemasvasc problemas vasculares = 2 sin problemas

,834 ,746 ,933

N de casos válidos 240 Riesgo de los “con problemas vasculares” que “fuman o no”= La probabilidad de tener problemas vasculares en las que fuman es de 3,342 veces mayor que en las que “no fuman”.

Riesgo de los “sin problemas vasculares” que “fuman o no”= Por cada individuo sin problemas vasculares que no fuma, no encuentro uno que no tenga problemas vasculares y fume. Es decir, que por cada 1834 individuos sin problemas vasculares, 834 fuman.

Page 23: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

23

EJERCICIO: INTENCIÓN DE VOTO ANTES Y DESPUÉS PRUEBA DE MCNEMAR.

Intención voto D Intención voto A 1 Partido A 2 Partido B 1 1 51 1 Partido A 51 45 96 1 2 45 2 Partido B 80 64 144 2 1 80 131 109 240 2 2 64 La hipótesis de partida es: H0: No hay cambios en la intención de voto.

Viendo la tabla, llegamos a la conclusión de que antes, 96 personas tenían intención de votar al Partido A, y después son 131, es decir, se suman 80. El Partido B es perjudicado.

Fórmula de McNemar: �?1P?2P1�2

?> = �45P80P1�2

45Q80

α ≤ 0,05: Rechazo hipótesis.

α > 0,05: Acepto Hipótesis.

Analizar, Estadísticos descriptivos, Tablas de contingencia, Estadísticos, McNemar: 0,002, por lo que rechazo hipótesis.

CASO 2:

Intención voto D Intención voto A 1 Partido A 2 Partido B 3 Partido C 1 1 54 1 Partido A 54 18 16 88 1 2 18 2 Partido B 12 42 31 85 1 3 16 3 Partido C 14 9 63 86 2 1 12 80 69 110 259 2 2 42 2 3 31 3 1 14 3 2 9 3 3 63

La hipótesis de partida es: H0: No hay cambios en la intención de voto.

Fórmula de McNemar Bowker: 13,433. Se rechaza la hipótesis.

∑ �?@RP?R@�2

?@RQ?R@ = �12P18�2

12Q18 + �14P16�2

14Q16 + �9P31�2

9Q31

Para comprobar el movimiento de votos entre A y B, puedo hacer una selección de casos de A y B o no seleccionar C.

Datos, Seleccionar casos, intenciónvotoantes ~= 3 & intenciónvotodespues ~= 3

Page 24: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

24

Pedimos de nuevo la tabla de contingencia, y sólo aparecen los datos de A y B.

Tabla de contingencia intenciónvotoantes intención voto antes * intenciónvotodespues intencion voto después

intenciónvotodespues intencion voto

después Total 1 partidoA 2 PartidoB

intenciónvotoantes intención voto antes

1 partidoA 54 18 72 2 PartidoB 12 42 54

Total 66 60 126 Pruebas de chi-cuadrado

Valor Sig. exacta (bilateral)

Prueba de McNemar ,362a N de casos válidos 126 a. Utilizada la distribución binomial

La Prueba de McNemar es mayor que 0,05, por lo que aceptamos la hipótesis, no hay cambio en la intención de voto, entre el Partido A y B.

Para comprobarlo entre el A y el C: intenciónvotoantes ~= 2 & intenciónvotodespues ~= 2

Tabla de contingencia intenciónvotoantes intención voto antes * intenciónvotodespues intencion voto después

intenciónvotodespues intencion voto

después Total 1 partidoA 3 partidoc

intenciónvotoantes intención voto antes

1 partidoA 54 16 70 3 partidoc 14 63 77

Total 68 79 147 Pruebas de chi-cuadrado

Valor Sig. exacta (bilateral)

Prueba de McNemar ,856a N de casos válidos 147

Se acepta la hipótesis.

Para comprobar entre B y C: intenciónvotoantes ~= 1 & intenciónvotodespues ~= 1

Tabla de contingencia intenciónvotoantes intención voto antes * intenciónvotodespues intencion voto después

intenciónvotodespues intencion voto

después Total 2 PartidoB 3 partidoc

intenciónvotoantes intención voto antes

2 PartidoB 42 31 73 3 partidoc 9 63 72

Total 51 94 145 Pruebas de chi-cuadrado

Valor Sig. exacta (bilateral)

Prueba de McNemar ,001a N de casos válidos 145 a. Utilizada la distribución binomial

Se rechaza hipótesis, por lo que el trasvase de votos es entre los partidos B y C.

Page 25: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

25

7 NORMAL TIPIFICADA: Sólo se pueden tipificar variables cuantitativas de escala.

Tipificar la variable es calcular la media de todas las distintas medidas, se calcula la desviación típica, tras realizar una prueba de normalidad, y haber comprobado que los datos se distribuyen normalmente, calculada la mediana (una vez ordenados los valores de menor a mayor), y cuando la mediana y la media son iguales (nos habla de normalidad), y la asimetría y la curtosis se acercan a 0 (también nos indica normalidad).

Tipificación: Tipificar un valor es cogerlo, restarle media dividido por la desviación típica. Se tipifican todos los valores de los resultados de la muestra. Si la tipificación de un valor da 0.8 y de otro da -0.6, cuya media es 0 y su desviación típica es 1, para el caso 0.8, el valor tipificado es 0.788. También se puede dar una distribución normal doble, por ejemplo, da unos resultados para hombres y otros para mujeres.

SPSS: Analizar, Estadísticos descriptivos, descriptivos: Pasamos la variable altura y marcamos “Guardar valores tipificados como variables”

Estadísticos descriptivos N Mínimo Máximo Media Desv. típ. p33 altura que mide 3973 115 220 170,37 9,337 N válido (según lista) 3973

842�843,24;,224 = 0,282

Si vamos a la vista de datos y en la columna de altura, y buscamos un dato 173, “Caso 30”, y buscamos al final de la fila so, aparece 0,282.

Viendo en la tabla el dato 0,28: Vamos que el resultado es 0,6103, lo que significa que, de la muestra, el 61% está por debajo de mi altura, y el 39% por encima (en este caso está teniendo en cuenta hombres y mujeres).

2ª CASO:

Seleccionamos sólo los hombres: Selección de casos: P35=1

Estadísticos descriptivos N Mínimo Máximo Media Desv. típ. p33 altura que mide 1572 125 220 178,25 7,397 N válido (según lista) 1572

842�849,674,2;4 = 0,71.

El dato a es de 0,242, por lo que hay una probabilidad de encontrar un 24,2% de casos por debajo de mi altura, y un 75,8% por encima.

Para el caso de las mujeres:

Estadísticos descriptivos N Mínimo Máximo Media Desv. típ. p33 altura que mide 2382 115 200 165,19 6,368 N válido (según lista) 2382

842�8<7,8;<,2<9 = 1,23

Tengo una probabilidad de encontrar un 89,07% por debajo de mi altura, y un 10,93% por encima.

PARA REALIZAR UNA COMPARACIÓN DE MEDIAS: (sólo es posible ver valores atípicos con variables de escala)

Page 26: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

26

ANALIZAR, ESTADÍSTICOS DESCRIPTIVOS, EXPLORAR: Ponemos “Altura” como variable dependiente, y en lista de factores “Sexo”

Resumen del procesamiento de los casos p35 sexo Casos Válidos Perdidos Total N Porcentaje N Porcentaje N Porcentaje p33 altura que mide 1 hombre 1572 97,9% 33 2,1% 1605 100,0%

2 mujer 2382 97,3% 65 2,7% 2447 100,0% Descriptivos p35 sexo Estadístico Error típ. p33 altura que mide 1 hombre Media 178,25 ,187

Intervalo de confianza para la media al 95%

Límite inferior 177,88 Límite superior 178,61

Media recortada al 5% 178,32 Mediana 179,00 Varianza 54,713 Desv. típ. 7,397 Mínimo 125 Máximo 220 Rango 95 Amplitud intercuartil 9 Asimetría -,525 ,062 Curtosis 4,508 ,123

2 mujer Media 165,19 ,130 Intervalo de confianza para la media al 95%

Límite inferior 164,94 Límite superior 165,45

Media recortada al 5% 165,14 Mediana 165,00 Varianza 40,555 Desv. típ. 6,368 Mínimo 115 Máximo 200 Rango 85 Amplitud intercuartil 10 Asimetría ,060 ,050 Curtosis 2,594 ,100

En el caso de los hombres, la media y la mediana se parecen bastante, lo que me indica que los datos de los hombres se distribuyen normalmente. En el caso de las mujeres se parecen más todavía, por lo que se acercan aún más a los criterios de normalidad.

Page 27: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

27

Para el caso de las mujeres, ordenados los datos de menor al mayor, la mediana coincidiría con el 2º cuartil, y la distancia entre éste será igual que entre el segundo cuartil y el tercer cuartil. Si la mediana no mide la caja en dos partes iguales, tendríamos un caso de asimetría. Todos los casos que sobresalen a las patillas, son datos atípicos, porque se pasan o se quedan cortos, como los casos atípicos º 1208, 3605 y 157, que aparece con un * y nos indica que es atípico extremo. Cuando el símbolo es más oscuro, significa que hay más de un caso en sobre ese dato.

DIAGRAMAS DE CAJA.

Pasamos la tabla al SPSS.

Sexo-centro-aciertos-caso 1 1 20 1 1 1 30 2 1 1 35 3 1 1 30 4 1 1 30 5 1 1 15 6 1 1 34 7 1 1 26 8 1 1 28 9 1 1 25 10 1 1 29 11 1 1 30 12 1 1 1 13 1 1 50 14 1 1 46 15 1 1 25 16 1 1 20 17 1 2 18 18 1 2 32 19 1 2 30 20

1 2 35 21 1 2 36 22 1 2 38 23 1 2 40 24 1 2 26 25 2 2 28 26 2 2 25 27 2 2 20 28 2 2 29 29 2 2 29 30 2 2 44 31 2 2 16 32 2 2 20 33 2 2 20 34 2 3 24 35 2 3 28 36 2 3 32 37 2 3 32 38 2 3 28 39 2 3 29 40 2 3 34 41 2 3 45 42

2 3 20 43 2 3 35 44 2 3 26 45 2 3 18 46 2 3 25 47 2 3 36 48 2 3 40 49 2 3 48 50 2 3 28 51

Page 28: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

28

Sexo Numérico 1: chico, 2: chica Nominal Centro Numérico 1: A, 2: B, 3: C Nominal Aciertos Numérico Escala Caso Numérico Ordinal

Analizar, Estadísticos descriptivos, Frecuencias, Gráficos, Histograma “Mostrar curva normal en el histograma” [sólo disponible para variables de escala (aciertos) u ordinales (0-10)].

Estadísticos: Pedimos Media, mediana, cuartiles y desviación típica.

Estadísticos aciertos ACIERTOS N Válidos 51

Perdidos 0 Media 29,18 Mediana 29,00 Desv. típ. 9,143 Percentiles 25 25,00

50 29,00 75 35,00

Esta distribución de datos “Aciertos”, ¿es normal? ¿Cumple criterios de normalidad?

Cuando se tienen muchos datos (> 10.000) se considera normal. Cuando no se tienen muchos datos, hay que hacer pruebas de normalidad: Pruebas de normalidad sencilla:

- Comprobar media: debe ser igual o casi igual que la mediana. - Comprobar la asimetría (=0). - Pedir Histograma con curva normal y comprobar si se distribuye normalmente.

EXPLORACIÓN PRELIMINAR: Analizar, Frecuencias, Histograma, con curva normal, media, desviación típica, asimetría, etc.

- PRIMERA EXPLORACIÓN (sólo posible con variables de escala u ordinales): Analizar, estadísticos descriptivos, descriptivos, guardar valores tipificados como variables (esta opción sólo está disponible aquí). Cuando una distribución es normal y pido los valores tipificados, me permite hacer comparaciones y predicciones o probabilidades.

TIPIFICAR UN VALOR: Coger un valor, restarle la media, dividido por la desviación típica.

Analizar. Estadísticos descriptivos, descriptivos: Guardar valores tipificados como variables.

Si escogemos el valor 32, sería 32-29,18 / 9,143 = 0,308. Buscamos el valor (0,31) en la tabla tipificada, y el valor es 0,6217. Esto significa que hay un 62,17% de valores por debajo de 32 aciertos, y por tanto, hay 37,83 % de valores por encima de los 32 aciertos.

Page 29: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

29

¿Cuál es la Z de aciertos y la probabilidad de obtener aciertos mayores de 20?

20-29,18 / 9,143= -1,003. Buscamos el valor (-1,00) en la tabla tipificada, y el valor es 0,1587, lo que significa que hay un 15,87 % de valores por debajo de 20 aciertos, y un 84,13 % de valores por encima de los 20 aciertos.

Para calcular cuántas personas tengo entre 20 y 32 aciertos, es decir, entre 62,17 y 15,87= 46,30.

- EXPLORACIÓN AVANZADA: Analizar, Estadísticos descriptivos, Explorar: Diagrama de caja: Atipicidad, Estimadores robustos centrales (de la media), pruebas de normalidad, gráficos de dispersión, etc.

Lista de dependientes: Sólo variables de escala.

Lista de factores: Variables nominales (si pongo “sexo”, nos da los datos separados por sexo, si pongo “centro”, nos da los datos por centro).

Etiquetar los casos mediante: Podemos etiquetar los datos por casos (nos dirá a qué caso pertenece el dato atípico), o por centro (nos dice a qué centro pertenece el valor atípico) o también puedo no poner nada.

Analizar, Estadísticos descriptivos, Explorar: Lista de dependientes: (sólo variables de escala) Aciertos

Descriptivos Estadístico Error típ. aciertos ACIERTOS Media 29,18 1,280

Intervalo de confianza para la media al 95%

Límite inferior 26,61 Límite superior 31,75

Media recortada al 5% 29,19 Mediana 29,00 Varianza 83,588 Desv. típ. 9,143 Mínimo 1 Máximo 50 Rango 49 Amplitud intercuartil 10 Asimetría -,083 ,333 Curtosis 1,085 ,656

GRÁFICO DE TALLO Y HOJAS

ACIERTOS Stem-and-Leaf Plot Frequency Stem & Leaf 1,00 Extremes (=<1) ,00 1 . 4,00 1 . 5688 7,00 2 . 0000004 16,00 2 . 5555666888889999 10,00 3 . 0000022244 6,00 3 . 555668 3,00 4 . 004 3,00 4 . 568 1,00 Extremes (>=50) Stem width: 10 Each leaf: 1 case(s)

Page 30: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

30

DIAGRAMA DE CAJA UNIVARIABLE (NO SE USA NINGUNA VARIABLE PARA CONTEMPLAR LAS VARIACIONES A TRAVÉS DE OTRAS VARIABLES QUE PODEMOS CONSIDERAR RELEVANTE).

La caja representa: La línea del medio representa la mediana o Q2 (29), la inferior el Q1 (15) y la superior el Q3 (35). La línea central, no está justo en el centro, por lo que ya sabemos que no es perfectamente simétrica. Si se desplaza hacia abajo, tiene asimetría a la izquierda, y si se desplaza hacia arriba, tiene asimetría a la derecha. Q3-Q1 es la distancia intercuartílica. Las patillas son valores alejados de los cuartiles. Indica: 1.5 veces la distancia intercuantílica, es decir, para el Q1 es 25-15= 10, por lo que la patilla inferir es el valor más próximo a 10 que no lo sobrepasa por debajo, y la partilla superior: Q3 es 35 + 14= 50, por lo que la patilla superior es el valor más próximo a 50 que no lo sobrepasa por encima. Los datos del 13 y el 14 destacan como valores atípicos, el 13 tiene un 1, y el 14 tiene un 50.

DIAGRAMA DE CAJA SEPARADOS POR CENTRO.

Lista de dependientes: Sólo variables de escala.

Lista de factores: CENTRO

Separados por centros, los resultados de la caja son:

Con * son valores extremos: Cuanto más intenso es el color, significa que hay más casos.

Con º son valores atípicos.

El centro A tiene los casos concentrados en pocos valores (25-30), el centro B tiene los concentra entre 20 y 25, y el centro C los concentra entre 25-35.

Page 31: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

31

DIAGRAMA DE CAJA SEPARADOS POR SEXO.

Lista de dependientes: Sólo variables de escala.

Lista de factores: SEXO

Separados por centros, los resultados de la caja son:

OJO: SÓLO SE PUEDEN BUSCAR CASOS ATÍPICOS EN VARIABLES DE ESCALA. SI PREGUNTA BUSCAR VALORES ATÍPICOS EN EL EXAMEN Y NO HAY VARIABLES DE ESCALA, LA RESPUESTA ES “NO ES POSIBLE ENCONTRAR VALORES ATÍPICOS DEBIDO A QUE NO HAY VARIABLES DE ESCALA”.

Analizar, ED, Explorar: Dependiente: Aciertos.

Estadísticos: Estimadores robustos centrales, Valores Atípicos, Percentiles.

Gráficos, desmarcar Diagrama de tallos y hojas. Marcar Gráficos con pruebas de normalidad.

Estimadores Robustos centrales: Fórmulas para calcular la media de otro modo. Hace que los valores alejados de la media, pierdan peso:

Estimadores-M

Estimador-M de

Hubera

Biponderado de

Tukeyb

Estimador-M de

Hampelc

Onda de

Andrewsd

aciertos ACIERTOS 29,01 28,61 28,94 28,58

a. La constante de ponderación es 1,339.

b. La constante de ponderación es 4,685.

c. Las constantes de ponderación son 1,700, 3,400 y 8,500.

d. La constante de ponderación es 1,340*pi.

Page 32: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

32

Si estos valores son parecidos a la media inicial, compruebo si hay mucha variabilidad o no. Si no la hay, la media que tengo es robusta, fuerte, poco sensible a valores extremos. Los valores más alejados de la media disminuyen su peso respecto a los valores cercanos a la media.

PERCENTILES

Percentiles

Percentiles

5 10 25 50 75 90 95

Promedio

ponderado(definición 1)

aciertos ACIERTOS 15,60 18,40 25,00 29,00 35,00 44,80 48,80

Bisagras de Tukey aciertos ACIERTOS 25,00 29,00 35,00

Una prueba de normalidad compara nuestros los valores iniciales con los segundos

Kolmogorov: Se tienen + de 30 casos.

Shapiro: Se tienen – de 30 casos.

Si la significación es mayor que 0,05, es normal, si no es mayor, incumple el criterio de normalidad.

Pruebas de normalidad

Kolmogorov-Smirnova Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

aciertos ACIERTOS ,272 51 ,000 ,428 51 ,000

a. Corrección de la significación de Lilliefors

También podemos comprobar con los gráficos de normalidad:

Page 33: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

33

EJEMPLO:

Altura: 175: Zaltura Yemsal: (175-media del grupo) / desviación típica del grupo= (175-178,25) / 7,397 = -0,43.

Peso: 72: Zpeso Yemsal: (72-media del grupo) / desviación típica del grupo= (72-74,4) / 12,096 = -0,19.

Si la media es 0, Yemsal se acerca más al peso medio que a la altura media, es más bajo que delgado respecto a la media del grupo.

Carlos mide 180 y pesa 80 kg. Calcular:

Seleccionar hombres, vamos a Analizar, Estadísticos D., Descriptivos, pasamos altura y peso y pinchamos “guardas valores tipificados”. Buscamos en P33 un valor 180 y s busca de ese caso, el valor tipificado de la altura (0,237). Buscando los valores en la tabla de Normal tipificada: El 59,10% del grupo está por debajo de su altura y un 40,9% del grupo, está por encima de su altura.

Hacemos lo mismo con el peso (0,46305). Carlos es más alto y pesa más que la media, y es más pesado que alto. Buscamos el valor en la tabla Normal tipificada, y da 0,6772, lo que significa que el 62,72% del grupo pesa menos que Carlos y el 37,28% pesa más.

A las variables de escala se les pide la tabla de frecuencias para comprobar si tiene errores o para calcular posibles remodificaciones. Para estas variables, son imprescindibles la media y la desviación típica.

DIAGRAMA DE CAJA:

Analizar, Estadísticos descriptivos, Explorar: Dependiente: Altura. Factores: Sexo. Etiquetar casos mediante: nº cuestionario

Descriptivos p35 sexo Estadístico Error típ. p33 altura que mide 1 hombre Media 178,25 ,187

Intervalo de confianza para la media al 95%

Límite inferior 177,88 Límite superior 178,61

Media recortada al 5% 178,32 Mediana 179,00 Varianza 54,713 Desv. típ. 7,397 Mínimo 125 Máximo 220 Rango 95 Amplitud intercuartil 9 Asimetría -,525 ,062 Curtosis 4,508 ,123

2 mujer Media 165,19 ,130 Intervalo de confianza para la media al 95%

Límite inferior 164,94 Límite superior 165,45

Page 34: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

34

Media recortada al 5% 165,14 Mediana 165,00 Varianza 40,555 Desv. típ. 6,368 Mínimo 115 Máximo 200 Rango 85 Amplitud intercuartil 10 Asimetría ,060 ,050 Curtosis 2,594 ,100

El diagrama de caja sirve para comprobar si hay muchos o pocos valores atípicos, así como para ver si hay normalidad. En este caso, se puede comprobar que hay más valores atípicos en los hombres que en las mujeres, sobre todo por debajo.

Page 35: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

35

8 ANÁLISIS DE MEDIAS. CONTRASTE DE MEDIAS.

Nos preguntamos si estadísticamente, comparando dos medias, hay igualdad. Si la media de una variable, es igual a esa media, para un modelo de casos distintos. PE: una media para hombres y una media para mujeres: ¿La media de resultados de matemáticas en los hombres es igual a la de las mujeres? El punto de partida es que sí son iguales, o estadísticamente no muy diferentes. La clave está en si esa diferencia (si la hay) es significativa. Si las medias de todos los centros son iguales, no será posible realizar un contraste de medias, ya que el resultado es 0.

Si tengo una variable de escala, a través de una variable dicotómica independiente, tengo un Contraste de medias (resultados de hombres comparados con resultados de mujeres). Cuando la variable de escala (aciertos en matemáticas) la veo a través de una variable categórica de más de dos categorías (resultados de matemáticas por islas, por tipo de colegios, por municipios, etc.), se trata de Análisis de Varianza.

CONTRASTE DE MEDIAS. 3 Opciones posibles.

1. Hombres con mujeres (v. independiente) en aciertos (v. dependiente): Se toma la variable general y se estudia con dos medias diferenciadas, y se compara la media de los hombres con la media de las mujeres. Analizar, comparar medias, Prueba de T para muestras independientes…

2. Se comparan los valores de una variable dependiente (media de lengua) con otra variable dependiente (media de matemáticas). Analizar, comparar medias, Prueba de T para muestras relacionadas…

3. Se comparan variaciones con el paso del tiempo, tomando como referencia el valor obtenido previamente. Analizar, comparar medias, Prueba de T para una muestra…

Análisis, comparar medias, Medias= Dependiente: Aciertos, Independiente: centro:

Resumen del procesamiento de los casos

Casos

Incluidos Excluidos Total

N Porcentaje N Porcentaje N Porcentaje

aciertos ACIERTOS * centro

CENTRO

51 100,0% 0 ,0% 51 100,0%

Informe

aciertos ACIERTOS

centro CENTRO Media N Desv. típ.

dimension

1

1 A 27,88 17 11,062

2 B 28,59 17 8,209

3 C 31,06 17 8,097

Total 29,18 51 9,143

Una comparación entre sexos es:

Page 36: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

36

Análisis, comparar medias, Medias= Dependiente: Aciertos, Independiente: sexo:

Resumen del procesamiento de los casos

Casos

Incluidos Excluidos Total

N Porcentaje N Porcentaje N Porcentaje

aciertos ACIERTOS * sexo

SEXO

51 100,0% 0 ,0% 51 100,0%

Informe

aciertos ACIERTOS

sexo SEXO Media N Desv. típ.

di

m

en

si

on

1

1 chico 29,16 25 10,011

2 chica 29,19 26 8,424

Total 29,18 51 9,143

PRUEBA T PARA UN MUESTRA:

Variables para contrastar: Aciertos:

Valor de Prueba: 28.

LA hipótesis de partida es que las medias son iguales o casi iguales, no significativamente diferentes:

Estadísticos para una muestra

N Media Desviación típ. Error típ. de la

media aciertos ACIERTOS 51 29,18 9,143 1,280

Prueba para una muestra

Valor de prueba = 28

t gl Sig. (bilateral) Diferencia de

medias

95% Intervalo de confianza para la diferencia

Inferior Superior aciertos ACIERTOS ,919 50 ,363 1,176 -1,39 3,75

29,18 - 28 / 1,280= 0,9218

Si es mayor que 0,05 no es distinta significativamente.

Page 37: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

37

PARA MUESTRAS INDEPENDIENTES.

Dependiente: Aciertos.

Independiente: Sexo: Asignar grupos: 1: Hombres, 2 Mujeres

Estadísticos de grupo sexo SEXO

N Media Desviación típ. Error típ. de la

media aciertos ACIERTOS dimen

sion1 1 chico 25 29,16 10,011 2,002 2 chica 26 29,19 8,424 1,652

Prueba de muestras independientes

Prueba de Levene para la

igualdad de varianzas Prueba T para la igualdad de medias

F Sig. t gl Sig.

(bilateral) Diferencia de medias

Error típ. de la

diferencia

95% Intervalo de confianza para la

diferencia Inferior Superior

aciertos ACIERTOS

Se han asumido varianzas iguales

,126 ,724 -,012

49 ,990 -,032 2,587 -5,231 5,166

No se han asumido varianzas iguales

-,012

46,924 ,990 -,032 2,596 -5,255 5,190

Se toma el dato superior si las varianzas son iguales. Se observa la significación, si es superior a 0,05, no hay diferencias entre las notas de los chicos y de las chicas, estadísticamente, son prácticamente iguales.

COMPARACIÓN DE MEDIAS:

Analizar, Comparar medias

- Media: Descripción de la situación. - Prueba T de Student para una muestra. - Prueba T para 2 muestras independientes. - Prueba T para 2 muestras relacionadas. - ANOVA:

Cada vez que se hacen comparaciones de medias y comprobar si hay diferencias significativas o no entre lo que se compara, las variables tienen que ser normales:

- Media: Mediana. - Media: Media recortada. - Asimentría 0. - Medias robustas - Q-Q normal. - Q menos Q normal - Diagrama de caja. - Histograma con curva normal. - Kolmogorov y Sapiro.

Page 38: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

38

Analizar, comparación de medias, Medias:

Dependientes: Nota a Rajoy. Nota a Zapatero.

Independientes: Sexo:

Resumen del procesamiento de los casos

Casos

Incluidos Excluidos Total N Porcentaje N Porcentaje N Porcentaje

p42a nota que pone a Mariano Rajoy entre 0 y 10 * p35 sexo

3111 75,7% 1001 24,3% 4112 100,0%

p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10 * p35 sexo

3435 83,5% 677 16,5% 4112 100,0%

Informe p35 sexo

p42a nota que pone a Mariano Rajoy entre 0 y

10

p42b nota que pone a José Luis

Rodríguez Zapatero entre 0

y 10 1 hombre Media 4,23 4,41

N 1344 1416 Desv. típ. 2,637 2,433

2 mujer Media 4,30 4,50 N 1767 2019 Desv. típ. 2,391 2,408

Total Media 4,27 4,46 N 3111 3435 Desv. típ. 2,500 2,419

Las notas de las mujeres son ligeramente superiores.

PRUEBA T DE STUDENT:

Vamos a comparar la nota 4,4 de Zapatero con la nota de la media:

Analizar, Comparar medias, Prueba T para 1 muestra, se pasa Nota de Zapatero.

Valor de la prueba: 4,4.

Estadísticos para una muestra

N Media Desviación típ. Error típ. de la

media p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10

3455 4,47 2,416 ,041

Se resta a la media de resultado (4,47) el valor de la prueba (4,4): 4,47-4,4= 0,07:

(4,47-4,4) / 0,041 (error típico)= 1,619 (T de Student

Page 39: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

39

Si la sig > 0,05: Las medias son parecidas, no hay diferencias significativas, y es el caso, ya que Sig=0,105. Por tanto, las medias no son significativamente diferentes. Las medias no han superado el valor crítico. Cuando el intervalo de confianza incluye el 0, es que las medias no son estadísticamente distintas.

Prueba para una muestra

Valor de prueba = 4.40

t gl Sig. (bilateral) Diferencia de

medias

95% Intervalo de confianza para la diferencia

Inferior Superior p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10

1,619 3454 ,105 ,067 -,01 ,15

COMPARAMOS A RAJOY:

Estadísticos para una muestra

N Media Desviación típ. Error típ. de la

media p42a nota que pone a Mariano Rajoy entre 0 y 10

3131 4,27 2,497 ,045

(4,27-4,0)/0,045= 5,969.

Sig< 0,05, por lo que la hipótesis se rechaza, lo que significa que hay Sig diferentes y por tanto las medias son distintas significativamente. De hecho, si nos fijamos en el intervalo de confianza, no se incluye el 0.

Prueba para una muestra

Valor de prueba = 4.00

t gl Sig. (bilateral) Diferencia de

medias

95% Intervalo de confianza para la diferencia

Inferior Superior p42a nota que pone a Mariano Rajoy entre 0 y 10

5,969 3130 ,000 ,266 ,18 ,35

¿HAY DIFERENTE SIGNIFICACIÓN ENTRE LA NOTA MEDIA QUE PONEN LOS HOMBRES Y LA QUE PONEN LAS MUJERES?

Prueba T para muestras independientes:

Variables a contrastar: Nota a Rajoy, Nota a Zapatero.

Variable de agrupación: Sexo, (Definir grupos): 1 (1) Hombres, 2 (2) Mujeres.

Estadísticos de grupo p35 sexo

N Media Desviación típ. Error típ. de la

media p42a nota que pone a Mariano Rajoy entre 0 y 10

1 hombre 1344 4,23 2,637 ,072 2 mujer 1767 4,30 2,391 ,057

p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10

1 hombre 1416 4,41 2,433 ,065 2 mujer 2019 4,50 2,408 ,054

Cuando se comparan medias de 2 muestras (hombres, mujeres), hay que tener en cuenta la desviación típica.

Page 40: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

40

Las mujeres ponen mejores notas. Zapatero recibe mejores notas.

Prueba de muestras independientes

Prueba de Levene para la igualdad de

varianzas Prueba T para la igualdad de medias

F Sig. t gl Sig.

(bilateral) Diferencia de medias

Error típ. de la diferencia

95% Intervalo de confianza para la

diferencia Inferior Superior

p42a nota que pone a Mariano Rajoy entre 0 y 10

Se han asumido varianzas iguales

29,763 ,000 -,731 3109 ,465 -,066 ,090 -,243 ,111

No se han asumido varianzas iguales

-,721 2734,536 ,471 -,066 ,092 -,246 ,114

p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10

Se han asumido varianzas iguales

,551 ,458 -1,012

3433 ,312 -,085 ,084 -,249 ,080

No se han asumido varianzas iguales

-1,010

3025,645 ,312 -,085 ,084 -,250 ,080

F mide las desviaciones típicas de hombres y mujeres. Si es muy alta, dice que se debe estudiar la “t” de abajo (-0,721). Por tanto, Sig= 0,471>0,05, por lo que las notas que ponen los hombres y las mujeres no tienen diferencias significativas.

GRÁFICOS= GENERADOR DE GRÁFICO:

Gráfico de barras de error:

Eje Y: Nota a Zapatero.

Eje X: Sexo.

Muestra la media de la nota de Zapatero por Hombres y por mujeres. Y sus intervalo de confianza.

Page 41: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

41

Eje Y: Nota a Zapatero.

Eje X: Cercanía al PSOE.

Page 42: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

42

COMPARACIÓN DE MEDIAS.

Analizar, Comparación de medias, Medias = Lo utilizamos para realizar una comparación descriptiva.

Lista de dependientes: Nota a Zapatero; Nota a Rajoy.

Lista de independientes: Cercanía al PSOE.

Resumen del procesamiento de los casos

Casos

Incluidos Excluidos Total N Porcentaje N Porcentaje N Porcentaje

p42a nota que pone a Mariano Rajoy entre 0 y 10 * p15b cercanía al PSOE

2854 69,4% 1258 30,6% 4112 100,0%

p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10 * p15b cercanía al PSOE

3155 76,7% 957 23,3% 4112 100,0%

Informe

p15b cercanía al PSOE p42a nota que

pone a Mariano Rajoy entre 0 y

10

p42b nota que pone a José Luis

Rodríguez Zapatero entre 0

y 10 1 muy alejado Media 4,33 2,82

N 571 623 Desv. típ. 2,880 2,284

2 alejado Media 4,61 3,61 N 459 495 Desv. típ. 2,497 2,087

3 ni cercano ni alejado Media 4,50 4,57 N 887 1006 Desv. típ. 2,340 2,052

4 cercano Media 3,89 5,77 N 658 718 Desv. típ. 2,181 1,811

5 muy cercano Media 3,23 6,54 N 279 313 Desv. típ. 2,321 2,211

Total Media 4,22 4,54 N 2854 3155 Desv. típ. 2,480 2,395

Page 43: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

43

Analizar, Comparación de medias, Prueba T para una muestra = Necesitamos un valor referencial externo al archivo (con igual escala de medida e igual variable), para comparar con la media de una variable del archivo- LA hipótesis e partida es que las medias no son diferentes, o no significativamente diferentes.

Variables para contrastar: Nota a Zapatero.

Valor de Prueba: 4,3

Estadísticos para una muestra

N Media Desviación típ. Error típ. de la

media p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10

3455 4,47 2,416 ,041

Prueba para una muestra

Valor de prueba = 4.3

t gl Sig.

(bilateral) Diferencia de

medias

95% Intervalo de confianza para la diferencia

Inferior Superior p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10

4,052 3454 ,000 ,167 ,09 ,25

Diferencia de medias: 0,167.

T de Student: 4,052

Gl: grados de libertad: 3454

Busco en la tabla el valor de la t,

La diferencia es significativa, por lo que no se cumple la hipótesis.

Nivel de significación: Si es menor que 0.05, se rechaza la hipótesis, por lo que la diferencia de medias es estadísticamente significativa.

Intervalos de confianza: Si contienen el 0, las medias son iguales o casi iguales. Si no lo contienen, son distintas.

Analizar, Comparación de medias, Prueba T para muestras independientes:

Comparar la media de una variable de escala o de orden de mi archivo, con una variable categórica, por ejemplo, el sexo (1,2). Si esta variable tiene más de dos categorías, tengo que elegir dos para hacer la comparación,

Variables para contrastar: Nota a Zapatero.

Variable de agrupación: P35, Sexo: Grupos: 1,2

Page 44: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

44

Estadísticos de grupo p35 sexo

N Media Desviación típ. Error típ. de la

media p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10

1 hombre 1416 4,41 2,433 ,065 2 mujer 2019 4,50 2,408 ,054

Prueba de muestras independientes

Prueba de Levene para la

igualdad de varianzas Prueba T para la igualdad de medias

F Sig. t gl Sig.

(bilateral) Diferencia de medias

Error típ. de la

diferencia

95% Intervalo de confianza para la diferencia

Inferior Superior p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10

Se han asumido varianzas iguales

,551 ,458 -1,012 3433 ,312 -,085 ,084 -,249 ,080

No se han asumido varianzas iguales

-1,010 3025,645 ,312 -,085 ,084 -,250 ,080

Hago la valoración con la primera línea, porque la sig es mayor que 0,05, las desviaciones típicas son prácticamente iguales. Por tanto, la diferencia de las medias de la nota que ponen los hombres y la nota que ponen las mujeres, no es significativamente distinta. Viendo el intervalo de confianza, puesto que incluye los 0, la hipótesis se acepta.

Analizar, Comparación de medias, Prueba T para muestras relacionadas:

2 variables de mi archivo de datos. Ambas variables deben tener igual escala (no puedo comparar la atura con el peso), por ejemplo, comparar la nota de Zapatero con la nota de Rajoy. Es decir, si la nota de Zapatero es significativamente diferente que la nota de Rajoy.

Estadísticos de muestras relacionadas

Media N Desviación típ. Error típ. de la

media Par 1 p42a nota que pone a Mariano

Rajoy entre 0 y 10 4,26 3105 2,494 ,045

p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10

4,44 3105 2,426 ,044

Correlaciones de muestras relacionadas

N Correlación Sig. Par 1 p42a nota que pone a Mariano

Rajoy entre 0 y 10 y p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10

3105 ,147 ,000

Prueba de muestras relacionadas

Diferencias relacionadas

t gl Sig.

(bilateral) Media Desviación

típ. Error típ.

de la media

95% Intervalo de confianza para la

diferencia Inferior Superior

Page 45: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

45

Prueba de muestras relacionadas

Diferencias relacionadas

t gl Sig.

(bilateral) Media Desviación

típ. Error típ.

de la media

95% Intervalo de confianza para la

diferencia Inferior Superior

Par 1 p42a nota que pone a Mariano Rajoy entre 0 y 10 - p42b nota que pone a José Luis Rodríguez Zapatero entre 0 y 10

-,183 3,214 ,058 -,296 -,070 -3,172 3104 ,002

Las notas de Rajoy y Zapatero tienen diferencias significativas.

Analizar, Comparación de medias, ANOVA de un factor…:

Caso colegio resultado

1 1 33 2 1 30 3 1 28 4 1 26 5 1 23 6 2 26 7 2 19 8 2 24 9 2 22 10 2 29 11 3 14 12 3 19 13 3 16 14 3 12 15 3 9

Estadísticos descriptivos N Mínimo Máximo Media Desv. típ.

VAR00003 resultado 15 9 33 22,00 7,041 N válido (según lista) 15

Analizar, comparar medias, Medias:

Dependientes: Resultados

Independientes: Colegio

Informe resultado resultado colegio colegio Media N Desv. típ. Máximo Mínimo

dimension1

1 28,00 5 3,808 33 23 2 24,00 5 3,808 29 19 3 14,00 5 3,808 19 9 Total 22,00 15 7,041 33 9

Page 46: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

46

Intuimos que entre el colegio A y B no hay diferencias significativas, pero sí entre el colegio A y C, y el B y C.

Analizar, Comparación de medias, ANOVA de un factor…

Dependiente: Resultados

Factor: Colegio.

ANOVA resultado resultado

Suma de cuadrados gl Media cuadrática F Sig.

Inter-grupos 520,000 2 260,000 17,931 ,000 Intra-grupos 174,000 12 14,500 Total 694,000 14

Buscamos en la tabla de F los grados de libertad (gl), nominador 2, denominador: 12: El resultado es 3.88. Como la F es mayor que el F crítico para 2 y 12 grados de libertad, 3,88, se supera los valores críticos, por lo que hay diferencias significativas entre las notas.

El ANOVA parte de la hipótesis de que las medias son parecidas, no estadísticamente diferentes. Como la Sig (0,000) es menor que 0.05, se rechaza la hipótesis, es decir, hay diferencias significativas de notas.

Analizar, Comparación de medias, ANOVA de un factor… Opciones:

Page 47: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

47

Descriptivos resultado resultado

N Media Desviación típica Error típico

Intervalo de confianza para la media al 95%

Mínimo Máximo Límite inferior Límite superior 1 5 28,00 3,808 1,703 23,27 32,73 23 33 2 5 24,00 3,808 1,703 19,27 28,73 19 29 3 5 14,00 3,808 1,703 9,27 18,73 9 19 Total 15 22,00 7,041 1,818 18,10 25,90 9 33

Prueba de homogeneidad de varianzas

resultado resultado Estadístico de

Levene gl1 gl2 Sig. ,000 2 12 1,000

Las varianzas son iguales

ANOVA

resultado resultado

Suma de

cuadrados gl Media cuadrática F Sig.

Inter-grupos 520,000 2 260,000 17,931 ,000

Intra-grupos 174,000 12 14,500

Total 694,000 14

Page 48: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

48

Analizar, Comparación de medias, ANOVA de un factor… Post hoc, marcamos DMS

Comparaciones múltiples resultado resultado DMS (I) colegio colegio (J) colegio colegio Diferencia de

medias (I-J) Error típico Sig. Intervalo de confianza al 95%

Límite inferior Límite superior

dimension2

1 dimension3

2 4,000 2,408 ,123 -1,25 9,25 3 14,000* 2,408 ,000 8,75 19,25

2 dimension3

1 -4,000 2,408 ,123 -9,25 1,25 3 10,000* 2,408 ,001 4,75 15,25

3 dimension3

1 -14,000* 2,408 ,000 -19,25 -8,75 2 -10,000* 2,408 ,001 -15,25 -4,75

*. La diferencia de medias es significativa al nivel 0.05.

Analizar, Comparación de medias, ANOVA de un factor…

Dependiente: Nota a Rajoy

Factor: Clase Social

ANOVA p42a nota que pone a Mariano Rajoy entre 0 y 10

Suma de cuadrados gl Media cuadrática F Sig.

Inter-grupos 304,940 4 76,235 12,443 ,000 Intra-grupos 18883,177 3082 6,127 Total 19188,117 3086

Hay diferencia significativa en las notas medias de Rajoy por clase social.

La nota media de la clase alta no da diferencia significativa con ninguna clase.

La clase media-alta se diferencia con la media –baja y baja.

Prueba de homogeneidad de varianzas p42a nota que pone a Mariano Rajoy entre 0 y 10

Page 49: Multivariante con spss

TÉCNICAS DE INVESTIGACIÓN II. MHG

49

Estadístico de Levene gl1 gl2 Sig.

4,866 4 3082 ,001

Comparaciones múltiples p42a nota que pone a Mariano Rajoy entre 0 y 10 Tamhane (I) p31 clase social a la que cree pertenece

(J) p31 clase social a la que cree pertenece

Diferencia de medias (I-J) Error típico Sig.

Intervalo de confianza al 95% Límite inferior Límite superior

dimension2

1 baja dimensio

n3

2 media-baja -,360 ,438 ,995 -1,64 ,92 3 media -,936 ,427 ,287 -2,19 ,32 4 media-alta -1,487* ,445 ,014 -2,78 -,19 5 alta -1,309 ,948 ,860 -4,19 1,58

2 media-baja dimensio

n3

1 baja ,360 ,438 ,995 -,92 1,64 3 media -,575* ,124 ,000 -,92 -,23 4 media-alta -1,127* ,175 ,000 -1,62 -,64 5 alta -,949 ,856 ,963 -3,66 1,76

3 media dimensio

n3

1 baja ,936 ,427 ,287 -,32 2,19 2 media-baja ,575* ,124 ,000 ,23 ,92 4 media-alta -,552* ,144 ,001 -,96 -,15 5 alta -,374 ,850 1,000 -3,08 2,33

4 media-alta dimensio

n3

1 baja 1,487* ,445 ,014 ,19 2,78 2 media-baja 1,127* ,175 ,000 ,64 1,62 3 media ,552* ,144 ,001 ,15 ,96 5 alta ,178 ,859 1,000 -2,54 2,90

5 alta dimensio

n3

1 baja 1,309 ,948 ,860 -1,58 4,19 2 media-baja ,949 ,856 ,963 -1,76 3,66 3 media ,374 ,850 1,000 -2,33 3,08 4 media-alta -,178 ,859 1,000 -2,90 2,54

*. La diferencia de medias es significativa al nivel 0.05.

Gráfico de diferencia de medias