estadisticaaaaapruebas paramétricas con spss

15
Cuadernillo de trabajo para el taller de métodos estadístcos Dr. Jean Zapata Página 1 de 15 Análisis cuantitativo de datos con SPSS Pruebas paramétricas Manual de trabajo para el Taller de Métodos Estadísticos para Investigadores. En general las pruebas paramétricas son más potentes que las pruebas no paramétricas, pero exigen que se cumplan una serie de supuestos como la normalidad en la distribución variable, la homocedasticidad (igualdad de varianzas) y la independencia de las observaciones, requiriendo algunas pruebas que se cumplan todo el conjunto de supuestos o alguno de ellos, dependiendo de la prueba a utilizar, sin los cuales, estas pruebas pierden todo su potencial y resulta imprescindible recurrir a sus homólogas no paramétricas. Las pruebas paramétricas a estudiar serán: Prueba t (para una muestra o para dos muestras relacionadas o independientes) y prueba ANOVA (para más de dos muestras independientes). Temas a tratar Pruebas paramétricas de comparación de medias Condiciones de parametricidad Variable numérica Normalidad Homocedasticidad Selección de la muestra Muestras independientes Muestras dependiente so relacionadas Tipos de pruebas paramétricas Importante. Ho (hipótesis nula) representa la afirmación de que no existe asociación entre las dos variables estudiadas. Ha (hipótesis alternativa) afirma que hay algún grado de relación o asociación entre las dos variables. Dicha decisión puede ser afirmada con una seguridad que se decide previamente a través del nivel de significación

Upload: moises-angulo

Post on 17-Dec-2015

56 views

Category:

Documents


11 download

DESCRIPTION

pruebas parametricas con spss

TRANSCRIPT

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 1 de 15

    Anlisis cuantitativo de datos con SPSS

    Pruebas paramtricas Manual de trabajo para el Taller de Mtodos Estadsticos para

    Investigadores.

    En general las pruebas paramtricas son ms potentes que las

    pruebas no paramtricas, pero exigen que se cumplan una serie de

    supuestos como la normalidad en la distribucin variable, la

    homocedasticidad (igualdad de varianzas) y la independencia de

    las observaciones, requiriendo algunas pruebas que se cumplan todo

    el conjunto de supuestos o alguno de ellos, dependiendo de la

    prueba a utilizar, sin los cuales, estas pruebas pierden todo su

    potencial y resulta imprescindible recurrir a sus homlogas no

    paramtricas.

    Las pruebas paramtricas a estudiar sern:

    Prueba t (para una muestra o para dos muestras relacionadas o independientes) y prueba

    ANOVA (para ms de dos muestras independientes).

    Temas a tratar

    Pruebas paramtricas de

    comparacin de medias

    Condiciones de parametricidad

    Variable numrica

    Normalidad

    Homocedasticidad

    Seleccin de la muestra

    Muestras independientes

    Muestras dependiente so

    relacionadas

    Tipos de pruebas paramtricas

    Importante.

    Ho (hiptesis nula) representa la

    afirmacin de que no existe

    asociacin entre las dos

    variables estudiadas.

    Ha (hiptesis alternativa) afirma

    que hay algn grado de

    relacin o asociacin entre las

    dos variables. Dicha decisin

    puede ser afirmada con una

    seguridad que se decide

    previamente a travs del nivel

    de significacin

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 2 de 15

    Condiciones de parametricidad.

    a. Variable numrica: la variable de estudio (la dependiente) debe estar medida en una

    escala que sea, por lo menos, de intervalo e, idealmente, de razn.

    b. Normalidad: los valores de la variable dependiente deben seguir una distribucin normal;

    por lo menos, en la poblacin a la que pertenece la muestra.

    Debido a esto es preciso comprobar si la distribucin de nuestro estudio sigue esta estructura

    terica. Para ello una simple exploracin v isual de los datos puede sugerir la forma. Existen, no

    obstante, otras medidas como son los grficos de normalidad y los contrastes de hiptesis

    (Prueba de Kolmogorov -Smirnov (se usa cuando n50) y la Prueba de Shapiro-Wilk (se usa

    cuando n

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 3 de 15

    Tipos de pruebas paramtricas

    A continuacin en la siguiente tabla resumimos el tipo de

    prueba que debe utilizarse segn el contraste planteado:

    Tipo de Contraste Pruebas

    Una muestra Prueba T

    Dos muestras independientes Prueba t para muestras

    independientes

    Dos muestras relacionadas Prueba t para muestras

    relacionadas

    Ms de dos muestras

    independientes

    ANOVA

    PRUEBA T PARA MUESTRAS INDEPENDIENTES

    CASO 01 CON SPSS

    La variable raza se desea saber si est relacionada con el peso de

    los indiv iduos (una variable cuantitativa, cuya medida est en

    kilogramos).

    Es decir, pretendemos responder a la pregunta:

    Est relacionada la raza del individuo con su peso?

    REVISAR EL SIGUIENTE VDEO TUTORIAL: (encontrars la explicacin

    paso a poso del desarrollo y resolucin del caso)

    http://youtu.be/dMp5dafERVM

    En este caso se trata de comparar las medias de una variable

    cuantitativa (peso) en dos grupos establecidos por una variable

    (raza); por lo que el procedimiento estadstico correspondiente es

    Prueba t para muestras independientes.

    PASO 1: Verificar el cumplimiento de normalidad y homocedasticidad.

    a. Prueba t para una muestra. Contrasta si la media de una

    poblacin difiere significativamente

    de un valor dado conocido o

    hipotetizado.

    b. Prueba t para dos muestras independientes. Esta prueba debe

    utilizarse cuando la comparacin se

    realice entre las medias de dos

    poblaciones independientes, por

    ejemplo, en el caso de la

    comparacin de las poblaciones de

    hombres y mujeres.

    c. Prueba t para dos muestras relacionadas. Existe una segunda

    alternativa para contrastar dos

    medias. Esta se refiere al supuesto

    caso en el que las dos poblaciones

    no sean independientes, es decir, el

    caso en el que se trate de

    poblaciones relacionadas, por

    ejemplo, en los diseos apareados,

    diseos en los que los mismos

    indiv iduos son observados antes y

    despus de una determinada

    intervencin.

    d. Prueba ANOVA para ms de dos muestras independientes.

    ANOVA es el acrnimo de anlisis de

    la varianza. Es una prueba

    estadstica desarrollada para realizar

    simultneamente la comparacin

    de las medias de ms de dos

    poblaciones. A la asuncin de

    Normalidad debe aadirse la de la

    homogeneidad de las varianzas de

    las poblaciones a comparar.

    Si del ANOVA resultase el rechazo de la hiptesis nula de igualdad de

    medias, se debe proseguir el anlisis con la realizacin de los

    contrastes a posteriori (post hoc).

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 4 de 15

    Se hace clic en Grficos y luego se activa grficos con pruebas de normalidad.

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 5 de 15

    Seguidamente, se nos muestra las pruebas de normalidad:

    En nuestro ejemplo en ambos grupos el p-valor es no significativo

    (esto es, p-valor > 0,05). Por lo que aceptamos Ho, es decir, se

    asume la normalidad de la variable cuantitativa peso en ambos

    grupos (raza blanca y raza negra).

    PASO 2:

    Para completar el anlisis inferencial debemos recurrir al contraste de hiptesis, es decir, Prueba T

    para muestras independientes.

    Estadstico gl Sig. Estadstico gl Sig.

    Negro ,174 17 ,182 ,943 17 ,350

    Blanco ,166 15 ,200* ,903 15 ,107

    a. Correccin de la significacin de Lilliefors

    Pruebas de normalidad

    Raza del individuo

    observado

    Kolmogorov-Smirnova

    Shapiro-Wilk

    Peso del

    individuo

    observado*. Este es un lmite inferior de la significacin verdadera.

    Prueba de Kolmogorov -Smirnov (se usa cuando n50) y la

    Prueba de Shapiro-Wilk (se usa cuando n0.05 se acepta Ho, en caso contrario se rechaza; teniendo en

    cuenta que:

    Ho= El peso de los individuos

    tiene distribucin normal.

    Ha= El peso de los individuos no

    tiene distribucin normal .

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 6 de 15

    En variables para contrastar seleccionar peso y en variables de agrupacin raza, luego pulsar en

    Definir grupos y considerar los grupos 1 y 2, pulsar en Continuar y Aceptar.

    Paso 03

    Los resultados que se muestran son:

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 7 de 15

    Estadsticos de grupo

    Raza del

    individuo

    observado

    N Media Desviacin

    tp.

    Error tp.

    de la

    media

    Peso del

    individuo

    observado

    Negro 17 69,4118 7,34046 1,78032

    Blanco 15 69,2667 8,07524 2,08502

    p-valor es 0.382 > 0.05, concluimos que las varianzas en los grupos son homogneas.

    La prueba T propiamente dicha, para la igualdad de medias nos da la siguiente informacin:

    El valor de T (t), los grados de libertad del estadstico (gl) y, lo ms importante, el valor de p-valor (Sig. Bilateral) asociado al contraste.

    El valor de la diferencia de medias entre los dos grupos, su error tpico, y el intervalo de confianza al 95% de dicha diferencia de medias

    En el ejemplo con el que estamos trabajando la t de Student en la fila superior (se han asumido

    varianzas iguales): el estadstico t= 0.053 (con 30 grados de libertad) y el valor p-valor o sig.

    bilateral es 0,958.

    Conclusin:

    No hay asociacin entre el peso y la raza, ya que la media del peso de los de raza negra y los de

    raza blanca no son estadsticamente diferentes al nivel de signif icacin alfa = 0,05.

    Una prueba de homogeneidad de varianzas (la prueba de Levene), El programa hace un contraste a

    travs del estadstico F de

    Snedecor y nos aporta una significacin estadstica, o valor p

    Ho: las varianzas son homogneas

    Ha: las varianzas no son homogneas

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 8 de 15

    ANOVA

    Comparacin de medias de una variable cuantitativa en tres o

    ms grupos establecidos por una variable categrica

    REVISAR (encontrars la explicacin paso a poso del desarrollo y resolucin del caso):

    http://youtu.be/gOJgq2odXBI

    CASO 02 CON SPSS

    Hay relacin entre el peso de los individuos y su estado civil?

    Antes que nada debemos comprobar si se cumple el requisito de

    normalidad en la distribucin de la variable cuantitativa en todos

    y cada uno de los estratos.

    PASO 01.

    Cuando la variable cualitativa tiene tres o ms categoras, el

    anlisis de asociacin entre esta

    variable y una cuantitativa ya no puede llevarse a cabo por el test t

    de Student, sino que debe

    recurrirse a una tcnica conocida como Anlisis de Varianza

    (ANOVA).

    Esta prueba contrasta las hiptesis:

    Ho: las medias de las

    distribuciones de la variable

    cuantitativa en todos y cada

    uno de los grupos

    independientes son iguales:

    Ha: alguna de las medias de

    las distribuciones de la variable

    cuantitativa en todos y cada

    uno de los grupos

    independientes es diferente.

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 9 de 15

    Con respecto a los test de normalidad, se encuentra significacin estadstica (p-valor > 0,05) en el

    test de Shapiro-Wilk(n

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 10 de 15

    Los resultados que se obtienen se muestran a continuacin:

    Primero se nos muestra un cuadro resumen con los estadsticos descriptivos (de la variable

    cuantitativa) ms relevantes en cada grupo que se va a contrastar: las medias (y sus I ntervalos de

    Confianzas al 95%), las desv iaciones tpicas y los valores mximo y mnimo.

    Descriptivos

    Peso del individuo observado

    N Media Desviacin

    tpica Error tpico

    Intervalo de confianza para la

    media al 95%

    Mnimo Mximo Lmite inferior

    Lmite superior

    Soltero 11 72,1818 8,17090 2,46362 66,6925 77,6711 58,00 82,00

    Casado 10 64,0000 5,09902 1,61245 60,3524 67,6476 58,00 72,00

    Otro 11 71,3636 6,74200 2,03279 66,8343 75,8930 59,00 81,00

    Total 32 69,3438 7,56737 1,33774 66,6154 72,0721 58,00 82,00

    Luego, la homogeneidad de varianzas, el test de Levene.

    En nuestro ejemplo la significacin estadstica p-valor (Sig)= 0.492, pudiendo asumirse la

    homogeneidad de varianzas.

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 11 de 15

    Prueba de homogeneidad de varianzas

    Peso del individuo observado

    Estadstico de

    Levene

    gl1 gl2 Sig.

    ,727 2 29 ,492

    Por ltimo, aparece la salida del ANOVA

    ANOVA de un factor

    PASO 03

    Pulsar en la casilla Post hoc y seleccionar algn tipo de pruebas segn varianzas iguales o diferentes,

    los contrastes a posteriori ms usadas son Tukey, Bonferroni, DMS. Para el ejemplo se seleccion la

    prueba DMS y Tukey-b (por tener diferentes tamaos de grupos)

    Para llevar a cabo el contraste, se recurre al estadstico F de

    Snedecor, que en nuestro ejemplo

    vale 4.480 y tiene un p-valor (sig) =0.020 > 0.05

    Conclusin:

    las variables PESO y grupos de ESTADO CVIL muestran

    asociacin;

    Se rechaza la Hiptesis nula.

    En este caso habra lugar a evaluar los contrastes a posteriori, puesto que se ha encontrado diferencias

    significativas en el ANOVA.

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 12 de 15

    Los resultados se muestran a continuacin:

    En el cuadro de comparaciones mltiples vemos que cada grupo de ESTADO CIVIL se compara con

    los otros dos, obtenindose en cada contraste la diferencia de medias, el IC95%, el error estndar y

    el p-valor sig., en la que en algunos casos es no-significativo.

    Comparaciones mltiples

    Variable dependiente: Peso del individuo observado

    (I) Estado civil del individuo Diferencia de medias (I-J)

    Error tpico

    Sig.

    Intervalo de confianza al 95%

    Lmite inferior Lmite superior

    DMS Soltero Casado 8,18182* 2,98795 ,010 2,0708 14,2929

    Otro ,81818 2,91594 ,781 -5,1456 6,7819

    Casado Soltero -8,18182* 2,98795 ,010 -14,2929 -2,0708

    Otro -7,36364* 2,98795 ,020 -13,4747 -1,2526

    Otro Soltero -,81818 2,91594 ,781 -6,7819 5,1456

    Casado 7,36364* 2,98795 ,020 1,2526 13,4747

    *. La diferencia de medias es significativa al nivel 0.05.

    De igual manera la prueba de Tukey nos proporciona los subconjuntos homogneos, como en

    nuestro caso hay diferencia significativa en los grupos estados civil, se muestra los tres grupos en

    diferente subconjunto; lo indica que hay diferencia entre los grupos.

    Peso del individuo observado

    Estado civil del individuo N Subconjunto para alfa = 0.05

    1 2

    Tukey Ba,b

    Casado 10 64,0000

    Otro 11 71,3636

    Soltero 11 72,1818

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 13 de 15

    PRUEBA T PARA MUESTRAS RELACIONADAS O

    PAREADAS

    CASO 03 CON SPSS

    REVISAR EL SIGUIENTE VIDEO TUTORIAL (encontrars la explicacin

    paso a poso del desarrollo y resolucin del caso):

    http://youtu.be/tBVX4vbmbks

    Entonces necesitamos probar si:

    Hay diferencia significativa entre el peso antes de los ejercicios

    anti estrs y despus de los ejercicios anti estrs?

    Consideraremos la comparacin de las medias de dos poblaciones

    en base a dos muestras

    emparejadas o relacionadas. Por ejemplo, los datos de la variable

    peso y supongamos que queremos

    establecer la influencia de un programa de ejercicios anti estrs,

    por lo que se mide el peso antes y

    despus de iniciar los ejercicios anti

    estrs, aqu cada caso representa a un mismo sujeto..

    Las hiptesis a plantear son:

    Ho: El nivel promedio de peso antes del los ejercicios anti estrs es igual

    al peso despus del los ejercicios

    anti estrs.

    Ha: El nivel promedio de peso antes del los ejercicios anti estrs es

    diferente al peso despus del los

    ejercicios anti estrs.

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 14 de 15

    Se encuentran los siguientes resultados en: Estadsticos de muestras relacionadas, la media, tamao

    muestral comn, desv iacin tpica y error tpico de la media de cada una de las dos variables.

    Estadsticos de muestras relacionadas

    Media N Desviacin tp. Error tp. de la

    media

    Par 1

    Peso antes del tratamiento

    anti estrs 69,3438 32 7,56737 1,33774

    Peso despus del

    tratamiento anti estrs 66,2500 32 5,90790 1,04438

  • Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 15 de 15

    Finalmente, encontramos los resultados de la prueba T de muestras relacionadas: media, desviacin

    tpica y error tpico de la media para la diferencia de las dos muestras, un intervalo de confianza y

    un contraste para la diferencia de las medias.

    Puesto que la significacin o P-valor Sig. bilateral = 0.000 < 0.05 se concluye que hay diferencia

    significativa entre el peso antes y despus de iniciar los ejercicios anti estrs, podemos decir que, hay

    ev idencia estadstica para afirmar que los ejercicios anti estrs ayudan a reducir el peso.

    Inferior Superior

    Par 1 Peso antes del

    tratamiento anti estrs -

    Peso despus del

    tratamiento anti estrs

    3,09375 2,55721 ,45205 2,17178 4,01572 6,844 31 ,000

    Diferencias relacionadas

    t gl

    Sig.

    (bilateral)Media

    Desviacin

    tp.

    Error tp. de la

    media

    95% Intervalo de

    confianza para la

    Prueba de muestras relacionadas