analisis varianza

13
Estudio del efecto de un factor con múltiples niveles y de la combinación de varios factores Análisis Univariante de la varianza

Upload: joel-santiago-ricaldi-condor

Post on 08-Nov-2015

3 views

Category:

Documents


2 download

DESCRIPTION

bien

TRANSCRIPT

  • Estudio del efecto de un factor con mltiples niveles

    y de la combinacin de varios factores

    Anlisis Univariante de la varianza

  • EjemploEstamos estudiando los procesos memorsticos subyacentes a la emisin de un diagnstico mdico. Disponemos de un grupo de estudiantes de medicina que reciben una serie de compensaciones acadmicas por su colaboracin. Una vez asignados al azar a cada uno de los 4 grupos experimentales, se les pide que una vezvista la serie de casos que se les presentar, emitan un juicio sobre la probabilidad que el alimento concreto sea la causa de un malestar gstrico: Existen por tanto 4 situaciones (comida-malestar, comida-no malestar, otra comida-malestar y otra comida-no malestar.

    25P(E/NC)= 0.25 P(E/C)=0.50C20P(E/NC)= 0.25 P(E/C)=0.25C1 (azar)

    75P(E/NC)= 0.25 P(E/C)= 1.C450P(E/NC)= 0.25 P(E/C)= 0.75C3

    Juicio esperadoFase de Exposicin (50 casos)Grupo

  • 10101010N =

    GRUPO

    C4C3C2Azar

    95%

    IC R

    ESU

    L

    30

    20

    10

    0

    -1,3

    1,0

    3,3

    5,7

    8,0

    10,3

    12,7

    15,0

    17,3

    19,7

    22,0

    24,3

    26,7

    29,0

    31,3

    1086420

    Desv. tp. = 6,08

    Media = 14,5

    N = 40,00

    HiptesisNula

    Hiptesis AlternativaRESUL

    32,530,0

    27,525,0

    22,520,0

    17,515,0

    12,5

    GRUPO: 0 Azar3,5

    3,0

    2,5

    2,0

    1,5

    1,0

    ,5

    0,0

    Desv. tp. = 7,20 Media = 19,0

    N = 10,00

    RESUL

    20,017,5

    15,012,5

    10,07,5

    5,02,5

    0,0-2,5

    GRUPO: 2 C33,5

    3,0

    2,5

    2,0

    1,5

    1,0

    ,5

    0,0

    Desv. tp. = 5,79 Media = 11,3

    N = 10,00

    RESUL

    16,014,012,010,08,06,04,0

    GRUPO: 1 C23,5

    3,0

    2,5

    2,0

    1,5

    1,0

    ,5

    0,0

    Desv. tp. = 3,47 Media = 11,4

    N = 10,00

    RESUL

    22,020,018,016,014,012,010,0

    GRUPO: 3 C43,5

    3,0

    2,5

    2,0

    1,5

    1,0

    ,5

    0,0

    Desv. tp. = 3,94 Media = 16,2

    N = 10,00

  • Grupo 1Grupo 2

    Total Grupo 3

    PROBLEMA DE LA IGUALDAD DE VARIANZAS

    Los grupos necesitan tener varianzas iguales para poder distinguir entre la situacin representada por la hiptesis nula (mostrada aqu), donde las diferencias con respecto a la media global, que es nica, son debidas al azar (mucha varianza). Y la situacin representada a continuacin, donde al contrario, las diferencias se explican por la existencia de diversas medias pero con una varianza parecida.

  • 1

    23

    Total Grupo 1 Grupo 2 Grupo 3 ...

    PROBLEMA DE LA IGUALDAD DE VARIANZAS

  • PARTICIN DE LA VARIACIN TOTAL

    Informe

    RESUL

    18,9549 10 7,1972811,4000 10 3,4705111,3000 10 5,7936716,2000 10 3,9384114,4637 40 6,08090

    GRUPOAzarC2C3C4Total

    Media N Desv. tp.

    GRUPO

    RES

    UL

    40

    30

    20

    10

    0

    -10 C1 C2 C3 C4

    DESVIACIN TOTAL =Efecto Grupo +Desv. No Explicada

  • )()()( jijTjTij yyyyyy +=

    ))((2)()()( 222 jijTjjijTjTij yyyyyyyyyy ++=

    Desviacin total = desviacin explicada + desviacin no explicada

    Para poder sumar las desviaciones, necesitamos elevar al cuadrado, as las desviaciones positivas y las negativas no se anulan:

    PARTICIN DE LA VARIACIN TOTAL

  • Luego hacemos el sumatorio del conjunto de N = c x n sujetos:

    = == == == =

    ++=c

    j

    n

    ijijTj

    c

    j

    n

    ijij

    c

    j

    n

    iTj

    c

    j

    n

    iTij yyyyyyyyyy

    1 11 1

    2

    1 1

    2

    1 1

    2 ))((2)()()(

    Siendo el tercer trmino 0, finalmente obtenemos:

    cNSC

    cSC

    NSC

    yyyynyy

    residualGruposTotal

    c

    j

    n

    ijij

    c

    jTj

    c

    j

    n

    iTij

    +

    =

    += = === =

    11

    )()()(1 1

    2

    1

    2

    1 1

    2

  • ANOVA DE UN FACTOR

    GrupoTotalsidual SCSCSC =Re

    Fuente de variacin

    Sumas de cuadrados Gradosde

    libertad

    VarianciasCM

    F

    Entregrupos

    Total

    =

    =

    c

    jTjGrupo yynSC

    1

    2)(

    = =

    =

    c

    j

    n

    iTijTotal yySC

    1 1

    2)(

    Grup

    Grup

    GLSC

    sidual

    sidual

    GLSC

    Re

    Re

    Total

    Total

    GLSC

    1c

    cN

    1N

    sidual

    Grupo

    CMCM

    Re

    Residual

  • Anlisis Varianza del Ejemplo

    Prueba de homogeneidad de varianzas

    RESUL

    2,744 3 36 ,057

    Estadsticode Levene gl1 gl2 Sig.

    ANOVA

    RESUL

    425,807 3 141,936 5,028 ,0051016,308 36 28,2311442,115 39

    Inter-gruposIntra-gruposTotal

    Suma decuadrados gl

    Mediacuadrtica F Sig.

    Pruebas robustas de igualdad de las medias

    RESUL

    4,825 3 19,409 ,0115,028 3 27,353 ,007

    WelchBrown-Forsythe

    Estadsticoa gl1 gl2 Sig.

    Distribuidos en F asintticamente.a.

    Pasos

    1

    2a

    2b

    GRUPO

    C4C3C2Azar

    Med

    ia d

    e R

    ES

    UL

    20

    18

    16

    14

    12

    10

  • Anlisis Varianza del EjemploPaso 3 Aceptamos la Hiptesis Alternativa, Cul es la conclusin?Quin es distinto de quin?Son distintos C2 C3 y C4 en promedio del grupo Azar?Es distinto C4 de C2 y C3 juntos?

    TENEMOS 2 OPCIONES PARA CONTESTAR:

    CONTRASTESMediante las opciones POLINOMICO y COEFICINETES se puede dividir las sumas de cuadrados inter-grupos en componentes de tendencia o especificar contrastes a priori.

    POST-HOCLas pruebas de rango post hoc y las comparaciones mltiples por parejas permiten determinar qu medias difieren. Las pruebas de rango identifican subconjuntos homogneos de medias que no se diferencian entre s. Las comparaciones mltiples por parejas contrastan la diferencia entre cada pareja de medias y dan lugar a una matriz donde los asteriscos indican las medias de grupo significativamente diferentes a un nivel alfa de 0,05.

  • Comparaciones mltiples

    Variable dependiente: RESULScheff

    7,55* 2,376 ,029 ,59 14,527,65* 2,376 ,026 ,69 14,622,75 2,376 ,720 -4,21 9,72

    -7,55* 2,376 ,029 -14,52 -,59,10 2,376 1,000 -6,87 7,07

    -4,80 2,376 ,270 -11,77 2,17-7,65* 2,376 ,026 -14,62 -,69

    -,10 2,376 1,000 -7,07 6,87-4,90 2,376 ,254 -11,87 2,07-2,75 2,376 ,720 -9,72 4,214,80 2,376 ,270 -2,17 11,774,90 2,376 ,254 -2,07 11,87

    (J) GRUPOC2C3C4AzarC3C4AzarC2C4AzarC2C3

    (I) GRUPOAzar

    C2

    C3

    C4

    Diferencia demedias (I-J) Error tpico Sig. Lmite inferior

    Lmitesuperior

    Intervalo de confianza al95%

    La diferencia entre las medias es significativa al nivel .05.*.

  • Mediante comparaciones mltiples no podemos contestar este tipo de cuestiones:

    Son distintos C2 C3 y C4 en promedio del grupo Azar?

    Coeficientes de los contrastes

    0 -,5 -,5 1Contraste1

    Azar C2 C3 C4GRUPO

    Pruebas para los contrastes

    4,85 2,058 2,357 36 ,024

    4,85 1,641 2,956 20,367 ,008

    Contraste1

    1

    Asumiendo igualdadde varianzasNo asumiendoi ld d d i

    RESUL

    Valor delcontraste Error tpico t gl Sig. (bilateral)

    Coeficientes de los contrastes

    -1 ,33 ,33 ,33Contraste1

    Azar C2 C3 C4GRUPO

    Pruebas para los contrastes

    -6,12a

    1,935 -3,161 36 ,003

    -6,12a 2,418 -2,530 11,385 ,027

    Contraste1

    1

    Asumiendo igualdadde varianzasNo asumiendoi ld d d i

    RESUL

    Valor delcontraste Error tpico t gl Sig. (bilateral)

    La suma de los coeficientes del contraste no es cero.a.

    Es distinto C4 de C2 y C3 juntos?