anova de dos factores

19
Universidad Autónoma de Madrid Análisis de Datos en Psicología II Tema 7 1 ANOVA de dos factores Tema 7 1. Objetivo. Concepto de interacción 2. ANOVA de dos factores, efectos fijos, completamente aleatoriazado (ANOVA-AB-EF-CA) 3. Comparaciones múltiples

Upload: aldrin-hernandez

Post on 03-Mar-2015

82 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

1

ANOVA de dos factores Tema 7

1. Objetivo. Concepto de interacción 2. ANOVA de dos factores, efectos

fijos, completamente aleatoriazado (ANOVA-AB-EF-CA)

3. Comparaciones múltiples

Page 2: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

2

1. Objetivo: estudiar si los valores de una variable dependiente (VD) dependen de los niveles de dos VVII (factores) o de la interacción entre ambas. La primera VI se denomina A y tiene J niveles. La segunda VI es B y tiene K niveles. Interacción Existe interacción entre dos factores cuando el efecto de un factor sobre la VD depende de cual sea el nivel del otro factor. Ejemplo: Efecto de dos factores: Edad (joven, medio, adulto) y Fumar (sí, no) sobre las puntuaciones en una escala de Ansiedad Social.

Page 3: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

3

Gráficos de medias

Caso 1: Sin efectos principales de los factores ni interacción

Caso 2: Efectos principales sin interacción

EDAD

321

Ans

ieda

d

8

7

6

5

4

3

FUMAR

0

1

EDAD

321

Ans

ieda

d

8

7

6

5

4

3

2

1

0

FUMAR

0

1

Fumar Edad No Si µj+

1 µ11=7 µ12=7 µ1+=72 µ21=7 µ22=7 µ2+=73 µ31=7 µ32=7 µ3+=7

µ+k µ+1=7 µ+2=7 µjk

Fumar Edad No Si

1 µ11=1 µ12=3 µ1+=22 µ21=3 µ22=5 µ2+=43 µ31=5 µ32=7 µ3+=6 µ+1=3 µ+2=5

Page 4: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

4

Gráficos de medias Caso 3: Interacción sin

efectos principales. Caso 4: Efectos

principales e interacción.

EDAD

321

Ans

ieda

d

8

7

6

5

4

3

2

FUMAR

0

1

EDAD

321

Ans

ieda

d

9

8

7

6

5

4

3

2

FUMAR

0

1

Fumar

Edad No Si 1 µ11=5 µ12=5 µ1+=52 µ21=3 µ22=7 µ2+=53 µ31=7 µ32=3 µ3+=5 µ+1=5 µ+2=5 µ11 - µ21 = 5 – 3 = 2 µ1+ - µ2+ = 5 – 5 = 0

Fumar

Edad No Si 1 µ11=8 µ12=4 µ1+=62 µ21=5 µ22=3 µ2+=43 µ31=5 µ32=5 µ3+=5 µ+1=6 µ+2=4

Page 5: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

5

2. Procedimiento del ANOVA AB - EF - CA Estructura de los datos

B1 B2 ... BK

A1

Y111 Y211 …

Yn11

Y112 Y212 …

Yn12 M

Y11K Y21K …

Yn1K

A2

Y121 Y221 …

Yn21

Y122 Y222 …

Yn22 M

Y12K Y22K …

Yn2K

M M M

Y1jk Y2jk …, Yijk ...

Ynjk

M

AJ

Y1J1 Y2J1 …

YnJ1

Y1J2 Y2J2 …

YnJ2 M

Y1JK Y2JK …

YnJK

Page 6: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

6

1. Hipótesis H0(A): µ1+ = µ2+ = … = µJ+ Las J medias poblacionales correspondientes a los J niveles del factor A son iguales H0(B): µ+1 = µ+2 = … = µ+Κ Las K medias poblacionales correspondientes a los K niveles del factor B son iguales H0(AB): µjk − µj’k = µj+− µj’+ No hay efecto de interacción. H1(A): µj+ ≠ µj’+ El factor A influye o afecta a la VD. H1(B): µ+k ≠ µ+k’ El factor B influye o afecta a la VD. H1(AB): µjk − µj’k ≠ µj+− µj’+ Hay interacción.

Page 7: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

7

2. Supuestos Independencia: Las JK muestras de tamaño n son aleatorias e independientes Normalidad: Las JK poblaciones de donde se extraen las JK muestras son normales Homocedasticidad: Las JK poblaciones tienen, todas ellas, la misma varianza 3. Estadístico de contraste J : niveles del factor A K : niveles del factor B n : nº de observaciones en cada casilla N : nº total de observaciones (N=nJK) Tj+ : Totales de cada nivel del factor A T+k : Totales de cada nivel del factor B Tjk : Totales de cada casilla T : Total de la muestra

Page 8: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

8

Sumas de cuadrados

NTYSCT

i j kijk

22 −= ∑∑∑

NT

nK

TSCA j

j 22

−=∑ +

NT

nJ

TSCB k

k 22

−=∑ +

NT

nJ

T

nK

T

n

TSCAB k

kj

jj k

jk 2222

+−−=∑∑∑∑ ++

n

TYSCE j k

jk

i j kijk

∑∑∑∑∑ −=

2

2

SCT = SCA + SCB + SCAB + SCE

Page 9: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

9

Tabla resumen del ANOVA AB-EF- CA

FV SC g.l. MC F Factor A SCA J – 1 1J-

SCA MCE

MCAFA =

Factor B SCB K – 1 1K-

SCB MCE

MCBFB =

Interacción SCAB (J – 1)(K – 1) ))(K- (J - SCAB

11 MCEMCABFAB =

Error SCE N - JK

N-JK SCE

Total

SCT N – 1

Zona crítica

FA se distribuye según FJ-1, N-JK, luego la zona crítica es FA ≥ 1-αFJ-1, N-JK

FB se distribuye según FK-1, N-JK, luego la zona crítica es FB ≥ 1-αFK-1, N-JK

FAB se distribuye según F(J-1)(K-1), N-JK, luego la zona crítica es FAB ≥ 1-αF(J-1)(K-1),

N-JK

Page 10: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

10

4. Regla de decisión

Rechazar H0(A) si el estadístico FA cae en la zona crítica. Mantener H0(A) en caso contrario

Rechazar H0(B) si el estadístico FB cae en la zona crítica. Mantener H0(B) en caso contrario

Rechazar H0(AB) si FAB cae en la zona crítica. Mantener H0(AB) en caso contrario

Ejemplo: Estudiar el efecto de las variables Edad y Fumar sobre la Ansiedad Social con α=0,01.

Fumar No Si

1 3,91 5,01 4,47 3,33 4,71

4,83 3,95 4,043,66 9,44

2 5,65 6,49 5,50 5,72 5,44

9,66 7,68 9,57 7,98 7,39Edad

3 4,94 7,13 5,54 5,94 6,16

5,92 5,48 5,196,12 4,45

Page 11: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

11

1. Hipótesis H0(A): µ1+ = µ2+ = µ3+ (Edad) H0(B): µ+1 = µ+2 (Fumar) H0(AB): µjk − µj’k = µj+− µj’+ (Interacción)

H1(A): µj+ ≠ µj’+ H1(B): µ+k ≠ µ+k’ H1(AB): µjk − µj’k ≠ µj+− µj’+

2. Supuestos Independencia Normalidad Homocedasticidad

3. Estadístico de contraste Tabla de totales: Fumar No Sí

1 T11 = 21,40 T12 = 25,90 T1+ = 47,302 T21 = 28,77 T22 = 42,23 T2+ = 71,00Edad 3 T31 = 29,69 T32 = 27,13 T3+ = 56,82

T+1 = 79,86 T+2 = 95,26 T = 175,12

J = 3 n = 5 K = 2 N = 5(3)2 = 30

3911062 ,Yi j k

ijk =∑∑∑

Page 12: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

12

16,8430

1217539110622

2 =−=−= ∑∑∑ ,,NTYSCT

i j kijk

90730

1217535

269535

8679 22222

,,)(

,)(

,NT

nJ

TSCB k

k

=−

+=−=

∑ +

SCAB = SCT - SCA - SCB - SCE

= 84,16 - 28,44 - 7,90 - 34,91 = 12,89

442830

1217525

825625

007125

3047 222222

,,)(

,)(

,)(

,NT

nK

TSCA j

j

=−

++=−=

∑ +

913451327

54021391106

222

2 ,,...,,n

TYSCE j k

jk

i j kijk =

++−=−=

∑∑∑∑∑

Page 13: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

13

FV SC g.l. MC F

Factor A 28,44 2 14,22 9,77 Factor B 7,90 1 7,90 5,43

Interacción 12,89 2 6,44 4,43 Error 34,91 24 1,45 Total 84,16 29

FA ~ F2,24 FB ~ F 1,24 FAB ~ F 2,24 4. Zona crítica FA ≥ 0,99F 2,24 = 5,61 FB ≥ 0,99F 1,24 = 7,82 FAB ≥ 0,99F 2,24 = 5,61 5. Decisión Rechazar H0(A) Mantener H0(B) Mantener H0(AB)

Page 14: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

14

3. Comparaciones múltiples (Tukey)

vNMCEqDMS JKNvTukey /,1 −−= α

Donde: q aparece en la tabla J v : nº de medias que se están comparando:

v = J para el factor A v = K para el factor B v =J K para la interacción Si la interacción es significativa: Representar las medias gráficamente e interpretar.

Page 15: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

15

Ejemplo: Tukey sobre los niveles del factor A, que es el único efecto significativo. Medias:

682,510

82,56 1,71071 73,4

103,47

321 ====== +++ YYY

Tabla de diferencia de medias

2Y 3Y

1Y 2,37 0,952

2Y 1,418

73,1)38,0(55,43/30

45,1/

24,399,0

,1

===

= −−

q

vNMCEqDMS JKNvTukey α

Difieren µ1 y µ2

Page 16: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

16

Formulario del tema 7

ANOVA-AB-EF-CA

NTYSCT

i j kijk

22 −= ∑∑∑

NT

nK

TSCA j

j 22

−=∑ +

NT

nJ

TSCB k

k 22

−=∑ +

NT

nJ

T

nK

T

n

TSCAB k

kj

jj k

jk 2222

+−−=∑∑∑∑ ++

n

TYSCE j k

jk

i j kijk

∑∑∑∑∑ −=

2

2

GLA = J – 1 GLB = K – 1 GLAB = (J – 1)(K – 1) GLE = N - JK GLT = N – 1

Page 17: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

17

1

J- SCAMCA =

1K- SCBMCB =

))(K-(J SCABMCAB

11−=

N-JK SCEMCE =

MCEMCAFA =

MCEMCBFB =

MCEMCABFAB =

FA ∼ 1-αFJ-1, N-JK

FB ~ 1-αFK-1, N-JK

FAB ~ 1-αF(J-1)(K-1), N-JK

Page 18: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

18

Prueba de Tukey

vNMCEqDMS JKNvTukey /,1 −−= α

q ≡ tabla J v = J (factor A) v = K (factor B) v =J K (interacción)

Page 19: Anova de Dos Factores

Universidad Autónoma de Madrid

Análisis de Datos en Psicología II Tema 7

19

Ejercicios recomendados del libro: 7.3 7.7 7.8 7.16