supuestos andeva

25
SUPUESTOS DEL ANALISIS DE VARIANZA Mario Briones L. MV, MSc 2005

Upload: nardy-sandra-villanueva-arotinco

Post on 03-Jul-2015

1.425 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Supuestos andeva

SUPUESTOS DEL ANALISIS DE VARIANZA

Mario Briones L.MV, MSc

2005

Page 2: Supuestos andeva

Principales supuestos Los términos del error son aleatoria,

independiente y normalmente distribuidos.

Las varianzas de los diferentes grupos son homogéneas.

Las varianzas y los promedios de los grupos no están correlacionados.

Los efectos principales son aditivos.

Page 3: Supuestos andeva

Normalidad Las desviaciones de la normalidad

no afectan seriamente la validez del análisis.

Independencia significa que no hay relación entre el tamaño de los términos de error y el grupo al cual pertenecen.

Page 4: Supuestos andeva

Homogeneidad de las varianzas El análisis de varianza utiliza un

cuadrado medio de error combinado, para obtener la mejor estimación de una varianza común a todos los grupos.

Si las varianzas entre los grupos son diferentes no hay justificación para combinarlas.

Page 5: Supuestos andeva

Homogeneidad de las varianzas Ejemplo

µ µ1 µ2 µ3 µ4

Hipótesis nulaverdadera

Hipótesis nula falsa

No existen problemas si las varianzas son igualesentre los grupos.

Varianzas iguales

Page 6: Supuestos andeva

Homogeneidad de las varianzas Ejemplo

µ µ1 µ2 µ3 µ4

Hipótesis nulaverdadera

Hipótesis nula falsa

No existen problemas si las varianzas son igualesentre los grupos.

Varianzas diferentes

Page 7: Supuestos andeva

Ejemplo

A B C D3 6 12 201 8 6 145 7 9 114 4 3 172 5 15 8

PROMEDIO 3 6 9 14

S2 2.5 2.5 22.5 22.5

tratamientos

Page 8: Supuestos andeva

Tabla de Análisis de Varianza

ANÁLISIS DE VARIANZAFV SC GL CM F Probabilidad

Entre grupos 330 3 110 8.8 0.00111862Dentro de los grupos 200 16 12.5

Total 530 19

LSD (diferencia mínima significativa, la menordiferencia entre dos grupos que será estadísticamentesignificativa.

+=

21

11nn

CMtLSD ERROR 74.451

51

5.1212.2 =

+=LSD

Page 9: Supuestos andeva

Conclusión La diferencia mínima significativa es

razonable para la diferencia entre los promedios de C y D pero no lo es para los promedios Ay B.

La solución es analizar los grupos AB y CD por separado.

Page 10: Supuestos andeva

ANÁLISIS DE VARIANZA entre A y BFV SC gl CM F Probabilidad

Entre grupos 22.5 1 22.5 9 0.01707168Dentro de los grupos 20 8 2.5

Total 42.5 9

ANÁLISIS DE VARIANZA entre C y DFV SC gl CM F Probabilidad

Entre grupos 62.5 1 62.5 2.77777778 0.13414064Dentro de los grupos 180 8 22.5

Total 242.5 9

Page 11: Supuestos andeva

Independencia de medias y varianzas A veces existe una relación definida

entre las muestras y sus varianzas. Generalmente invloucra mayor

varianza para las muestras que tienen mayor promedio.

Page 12: Supuestos andeva

Independencia de medias y varianzas Ej. Aplicación de insecticidas para el

control de garrapata en el perro Dos tratamientos poco efectivos: 305 y 315

garrapatas sobrevivientes Dos tratamientos efectivos: 5 y 15 garrapatas

sobrevivientes. Si las varianzas son homogéneas y no

relacionadas con las medias, ambas diferencias tienen la misma importancia dado que tienen la misma magnitud.

Page 13: Supuestos andeva

Independencia de medias y varianzas Otro ejemplo: un investigador desea

probar el efecto de una nueva vitamina sobre el peso de animales y desea incluir varias especies para darle amplitud a sus inferencias.

Las magnitudes de las diferencias de interés en las diferentes especies son completamente diferentes.

Page 14: Supuestos andeva

Supuesto de Aditividad Cada diseño experimental tiene un

modelo matemático denominado modelo lineal aditivo.

Ej. En un análisis con un factor como causa de variación:

Yij= µ+Ai+eij

En un análisis con dos factores (ej. Tratamiento y bloque:

Yijk= µ+ Ai+Bj+eijk

Page 15: Supuestos andeva

Modelo lineal aditivo significa que la varianza de una observación individual (Y), perteneciente a una estructura clasificada de datos, es función de la media poblacional µ, MAS los efectos de las diferentes clasificaciones y el error residual asociado a las observaciones ya clasificadas

Page 16: Supuestos andeva

Por ejemplo, en un diseño en bloque al azar, la linearidad implica que el efecto de un tratamiento es el mismo en todos los bloques y que el efecto de bloque es el mismo para todos los tratamientos.

Page 17: Supuestos andeva

Prueba de Bartlett para homogeneidad de varianzas El test de Bartlett tiene distribución

de Chi cuadrado con un grado de libertad y es igual a

cq

X 3026.220 =

Page 18: Supuestos andeva

Estadístico de Bartlett:

∑=

−−−=a

iiiP SnSaNq

1

210

210 log)1(log)(

N= total de observacionesa= número de gruposS2

i= varianza muestreal del i ésimo grupo

−−−

−+= ∑

=

−−a

ii aNn

ac

1

11 )()1()1(3

11

aN

SnS

a

iii

iP −

−=

∑=1

2)1(

Page 19: Supuestos andeva

En Internet:

home.ubalt.edu/ntsbarsh/Business-stat/otherapplets/BartletTest.htm

Realiza comparación de homogeneidad de varianzashasta en 14 grupos.Se ingresa el número de observaciones por grupo y lavarianza

Page 20: Supuestos andeva

Transformaciones Transformaciones de escala de los

datos permiten corregir muchas de las violaciones de los supuestos

Page 21: Supuestos andeva

Transformación logarítmica Cada vez que las desviaciones

estándares (NO LAS VARIANZAS sean proporcionales a los promedios, la transformación más apropiada será la logarítmica.

También en casos que exista evidencia de efectos multiplicativos en lugar de aditivos.

Page 22: Supuestos andeva

Transformación logarítmica Cualquier logaritmo sirve, base 10 es el

más utilizado. Cuando existen ceros, reemplazan por 1. Si hay muchos ceros no es conveniente

utilizar esta metodología. Antes de la transformación es posible

multiplicar todos los datos por una constante.

Page 23: Supuestos andeva

Transformación de raíz cuadrada Normalmente se aplica cuando se trata de

números que registran acontecimientos poco comunes. Observaciones de animales en transectos. Animales muertos en diferentes grupos. Se calcula directamente la raíz cuadrada y se

hace el ANDEVA o bien se utiliza la siguiente expresión para valores menores a 10

21

´ −= XX

Page 24: Supuestos andeva

Transformación angular o de Bliss Se efectúa para analizar datos de

porcentajes, en los cuales, de modo natural, la varianza no es homogenea. Se saca raiz de la proporción (no del

porcentaje). Se saca seno inverso del resultado.

Page 25: Supuestos andeva

Transformación angular o de Bliss

porcentajes proporción raiz cuadrad seno inverso30 0.3 0.54772256 33.21 32 0.32 0.56568542 34.45 45 0.45 0.67082039 42.13 65 0.65 0.80622577 53.73 47 0.47 0.68556546 43.28 50 0.5 0.70710678 45.00

Formula del seno inverso= ASENO(X)*180/PI()