prueba para dos medias o dos varianzas (1)

8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)

1/7

EJEMPLO

Ejemplo 10.4 extraído del libro “Métodos Estadísticos. Un enfoque interdisciplinario”

de Gil y Zárate de Lara (1998), pág. 363.

En un experimento con plantas de soja se compararon dos tratamientos

consistentes en proporcionar el riego de auxilio cuando se tenían diferentes niveles

de humedad aprovechable en el suelo. Para el primer nivel (10 % ) se usaron 12

unidades experimentales, y para el segundo nivel (40 % ) se usaron 9 unidaes. Cada

unidad experimental es una superficie rectangular de 7 x 4 metros, en los que se

sembró la misma variedad de soja. En lo posible se trató que las unidades

experimentales tuvieran constantes los demás factores (fertilización, prácticas de

cultivo, densidad de siembra, etc.) que pueden afectar el rendimiento, que es la

respuesta que se comparó. De cualquier manera, puesto que es imposible tenerunidades completamente homogéneas, se decidió mediante un mecanismo aleatorio

qué unidades experimentales llevarían cada tratamiento. La aleatorización fue

irrestricta, por lo que se obtuvieron dos muestras aleatorias independientes. Las

respuestas observadas son:

Rendimiento (Kg/ha)

1735 2002 1820 2082 1894 1816

10% de humedad aprovechable 2008 1758 1898 2223 2873 2313

3403 3294 2899 3350 3212 296440% de humedad aprovechable

3098 2984 2492

Estos datos puede están disponibles en el archivo ejemplo soja.xls. Para

importarlos a R puede consultar Cómo crear conjuntos de datos en R.


2/7

PRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIASPRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIASPRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIASPRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIAS

En este ejemplo se desea realizar una prueba de hipótesis para comparar dos

promedios poblaciones, a partir de muestras independientes y donde puede

asumirse que la distribución para la variable respuesta (rendimiento) es normal.

La hipótesis nula que se quiere probar es simplemente que las medias de

rendimiento son iguales, contra la hipótesis alternativa de que son diferentes. Es

decir,

H0: 21 µ µ = (No hay diferencias entre los rendimientos medios poblacionales

obtenidos para niveles de 10% y 40% de humedad aprovechable en el suelo)

H1: 21 µ µ ≠ (Los rendimientos medios poblacionales, obtenidos para niveles

de 10% y 40% de humedad aprovechable en el suelo, son diferentes)

La elección del estadístico para probar estas hipótesis depende del

conocimiento o no de las varianzas poblaciones (en general, son desconocidas) y de

si las mismas son iguales o distintas. Si puede asumirse que las varianzas

poblacionales de la variable respuesta son iguales, se puede usar una prueba t de

Student, que utiliza el estadístico

2nH

21

2

2121

00

t~11

−+

+

−= n

a

H

n n S

x x t

donde

1x y 2x son las medias muestrales correspondientes a los dos grupos,

n 1 y n 2 son los tamaños de muestra correspondientes a los dos grupos, y

2a S es un promedio ponderado de las varianzas muestrales (

21S y

22S )

correspondientes a los dos grupos, es decir,( ) ( )

2

11

21

222

2112

−+

−+−=

n n

S n S n S a .

En el ejemplo, una comparación visual de los diagramas de puntos para los dos

niveles de humedad aprovechable del suelo (obtenido siguiendo la ruta GraficasGraficasGraficasGraficas


3/7

Diagrama de puntosDiagrama de puntosDiagrama de puntosDiagrama de puntos) sugiere que podría asumirse que las varianzas poblacionales

de los rendimientos, correspondientes a los dos niveles de humedad, son

homogéneas.

1 2

2 0 0 0

2 5

0 0

3 0 0 0

humedad

r e n d i m i e n t o

Sin embargo, si deseamos verificarlo podemos realizar una prueba de

hipótesis como la propuesta en la próxima sección.

Para poner a prueba la hipótesis de igualdad de medias se selecciona:

EstadísticosEstadísticosEstadísticosEstadísticos MediasMediasMediasMedias Test t para muestras independientesTest t para muestras independientesTest t para muestras independientesTest t para muestras independientes

y en la ventana de diálogo que se despliega se podrá seleccionar o indicar:

1. la variable categórica (factor) que identifica a los dos grupos, en este caso

humedadhumedadhumedadhumedad (asegúrese de hacer click sobre la variable para que en el campo

“diferencias” se muestre en que orden se hará la diferencia de medias y no

diga “no hay grupos seleccionados”),

2. la variable sobre la cual queremos probar la igualdad de medias, en este caso

rendimientorendimientorendimientorendimiento,


4/7

3. la hipótesis alternativa adecuada según el problema y de acuerdo a como

haya quedado planteada la diferencia de medias (en este caso, la hipótesis

alternativa es bilateral),

4. el nivel de confianza para la construcción de un intervalo para la diferencia

entre las medias poblacionales,

5. si puede asumirse o no que las varianzas son iguales (en este caso,

asumiremos que son homogéneas).

Se debe tener en cuenta que, de acuerdo a las hipótesis que se hayan

planteado y a si puede o no asumirse que las varianzas poblacionales son iguales,

los ítems seleccionados en esta ventana variarán.

Para el ejemplo planteado, la ventana de resultados mostrará lo siguiente:


5/7

Si trabajamos con un nivel de significación α = 0,05, el valor p


6/7

21S y 22S y n 1 y n 2 son las varianzas muestrales y los tamaños de muestra

correspondientes a los dos grupos,

En RCmdr, esta prueba puede realizarse siguiendo estos pasos:

EstadísticosEstadísticosEstadísticosEstadísticos VarianzasVarianzasVarianzasVarianzas Test F para dos varianzasTest F para dos varianzasTest F para dos varianzasTest F para dos varianzas

Esta secuencia abre una ventana de diálogo donde podemos seleccionar:

1. la variable categórica (factor) que identifica a los dos grupos, en este caso

humedadhumedadhumedadhumedad (asegúrese de hacer click sobre la variable para que en el campo

“diferencias” se muestre en que orden se hará la diferencia y no diga “no hay

grupos seleccionados”),

2. la variable sobre la cual queremos probar la igualdad de varianzas, en este

caso rendimientorendimientorendimientorendimiento,

3. la hipótesis alternativa adecuada según el problema y como haya quedado

planteada la diferencia (en este caso es bilateral)

4. el nivel de confianza para la construcción de un intervalo para el cociente

entre las varianzas poblacionales (donde el cociente se realiza en el mismo

orden que la diferencia).

En la ventana de resultados se mostrará lo siguiente:


7/7

donde encontramos el valor calculado del estadístico F, sus grados de libertad (df) y

el valor p correspondiente.

Además, se brinda el intervalo de confianza para el cociente entre las

varianzas, y la estimación puntual de dicho cociente claramente coincide con el

valor calculado del estadístico.

En este caso particular, como el valor p > 0,05, no hay motivos para rechazar

la igualdad de varianzas.

Una forma alternativa para comparar las varianzas de dos poblaciones

consiste en construir un intervalo de confianza para la relación entre las varianzas,

2

1

2

2

σ

σ . Como podemos ver, el intervalo de confianza para dicha relación tiene como

límite inferior a 0,299 y como límite superior a 4,643, es decir que el valor “1”

pertenece al intervalo. Como el “1” resulta ser un valor probable para el cociente de

varianzas, no podemos rechazar la hipótesis de igualdad de las varianzas.

prueba para dos medias o dos varianzas (1)

Documents