prueba para dos medias o dos varianzas (1)
TRANSCRIPT
-
8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)
1/7
EJEMPLO
Ejemplo 10.4 extraído del libro “Métodos Estadísticos. Un enfoque interdisciplinario”
de Gil y Zárate de Lara (1998), pág. 363.
En un experimento con plantas de soja se compararon dos tratamientos
consistentes en proporcionar el riego de auxilio cuando se tenían diferentes niveles
de humedad aprovechable en el suelo. Para el primer nivel (10 % ) se usaron 12
unidades experimentales, y para el segundo nivel (40 % ) se usaron 9 unidaes. Cada
unidad experimental es una superficie rectangular de 7 x 4 metros, en los que se
sembró la misma variedad de soja. En lo posible se trató que las unidades
experimentales tuvieran constantes los demás factores (fertilización, prácticas de
cultivo, densidad de siembra, etc.) que pueden afectar el rendimiento, que es la
respuesta que se comparó. De cualquier manera, puesto que es imposible tenerunidades completamente homogéneas, se decidió mediante un mecanismo aleatorio
qué unidades experimentales llevarían cada tratamiento. La aleatorización fue
irrestricta, por lo que se obtuvieron dos muestras aleatorias independientes. Las
respuestas observadas son:
Rendimiento (Kg/ha)
1735 2002 1820 2082 1894 1816
10% de humedad aprovechable 2008 1758 1898 2223 2873 2313
3403 3294 2899 3350 3212 296440% de humedad aprovechable
3098 2984 2492
Estos datos puede están disponibles en el archivo ejemplo soja.xls. Para
importarlos a R puede consultar Cómo crear conjuntos de datos en R.
-
8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)
2/7
PRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIASPRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIASPRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIASPRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIAS
En este ejemplo se desea realizar una prueba de hipótesis para comparar dos
promedios poblaciones, a partir de muestras independientes y donde puede
asumirse que la distribución para la variable respuesta (rendimiento) es normal.
La hipótesis nula que se quiere probar es simplemente que las medias de
rendimiento son iguales, contra la hipótesis alternativa de que son diferentes. Es
decir,
H0: 21 µ µ = (No hay diferencias entre los rendimientos medios poblacionales
obtenidos para niveles de 10% y 40% de humedad aprovechable en el suelo)
H1: 21 µ µ ≠ (Los rendimientos medios poblacionales, obtenidos para niveles
de 10% y 40% de humedad aprovechable en el suelo, son diferentes)
La elección del estadístico para probar estas hipótesis depende del
conocimiento o no de las varianzas poblaciones (en general, son desconocidas) y de
si las mismas son iguales o distintas. Si puede asumirse que las varianzas
poblacionales de la variable respuesta son iguales, se puede usar una prueba t de
Student, que utiliza el estadístico
2nH
21
2
2121
00
t~11
−+
+
−= n
a
H
n n S
x x t
donde
1x y 2x son las medias muestrales correspondientes a los dos grupos,
n 1 y n 2 son los tamaños de muestra correspondientes a los dos grupos, y
2a S es un promedio ponderado de las varianzas muestrales (
21S y
22S )
correspondientes a los dos grupos, es decir,( ) ( )
2
11
21
222
2112
−+
−+−=
n n
S n S n S a .
En el ejemplo, una comparación visual de los diagramas de puntos para los dos
niveles de humedad aprovechable del suelo (obtenido siguiendo la ruta GraficasGraficasGraficasGraficas
-
8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)
3/7
Diagrama de puntosDiagrama de puntosDiagrama de puntosDiagrama de puntos) sugiere que podría asumirse que las varianzas poblacionales
de los rendimientos, correspondientes a los dos niveles de humedad, son
homogéneas.
1 2
2 0 0 0
2 5
0 0
3 0 0 0
humedad
r e n d i m i e n t o
Sin embargo, si deseamos verificarlo podemos realizar una prueba de
hipótesis como la propuesta en la próxima sección.
Para poner a prueba la hipótesis de igualdad de medias se selecciona:
EstadísticosEstadísticosEstadísticosEstadísticos MediasMediasMediasMedias Test t para muestras independientesTest t para muestras independientesTest t para muestras independientesTest t para muestras independientes
y en la ventana de diálogo que se despliega se podrá seleccionar o indicar:
1. la variable categórica (factor) que identifica a los dos grupos, en este caso
humedadhumedadhumedadhumedad (asegúrese de hacer click sobre la variable para que en el campo
“diferencias” se muestre en que orden se hará la diferencia de medias y no
diga “no hay grupos seleccionados”),
2. la variable sobre la cual queremos probar la igualdad de medias, en este caso
rendimientorendimientorendimientorendimiento,
-
8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)
4/7
3. la hipótesis alternativa adecuada según el problema y de acuerdo a como
haya quedado planteada la diferencia de medias (en este caso, la hipótesis
alternativa es bilateral),
4. el nivel de confianza para la construcción de un intervalo para la diferencia
entre las medias poblacionales,
5. si puede asumirse o no que las varianzas son iguales (en este caso,
asumiremos que son homogéneas).
Se debe tener en cuenta que, de acuerdo a las hipótesis que se hayan
planteado y a si puede o no asumirse que las varianzas poblacionales son iguales,
los ítems seleccionados en esta ventana variarán.
Para el ejemplo planteado, la ventana de resultados mostrará lo siguiente:
-
8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)
5/7
Si trabajamos con un nivel de significación α = 0,05, el valor p
-
8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)
6/7
21S y 22S y n 1 y n 2 son las varianzas muestrales y los tamaños de muestra
correspondientes a los dos grupos,
En RCmdr, esta prueba puede realizarse siguiendo estos pasos:
EstadísticosEstadísticosEstadísticosEstadísticos VarianzasVarianzasVarianzasVarianzas Test F para dos varianzasTest F para dos varianzasTest F para dos varianzasTest F para dos varianzas
Esta secuencia abre una ventana de diálogo donde podemos seleccionar:
1. la variable categórica (factor) que identifica a los dos grupos, en este caso
humedadhumedadhumedadhumedad (asegúrese de hacer click sobre la variable para que en el campo
“diferencias” se muestre en que orden se hará la diferencia y no diga “no hay
grupos seleccionados”),
2. la variable sobre la cual queremos probar la igualdad de varianzas, en este
caso rendimientorendimientorendimientorendimiento,
3. la hipótesis alternativa adecuada según el problema y como haya quedado
planteada la diferencia (en este caso es bilateral)
4. el nivel de confianza para la construcción de un intervalo para el cociente
entre las varianzas poblacionales (donde el cociente se realiza en el mismo
orden que la diferencia).
En la ventana de resultados se mostrará lo siguiente:
-
8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)
7/7
donde encontramos el valor calculado del estadístico F, sus grados de libertad (df) y
el valor p correspondiente.
Además, se brinda el intervalo de confianza para el cociente entre las
varianzas, y la estimación puntual de dicho cociente claramente coincide con el
valor calculado del estadístico.
En este caso particular, como el valor p > 0,05, no hay motivos para rechazar
la igualdad de varianzas.
Una forma alternativa para comparar las varianzas de dos poblaciones
consiste en construir un intervalo de confianza para la relación entre las varianzas,
2
1
2
2
σ
σ . Como podemos ver, el intervalo de confianza para dicha relación tiene como
límite inferior a 0,299 y como límite superior a 4,643, es decir que el valor “1”
pertenece al intervalo. Como el “1” resulta ser un valor probable para el cociente de
varianzas, no podemos rechazar la hipótesis de igualdad de las varianzas.