prueba para dos medias o dos varianzas (1)

Upload: franckiko2

Post on 07-Jul-2018

246 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)

    1/7

     

    EJEMPLO

    Ejemplo 10.4 extraído del libro “Métodos Estadísticos. Un enfoque interdisciplinario”

    de Gil y Zárate de Lara (1998), pág. 363.

    En un experimento con plantas de soja se compararon dos tratamientos

    consistentes en proporcionar el riego de auxilio cuando se tenían diferentes niveles

    de humedad aprovechable en el suelo. Para el primer nivel (10 %  ) se usaron 12

    unidades experimentales, y para el segundo nivel (40 %  ) se usaron 9 unidaes. Cada

    unidad experimental es una superficie rectangular de 7 x 4 metros, en los que se

    sembró la misma variedad de soja. En lo posible se trató que las unidades

    experimentales tuvieran constantes los demás factores (fertilización, prácticas de

    cultivo, densidad de siembra, etc.) que pueden afectar el rendimiento, que es la

    respuesta que se comparó. De cualquier manera, puesto que es imposible tenerunidades completamente homogéneas, se decidió mediante un mecanismo aleatorio

    qué unidades experimentales llevarían cada tratamiento. La aleatorización fue

    irrestricta, por lo que se obtuvieron dos muestras aleatorias independientes. Las

    respuestas observadas son:

    Rendimiento (Kg/ha)

    1735 2002 1820 2082 1894 1816

    10% de humedad aprovechable 2008 1758 1898 2223 2873 2313

    3403 3294 2899 3350 3212 296440% de humedad aprovechable

    3098 2984 2492

    Estos datos puede están disponibles en el archivo ejemplo soja.xls. Para

    importarlos a R puede consultar Cómo crear conjuntos de datos en R.

  • 8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)

    2/7

      PRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIASPRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIASPRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIASPRUEBA DE HIPÓTESIS PARA COMPARAR DOS MEDIAS

    En este ejemplo se desea realizar una prueba de hipótesis para comparar dos

    promedios poblaciones, a partir de muestras independientes y donde puede

    asumirse que la distribución para la variable respuesta (rendimiento) es normal.

    La hipótesis nula que se quiere probar es simplemente que las medias de

    rendimiento son iguales, contra la hipótesis alternativa de que son diferentes. Es

    decir,

    H0: 21   µ  µ    =   (No hay diferencias entre los rendimientos medios poblacionales

    obtenidos para niveles de 10% y 40% de humedad aprovechable en el suelo)

    H1: 21   µ  µ    ≠  (Los rendimientos medios poblacionales, obtenidos para niveles

    de 10% y 40% de humedad aprovechable en el suelo, son diferentes)

    La elección del estadístico para probar estas hipótesis depende del

    conocimiento o no de las varianzas poblaciones (en general, son desconocidas) y de

    si las mismas son iguales o distintas. Si puede asumirse que las varianzas

    poblacionales de la variable respuesta son iguales, se puede usar una prueba t de

    Student, que utiliza el estadístico

    2nH

    21

    2

    2121

    00

    t~11

      −+

     

      

     +

    −= n 

    n n S 

    x x t   

    donde

    1x   y 2x    son las medias muestrales correspondientes a los dos grupos,

    n 1 y n 2   son los tamaños de muestra correspondientes a los dos grupos, y

    2a S    es un promedio ponderado de las varianzas muestrales (

    21S    y 

    22S  )

    correspondientes a los dos grupos, es decir,( ) ( )

    2

    11

    21

    222

    2112

    −+

    −+−=

    n n 

    S n S n S a  . 

    En el ejemplo, una comparación visual de los diagramas de puntos para los dos

    niveles de humedad aprovechable del suelo (obtenido siguiendo la ruta GraficasGraficasGraficasGraficas  

  • 8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)

    3/7

    Diagrama de puntosDiagrama de puntosDiagrama de puntosDiagrama de puntos) sugiere que podría asumirse que las varianzas poblacionales

    de los rendimientos, correspondientes a los dos niveles de humedad, son

    homogéneas.

    1 2

         2     0     0     0

         2     5

         0     0

         3     0     0     0

    humedad

        r    e    n     d     i    m     i    e    n     t    o

     

    Sin embargo, si deseamos verificarlo podemos realizar una prueba de

    hipótesis como la propuesta en la próxima sección.

    Para poner a prueba la hipótesis de igualdad de medias se selecciona:

    EstadísticosEstadísticosEstadísticosEstadísticos  MediasMediasMediasMedias  Test t para muestras independientesTest t para muestras independientesTest t para muestras independientesTest t para muestras independientes

    y en la ventana de diálogo que se despliega se podrá seleccionar o indicar:

    1.  la variable categórica (factor) que identifica a los dos grupos, en este caso

    humedadhumedadhumedadhumedad (asegúrese de hacer click sobre la variable para que en el campo

    “diferencias” se muestre en que orden se hará la diferencia de medias y no

    diga “no hay grupos seleccionados”),

    2.  la variable sobre la cual queremos probar la igualdad de medias, en este caso

    rendimientorendimientorendimientorendimiento,

  • 8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)

    4/7

    3.  la hipótesis alternativa adecuada según el problema y de acuerdo a como

    haya quedado planteada la diferencia de medias (en este caso, la hipótesis

    alternativa es bilateral),

    4.  el nivel de confianza para la construcción de un intervalo para la diferencia

    entre las medias poblacionales,

    5.  si puede asumirse o no que las varianzas son iguales (en este caso,

    asumiremos que son homogéneas).

    Se debe tener en cuenta que, de acuerdo a las hipótesis que se hayan

    planteado y a si puede o no asumirse que las varianzas poblacionales son iguales,

    los ítems seleccionados en esta ventana variarán.

    Para el ejemplo planteado, la ventana de resultados mostrará lo siguiente:

  • 8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)

    5/7

     

    Si trabajamos con un nivel de significación α = 0,05, el valor p

  • 8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)

    6/7

      21S   y 22S   y n 1 y n 2   son las varianzas muestrales y los tamaños de muestra

    correspondientes a los dos grupos,

    En RCmdr, esta prueba puede realizarse siguiendo estos pasos:

    EstadísticosEstadísticosEstadísticosEstadísticos VarianzasVarianzasVarianzasVarianzas  Test F para dos varianzasTest F para dos varianzasTest F para dos varianzasTest F para dos varianzas

    Esta secuencia abre una ventana de diálogo donde podemos seleccionar:

    1.  la variable categórica (factor) que identifica a los dos grupos, en este caso

    humedadhumedadhumedadhumedad (asegúrese de hacer click sobre la variable para que en el campo

    “diferencias” se muestre en que orden se hará la diferencia y no diga “no hay

    grupos seleccionados”),

    2.  la variable sobre la cual queremos probar la igualdad de varianzas, en este

    caso rendimientorendimientorendimientorendimiento,

    3.  la hipótesis alternativa adecuada según el problema y como haya quedado

    planteada la diferencia (en este caso es bilateral)

    4.  el nivel de confianza para la construcción de un intervalo para el cociente

    entre las varianzas poblacionales (donde el cociente se realiza en el mismo

    orden que la diferencia).

    En la ventana de resultados se mostrará lo siguiente:

  • 8/18/2019 Prueba Para Dos Medias o Dos Varianzas (1)

    7/7

     

    donde encontramos el valor calculado del estadístico F, sus grados de libertad (df) y

    el valor p correspondiente.

    Además, se brinda el intervalo de confianza para el cociente entre las

    varianzas, y la estimación puntual de dicho cociente claramente coincide con el

    valor calculado del estadístico.

    En este caso particular, como el valor p > 0,05, no hay motivos para rechazar

    la igualdad de varianzas.

    Una forma alternativa para comparar las varianzas de dos poblaciones

    consiste en construir un intervalo de confianza para la relación entre las varianzas,

    2

    1

    2

    2

    σ 

    σ . Como podemos ver, el intervalo de confianza para dicha relación tiene como

    límite inferior a 0,299 y como límite superior a 4,643, es decir que el valor “1”

    pertenece al intervalo. Como el “1” resulta ser un valor probable para el cociente de

    varianzas, no podemos rechazar la hipótesis de igualdad de las varianzas.