prueba de hipÓtesis
TRANSCRIPT
Estadística ICM 00166
PRUEBA DE HIPÓTESIS
Esta técnica de inferencia estadística es muy utilizada como apoyo a la investigación científica. Consiste en suponer algún valor para el parámetro de interés y usar los datos de la muestra para aceptar o rechazar esta afirmación.
Es importante entender las diferentes situaciones que pueden ocurrir al probar estadísticamente una hipótesis
Sea Ho: hipótesis que se propone para el parámetro de interés
El Error tipo I se produce al rechazar una hipótesis sin saber que era verdaderaEl Error tipo II se produce al aceptar una hipótesis sin saber que era falsa
Ambos errores pueden tener consecuencias negativas en una situación real. Por lo tanto es importante cuantificar su probabilidad.
Medida del Error tipo I: = P(Rechazar Ho dado que Ho es verdadera)
Medida del Error tipo II: = P(Aceptar Ho dado que otra hipótesis es verdadera)
El valor se denomina nivel de significancia de la prueba y generalmente es un dato dado para realizar la prueba.
Algunos valores típicos para son 10%, 5%, 2%, 1%
TerminologíaHo: Hipótesis nula. Es la hipótesis que se plantea para el parámetroHa: Hipótesis alterna. Es la hipótesis que se plantea en oposición a Ho
y que es aceptada en caso de que Ho sea rechazada
Generalmente, es de interés probar Ha, por lo que se plantea Ho con la esperanza de que sea rechazada utilizando la información de la muestra.
EjemploSuponer que se desea probar que la media poblacional no es igual a 5Entonces se puede plantear:
Ho: = 5Ha: 5
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
Si con los datos de la muestra se puede rechazar Ho, entonces habremos probado Ha
Tipos de pruebasSea : parámetro de interés para la prueba
0: algún valor supuesto para el parámetro Pruebas de una cola
1) Ho: = 0: (hipótesis nula) Ha: < 0: (hipótesis alterna)
2) Ho: = 0: (hipótesis nula) Ha: > 0: (hipótesis alterna)
Prueba de dos colas3) Ho: = 0: (hipótesis nula) Ha: < 0 > 0: (hipótesis alterna)
PROCEDIMIENTO BÁSICO PARA REALIZAR UNA PRUEBA DE HIPÓTESIS
Para entender este procedimiento usamos un caso particular, pero luego podremos extenderlo a otros casos
Parámetro de interés: (media poblacional)Estimador: (media muestral)n 30: (muestra grande)Suponer que proponemos 0 un valor específico para el parámetro
1) Formular la hipótesis nula:Ho: = 0
2) Formular una hipótesis alterna que interesa probar, elegir una entre:Ha: < 0
Ha: > 0
Ha: < 0 > 0
3) Especificar el nivel de significancia de la prueba
4) Seleccionar el estadístico de prueba y definir la región de rechazo de Ho
Por el teorema del límite central el estadístico
, tiene distribución normal estándar aproximadamente
La región de rechazo depende de la hipótesis alterna Ha y está definida por :
Ho: = 0
Ha: < 0
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
La media muestral es un estimador insesgado y su valor esperado es igual al valor propuesto 0 para el parámetro. Por lo tanto, el valor obtenido para la media muestral debería estar cercano a este valor 0.
Si el valor de Z correspondiente a la media muestral cae en la región de rechazo, debe entenderse que es una evidencia de que la media propuesta para el parámetro, = 0, no es verdad y que debería ser algún valor más pequeño: < 0
Con esta interpretación rechazamos Ho en favor de Ha
Sin embargo, siendo una variable aleatoria, es posible que aún siendo verdad que el valor supuesto 0 es verdadero, el valor de la media muestral puede caer en la región de rechazo.
Esto constituye el Error tipo I, y la probabilidad que esto ocurra es .
Esta interpretación debe ayudar a entender los siguientes casos:
Ho: = 0
Ha: > 0
Ho: = 0
Ha: < 0 > 0 .
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
5) Con los datos de la muestra calcule el valor del estadístico
6) Si el valor del estadístico de prueba cae en la región de rechazo, la decisión es rechazar Ho en favor de Ha. Pero, si el valor no cae en esta región crítica, se dice que no hay evidencia suficiente para rechazar Ho. En este caso es preferible abstenerse de aceptar Ho como verdadera pues esto puede introducir el Error tipo II
EjemploUna muestra aleatoria de 100 paquetes mostró un peso promedio de 71.8 gr. con una desviación estándar de 8.9 gr.
Pruebe, con un nivel de significancia de 5%, que el peso promedio de todos los paquetes (población) es mayor a 70 gr.
SoluciónSeguimos los pasos indicados en el procedimiento básico dado:
1) Hipótesis nulaHo: = 70
2) Hipótesis alternaHa: > 70
3) Nivel de significancia = 0.05
4) Estadístico de prueba
por el Teorema del Límite Central, además 2 s2
Región de rechazoz = z0.05 = 1.645
Rechazar Ho en favor de Ha, si z > 1.645
5) Valor del estadístico
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
= = 2.02
6) DecisiónDebido a que 2.02 > 1.645, se rechaza Ho y se concluye, con una significancia de 5%, que el peso promedio de la población es mayora 70 gr,
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
PRUEBA DE HIPÓTESIS
DEFINICIÓN
PROBABILIDAD DE COLAEs el nivel de significancia obtenido con los datos de la muestra .
EjemploCalcule la probabilidad de cola con los datos del ejemplo de la lección anterior:
Una muestra aleatoria de 100 paquetes mostró un peso promedio de 71.8 gr. con una desviación estándar de 8.9 gr.Pruebe, con un nivel de significancia de 5%, que el peso promedio de todos los paquetes (población) es mayor a 70 gr.
SoluciónTomamos los resultados obtenidos anteriormente:
Región de rechazoz = z0.05 = 1.645
Valor del estadístico de prueba
= = 2.02
Probabilidad de colaP = P(Z2.02) = 1 – F(2.02) = 1 – 0.9783 = 0.0217 (Tabla Z)
Se puede afirmar que la prueba tiene una significancia real de 2.17%
CÁLCULO DEL ERROR TIPO I Y ERROR TIPO II
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
Suponga que se define la siguiente hipótesis relacionada con la media:
Ho: = 0
Ha: > 0
Error Tipo I
= P(Z>z) = = P(Z> )
El Error de tipo I es el nivel de significancia de la prueba , y representa el error en que se incurrirá al rechazar Ho con la evidencia de la muestra, sin saber que Ho es verdadera. El valor crítico de la región de rechazo c puede ser un dato especificado para la prueba o puede obtenerse a partir del nivel de significancia especificado con la relación:
z =
Error tipo II
= = P(Z< )
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
El Error de tipo II es , y representa el error en que se incurrirá al aceptar Ho si la evidencia de la muestra no es suficiente para rechazar Ho.
Para calcular un valor de es necesario suponer que hay otro valor verdadero para el parámetro: 1 entonces es la probabilidad (área) a la izquierda del valor crítico c debajo de la curva con media 1
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
POTENCIA DE UNA PRUEBA
Suponga que se define la siguiente hipótesis relacionada con la media:Ho: = 0
Ha: > 0
Se describió anteriormente la manera de calcular el error tipo II
= P(Aceptar Ho: = 0 dado que otra hipótesis es verdadera: = 1 )
Si la muestra es grande, el cálculo de se hace con la fórmula:
= P = P(Z< )En donde c es el valor crítico de con el que se acepta o rechaza Ho:
Está claro que puede calcularse para otros valores de =1, por lo tanto, es una función de .
El complemento de es otra función: K = 1 - , y se denomina Potencia de la Prueba.
DefiniciónPotencia de la prueba: K = 1 - .
Si mide la probabilidad de aceptar una hipótesis falsa, entonces K, la potencia de la prueba, mide la probabilidad de rechazar una hipótesis falsa.
EjemploDe una población XN(, 2), (esto significa que la variable X tiene distribución normal con media y varianza 2), con varianza 2=49. Se ha tomado una muestra aleatoria de tamaño n para realizar la prueba de hipótesis:
Ho: = 15
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
Ha: > 15Siendo la región crítica >c Se requiere que la potencia de la prueba tome el valor 0.8 cuando =17, y que tome el valor 0.95 cuando =18.
a) Determine los valores de n, c
SoluciónPrimero obtenemos los valores respectivos de
K = 1 - K17 0.8 0.218 0.95 0.05
Ahora usamos la fórmula para
= P = P(Z< )
0.2 = F( ) = -0.84 (tabla Z)
Igualmente,
= P = P(Z< )
0.05 = F( ) = --1.65 (tabla Z)
Resolviendo estas dos ecuaciones por sustitución o igualación:
(1) = -0.84 (2) = --1.65
Se obtiene n=32, c=15.96
b) Calcule el nivel de significancia de la prueba:
Solución
= P = P(Z> )= P(Z> )= 0.22 (Tabla Z)
c) Calcule y grafique la potencia de la prueba con 1 = 12, 13, ..., 19
Solución
K = 1 - = 1 - P = 1 - P(Z< )Valores calculados con la distribución normal estándar
1 K12 1 013 0.991 0.00914 0.943 0.05715 0.781 0.21916 0.487 0.51317 0.200 0.80018 0.049 0.95119 0.007 0.993
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
Gráfico de la potencia de la prueba K():
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
PRUEBA DE HIPÓTESIS RELACIONADA CON
Caso n<30 (muestras pequeñas)
Parámetro de interés: (media poblacional)Suposiciones: población normal, varianza desconocidaEstimador: (media muestral)
PROCEDIMIENTO BÁSICO
1) Formular la hipótesis nula: Ho: = 0
2) Formular una hipótesis alterna, elegir una entre:Ha: < 0
Ha: > 0
Ha: 0
3) Especificar el nivel de significancia de la prueba
4) Seleccionar el estadístico de prueba y definir la región de rechazo de Ho
, tiene distribución t con = n-1 grados de libertad
Ha Región de rechazo de Ho en favor de Ha < 0 t < -t > 0 t > t
< 0 t<-t/2 t > t/2
5) Con los datos de la muestra calcule el valor del estadístico
6) Si el valor del estadístico de prueba cae en la región de rechazo, la decisión es rechazar Ho en favor de Ha. Pero, si el valor no cae en esta región crítica, se dice que no hay evidencia suficiente para rechazar Ho. En este caso es preferible abstenerse de aceptar Ho como verdadera pues esto puede introducir el Error tipo II
EjemploDe una población normal se tomó una muestra aleatoria y se obtuvieron los siguientes resultados: 15, 17, 23, 18, 20. Probar con una significancia de 10% que la media de la población es mayor a 18
Solución1) Ho: = 18
2) Ha: >18
3) Nivel de significancia de la prueba = 0.10
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
4) Estadístico de prueba
, tiene distribución t con = n-1 grados de libertad
(15+17+23+18+20)=18.6
S2 = ((15-18.6)2 + ... ) = 9.3 s = 3.05 Re región de rechazo de Ho
= 0.1 , = 5 – 1 = 4 t0.1 = 1.53 (tabla T)
Región de rechazo de Ho: t > 1.53
5) t = (18.6 – 18)/(3.05/5) = 0.44 no es mayor que 1.53
6) No hay evidencia suficiente para rechazar la hipótesis nula
PRUEBA DE HIPÓTESIS
Caso n 30Parámetro de interés: p (proporción poblacional)Estimador: =x/n (proporción muestral)
PROCEDIMIENTO BÁSICO
1) Formular la hipótesis nula: Ho: p = p0 (algún valor específico para p)
2) Formular una hipótesis alterna, elegir una entre:Ha: p < p0
Ha: p > p0
Ha: p p0
3) Especificar el nivel de significancia para la prueba
4) Seleccionar el estadístico de prueba y definir la región de rechazo de Ho
z = tiene distribución normal estándar aproximadamente
Ha Región de rechazo de Ho en favor de Hap < p0 z < -z
p > p0 z > z
p p0 z<-z/2 z > z/2
5) Con los datos de la muestra calcule el valor del estadístico
6) Si el valor del estadístico de prueba cae en la región de rechazo, la decisión
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
es rechazar Ho en favor de Ha. Caso contrario, se dice que no hay evidencia suficiente para rechazar Ho.
EjemploEl estándar de artículos aceptables producidos por una fábrica es 90%. Se ha tomado una muestra aleatoria de 175 artículos y se encontraron 150 artículos aceptables. Pruebe con una significancia de 5% que no se está cumpliendo con el estándar
Solución
Sea p: proporción de artículos aceptables que produce la fábrica = x/n = 150/175 = 0.857 = 85.7%
¿Es esto una evidencia que p < 90% o se puede atribuir únicamente a la aleatoriedad de los datos, con 5% de probabilidad de equivocarnos?
1) Ho: p = 0.9
2) Ha: p < 0.9
3) Nivel de significancia de la prueba = 0.05
4) Estadístico de prueba
z =
Región de rechazo de Ho = 0.5 , z = z0.05 = 1.645 (tabla Z)
Región de rechazo de Ho: z < -1.645
5) z = = = -1.869 < -1.645
6) Hay evidencia suficiente para afirmar que el estándar no se cumple.
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
PRUEBA DE HIPÓTESIS PARA DIFERENCIAS DE MEDIAS
PROCEDIMIENTO BÁSICO
1) Formular la hipótesis nula: Ho: 1 - 2 = d0 (usualmente d0=0)
2) Formular una hipótesis alterna, elegir una entre:Ha: 1 - 2 < d0 Ha: 1 - 2 > d0 Ha: 1 - 2 d0
3) Especificar el nivel de significancia para la prueba
4) Seleccionar el estadístico de prueba y definir la región de rechazo de Ho
Z = tiene distribución normal estándar
aproximadamenteAdicionalmente: ,
Ha Región de rechazo de Ho en favor de Ha1 - 2 < d0 z < -z
1 - 2 > d0 z > z
1 - 2 d0 z<-z/2 z > z/2
5) Con los datos de la muestra calcule el valor del estadístico
6) Si el valor del estadístico de prueba cae en la región de rechazo, la decisión es rechazar Ho en favor de Ha. Caso contrario, se dice que no hay evidencia suficiente para rechazar Ho.
EjemploSuponga los siguientes los siguientes datos correspondientes a dos muestras aleatorias independientes tomadas de dos poblaciones cuyas medias se desea estudiar
muestra n S2
1 75 82 642 50 76 36
Pruebe la hipótesis 1 > 2 con un nivel de significancia de 10%
Solución1) Ho: 1 - 2 = 0
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
2) Ha: 1 - 2 >03) = 0.1
4) Z =
z = 1.28: Rechazar Ho si z > 1.28
5) Z = = 4.78
6) Con una significancia de 5% se acepta que 1 > 2
Caso: Muestras pequeñas
Este estudio estadístico permite comparar las medias de dos poblaciones mediante muestras aleatorias independientes cuando las muestras son pequeñas.
Supongamos dos poblaciones: 1 y 2, con medias 1, 2,
varianzas desconocidas y distribución normal.
De estas poblaciones se toman muestras aleatorias independientes de tamaño n1 y n2 y se obtienen las medias muestrales , .
Parámetro de interés: 1 - 2
Tamaño de las muestras: n1, n2 < 30 (muestras pequeñas)Estimador: -
= E[ - ] = E[ ] – E[ ] = 1 - 2 (estimador insesgado)
Note que si las varianzas poblacionales fuesen conocidasteniendo las poblaciones distribución normal, el estadístico sería
Z, sin importar el tamaño de las muestras
Se consideran dos suposiciones acerca de las varianzas: y .
La teoría estadística provee adicionalmente una prueba para verificar estas suposiciones mediante la prueba de hipótesis para dos varianzas (Lección E61)
CASO: (SUPOSICIÓN)
Estadístico
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
t = , distribución t con = n1 + n2 – 2 gr. de
libertad
= Sp ,
Ho: 1 - 2 = d0 (usualmente d0 = 0): nivel de significancia
Estadístico de prueba
t = , distribución t con = n1 + n2 – 2 gr. de libertad
Ha Región de rechazo de Ho1 - 2 < d0 t < -t1 - 2 > d0 t > t1 - 2 d0 t < -t/2 t > t/2
CASO: (SUPOSICIÓN)
Estadístico
t = , distribución t
con = grados de libertad
= ,
Ho: 1 - 2 = d0 (usualmente d0 = 0): nivel de significancia
Estadístico de prueba
t = , distribución t
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
con = grados de libertad
Ha Región de rechazo de Ho1 - 2 < d0 t < -t1 - 2 > d0 t > t1 - 2 d0 t < -t/2 t > t/2
Ejemplo (caso )Se realizó un experimento para comparar la resistencia de dos materiales, obteniéndose los siguientes resultados:
Material n S 1 12 85 4 2 10 81 5
Suponga que son muestras aleatorias independientes y que provienen de poblaciones normales con varianzas desconocidas, suponer iguales.
Pruebe con 5% de significancia que la resistencia del material 1 excede a la resistencia del material 2 en dos unidades.
Solución1) Ho: 1 - 2 = 22) Ha: 1 - 2 > 23) = 0.05
4) Estadístico de prueba
t = , distribución t con = n1 + n2 – 2 gr. de libertad
Región de rechazo de Ho = 0.05, = n1 + n2 – 2 = 12 + 10 – 2 = 20 t0.05 = 1.725 (tabla T)t > 1.725
5) Cálculo del valor del estadístico de prueba
= = 20.05
= Sp = = 1.917
t = = = 1.043
6) t no cae en la región de rechazo de Ho, por lo tanto, no hay evidencia suficiente para rechazarla.
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
Ejemplo (caso )Se realizó un experimento para comparar la resistencia de dos materiales, obteniéndose los siguientes resultados:
Material n S2
1 15 3.84 3.07 2 12 1.49 0.80
Suponga que son muestras aleatorias independientes y que provienen de poblaciones normales con varianzas desconocidas, suponer diferentes.
Encuentre un intervalo de confianza de 95% para la diferencia de las medias poblacionales 1 - 2
Solución
= = 21
1 - = 0.95 /2 = 0.025, = 21, t/2 = t0.025 = 2.08 (Tabla T)
= = = 0.521
Sustituimos en la fórmula respectiva :
( - ) - t/2 1 - 2 ( - ) + t/2
(3.84 – 1.49) – 2.08(0.521) 1 - 2 (3.84 – 1.49) + 2.08(0.521)
1.266 1 - 2 3.434
Por lo tanto, se puede afirmar con una confianza de 95% que la diferencia de las medias de la resistencia de los dos materiales está
entre 1.266 y 3.434
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
PRUEBA DE HIPÓTESIS PARA DIFERENCIAS DE PROPORCIONES
PROCEDIMIENTO BÁSICO
1) Formular la hipótesis nula:Ho: p1 - p2 = d0 (Algún valor especificado, ej. d0=0)2) Formular una hipótesis alterna. Elegir una entre:
Ha: p1 - p2 < d0 Ha: p1 - p2 > d0 Ha: p1 - p2 d0
3) Especificar el nivel de significancia para la prueba
4) Seleccionar el estadístico de prueba y definir la región de rechazo de Ho
Z = , con distribución normal estándar
aproximadamente
Adicionalmente:
Ha Región de rechazo de Ho en favor de Hap1 - p2 < d0 z < -z
p1 - p2 > d0 z > z
p1 - p2 d0 z<-z/2 z > z/2
5) Con los datos de la muestra calcule el valor del estadístico
6) Si el valor del estadístico de prueba cae en la región de rechazo, la decisión es rechazar Ho en favor de Ha. Caso contrario, se dice que no hay evidencia suficiente para rechazar Ho.
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
UNA PRUEBA PARA LA DIFERENCIA DE MEDIAS MEDIANTE MUESTRAS PAREADAS
Este estudio estadístico permite comparar las medias de dos poblaciones mediante muestras aleatorias que no son independientes. Esto significa que las observaciones de una muestra influyen en los resultados de la otra.
Suponga que se quiere comparar la duración de dos marcas de llantas. Si se eligiera una muestra aleatoria de llantas de una marca y se las probara en vehículos y se eligiera una muestra aleatoria de llantas de la otra marca y se las probara con otros vehículos, entonces las muestras serían independientes.
Pero, si se las muestras aleatorias de llantas se las probase simultáneamente en los mismos vehículos, entonces los resultados obtenidos ya no son independientes pues recibieron las mismas condiciones de uso. Estas serían muestras pareadas.
Supongamos dos poblaciones: 1 y 2, con medias 1, 2,
De estas poblaciones se toma una muestra aleatoria pareada de tamaño n.Es de interés estimar el valor de 1 - 2. Las muestras no son independientes, por lo tanto no se pueden usar como estimador sus medias muestrales.
Ahora se debe seguir otro procedimiento.
Sean: n: tamaño de la muestraX1: observaciones obtenidas en la muestra de la población 1X2: observaciones obtenidas en la muestra de la población 2Di = X1,i – X2,i , i=1, 2, ..., n: Diferencias entre observaciones
Se supondrá que Di son variables aleatorias independientes tales que = E[Di] = 1 - 2
DefiniciónEstadístico para la prueba con muestras pareadas
=
con varianza
.
Prueba de Hipótesis1) Ho: 1 - 2 = d0 (algún valor especificado, por ejemplo 0)2) Ha: 1 - 2 < d0
o 1 - 2 > d0
o 1 - 2 d0
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
3) : nivel de significancia4) Estadístico de prueba
Caso: n 30
con distribución aproximadamente normal estándar por el Teorema del Límite Central
Caso: n < 30. Suponer distribución normal
Distribución T con = n –1 grados de libertad
EjemploLos siguientes datos corresponden a un estudio de las horas perdidas mensualmente por accidentes de trabajo en 6 fábricas antes y después de implantar un programa de seguridad industrial.
Fábrica Antes(horas perdidas)
Después(horas perdidas)
1 45 362 73 603 46 444 39 295 17 116 30 32
Suponer que la población es normal. Probar con 5% de significancia que el programa es eficaz
SoluciónSean 1 media de la horas perdidas antes del programa
2 media de la horas perdidas después del programa
Se desea probar que 1 > 2
1) Ho: 1 = 2 2) Ha: 1 > 2
3) = 0.054) Estadístico de prueba, n < 30
Distribución T con = n –1 grados de libertad
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
t = t0.05 = 2.015, con = n – 1 = 5 grados de libertadRegión de rechazo para Ho: t > 2.015
5) = [(45-36) + (73-60) + ... ] = 5.5
= [(9-5.5)2 + (13-5.5)2 + ... ] =27.5
= 5.244
=2.56
6) Decisión: Se rechaza Ho en favor de Ha, es decir, con una significanciade 5% se puede afirmar que el programa si es eficaz
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
INFERENCIAS RELACIONADAS CON LA VARIANZA 2
Para algunas pruebas y aplicaciones es de interés estimar el valor de la varianza poblacional 2.
Suponer que una población tiene distribución aproximadamente normal y se toma una muestra aleatoria de tamaño n de la cual se obtiene la varianza muestra S2:
,
El estadístico S2 es un estimador insesgado del parámetro 2: E[S2] = 2
La teoría estadística demuestra que la variable aleatoria: (n-1)S2/2 tiene distribución Ji-Cuadrado (2), con = n -1 grados de libertad. La distribución Ji-Cuadrado es una función cuya forma es tipo campana con sesgo positivo.
Para cada valor de se tiene una campana diferente:
Figura: Distribución Ji-Cuadrado 2 = (n-1) , con = n-1 grados de
libertadAlgunos valores de la distribución Ji-Cuadrado están tabulados para ciertos valores de y para valores típicos de con la siguiente definición
P(2 ) =
EjemploEncuentre el valor de para n = 11, = 0.05
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
SoluciónConsulte el documento E50 -Tabla de la distribución Ji-Cuadrado = n – 1 = 10, = 18.31
INTERVALO DE CONFIANZA PARA 2
En la distribución 2 se define un área central correspondiente a la probabilidad 1 - , y a los lados se divide la diferencia en dos áreas iguales /2.
Debido a que la distribución es asimétrica, los valores de la variable 2 no tienen la misma distancia desde el centro y se los representa con y
de acuerdo a la definición anterior
Se obtiene entonces el intervalo para 2 con probabilidad 1 - : 2
Si se sustituye la definición del estadístico 2 = (n-1) y se despeja el
parámetro de interés 2 se obtiene
DefiniciónIntervalo de confianza para 2 con nivel 1 -
(n – 1) 2 (n – 1) .
EjemploEn una muestra aleatoria se registró el peso de 10 paquetes y se obtuvieron los siguientes resultados en gramos:46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 41.9, 45.2, 46.0
Encuentre un intervalo de confianza para la varianza en el peso de toda la producción, con un nivel de 95%, suponiendo distribución normal
Solución
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
n=10
= [46.4 + 46.1 + ... ] = 45.62
= [(46.4 – 45.62)2 + (46.1 – 45.62)2 + ... ] = 1.919
1 - = 0.95, = n – 1 = 9 = = 19.02 (Tabla 2)
= = 2.7 (Tabla 2)
Sustituya en la definición del intervalo de confianza:
9 (1.919/19.02) 2 9 (1.919/2.7)
0.908 2 6.398
Se puede afirmar con una confianza de 95% que la varianza poblacional se encuentra en el intervalo de 0,908 a 6.398
PRUEBA DE HIPÓTESIS RELACIONADA CON LA VARIANZA 2
Seguimos el procedimiento básico establecido
1) Definir la hipótesis nula Ho: 2 = (algún valor especificado)2) Elegir una Hipótesis alterna: Ha: 2 <
Ha: 2 > Ha: 2
3) Seleccionar el nivel de significancia4) Estadístico de prueba
2 = (n-1) , distribución ji-cuadrado con =n-1 grados de libertad
Región crítica Ha Región de rechazo de Ho en favor de Ha2 < 2 < 2 > 2 >2 2< 2 >
5) Calcular el valor del estadístico de prueba con los datos de la muestra6) Decidir
EjemploUn fabricante afirma que la duración de su producto tiene distribución aproximadamente normal con una desviación estándar de 0.9 años.
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
Una muestra aleatoria de 10 productos tuvo una desviación estándar de 1.2 años. Pruebe, con una significancia de 5%, si esta evidencia es suficiente para afirmar que la desviación estándar poblacional es mayor a la especificada
SoluciónLa prueba se aplica a la varianza 2 por lo tanto 2 = (1.2)2 = 1.44
1) Ho: 2 = 0.812) Ha: 2 > 0.813) = 0.054) Estadístico de prueba
2 = (n-1) , distribución ji-cuadrado con =n-1 grados de libertad
Región de rechazo=0.05, = n-1 = 9, = 16.91Rechazar Ho si 2 > 16.91
5) 2 = (n-1) = 9 =16.0
6) Con una significancia de 5%, no hay evidencia suficiente para rechazar la
afirmación del fabricante
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
PRUEBA DE HIPÓTESIS PARA DOS VARIANZAS
Esta prueba permite comparar las varianzas de dos poblaciones. Suponer dos poblaciones con distribución aproximadamente normal con varianzas desconocidas pero supuestamente iguales.
Se toman muestras aleatorias independientes de tamaño n1 y n2 obteniéndose las varianzas muestrales y respectivamente.
La teoría estadística demuestra que el estadístico
F = , tiene distribución F con 1 = n1 – 1, 2 = n2 – 1 grados de libertad
El estadístico F tiene distribución con forma tipo campana con sesgo positivo.Para cada combinación 1 , 2 se tiene una campana diferente.
Algunos valores de esta distribución están tabulados para valores específicos de, 1, 2 de acuerdo a la siguiente definición:
= P(F> ).
También se puede usar una relación útil para conocer otros valores de la distribución F:
.
Ing. Luis Rodríguez Ojeda Derechos reservados
Estadística ICM 00166
Siguiendo el procedimiento básico establecido para prueba de hipótesis:
1) Definir la hipótesis nula Ho: 2) Elegir una Hipótesis alterna: Ha:
Ha: Ha:
3) Seleccionar el nivel de significancia 4) Estadístico de prueba
F = , distribución F con 1 = n1 – 1, 2 = n2 – 1 grados de libertad
Región crítica Ha Región de rechazo de Ho en favor de Ha
F < F1-
F > F
F < F1-/2 F > F/2
5) Calcular el valor del estadístico de prueba con los datos de la muestra6) Decidir
EjemploDe dos poblaciones con distribución aproximadamente normal se han tomado dos muestras aleatorias independientes y se obtuveron:
Muestra n S2
1 10 5.9 4 2 8 7.1 5
Pruebe con 10% de significancia que las poblaciones tienen varianzas diferentes
Solución1) Ho: 2) Ha: 3) = 0.14) Estadístico de prueba
F = , distribución F con 1 = n1 – 1, 2 = n2 – 1 grados de libertad
Región crítica = 0.1, /2 = 0.05, 1 = 10 – 1 = 9, 2 = 8 – 1 = 7 = F0.05, 9, 7 = 3.68 (Tabla F) = F0.95, 9, 7 = 1/ = 1/F0.05, 7, 9 = 1/3.29 = 0.304
Región de rechazo de Ho en favor de Ha
F < 0.304 F > 3.68
Ing. Luis Rodríguez Ojeda Derechos reservados