prueba de hipÓtesis

30
Estadística ICM 00166 PRUEBA DE HIPÓTESIS Esta técnica de inferencia estadística es muy utilizada como apoyo a la investigación científica. Consiste en suponer algún valor para el parámetro de interés y usar los datos de la muestra para aceptar o rechazar esta afirmación. Es importante entender las diferentes situaciones que pueden ocurrir al probar estadísticamente una hipótesis Sea Ho: hipótesis que se propone para el parámetro de interés El Error tipo I se produce al rechazar una hipótesis sin saber que era verdadera El Error tipo II se produce al aceptar una hipótesis sin saber que era falsa Ambos errores pueden tener consecuencias negativas en una situación real. Por lo tanto es importante cuantificar su probabilidad. Medida del Error tipo I: = P(Rechazar Ho dado que Ho es verdadera) Medida del Error tipo II: = P(Aceptar Ho dado que otra hipótesis es verdadera) El valor se denomina nivel de significancia de la prueba y generalmente es un dato dado para realizar la prueba. Algunos valores típicos para son 10%, 5%, 2%, 1% Terminología Ho: Hipótesis nula. Es la hipótesis que se plantea para el parámetro Ha: Hipótesis alterna. Es la hipótesis que se plantea en oposición a Ho y que es aceptada en caso de que Ho sea rechazada Generalmente, es de interés probar Ha, por lo que se plantea Ho con la esperanza de que sea rechazada utilizando la información de la muestra. Ejemplo Suponer que se desea probar que la media poblacional no es igual a 5 Entonces se puede plantear: Ho: = 5 Ha: 5 Ing. Luis Rodríguez Ojeda Derechos reservados

Upload: independent

Post on 04-Dec-2023

0 views

Category:

Documents


0 download

TRANSCRIPT

Estadística ICM 00166

PRUEBA DE HIPÓTESIS

Esta técnica de inferencia estadística es muy utilizada como apoyo a la investigación científica. Consiste en suponer algún valor para el parámetro de interés y usar los datos de la muestra para aceptar o rechazar esta afirmación.

Es importante entender las diferentes situaciones que pueden ocurrir al probar estadísticamente una hipótesis

Sea Ho: hipótesis que se propone para el parámetro de interés

El Error tipo I se produce al rechazar una hipótesis sin saber que era verdaderaEl Error tipo II se produce al aceptar una hipótesis sin saber que era falsa

Ambos errores pueden tener consecuencias negativas en una situación real. Por lo tanto es importante cuantificar su probabilidad.

Medida del Error tipo I: = P(Rechazar Ho dado que Ho es verdadera)

Medida del Error tipo II: = P(Aceptar Ho dado que otra hipótesis es verdadera)

El valor se denomina nivel de significancia de la prueba y generalmente es un dato dado para realizar la prueba.

Algunos valores típicos para son 10%, 5%, 2%, 1%

TerminologíaHo: Hipótesis nula. Es la hipótesis que se plantea para el parámetroHa: Hipótesis alterna. Es la hipótesis que se plantea en oposición a Ho

y que es aceptada en caso de que Ho sea rechazada

Generalmente, es de interés probar Ha, por lo que se plantea Ho con la esperanza de que sea rechazada utilizando la información de la muestra.

EjemploSuponer que se desea probar que la media poblacional no es igual a 5Entonces se puede plantear:

Ho: = 5Ha: 5

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

Si con los datos de la muestra se puede rechazar Ho, entonces habremos probado Ha

Tipos de pruebasSea : parámetro de interés para la prueba

0: algún valor supuesto para el parámetro Pruebas de una cola

1) Ho: = 0: (hipótesis nula) Ha: < 0: (hipótesis alterna)

2) Ho: = 0: (hipótesis nula) Ha: > 0: (hipótesis alterna)

Prueba de dos colas3) Ho: = 0: (hipótesis nula) Ha: < 0 > 0: (hipótesis alterna)

PROCEDIMIENTO BÁSICO PARA REALIZAR UNA PRUEBA DE HIPÓTESIS

Para entender este procedimiento usamos un caso particular, pero luego podremos extenderlo a otros casos

Parámetro de interés: (media poblacional)Estimador: (media muestral)n 30: (muestra grande)Suponer que proponemos 0 un valor específico para el parámetro

1) Formular la hipótesis nula:Ho: = 0

2) Formular una hipótesis alterna que interesa probar, elegir una entre:Ha: < 0

Ha: > 0

Ha: < 0 > 0

3) Especificar el nivel de significancia de la prueba

4) Seleccionar el estadístico de prueba y definir la región de rechazo de Ho

Por el teorema del límite central el estadístico

, tiene distribución normal estándar aproximadamente

La región de rechazo depende de la hipótesis alterna Ha y está definida por :

Ho: = 0

Ha: < 0

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

La media muestral es un estimador insesgado y su valor esperado es igual al valor propuesto 0 para el parámetro. Por lo tanto, el valor obtenido para la media muestral debería estar cercano a este valor 0.

Si el valor de Z correspondiente a la media muestral cae en la región de rechazo, debe entenderse que es una evidencia de que la media propuesta para el parámetro, = 0, no es verdad y que debería ser algún valor más pequeño: < 0

Con esta interpretación rechazamos Ho en favor de Ha

Sin embargo, siendo una variable aleatoria, es posible que aún siendo verdad que el valor supuesto 0 es verdadero, el valor de la media muestral puede caer en la región de rechazo.

Esto constituye el Error tipo I, y la probabilidad que esto ocurra es .

Esta interpretación debe ayudar a entender los siguientes casos:

Ho: = 0

Ha: > 0

Ho: = 0

Ha: < 0 > 0 .

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

5) Con los datos de la muestra calcule el valor del estadístico

6) Si el valor del estadístico de prueba cae en la región de rechazo, la decisión es rechazar Ho en favor de Ha. Pero, si el valor no cae en esta región crítica, se dice que no hay evidencia suficiente para rechazar Ho. En este caso es preferible abstenerse de aceptar Ho como verdadera pues esto puede introducir el Error tipo II

EjemploUna muestra aleatoria de 100 paquetes mostró un peso promedio de 71.8 gr. con una desviación estándar de 8.9 gr.

Pruebe, con un nivel de significancia de 5%, que el peso promedio de todos los paquetes (población) es mayor a 70 gr.

SoluciónSeguimos los pasos indicados en el procedimiento básico dado:

1) Hipótesis nulaHo: = 70

2) Hipótesis alternaHa: > 70

3) Nivel de significancia = 0.05

4) Estadístico de prueba

por el Teorema del Límite Central, además 2 s2

Región de rechazoz = z0.05 = 1.645

Rechazar Ho en favor de Ha, si z > 1.645

5) Valor del estadístico

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

= = 2.02

6) DecisiónDebido a que 2.02 > 1.645, se rechaza Ho y se concluye, con una significancia de 5%, que el peso promedio de la población es mayora 70 gr,

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

PRUEBA DE HIPÓTESIS

DEFINICIÓN

PROBABILIDAD DE COLAEs el nivel de significancia obtenido con los datos de la muestra .

EjemploCalcule la probabilidad de cola con los datos del ejemplo de la lección anterior:

Una muestra aleatoria de 100 paquetes mostró un peso promedio de 71.8 gr. con una desviación estándar de 8.9 gr.Pruebe, con un nivel de significancia de 5%, que el peso promedio de todos los paquetes (población) es mayor a 70 gr.

SoluciónTomamos los resultados obtenidos anteriormente:

Región de rechazoz = z0.05 = 1.645

Valor del estadístico de prueba

= = 2.02

Probabilidad de colaP = P(Z2.02) = 1 – F(2.02) = 1 – 0.9783 = 0.0217 (Tabla Z)

Se puede afirmar que la prueba tiene una significancia real de 2.17%

CÁLCULO DEL ERROR TIPO I Y ERROR TIPO II

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

Suponga que se define la siguiente hipótesis relacionada con la media:

Ho: = 0

Ha: > 0

Error Tipo I

= P(Z>z) = = P(Z> )

El Error de tipo I es el nivel de significancia de la prueba , y representa el error en que se incurrirá al rechazar Ho con la evidencia de la muestra, sin saber que Ho es verdadera. El valor crítico de la región de rechazo c puede ser un dato especificado para la prueba o puede obtenerse a partir del nivel de significancia especificado con la relación:

z =

Error tipo II

= = P(Z< )

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

El Error de tipo II es , y representa el error en que se incurrirá al aceptar Ho si la evidencia de la muestra no es suficiente para rechazar Ho.

Para calcular un valor de es necesario suponer que hay otro valor verdadero para el parámetro: 1 entonces es la probabilidad (área) a la izquierda del valor crítico c debajo de la curva con media 1

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

POTENCIA DE UNA PRUEBA

Suponga que se define la siguiente hipótesis relacionada con la media:Ho: = 0

Ha: > 0

Se describió anteriormente la manera de calcular el error tipo II

= P(Aceptar Ho: = 0 dado que otra hipótesis es verdadera: = 1 )

Si la muestra es grande, el cálculo de se hace con la fórmula:

= P = P(Z< )En donde c es el valor crítico de con el que se acepta o rechaza Ho:

Está claro que puede calcularse para otros valores de =1, por lo tanto, es una función de .

El complemento de es otra función: K = 1 - , y se denomina Potencia de la Prueba.

DefiniciónPotencia de la prueba: K = 1 - .

Si mide la probabilidad de aceptar una hipótesis falsa, entonces K, la potencia de la prueba, mide la probabilidad de rechazar una hipótesis falsa.

EjemploDe una población XN(, 2), (esto significa que la variable X tiene distribución normal con media y varianza 2), con varianza 2=49. Se ha tomado una muestra aleatoria de tamaño n para realizar la prueba de hipótesis:

Ho: = 15

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

Ha: > 15Siendo la región crítica >c Se requiere que la potencia de la prueba tome el valor 0.8 cuando =17, y que tome el valor 0.95 cuando =18.

a) Determine los valores de n, c

SoluciónPrimero obtenemos los valores respectivos de

K = 1 - K17 0.8 0.218 0.95 0.05

Ahora usamos la fórmula para

= P = P(Z< )

0.2 = F( ) = -0.84 (tabla Z)

Igualmente,

= P = P(Z< )

0.05 = F( ) = --1.65 (tabla Z)

Resolviendo estas dos ecuaciones por sustitución o igualación:

(1) = -0.84 (2) = --1.65

Se obtiene n=32, c=15.96

b) Calcule el nivel de significancia de la prueba:

Solución

= P = P(Z> )= P(Z> )= 0.22 (Tabla Z)

c) Calcule y grafique la potencia de la prueba con 1 = 12, 13, ..., 19

Solución

K = 1 - = 1 - P = 1 - P(Z< )Valores calculados con la distribución normal estándar

1 K12 1 013 0.991 0.00914 0.943 0.05715 0.781 0.21916 0.487 0.51317 0.200 0.80018 0.049 0.95119 0.007 0.993

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

Gráfico de la potencia de la prueba K():

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

PRUEBA DE HIPÓTESIS RELACIONADA CON

Caso n<30 (muestras pequeñas)

Parámetro de interés: (media poblacional)Suposiciones: población normal, varianza desconocidaEstimador: (media muestral)

PROCEDIMIENTO BÁSICO

1) Formular la hipótesis nula: Ho: = 0

2) Formular una hipótesis alterna, elegir una entre:Ha: < 0

Ha: > 0

Ha: 0

3) Especificar el nivel de significancia de la prueba

4) Seleccionar el estadístico de prueba y definir la región de rechazo de Ho

, tiene distribución t con = n-1 grados de libertad

Ha Región de rechazo de Ho en favor de Ha < 0 t < -t > 0 t > t

< 0 t<-t/2 t > t/2

5) Con los datos de la muestra calcule el valor del estadístico

6) Si el valor del estadístico de prueba cae en la región de rechazo, la decisión es rechazar Ho en favor de Ha. Pero, si el valor no cae en esta región crítica, se dice que no hay evidencia suficiente para rechazar Ho. En este caso es preferible abstenerse de aceptar Ho como verdadera pues esto puede introducir el Error tipo II

EjemploDe una población normal se tomó una muestra aleatoria y se obtuvieron los siguientes resultados: 15, 17, 23, 18, 20. Probar con una significancia de 10% que la media de la población es mayor a 18

Solución1) Ho: = 18

2) Ha: >18

3) Nivel de significancia de la prueba = 0.10

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

4) Estadístico de prueba

, tiene distribución t con = n-1 grados de libertad

(15+17+23+18+20)=18.6

S2 = ((15-18.6)2 + ... ) = 9.3 s = 3.05 Re región de rechazo de Ho

= 0.1 , = 5 – 1 = 4 t0.1 = 1.53 (tabla T)

Región de rechazo de Ho: t > 1.53

5) t = (18.6 – 18)/(3.05/5) = 0.44 no es mayor que 1.53

6) No hay evidencia suficiente para rechazar la hipótesis nula

PRUEBA DE HIPÓTESIS

Caso n 30Parámetro de interés: p (proporción poblacional)Estimador: =x/n (proporción muestral)

PROCEDIMIENTO BÁSICO

1) Formular la hipótesis nula: Ho: p = p0 (algún valor específico para p)

2) Formular una hipótesis alterna, elegir una entre:Ha: p < p0

Ha: p > p0

Ha: p p0

3) Especificar el nivel de significancia para la prueba

4) Seleccionar el estadístico de prueba y definir la región de rechazo de Ho

z = tiene distribución normal estándar aproximadamente

Ha Región de rechazo de Ho en favor de Hap < p0 z < -z

p > p0 z > z

p p0 z<-z/2 z > z/2

5) Con los datos de la muestra calcule el valor del estadístico

6) Si el valor del estadístico de prueba cae en la región de rechazo, la decisión

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

es rechazar Ho en favor de Ha. Caso contrario, se dice que no hay evidencia suficiente para rechazar Ho.

EjemploEl estándar de artículos aceptables producidos por una fábrica es 90%. Se ha tomado una muestra aleatoria de 175 artículos y se encontraron 150 artículos aceptables. Pruebe con una significancia de 5% que no se está cumpliendo con el estándar

Solución

Sea p: proporción de artículos aceptables que produce la fábrica = x/n = 150/175 = 0.857 = 85.7%

¿Es esto una evidencia que p < 90% o se puede atribuir únicamente a la aleatoriedad de los datos, con 5% de probabilidad de equivocarnos?

1) Ho: p = 0.9

2) Ha: p < 0.9

3) Nivel de significancia de la prueba = 0.05

4) Estadístico de prueba

z =

Región de rechazo de Ho = 0.5 , z = z0.05 = 1.645 (tabla Z)

Región de rechazo de Ho: z < -1.645

5) z = = = -1.869 < -1.645

6) Hay evidencia suficiente para afirmar que el estándar no se cumple.

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

PRUEBA DE HIPÓTESIS PARA DIFERENCIAS DE MEDIAS

PROCEDIMIENTO BÁSICO

1) Formular la hipótesis nula: Ho: 1 - 2 = d0 (usualmente d0=0)

2) Formular una hipótesis alterna, elegir una entre:Ha: 1 - 2 < d0 Ha: 1 - 2 > d0 Ha: 1 - 2 d0

3) Especificar el nivel de significancia para la prueba

4) Seleccionar el estadístico de prueba y definir la región de rechazo de Ho

Z = tiene distribución normal estándar

aproximadamenteAdicionalmente: ,

Ha Región de rechazo de Ho en favor de Ha1 - 2 < d0 z < -z

1 - 2 > d0 z > z

1 - 2 d0 z<-z/2 z > z/2

5) Con los datos de la muestra calcule el valor del estadístico

6) Si el valor del estadístico de prueba cae en la región de rechazo, la decisión es rechazar Ho en favor de Ha. Caso contrario, se dice que no hay evidencia suficiente para rechazar Ho.

EjemploSuponga los siguientes los siguientes datos correspondientes a dos muestras aleatorias independientes tomadas de dos poblaciones cuyas medias se desea estudiar

muestra n S2

1 75 82 642 50 76 36

Pruebe la hipótesis 1 > 2 con un nivel de significancia de 10%

Solución1) Ho: 1 - 2 = 0

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

2) Ha: 1 - 2 >03) = 0.1

4) Z =

z = 1.28: Rechazar Ho si z > 1.28

5) Z = = 4.78

6) Con una significancia de 5% se acepta que 1 > 2

Caso: Muestras pequeñas

Este estudio estadístico permite comparar las medias de dos poblaciones mediante muestras aleatorias independientes cuando las muestras son pequeñas.

Supongamos dos poblaciones: 1 y 2, con medias 1, 2,

varianzas desconocidas y distribución normal.

De estas poblaciones se toman muestras aleatorias independientes de tamaño n1 y n2 y se obtienen las medias muestrales , .

Parámetro de interés: 1 - 2

Tamaño de las muestras: n1, n2 < 30 (muestras pequeñas)Estimador: -

= E[ - ] = E[ ] – E[ ] = 1 - 2 (estimador insesgado)

Note que si las varianzas poblacionales fuesen conocidasteniendo las poblaciones distribución normal, el estadístico sería

Z, sin importar el tamaño de las muestras

Se consideran dos suposiciones acerca de las varianzas: y .

La teoría estadística provee adicionalmente una prueba para verificar estas suposiciones mediante la prueba de hipótesis para dos varianzas (Lección E61)

CASO: (SUPOSICIÓN)

Estadístico

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

t = , distribución t con = n1 + n2 – 2 gr. de

libertad

= Sp ,

Ho: 1 - 2 = d0 (usualmente d0 = 0): nivel de significancia

Estadístico de prueba

t = , distribución t con = n1 + n2 – 2 gr. de libertad

Ha Región de rechazo de Ho1 - 2 < d0 t < -t1 - 2 > d0 t > t1 - 2 d0 t < -t/2 t > t/2

CASO: (SUPOSICIÓN)

Estadístico

t = , distribución t

con = grados de libertad

= ,

Ho: 1 - 2 = d0 (usualmente d0 = 0): nivel de significancia

Estadístico de prueba

t = , distribución t

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

con = grados de libertad

Ha Región de rechazo de Ho1 - 2 < d0 t < -t1 - 2 > d0 t > t1 - 2 d0 t < -t/2 t > t/2

Ejemplo (caso )Se realizó un experimento para comparar la resistencia de dos materiales, obteniéndose los siguientes resultados:

Material n S 1 12 85 4 2 10 81 5

Suponga que son muestras aleatorias independientes y que provienen de poblaciones normales con varianzas desconocidas, suponer iguales.

Pruebe con 5% de significancia que la resistencia del material 1 excede a la resistencia del material 2 en dos unidades.

Solución1) Ho: 1 - 2 = 22) Ha: 1 - 2 > 23) = 0.05

4) Estadístico de prueba

t = , distribución t con = n1 + n2 – 2 gr. de libertad

Región de rechazo de Ho = 0.05, = n1 + n2 – 2 = 12 + 10 – 2 = 20 t0.05 = 1.725 (tabla T)t > 1.725

5) Cálculo del valor del estadístico de prueba

= = 20.05

= Sp = = 1.917

t = = = 1.043

6) t no cae en la región de rechazo de Ho, por lo tanto, no hay evidencia suficiente para rechazarla.

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

Ejemplo (caso )Se realizó un experimento para comparar la resistencia de dos materiales, obteniéndose los siguientes resultados:

Material n S2

1 15 3.84 3.07 2 12 1.49 0.80

Suponga que son muestras aleatorias independientes y que provienen de poblaciones normales con varianzas desconocidas, suponer diferentes.

Encuentre un intervalo de confianza de 95% para la diferencia de las medias poblacionales 1 - 2

Solución

= = 21

1 - = 0.95 /2 = 0.025, = 21, t/2 = t0.025 = 2.08 (Tabla T)

= = = 0.521

Sustituimos en la fórmula respectiva :

( - ) - t/2 1 - 2 ( - ) + t/2

(3.84 – 1.49) – 2.08(0.521) 1 - 2 (3.84 – 1.49) + 2.08(0.521)

1.266 1 - 2 3.434

Por lo tanto, se puede afirmar con una confianza de 95% que la diferencia de las medias de la resistencia de los dos materiales está

entre 1.266 y 3.434

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

PRUEBA DE HIPÓTESIS PARA DIFERENCIAS DE PROPORCIONES

PROCEDIMIENTO BÁSICO

1) Formular la hipótesis nula:Ho: p1 - p2 = d0 (Algún valor especificado, ej. d0=0)2) Formular una hipótesis alterna. Elegir una entre:

Ha: p1 - p2 < d0 Ha: p1 - p2 > d0 Ha: p1 - p2 d0

3) Especificar el nivel de significancia para la prueba

4) Seleccionar el estadístico de prueba y definir la región de rechazo de Ho

Z = , con distribución normal estándar

aproximadamente

Adicionalmente:

Ha Región de rechazo de Ho en favor de Hap1 - p2 < d0 z < -z

p1 - p2 > d0 z > z

p1 - p2 d0 z<-z/2 z > z/2

5) Con los datos de la muestra calcule el valor del estadístico

6) Si el valor del estadístico de prueba cae en la región de rechazo, la decisión es rechazar Ho en favor de Ha. Caso contrario, se dice que no hay evidencia suficiente para rechazar Ho.

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

UNA PRUEBA PARA LA DIFERENCIA DE MEDIAS MEDIANTE MUESTRAS PAREADAS

Este estudio estadístico permite comparar las medias de dos poblaciones mediante muestras aleatorias que no son independientes. Esto significa que las observaciones de una muestra influyen en los resultados de la otra.

Suponga que se quiere comparar la duración de dos marcas de llantas. Si se eligiera una muestra aleatoria de llantas de una marca y se las probara en vehículos y se eligiera una muestra aleatoria de llantas de la otra marca y se las probara con otros vehículos, entonces las muestras serían independientes.

Pero, si se las muestras aleatorias de llantas se las probase simultáneamente en los mismos vehículos, entonces los resultados obtenidos ya no son independientes pues recibieron las mismas condiciones de uso. Estas serían muestras pareadas.

Supongamos dos poblaciones: 1 y 2, con medias 1, 2,

De estas poblaciones se toma una muestra aleatoria pareada de tamaño n.Es de interés estimar el valor de 1 - 2. Las muestras no son independientes, por lo tanto no se pueden usar como estimador sus medias muestrales.

Ahora se debe seguir otro procedimiento.

Sean: n: tamaño de la muestraX1: observaciones obtenidas en la muestra de la población 1X2: observaciones obtenidas en la muestra de la población 2Di = X1,i – X2,i , i=1, 2, ..., n: Diferencias entre observaciones

Se supondrá que Di son variables aleatorias independientes tales que = E[Di] = 1 - 2

DefiniciónEstadístico para la prueba con muestras pareadas

=

con varianza

.

Prueba de Hipótesis1) Ho: 1 - 2 = d0 (algún valor especificado, por ejemplo 0)2) Ha: 1 - 2 < d0

o 1 - 2 > d0

o 1 - 2 d0

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

3) : nivel de significancia4) Estadístico de prueba

Caso: n 30

con distribución aproximadamente normal estándar por el Teorema del Límite Central

Caso: n < 30. Suponer distribución normal

Distribución T con = n –1 grados de libertad

EjemploLos siguientes datos corresponden a un estudio de las horas perdidas mensualmente por accidentes de trabajo en 6 fábricas antes y después de implantar un programa de seguridad industrial.

Fábrica Antes(horas perdidas)

Después(horas perdidas)

1 45 362 73 603 46 444 39 295 17 116 30 32

Suponer que la población es normal. Probar con 5% de significancia que el programa es eficaz

SoluciónSean 1 media de la horas perdidas antes del programa

2 media de la horas perdidas después del programa

Se desea probar que 1 > 2

1) Ho: 1 = 2 2) Ha: 1 > 2

3) = 0.054) Estadístico de prueba, n < 30

Distribución T con = n –1 grados de libertad

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

t = t0.05 = 2.015, con = n – 1 = 5 grados de libertadRegión de rechazo para Ho: t > 2.015

5) = [(45-36) + (73-60) + ... ] = 5.5

= [(9-5.5)2 + (13-5.5)2 + ... ] =27.5

= 5.244

=2.56

6) Decisión: Se rechaza Ho en favor de Ha, es decir, con una significanciade 5% se puede afirmar que el programa si es eficaz

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

INFERENCIAS RELACIONADAS CON LA VARIANZA 2

Para algunas pruebas y aplicaciones es de interés estimar el valor de la varianza poblacional 2.

Suponer que una población tiene distribución aproximadamente normal y se toma una muestra aleatoria de tamaño n de la cual se obtiene la varianza muestra S2:

,

El estadístico S2 es un estimador insesgado del parámetro 2: E[S2] = 2

La teoría estadística demuestra que la variable aleatoria: (n-1)S2/2 tiene distribución Ji-Cuadrado (2), con = n -1 grados de libertad. La distribución Ji-Cuadrado es una función cuya forma es tipo campana con sesgo positivo.

Para cada valor de se tiene una campana diferente:

Figura: Distribución Ji-Cuadrado 2 = (n-1) , con = n-1 grados de

libertadAlgunos valores de la distribución Ji-Cuadrado están tabulados para ciertos valores de y para valores típicos de con la siguiente definición

P(2 ) =

EjemploEncuentre el valor de para n = 11, = 0.05

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

SoluciónConsulte el documento E50 -Tabla de la distribución Ji-Cuadrado = n – 1 = 10, = 18.31

INTERVALO DE CONFIANZA PARA 2

En la distribución 2 se define un área central correspondiente a la probabilidad 1 - , y a los lados se divide la diferencia en dos áreas iguales /2.

Debido a que la distribución es asimétrica, los valores de la variable 2 no tienen la misma distancia desde el centro y se los representa con y

de acuerdo a la definición anterior

Se obtiene entonces el intervalo para 2 con probabilidad 1 - : 2

Si se sustituye la definición del estadístico 2 = (n-1) y se despeja el

parámetro de interés 2 se obtiene

DefiniciónIntervalo de confianza para 2 con nivel 1 -

(n – 1) 2 (n – 1) .

EjemploEn una muestra aleatoria se registró el peso de 10 paquetes y se obtuvieron los siguientes resultados en gramos:46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 41.9, 45.2, 46.0

Encuentre un intervalo de confianza para la varianza en el peso de toda la producción, con un nivel de 95%, suponiendo distribución normal

Solución

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

n=10

= [46.4 + 46.1 + ... ] = 45.62

= [(46.4 – 45.62)2 + (46.1 – 45.62)2 + ... ] = 1.919

1 - = 0.95, = n – 1 = 9 = = 19.02 (Tabla 2)

= = 2.7 (Tabla 2)

Sustituya en la definición del intervalo de confianza:

9 (1.919/19.02) 2 9 (1.919/2.7)

0.908 2 6.398

Se puede afirmar con una confianza de 95% que la varianza poblacional se encuentra en el intervalo de 0,908 a 6.398

PRUEBA DE HIPÓTESIS RELACIONADA CON LA VARIANZA 2

Seguimos el procedimiento básico establecido

1) Definir la hipótesis nula Ho: 2 = (algún valor especificado)2) Elegir una Hipótesis alterna: Ha: 2 <

Ha: 2 > Ha: 2

3) Seleccionar el nivel de significancia4) Estadístico de prueba

2 = (n-1) , distribución ji-cuadrado con =n-1 grados de libertad

Región crítica Ha Región de rechazo de Ho en favor de Ha2 < 2 < 2 > 2 >2 2< 2 >

5) Calcular el valor del estadístico de prueba con los datos de la muestra6) Decidir

EjemploUn fabricante afirma que la duración de su producto tiene distribución aproximadamente normal con una desviación estándar de 0.9 años.

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

Una muestra aleatoria de 10 productos tuvo una desviación estándar de 1.2 años. Pruebe, con una significancia de 5%, si esta evidencia es suficiente para afirmar que la desviación estándar poblacional es mayor a la especificada

SoluciónLa prueba se aplica a la varianza 2 por lo tanto 2 = (1.2)2 = 1.44

1) Ho: 2 = 0.812) Ha: 2 > 0.813) = 0.054) Estadístico de prueba

2 = (n-1) , distribución ji-cuadrado con =n-1 grados de libertad

Región de rechazo=0.05, = n-1 = 9, = 16.91Rechazar Ho si 2 > 16.91

5) 2 = (n-1) = 9 =16.0

6) Con una significancia de 5%, no hay evidencia suficiente para rechazar la

afirmación del fabricante

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

PRUEBA DE HIPÓTESIS PARA DOS VARIANZAS

Esta prueba permite comparar las varianzas de dos poblaciones. Suponer dos poblaciones con distribución aproximadamente normal con varianzas desconocidas pero supuestamente iguales.

Se toman muestras aleatorias independientes de tamaño n1 y n2 obteniéndose las varianzas muestrales y respectivamente.

La teoría estadística demuestra que el estadístico

F = , tiene distribución F con 1 = n1 – 1, 2 = n2 – 1 grados de libertad

El estadístico F tiene distribución con forma tipo campana con sesgo positivo.Para cada combinación 1 , 2 se tiene una campana diferente.

Algunos valores de esta distribución están tabulados para valores específicos de, 1, 2 de acuerdo a la siguiente definición:

= P(F> ).

También se puede usar una relación útil para conocer otros valores de la distribución F:

.

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

Siguiendo el procedimiento básico establecido para prueba de hipótesis:

1) Definir la hipótesis nula Ho: 2) Elegir una Hipótesis alterna: Ha:

Ha: Ha:

3) Seleccionar el nivel de significancia 4) Estadístico de prueba

F = , distribución F con 1 = n1 – 1, 2 = n2 – 1 grados de libertad

Región crítica Ha Región de rechazo de Ho en favor de Ha

F < F1-

F > F

F < F1-/2 F > F/2

5) Calcular el valor del estadístico de prueba con los datos de la muestra6) Decidir

EjemploDe dos poblaciones con distribución aproximadamente normal se han tomado dos muestras aleatorias independientes y se obtuveron:

Muestra n S2

1 10 5.9 4 2 8 7.1 5

Pruebe con 10% de significancia que las poblaciones tienen varianzas diferentes

Solución1) Ho: 2) Ha: 3) = 0.14) Estadístico de prueba

F = , distribución F con 1 = n1 – 1, 2 = n2 – 1 grados de libertad

Región crítica = 0.1, /2 = 0.05, 1 = 10 – 1 = 9, 2 = 8 – 1 = 7 = F0.05, 9, 7 = 3.68 (Tabla F) = F0.95, 9, 7 = 1/ = 1/F0.05, 7, 9 = 1/3.29 = 0.304

Región de rechazo de Ho en favor de Ha

F < 0.304 F > 3.68

Ing. Luis Rodríguez Ojeda Derechos reservados

Estadística ICM 00166

5) Estadístico de prueba

F = = 4/5 = 0.8

6) Decisión: No hay evidencia suficiente en la muestra para rechazar la hipótesis que las varianzas poblacionales son iguales

Ing. Luis Rodríguez Ojeda Derechos reservados