ei semana 1 nueva
DESCRIPTION
Prueba de Hipótesis: Muestra grandeTRANSCRIPT
Objetivos
Describir el significado de una hipótesis nula y una alternativa.
Transformar una declaración verbal en una hipótesis nula o alternativa, e incluso determinar si es adecuada una prueba de dos colas o de una cola.
Describir qué significan los errores de tipo I y de tipo II, y explicar cómo pueden reducirse en una prueba de hipótesis.
Efectuar una prueba de hipótesis para la media o la proporción poblacional, interpretar los resultados de la prueba y determinar la decisión de negocios correcta que debe aplicarse.
Determinar y aplicar el valor de p para una prueba de hipótesis.
Explicar cómo se relacionan los intervalos de confianza con las pruebas de hipótesis.
• Determinar y explicar la curva de
potencia para una prueba de hipótesis
y dar una regla de decisión específica.
• Determinar y explicar la curva
característica de operación para una
prueba de hipótesis y una regla de
decisión específica.
La hipótesis nula
El primer paso para examinar afirmaciones como las anteriores es plantear una hipótesis nula, expresada como H0 (“H subcero”). La hipótesis nula es una afirmación acerca del valor de un parámetro poblacional y se postula para ser probada según la evidencia numérica. Una hipótesis nula se rechaza o no se rechaza.
• La hipótesis nula es la afirmación de que
“todo sigue igual, no ocurre nada
extraño” que prácticamente lo invita a
desafiar su veracidad. En la filosofía de
una prueba de hipótesis, se supone que
la hipótesis nula es verdadera a menos
que tengamos una evidencia estadística
abrumadora de lo contrario. En otras
palabras, tiene el beneficio de la duda.
La hipótesis alternativa
La hipótesis alternativa, H1 (“H subuno), es la afirmación que se sustenta si la hipótesis es falsa. Para una prueba específica, las hipótesis nula y alternativa incluyen todos los valores posibles de un parámetro de la población, de modo que una de las dos tiene que ser falsa.
Existen tres opciones posibles para plantear las hipótesis nula y alternativa
Prueba direccional y prueba no direccional
Una declaración o afirmación direccional sostiene que un parámetro poblacional es mayor que (>), al menos (≥), no mayor que (≤) o menor que (<) alguna cantidad. Por ejemplo, el proveedor de Jackson afirma que no más de 20% de las latas de remolacha están abolladas.
• Una declaración o afirmación no
direccional sostiene que un parámetro
es igual a alguna cantidad. Por
ejemplo, Titus Walsh afirma que 35%
de los ciclistas son ciudadanos de la
tercera edad.
La prueba de hipótesis y la naturaleza de la prueba
Figura 1
H0: p = 0.35 H1: p 0.35
Rechazar H0 No rechazar H0 Rechazar H0
0.35
Proporción de personas de la tercera edad en una muestra aleatoria de ciclistas
a) Titus Walsh: “El 35% de los ciclistas del sistema son personas de la tercera edad”
H0: p ≤ 0.20 H1: p > 0.20
No se rechaza H0 Se rechaza H0
0.20
Proporción de envases abollados en una muestra aleatoria de latas de remolacha
a) Proveedor de Jackson Backus: “No más del 20% de las latas están abolladas”
Tabla 1: Categorías de las afirmaciones típicas para las hipótesis nula y alternativa
A: La afirmación es una igualdad, “ = ”
Ejemplo:”El promedio de duración de un neumático es de 35 000 millas”
H0: = 35 000 millas
H1: µ 35 000 millas
B: Las afirmaciones “ ” o “ ” (NO > o <)
Ejemplo: “El promedio de duración de un neumático es al menos de 35 000 millas”
H0: 35 000 millas
H1: µ < 35 000 millas
Ejemplo: “El promedio de duración de un neumático es no más de 35 000 millas”
H0: 35 000 millas
H1: µ > 35 000 millas
Errores en las pruebas de hipótesis
El rechazo de una hipótesis nula que es verdadera se conoce como error tipo I , y nuestra probabilidad de cometer tal error se representa mediante la letra griega alfa ( α ). Esta probabilidad, que se denomina nivel de significancia de la prueba, es muy importante en una prueba de hipótesis.
Por otra parte, podemos cometer el error de no rechazar una hipótesis nula que es falsa; éste es un error tipo II. La probabilidad de cometerlo se representa mediante la letra griega beta (β ).
La probabilidad de rechazar una hipótesis nula que es falsa se llama potencia de la prueba.
Pruebas de hipótesis: procedimientos básicos
1.- Formular las hipótesis nula y alternativa.
2.- Seleccionar el nivel de significancia.
3.- Seleccionar el estadístico de prueba y calcular su valor.
4.- Identificar los valores críticos para el estadístico de prueba y establecer la regla de decisión.
5.- Comparar los valores calculados y críticos y llegar a una conclusión acerca de la hipótesis nula.
6.- Tomar la decisión de negocios correspondiente.
Estadístico de la prueba, prueba z para la media muestral:
Interpretación del valor p en la impresión de una computadora:
Prueba para la proporción
En ocasiones, necesitamos comparar la proporción de una muestra, , con un valor
supuesto en una hipótesis para la proporción de la población, p. Por ejemplo, cada una
de las siguientes situaciones puede someterse a las técnicas de esta sección:
Una destacada candidata para el concejo municipal declara
que 65% de los electores de la ciudad pretende votar por
ella en la elección venidera. En un muestreo
independiente, sólo 40% de 120 electores dice que votará
por la candidata.
Un propietario de un taller de reparación de automóviles
afirma que no más de 5% de sus clientes está satisfecho
con su trabajo. Sin embargo, una encuesta de 150 clientes
revela que 20% no está satisfecho con el trabajo realizado.
Cuando una máquina funciona en forma correcta, sólo 3%
de las unidades producidas están defectuosas. En una
muestra de 400 unidades, 4.5% están defectuosas.
La distribución teóricamente correcta para abordar las proporciones es la distribución
binomial. Sin embargo, la distribución normal es una buena aproximación cuando np
5 y n(1-p) 5.. Cuanto más grande es el tamaño de la muestra, mejor se torna esta
aproximación y para la mayoría de las situaciones prácticas se satisface esta condición.
Cuando se usa la distribución normal para pruebas de hipótesis acerca de la proporción
muestral, el estadístico de la prueba es el siguiente:
Estadístico de la prueba, prueba z para la proporción muestral
, donde
= la proporción muestral
p = la proporción poblacional de la hipótesis
n = el tamaño de la muestra
el error estándar de la distribución de la proporción muestral
Prueba de dos colas para la proporción
Ejemplo: El director de servicios de carreras de la
Hobart University declaró que 70% de los
estudiantes universitarios de último año entra al
mercado laboral en un puesto directamente
relacionado con su área de estudio. En una
muestra formada por 200 graduados de la
generación del año anterior, 66% obtuvo empleos
relacionados con su área de estudios.
Solución
Formular las hipótesis nula y alternativa
La afirmación del director es no direccional y conduce a las hipótesis nula y alternativa
de:
H0: p = 0.70 La proporción de graduados que consiguen empleos en su área de
estudios es de 0.70.
H1: p 0.70 La proporción es un valor diferente de 0.70
Seleccionar el nivel de significancia
Para esta prueba, se utilizará un nivel de significancia de 0.05. La suma de las áreas de
las dos colas será 0.05.
Seleccionar el estadístico de la prueba y calcular su valor
El estadístico de la prueba será z, el número de unidades de error estándar entre la
proporción poblacional de la hipótesis, p = 0.70, y la proporción muestral, p = 0.66. El
error estándar de la proporción muestral es:
= 0.0324
y el valor calculado de z es:
= -1.23
Identificar los valores críticos para el estadístico de la prueba y plantear la
regla de decisión
Dado que esta prueba es de dos colas y el nivel de significancia seleccionado es
de 0.05, los valores críticos serán z = -1.96 y z = +1.96. La regla de decisión se
plantea como “Rechazar H0 si la z calculada es < -1.96 o > +1.96, de lo
contrario no rechazar”.
Comparar los valores calculado y crítico y llegar a una conclusión para la
hipótesis nula
El valor calculado del estadístico de la prueba, z = -1.23, cae entre los dos
valores críticos, lo cual lo coloca en la región de no rechazo de la distribución.
La hipótesis nula no se rechaza.
Tomar la decisión correspondiente
No rechazar la hipótesis nula nos hace concluir que
la proporción de graduados que entran al mercado
laboral en puestos relacionados con su área de
estudios puede ser igual al valor declarado de 0.70.
Si el director de servicios de carrera afirma esto
ante los estudiantes o sus padres, el análisis sugiere
que su aseveración no será cuestionada.
Prueba de una cola de una proporción
Ejemplo: En una decisión administrativa, la U.S. Veterans
Administration (VA) cerró las unidades de cirugía cardíaca en
varios de sus hospitales que realizaban menos de 150
operaciones al año o tenían tasas de mortalidad superiores a
5.0%. En una de las unidades quirúrgicas cerradas, se habían
efectuado 100 operaciones durante el año anterior, con una tasa
de mortalidad de 7.0%. Con un nivel de significancia de 0.01,
¿la tasa de mortalidad de este hospital fue significativamente
mayor que el valor límite de 5.0%? Considere que el
desempeño del hospital representa una muestra de la población
de operaciones que pudieron realizarse si hubieran tenido
pacientes.
Solución
Formular las hipótesis nula y alternativa
La hipótesis nula supone que la tasa de mortalidad de la “población” para la unidad de
cirugía cardíaca del hospital en realidad es no mayor que 0.05, y que la proporción
observada, = 0.07, se debió simplemente a una variación casual.
La tasa de mortalidad verdadera para la unidad es no mayor que 0.05
La tasa de mortalidad verdadera es mayor que 0.05
El centro de la distribución para la hipótesis, p = 0.05, es el valor más alto posible para
el cual la hipótesis nula podría ser verdadera.
Seleccionar el nivel de significancia
El nivel de significancia se especificó como = 0.01. Si la hipótesis nula fuera
verdadera, no habrá más que una probabilidad de 0.01 de rechazar incorrectamente.
Seleccionar el estadístico de prueba y calcular su valor
El estadístico de prueba será z, calculada como . El error estándar de la
proporción de la muestra y el valor calculado del estadístico de prueba son:
y
= 0.92
Identificar el valor crítico para estadístico de prueba y plantear la regla de decisión
Para el nivel de 0.01, el valor crítico de z es z = 2.33. La regla de decisión se plantea
como “Rechazar H0 si la z calculada es z > +2.33, de lo contrario, no rechazar”
Comparar los valores calculado y crítico y llegar a una conclusión para la hipótesis
nula
Como el valor calculado, z = 0.92, es menor que el valor crítico, cae en la región de no
rechazo y la hipótesis nula, , no puede ser rechazada.
Tomar la decisión correspondiente
La tasa de mortalidad por cirugía cardíaca para este
hospital pudo ser de 0.07 sólo por casualidad, y su
cierre no puede ser justificado con base en el
argumento “es significativamente mayor que 0.05”.
El efecto de un tamaño de muestra más grande en los errores de tipo I y de tipo II
Para un tamaño de muestra específico, podemos cambiar la regla de decisión de modo
que disminuya , la probabilidad de cometer un error de tipo II. Sin embargo, esto
aumentará , la probabilidad de cometer un error de tipo I. Asimismo, para un tamaño
de muestra específico, modificar la regla de decisión con el fin de disminuir
aumentará . En cualquiera de los casos, tenemos una correspondencia entre y . Por
otra parte, podemos disminuir tanto como al usar un tamaño de muestra más
grande. Con el tamaño de muestra más grande: 1) será más estrecha la distribución
muestral de la media o de la proporción, y 2) es más probable que la regla de decisión
resultante nos conduzca a la conclusión correcta con respecto a la hipótesis nula.
Si se efectúa una prueba con un nivel de significancia específico (por ejemplo, =
0.05), utilizar una tamaño de muestra más grande cambiará la regla de decisión, pero no
modificará . Esto se debe a que se ha definido con anticipación. Sin embargo, en
esta situación un tamaño de muestra más grande reducirá el valor de , la probabilidad
de cometer un error de tipo II.
Ejemplo Suponga que la prueba de Extendabulb corresponde a una muestra
formada por n = 60 focos en lugar de sólo 40. Con el tamaño de
muestra más grande, la prueba ahora se vería así:
La prueba no se modifica con respecto a los siguiente:
Hipótesis nula:
Hipótesis alternativa:
Desviación estándar de la población:
Nivel de significancia especificado:
Se modifica lo siguiente como resultado de n = 60 en lugar de n = 40:
El error estándar de la media muestral, , ahora es:
El valor crítico de z de +1.645 ahora corresponde a una media muestral de:
1030.00 + 1.645(11.62) horas = 1049.11 horas
La regla de decisión se convierte en, “Rechazar si > 1049.11 horas”
Con el tamaño de muestra más grande y esta nueva regla de decisión, encontraríamos
los valores siguientes para la potencia de la prueba. En la tabla respectiva, se comparan
los valores de la potencia de la prueba con n = 60 y n = 40.
Cada prueba utiliza su propia regla de decisión para el nivel de significancia de
0.05.
Potencia de la prueba
Con n = 60 Con n = 40
Verdadero valor de µ Prob.( >1049.11) Prob.( >1053.41)
1040 0.2177 0.1736
1060 0.8264 0.6772
1080 0.9961* 0.9693
Por ejemplo, para n = 60 y la regla de decisión mostrada;
con el área de la curva a la derecha de z = -2.66 igual a 0.9961*
Como indican estas cifras, la misma prueba con n = 60 (y la regla de decisión
correspondiente) tendría una probabilidad más grande de rechazar correctamente la
hipótesis nula falsa para cada posible media poblacional del caso anterior (curva de
potencia para una prueba de hipótesis). Si el ejemplo de Extendabulb hubiera
permanecido igual, pero sólo se hubiera cambiado el tamaño de la muestra, el
tamaño de la muestra n = 60 hubiera producido valores de ( mucho más alto
que los calculados antes para n = 40.
Diferencia Potencia (n = 40) Potencia1 (n = 60)
0 0.050000 0.050000
10 0.173064 0.216464
20 0.405399 0.530478
30 0.678437 0.825656
40 0.878205 0.963896
50 0.969174 0.996075
60 0.994937 0.999784
Procedimiento de Minitab para obtener la curva de potencia para una
prueba de hipótesis
1.- Haga clic en Star. Seleccione Power and Sample Size. Haga clic en 1-
Sample Z. Escriba 40 en el cuadro Sample Sizes. Introduzca 0, 10, 20, 30,
40, 50, 60 (separados por espacios) en el cuadro Diferences. Estas son las
diferencias entre la media poblacional de la hipótesis (1030) y los valores
seleccionados para la media real supuesta (es decir, 1030, 1040, 1050,
1060, 1070, 1080 y 1090). Escriba 90 en el cuadro Standard desviation.
2.- Haga clic en Options. Dentro del cuadro Alternative Hypothesis,
seleccione Greater than. Introduzca 0.05 en el cuadro Significance level.
Haga clic en OK dos veces. La impression muestra la potencia de la
prueba para los tamaños de muestra de 40 y para las medias poblacionales
reales supuestas de 1030 (la diferencia de 1030 es 0), 1040, 1050, 1060,
1070, 1080 y 1090.
Power and Sample Size 1-Sample Z Test
Testing mean = null (versus > null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 90
Sample
Difference Size Power
0 40 0.050000
10 40 0.173064
20 40 0.405399
30 40 0.678437
40 40 0.878205
50 40 0.969174
60 40 0.994937
Si consideramos un tamaño de muestra de n = 60, obtenemos los siguientes resultados:
1-Sample Z Test
Testing mean = null (versus > null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 90
Sample
Difference Size Power
0 60 0.050000
10 60 0.216464
20 60 0.530478
30 60 0.825656
40 60 0.963896
50 60 0.996075
60 60 0.999784
Se puede graficar la curva de potencia para los dos casos (n = 40 y n = 60):