ei semana 1 nueva

42

Upload: victor-perez

Post on 02-Apr-2016

234 views

Category:

Documents


6 download

DESCRIPTION

Prueba de Hipótesis: Muestra grande

TRANSCRIPT

Page 1: Ei semana 1 nueva
Page 2: Ei semana 1 nueva

Objetivos

Describir el significado de una hipótesis nula y una alternativa.

Transformar una declaración verbal en una hipótesis nula o alternativa, e incluso determinar si es adecuada una prueba de dos colas o de una cola.

Page 3: Ei semana 1 nueva

Describir qué significan los errores de tipo I y de tipo II, y explicar cómo pueden reducirse en una prueba de hipótesis.

Efectuar una prueba de hipótesis para la media o la proporción poblacional, interpretar los resultados de la prueba y determinar la decisión de negocios correcta que debe aplicarse.

Page 4: Ei semana 1 nueva

Determinar y aplicar el valor de p para una prueba de hipótesis.

Explicar cómo se relacionan los intervalos de confianza con las pruebas de hipótesis.

Page 5: Ei semana 1 nueva

• Determinar y explicar la curva de

potencia para una prueba de hipótesis

y dar una regla de decisión específica.

• Determinar y explicar la curva

característica de operación para una

prueba de hipótesis y una regla de

decisión específica.

Page 6: Ei semana 1 nueva

La hipótesis nula

El primer paso para examinar afirmaciones como las anteriores es plantear una hipótesis nula, expresada como H0 (“H subcero”). La hipótesis nula es una afirmación acerca del valor de un parámetro poblacional y se postula para ser probada según la evidencia numérica. Una hipótesis nula se rechaza o no se rechaza.

Page 7: Ei semana 1 nueva

• La hipótesis nula es la afirmación de que

“todo sigue igual, no ocurre nada

extraño” que prácticamente lo invita a

desafiar su veracidad. En la filosofía de

una prueba de hipótesis, se supone que

la hipótesis nula es verdadera a menos

que tengamos una evidencia estadística

abrumadora de lo contrario. En otras

palabras, tiene el beneficio de la duda.

Page 8: Ei semana 1 nueva

La hipótesis alternativa

La hipótesis alternativa, H1 (“H subuno), es la afirmación que se sustenta si la hipótesis es falsa. Para una prueba específica, las hipótesis nula y alternativa incluyen todos los valores posibles de un parámetro de la población, de modo que una de las dos tiene que ser falsa.

Page 9: Ei semana 1 nueva

Existen tres opciones posibles para plantear las hipótesis nula y alternativa

Page 10: Ei semana 1 nueva

Prueba direccional y prueba no direccional

Una declaración o afirmación direccional sostiene que un parámetro poblacional es mayor que (>), al menos (≥), no mayor que (≤) o menor que (<) alguna cantidad. Por ejemplo, el proveedor de Jackson afirma que no más de 20% de las latas de remolacha están abolladas.

Page 11: Ei semana 1 nueva

• Una declaración o afirmación no

direccional sostiene que un parámetro

es igual a alguna cantidad. Por

ejemplo, Titus Walsh afirma que 35%

de los ciclistas son ciudadanos de la

tercera edad.

Page 12: Ei semana 1 nueva

La prueba de hipótesis y la naturaleza de la prueba

Figura 1

H0: p = 0.35 H1: p 0.35

Rechazar H0 No rechazar H0 Rechazar H0

0.35

Proporción de personas de la tercera edad en una muestra aleatoria de ciclistas

a) Titus Walsh: “El 35% de los ciclistas del sistema son personas de la tercera edad”

Page 13: Ei semana 1 nueva

H0: p ≤ 0.20 H1: p > 0.20

No se rechaza H0 Se rechaza H0

0.20

Proporción de envases abollados en una muestra aleatoria de latas de remolacha

a) Proveedor de Jackson Backus: “No más del 20% de las latas están abolladas”

Page 14: Ei semana 1 nueva

Tabla 1: Categorías de las afirmaciones típicas para las hipótesis nula y alternativa

A: La afirmación es una igualdad, “ = ”

Ejemplo:”El promedio de duración de un neumático es de 35 000 millas”

H0: = 35 000 millas

H1: µ 35 000 millas

B: Las afirmaciones “ ” o “ ” (NO > o <)

Ejemplo: “El promedio de duración de un neumático es al menos de 35 000 millas”

H0: 35 000 millas

H1: µ < 35 000 millas

Ejemplo: “El promedio de duración de un neumático es no más de 35 000 millas”

H0: 35 000 millas

H1: µ > 35 000 millas

Page 15: Ei semana 1 nueva

Errores en las pruebas de hipótesis

El rechazo de una hipótesis nula que es verdadera se conoce como error tipo I , y nuestra probabilidad de cometer tal error se representa mediante la letra griega alfa ( α ). Esta probabilidad, que se denomina nivel de significancia de la prueba, es muy importante en una prueba de hipótesis.

Page 16: Ei semana 1 nueva

Por otra parte, podemos cometer el error de no rechazar una hipótesis nula que es falsa; éste es un error tipo II. La probabilidad de cometerlo se representa mediante la letra griega beta (β ).

La probabilidad de rechazar una hipótesis nula que es falsa se llama potencia de la prueba.

Page 17: Ei semana 1 nueva

Pruebas de hipótesis: procedimientos básicos

1.- Formular las hipótesis nula y alternativa.

2.- Seleccionar el nivel de significancia.

3.- Seleccionar el estadístico de prueba y calcular su valor.

4.- Identificar los valores críticos para el estadístico de prueba y establecer la regla de decisión.

5.- Comparar los valores calculados y críticos y llegar a una conclusión acerca de la hipótesis nula.

6.- Tomar la decisión de negocios correspondiente.

Page 18: Ei semana 1 nueva

Estadístico de la prueba, prueba z para la media muestral:

Page 19: Ei semana 1 nueva

Interpretación del valor p en la impresión de una computadora:

Page 20: Ei semana 1 nueva

Prueba para la proporción

En ocasiones, necesitamos comparar la proporción de una muestra, , con un valor

supuesto en una hipótesis para la proporción de la población, p. Por ejemplo, cada una

de las siguientes situaciones puede someterse a las técnicas de esta sección:

Page 21: Ei semana 1 nueva

Una destacada candidata para el concejo municipal declara

que 65% de los electores de la ciudad pretende votar por

ella en la elección venidera. En un muestreo

independiente, sólo 40% de 120 electores dice que votará

por la candidata.

Un propietario de un taller de reparación de automóviles

afirma que no más de 5% de sus clientes está satisfecho

con su trabajo. Sin embargo, una encuesta de 150 clientes

revela que 20% no está satisfecho con el trabajo realizado.

Cuando una máquina funciona en forma correcta, sólo 3%

de las unidades producidas están defectuosas. En una

muestra de 400 unidades, 4.5% están defectuosas.

Page 22: Ei semana 1 nueva

La distribución teóricamente correcta para abordar las proporciones es la distribución

binomial. Sin embargo, la distribución normal es una buena aproximación cuando np

5 y n(1-p) 5.. Cuanto más grande es el tamaño de la muestra, mejor se torna esta

aproximación y para la mayoría de las situaciones prácticas se satisface esta condición.

Cuando se usa la distribución normal para pruebas de hipótesis acerca de la proporción

muestral, el estadístico de la prueba es el siguiente:

Page 23: Ei semana 1 nueva

Estadístico de la prueba, prueba z para la proporción muestral

, donde

= la proporción muestral

p = la proporción poblacional de la hipótesis

n = el tamaño de la muestra

el error estándar de la distribución de la proporción muestral

Page 24: Ei semana 1 nueva

Prueba de dos colas para la proporción

Ejemplo: El director de servicios de carreras de la

Hobart University declaró que 70% de los

estudiantes universitarios de último año entra al

mercado laboral en un puesto directamente

relacionado con su área de estudio. En una

muestra formada por 200 graduados de la

generación del año anterior, 66% obtuvo empleos

relacionados con su área de estudios.

Page 25: Ei semana 1 nueva

Solución

Formular las hipótesis nula y alternativa

La afirmación del director es no direccional y conduce a las hipótesis nula y alternativa

de:

H0: p = 0.70 La proporción de graduados que consiguen empleos en su área de

estudios es de 0.70.

H1: p 0.70 La proporción es un valor diferente de 0.70

Seleccionar el nivel de significancia

Para esta prueba, se utilizará un nivel de significancia de 0.05. La suma de las áreas de

las dos colas será 0.05.

Page 26: Ei semana 1 nueva

Seleccionar el estadístico de la prueba y calcular su valor

El estadístico de la prueba será z, el número de unidades de error estándar entre la

proporción poblacional de la hipótesis, p = 0.70, y la proporción muestral, p = 0.66. El

error estándar de la proporción muestral es:

= 0.0324

y el valor calculado de z es:

= -1.23

Page 27: Ei semana 1 nueva

Identificar los valores críticos para el estadístico de la prueba y plantear la

regla de decisión

Dado que esta prueba es de dos colas y el nivel de significancia seleccionado es

de 0.05, los valores críticos serán z = -1.96 y z = +1.96. La regla de decisión se

plantea como “Rechazar H0 si la z calculada es < -1.96 o > +1.96, de lo

contrario no rechazar”.

Comparar los valores calculado y crítico y llegar a una conclusión para la

hipótesis nula

El valor calculado del estadístico de la prueba, z = -1.23, cae entre los dos

valores críticos, lo cual lo coloca en la región de no rechazo de la distribución.

La hipótesis nula no se rechaza.

Page 28: Ei semana 1 nueva

Tomar la decisión correspondiente

No rechazar la hipótesis nula nos hace concluir que

la proporción de graduados que entran al mercado

laboral en puestos relacionados con su área de

estudios puede ser igual al valor declarado de 0.70.

Si el director de servicios de carrera afirma esto

ante los estudiantes o sus padres, el análisis sugiere

que su aseveración no será cuestionada.

Page 29: Ei semana 1 nueva

Prueba de una cola de una proporción

Ejemplo: En una decisión administrativa, la U.S. Veterans

Administration (VA) cerró las unidades de cirugía cardíaca en

varios de sus hospitales que realizaban menos de 150

operaciones al año o tenían tasas de mortalidad superiores a

5.0%. En una de las unidades quirúrgicas cerradas, se habían

efectuado 100 operaciones durante el año anterior, con una tasa

de mortalidad de 7.0%. Con un nivel de significancia de 0.01,

¿la tasa de mortalidad de este hospital fue significativamente

mayor que el valor límite de 5.0%? Considere que el

desempeño del hospital representa una muestra de la población

de operaciones que pudieron realizarse si hubieran tenido

pacientes.

Page 30: Ei semana 1 nueva

Solución

Formular las hipótesis nula y alternativa

La hipótesis nula supone que la tasa de mortalidad de la “población” para la unidad de

cirugía cardíaca del hospital en realidad es no mayor que 0.05, y que la proporción

observada, = 0.07, se debió simplemente a una variación casual.

La tasa de mortalidad verdadera para la unidad es no mayor que 0.05

La tasa de mortalidad verdadera es mayor que 0.05

El centro de la distribución para la hipótesis, p = 0.05, es el valor más alto posible para

el cual la hipótesis nula podría ser verdadera.

Page 31: Ei semana 1 nueva

Seleccionar el nivel de significancia

El nivel de significancia se especificó como = 0.01. Si la hipótesis nula fuera

verdadera, no habrá más que una probabilidad de 0.01 de rechazar incorrectamente.

Seleccionar el estadístico de prueba y calcular su valor

El estadístico de prueba será z, calculada como . El error estándar de la

proporción de la muestra y el valor calculado del estadístico de prueba son:

y

= 0.92

Page 32: Ei semana 1 nueva

Identificar el valor crítico para estadístico de prueba y plantear la regla de decisión

Para el nivel de 0.01, el valor crítico de z es z = 2.33. La regla de decisión se plantea

como “Rechazar H0 si la z calculada es z > +2.33, de lo contrario, no rechazar”

Comparar los valores calculado y crítico y llegar a una conclusión para la hipótesis

nula

Como el valor calculado, z = 0.92, es menor que el valor crítico, cae en la región de no

rechazo y la hipótesis nula, , no puede ser rechazada.

Page 33: Ei semana 1 nueva

Tomar la decisión correspondiente

La tasa de mortalidad por cirugía cardíaca para este

hospital pudo ser de 0.07 sólo por casualidad, y su

cierre no puede ser justificado con base en el

argumento “es significativamente mayor que 0.05”.

Page 34: Ei semana 1 nueva

El efecto de un tamaño de muestra más grande en los errores de tipo I y de tipo II

Para un tamaño de muestra específico, podemos cambiar la regla de decisión de modo

que disminuya , la probabilidad de cometer un error de tipo II. Sin embargo, esto

aumentará , la probabilidad de cometer un error de tipo I. Asimismo, para un tamaño

de muestra específico, modificar la regla de decisión con el fin de disminuir

aumentará . En cualquiera de los casos, tenemos una correspondencia entre y . Por

otra parte, podemos disminuir tanto como al usar un tamaño de muestra más

grande. Con el tamaño de muestra más grande: 1) será más estrecha la distribución

muestral de la media o de la proporción, y 2) es más probable que la regla de decisión

resultante nos conduzca a la conclusión correcta con respecto a la hipótesis nula.

Si se efectúa una prueba con un nivel de significancia específico (por ejemplo, =

0.05), utilizar una tamaño de muestra más grande cambiará la regla de decisión, pero no

modificará . Esto se debe a que se ha definido con anticipación. Sin embargo, en

esta situación un tamaño de muestra más grande reducirá el valor de , la probabilidad

de cometer un error de tipo II.

Page 35: Ei semana 1 nueva

Ejemplo Suponga que la prueba de Extendabulb corresponde a una muestra

formada por n = 60 focos en lugar de sólo 40. Con el tamaño de

muestra más grande, la prueba ahora se vería así:

La prueba no se modifica con respecto a los siguiente:

Hipótesis nula:

Hipótesis alternativa:

Desviación estándar de la población:

Nivel de significancia especificado:

Se modifica lo siguiente como resultado de n = 60 en lugar de n = 40:

Page 36: Ei semana 1 nueva

El error estándar de la media muestral, , ahora es:

El valor crítico de z de +1.645 ahora corresponde a una media muestral de:

1030.00 + 1.645(11.62) horas = 1049.11 horas

La regla de decisión se convierte en, “Rechazar si > 1049.11 horas”

Con el tamaño de muestra más grande y esta nueva regla de decisión, encontraríamos

los valores siguientes para la potencia de la prueba. En la tabla respectiva, se comparan

los valores de la potencia de la prueba con n = 60 y n = 40.

Page 37: Ei semana 1 nueva

Cada prueba utiliza su propia regla de decisión para el nivel de significancia de

0.05.

Potencia de la prueba

Con n = 60 Con n = 40

Verdadero valor de µ Prob.( >1049.11) Prob.( >1053.41)

1040 0.2177 0.1736

1060 0.8264 0.6772

1080 0.9961* 0.9693

Page 38: Ei semana 1 nueva

Por ejemplo, para n = 60 y la regla de decisión mostrada;

con el área de la curva a la derecha de z = -2.66 igual a 0.9961*

Como indican estas cifras, la misma prueba con n = 60 (y la regla de decisión

correspondiente) tendría una probabilidad más grande de rechazar correctamente la

hipótesis nula falsa para cada posible media poblacional del caso anterior (curva de

potencia para una prueba de hipótesis). Si el ejemplo de Extendabulb hubiera

permanecido igual, pero sólo se hubiera cambiado el tamaño de la muestra, el

tamaño de la muestra n = 60 hubiera producido valores de ( mucho más alto

que los calculados antes para n = 40.

Page 39: Ei semana 1 nueva

Diferencia Potencia (n = 40) Potencia1 (n = 60)

0 0.050000 0.050000

10 0.173064 0.216464

20 0.405399 0.530478

30 0.678437 0.825656

40 0.878205 0.963896

50 0.969174 0.996075

60 0.994937 0.999784

Page 40: Ei semana 1 nueva

Procedimiento de Minitab para obtener la curva de potencia para una

prueba de hipótesis

1.- Haga clic en Star. Seleccione Power and Sample Size. Haga clic en 1-

Sample Z. Escriba 40 en el cuadro Sample Sizes. Introduzca 0, 10, 20, 30,

40, 50, 60 (separados por espacios) en el cuadro Diferences. Estas son las

diferencias entre la media poblacional de la hipótesis (1030) y los valores

seleccionados para la media real supuesta (es decir, 1030, 1040, 1050,

1060, 1070, 1080 y 1090). Escriba 90 en el cuadro Standard desviation.

2.- Haga clic en Options. Dentro del cuadro Alternative Hypothesis,

seleccione Greater than. Introduzca 0.05 en el cuadro Significance level.

Haga clic en OK dos veces. La impression muestra la potencia de la

prueba para los tamaños de muestra de 40 y para las medias poblacionales

reales supuestas de 1030 (la diferencia de 1030 es 0), 1040, 1050, 1060,

1070, 1080 y 1090.

Page 41: Ei semana 1 nueva

Power and Sample Size 1-Sample Z Test

Testing mean = null (versus > null)

Calculating power for mean = null + difference

Alpha = 0.05 Assumed standard deviation = 90

Sample

Difference Size Power

0 40 0.050000

10 40 0.173064

20 40 0.405399

30 40 0.678437

40 40 0.878205

50 40 0.969174

60 40 0.994937

Si consideramos un tamaño de muestra de n = 60, obtenemos los siguientes resultados:

1-Sample Z Test

Testing mean = null (versus > null)

Calculating power for mean = null + difference

Alpha = 0.05 Assumed standard deviation = 90

Sample

Difference Size Power

0 60 0.050000

10 60 0.216464

20 60 0.530478

30 60 0.825656

40 60 0.963896

50 60 0.996075

60 60 0.999784

Page 42: Ei semana 1 nueva

Se puede graficar la curva de potencia para los dos casos (n = 40 y n = 60):