prueba de hipótesis (2)

63
1 Prueba de hipótesis

Upload: paolo-pari

Post on 20-Oct-2015

594 views

Category:

Documents


14 download

TRANSCRIPT

1

Prueba de hipótesis

Conceptos generales

La prueba de hipótesis, denominada también prueba de significación, tiene como objeto principal evaluar suposiciones o afirmaciones acerca de los valores estadísticos de la población, denominados parámetros.

«Docimar = probar»

2

Hipótesis estadística

Es un supuesto acerca de un parámetro o algún valor estadístico de una población (media aritmética, varianza, etc.)

3

Ejemplo

Se efectúan 100 lanzamientos de una moneda y se obtienen 60 caras (40 sellos). Vamos a probar la legitimidad de la moneda tomando en cuenta que al lanzar 100 monedas, lo lógico sería que cayeran 50 caras y 50 sellos. Sin embargo, al realizar el experimento se presentaron 60 caras en vez de obtener 50; esta pequeña diferencia puede llevarnos a pensar, que la probabilidad de presentación de cara es mayor que la de sello, dicho en otras palabras, que la moneda está cargada o arreglada.

4

Ejemplo

i) Determinando la probabilidad de que se obtenga 60 caras a más 𝑃 𝑋 ≥ 60

𝝁 = 𝒏𝒑𝝈 = 𝒏𝒑𝒒𝒁 =𝑿 − 𝝁

𝝈

𝝁 = 𝟏𝟎𝟎𝟏

𝟐=50 𝝈 = 𝟏𝟎𝟎

𝟏

𝟐

𝟏

𝟐=5 𝒁 =

𝟔𝟎−𝟓𝟎

𝟓= 𝟐

por lo tanto: 𝑃 𝑋 ≥ 60 = 0,02275 = 2,28%

5

Lo que se considera una probabilidad muy pequeña

Ejemplo

Este resultado (N° mayor o menor de caras) nos lleva a pensar sobre lo sucedido y tenemos 2 explicaciones:

i) La moneda o monedas utilizadas en este experimento es o son fabricadas perfectamente, por lo tanto el resultado obtenido es el correcto, pero ha sucedido algo raro, pues esperábamos igual número de caras y sellos.

6

Ejemplo

ii. La moneda tiene falla de fabricación, por lo que se explica que una de las caras puede aparecer con mayor frecuencia. Se está diciendo que la moneda no está equilibrada, es decir, está cargada en uno de los lados.

7

Clases de Hipótesis

a) Hipótesis Nula 𝐻0

se formula con el fin de rechazarla.

a) Hipótesis alternativa 𝐻𝑎

Enunciado opuesto a la 𝐻0

8

9

Tipos de errores

Información muestral

Aceptar H0 Rechazar H0

Decisión

H0 es

cierta No hay error Error I

H0 es

falsa Error II No hay error

Ejemplo

Supongamos que se detiene a una persona por robo y se lo envía al juez quien podrá declararlo inocente o culpable. Al juez se le presentan los pro y los contra y, con base en toda la información, decide dejarlo libre o condenarlo. El juez, no sabrá si hubo error en su decisión, sólo podrá saber la persona que ha sido juzgada.

10

11

Ejemplo

Persona juzgada

Inocente Culpable

Decisión

Libre

Decisión

correcta Error

Condena

do Error

Decisión

correcta

12

Pasos a seguir en una Prueba

de Hipótesis

Paso 1: Planteo de hipótesis.

Paso 2: Nivel de significación.

Paso 3: Prueba estadística.

Paso 4: Suposiciones.

Paso 5: Regiones críticas. Criterios dedecisión.

Paso 6: Realización de la prueba.

Paso 7: Resultados y conclusiones.

Situaciones especiales

13

14

Estadístico de la prueba

Distribución de medias muestrales:

Distribución de proporciones muestrales:

15

𝑍 = 𝑥−𝜇𝜎

𝑛

o 𝑍 = 𝑥−𝜇𝜎

𝑛

𝑠𝑖 𝑛 > 30

𝑍 =𝑝−𝑃

𝑝𝑞

𝑛

𝑠iendo 𝑛 > 30

Estadístico de la prueba

Distribución de diferencias entre dos medias muestrales: (Siendo n1 y n2 mayores que 30)

Distribución de proporciones muestrales:

16

𝑍 = 𝑥− 𝑦 −(𝜇𝑥−𝜇𝑦)

𝜎2𝑥

𝑛1+

𝜎2𝑦

𝑛2

o 𝑍 = 𝑥− 𝑦 −(𝜇𝑥−𝜇𝑦)

𝑠2𝑥

𝑛1+

𝑠2𝑦

𝑛2

𝑍 =𝑝1−𝑝2 −(𝜇𝑃1−𝜇𝑃2)

𝑝1𝑞1𝑛1

+𝑝2𝑞2𝑛2

𝑐𝑢𝑎𝑛𝑑𝑜 𝑛1 𝑦 𝑛2 > 30

17

Prueba de hipótesis para una media

poblacional (varianza conocida)

Ejemplo 1. Un inspector de calidad investiga las acusaciones contra una embotelladora por su deficiente llenado que debe ser, en promedio, de 32,5 onzas. Para ello toma una muestra de 60 botellas, encontrando que el contenido medio es de 31,9 onzas de líquido. Se sabe que la máquina embotelladora debe producir un llenado con una desviación típica de 3,6 onzas. ¿Puede el inspector llegar a la conclusión, a un nivel de significación del 5%, que se están llenando las botellas por debajo de su especificación de contenido?

18

Prueba de hipótesis para una media

poblacional (varianza conocida)

Como -1,29 se sitúa en la zona de aceptación, es válida la hipótesis nula, lo cual significa que el inspector no debe llegar a la conclusión, que se esté llenando y vendiendo un producto por debajo de su especificación, al nivel del 5%.

19

Prueba de hipótesis para una media

poblacional (varianza conocida)

Un proceso está programado para empacarla cantidad media, una libra (16 onzas) decafé. Se toma una muestra aleatoria de 36paquetes; resulta una media de 14,2 onzas ydesviación típica de 5,3 onzas. Al nivel del5%, ¿Se podrá afirmar que no se estácumpliendo con lo indicado en el empaque?

20

𝜇 = 16 𝑛 = 36 𝑥 = 14,2 𝑠 = 5,3

16:

16:0

aH

H

04,2

36

3,5

162,14

Z

Al nivel del 5%, se podrá afirmar que no se está cumpliendo con lo indicado por la fábrica. Se puede ver que -2,04 se ubica en la región crítica, por lo tanto se estará rechazando la hipótesis nula, y aceptando la hipótesis alternativa.

21

Prueba de hipótesis para una media

poblacional (varianza conocida)

Una empresa eléctrica fabrica focoscuya duración se distribuye de formaaproximadamente normal con media de800 horas y desviación estándar de 40horas. Pruebe la hipótesis de quehoras contra la alternativa horas si unamuestra aleatoria de 28 focos tiene unaduración promedio de 784 horas.Utilice un nivel de significancia de 0.05.

22

1. Planteo de hipótesis.

2. Nivel de significación: a = 0.05

3. Prueba estadística

4. Supuestos.

a. Población normal.

b. Muestra tomada al azar.

800:H

800:H

1

0

)1.0(N~n/

xZ

_

c

23

5. Regiones críticas. Criterios de decisión.La hipótesis alternante define la(s) zona(s) de rechazo.

6. Cálculos

Conclusiones. Con 5% de nivel de significación y apartir de la información muestral, el tiempopromedio de duración de los focos es diferente de800 horas.

12.228/40

800784Zc

24

Prueba de hipótesis para una media

poblacional (varianza desconocida)

Problema1: Antes de publicar un nuevo libro

de Estadística, El autor desea probar la

hipótesis, con un nivel de significancia del 2%

de que el precio promedio de tales libros es de

S/. 35.00. ¿Esta afirmación se sustenta si una

muestra de 50 libros tiene una media de S/.

32.97 y una desviación estándar de S/. 12.87?

Distribución de proporciones muestrales

25

𝑍 =𝑝−𝑃

𝑝𝑞

𝑛

𝑠iendo 𝑛 > 30

Distribución de proporciones muestrales p

Por estadísticas que se tienen, se ha podido establecer que por lo menos el 40% de los jóvenes toman regularmente Coca-cola, cuando tienen sed. Una muestra aleatoria de 450 jóvenes reveló que 200 de ellos solían tomar dicha bebida, cuando tenían sed. ¿Cuál podría ser su conclusión al nivel del 1%, acerca de lo que muestran las estadísticas?

26

Distribución de proporciones muestrales p

27

𝑝 =200

450= 0,44 = 44% 𝑛 = 450 𝑞 =

250

450= 0,56

40,0:

40,0:0

PH

PH

a

71,1

450

)56,0(44,0

40,044,0

Z

n

pq

PpZ

Al nivel del 1%, se podrá afirmar que

pqs p

01,0a

Distribución de proporciones muestrales p

28

Un gerente de una empresa afirma que el porcentaje de atrasos en

las horas de llegada al trabajo cobija al 25% de sus empleados.

Solicita al jefe de personal la revisión de 40 tarjetas marcadas con

las horas de llegada, en la quincena, y encuentra que 8 han llegado

tarde. Al nivel del 5%, ¿hay razón para concluir que el gerente de la

empresa está exagerando?

Prueba de hipótesis para proporciones

El expendio Pollos Deliciosos asegura que 90% de sus órdenes se entregan en menos de 10 minutos. En una muestra de 100 órdenes, 82 se entregaron dentro de ese lapso. Puede concluirse en el nivel de significancia 0,01, que menos de 90% de las órdenes se entregan en menos de 10 minutos?

Prueba de hipótesis para proporciones

Un artículo reciente, publicado en el diario USA today, indica que solo a uno de cada tres egresados de una universidad les espera un puesto de trabajo. En una investigación a 200 egresados recientes de su universidad, se encontró que 80 tenían un puesto de trabajo. Puede concluirse en el nivel de significancia 0,02, que en su universidad la proporción de estudiantes que tienen trabajo es mayor?

Prueba de hipótesis para proporciones

A una muestra a nivel nacional (en Estados Unidos) de ciudadanos influyentes de los partidos republicano y demócrata, se les preguntó entre otras cosas, si estaban de acuerdo con la disminución de los estándares ambientales para permitir el uso del carbón con alto contenido de azufre como combustible. Los resultados fueron:republicanos Demócratas

Cantidad muestreada

1000 800

Cantidad a favor 200 168

Al nivel de significancia 0,02, puede decirse que hay una proporción mayor de Demócratas a favor de reducir los estándares?

Distribución de diferencias entre dos medias muestrales: (Siendo n1 y n2 mayores que 30)

35

𝑍 = 𝑥− 𝑦 −(𝜇𝑥−𝜇𝑦)

𝜎2𝑥

𝑛1+

𝜎2𝑦

𝑛2

o 𝑍 = 𝑥− 𝑦 −(𝜇𝑥−𝜇𝑦)

𝑠2𝑥

𝑛1+

𝑠2𝑦

𝑛2

Distribución de diferencias entre dos medias muestrales

Ejemplo 1. Supongamos que la empresa desarrollo un curso de entrenamiento para sus técnicos, formando dos grupos y aplicando métodos distintos de entrenamiento. Los dos grupos se consideran homogéneos en capacidad. El primer grupo lo componen 36 técnicos que obtuvieron un puntaje de 6 (en una escala de 0 a 10 puntos) y una desviación típica de 4 puntos y el segundo grupo de 40 técnicos cuyo promedio fue 8,2 y desviación típica de 4,3 puntos. ¿Se puede concluir que el método aplicado al segundo grupo fue superior al primero? Nivel 1%.

36

Distribución de diferencias entre dos medias muestrales

37

Distribución de diferencias entre dos medias muestrales

Ejemplo 2. una prueba de resistencia al esfuerzo de dos tipos diferentes de cables, que presentan desviaciones típicas de 35 y 45 respectivamente, se llevó a cabo, seleccionando dos muestras de tamaño 32 y 40, con medias de 905 y 925. ¿proporcionan estos resultados, al nivel del 10%, suficiente evidencia de que la resistencia de B es superior a la de A?

38

Distribución de diferencias entre dos medias muestrales

39

Distribución de diferencias entre dos medias muestrales

Ejemplo 3. Una firma que tiene dos fábricas ubicadas en dos regiones del país, desea establecer el promedio de antigüedad que tienen sus trabajadores, a fin de instaurar un programa para sus pensionados. Se toma de la primera fábrica una muestra de 60 obreros, la cual reflejó un promedio de trabajo de 16,4 años, con desviación estándar de 5 años, mientras que en la segunda fábrica una muestra de 40, fue de 15,8 años, con desviación estándar de 4,2 años ¿Al nivel del 5% se podrá afirmar que hay una diferencia significativa en cuanto a la antigüedad en la empresa?

40

Distribución de diferencias entre dos medias muestrales

41

Distribución de diferencias entre dos proporciones muestrales 𝑃1 − 𝑃2

42

𝑍 =𝑝1−𝑝2 −(𝜇𝑃1−𝜇𝑃2)

𝑝1𝑞1𝑛1

+𝑝2𝑞2𝑛2

𝑐𝑢𝑎𝑛𝑑𝑜 𝑛1 𝑦 𝑛2 > 30

Distribución de diferencias entre dos proporciones

Ejemplo 1. En una encuesta se preguntó sobre los hábitos de lectura, utilizando una muestra aleatoria de 350 señoras que trabajan y otra muestra independiente de 325 que no lo hacen. En el primer caso, 105 manifestaron que estaban suscritas a cierto tipo de revista. En el segundo, la respuesta fue de 130 que no estaban suscritas ni mostraban interés por ninguna revista, argumentando la falta de tiempo. ¿Al nivel del 1% se podrá afirmar que las eñoras que trabajan leen menos que las señoras que no trabajan?

43

Distribución de diferencias entre dos proporciones

44

Distribución de diferencias entre dos proporciones

Ejemplo 2. Un gerente de una compañía realiza dos muestras de tamaño de 120 empleados, una en cada fábrica, con el fin de determinar el porcentaje de accidentes de trabajo en el trimestre. En la primera fábrica durante el trimestre de observación se presentaron 12 casos, mientras que en la segunda, 16. ¿Al nivel del 5% se podrá afirmar que los accidentes de trabajo son iguales en las dos fábricas?

45

Distribución de diferencias entre dos proporciones

46

Distribución de diferencias entre dos proporciones

Ejemplo 3. Dos grupos A y B de 100 personas cada uno tienen determinada enfermedad. Un suero es dado al grupo A, pero no al B. Por otra parte, los grupos son tratados idénticamente. Sí encontramos que en el grupo A, 75 personas se recobran de la enfermedad y en el B, 65, pruebe la hipótesis de que el suero cura la enfermedad.

47

48

Distribución de diferencias entre dos proporciones

Ejemplo 4. Al investigar la "imagen" de calidad de cierta marca de reloj de pulso, se seleccionó una muestra de 120 profesionales y 80 talleres de reparación y se obtuvo la siguiente información. Con los resultados que se dan a continuación, ¿se podría interpretar, al nivel del 5% que existe una diferencia significativa, en cuanto a opinión sobre la marca del reloj?

49

50

PRUEBAS DE HIPÓTESIS PARA LA VARIANZA POBLACIONAL

Se cree que si la varianza de los puntajes de agresión de un grupo de estudiantes es superior a 0.30, entonces habrá que preocuparse por su conducta. Si en una muestra aleatoria de 10 estudiantes se encontró que el puntaje promedio de agresión fue 31.55 y la desviación estándar 0.48; ¿a qué conclusión llegarás con una confianza del 95%?

51

52

EJERCICIOS

53

54

Problema: Un químico ha desarrollado un

material plástico que, según él, tiene una

resistencia media a la ruptura de 29 onzas por

pulgada cuadrada. Para comprobar la bondad

del método se tomaron 20 láminas de plástico

en mención hallándose que en cada una de

éstas la resistencia a la ruptura es,

respectivamente,

55

Al nivel de significación 0.05 y suponiendonormalidad, ¿se admite la hipótesis delquímico?

30.1 22.5 28.9 29.8 31.4

32.7 27.5 27.7 28.9 30.4

27.0 24.3 22.8 22.3 33.4

31.2 26.4 29.4 29.1 23.5

56

Prueba de hipótesis para la varianza

Problema: Se reporta que la desviaciónestándar de la resistencia al rompimiento deciertos cables producidos por una compañía es240 lb. Después de que se introdujo un cambioen el proceso de producción de estos cables, laresistencia al rompimiento de una muestra de 8cables mostró una desviación estándar de 300lb. Investigue la significancia del aumentoaparente en la variación usando un nivel designificancia de 0.05

57

Pruebas de hipótesis para una

proporción poblacional

Problema. En cierta universidad se estima

que el 25% de los estudiantes van a

bicicleta a la universidad. ¿Esta parece ser

una estimación válida si, en una muestra

aleatoria de 90 estudiantes universitarios, se

encuentra que 28 van en bicicleta a la

universidad? Utilice un nivel de

significancia de 0.05

58

Pruebas de hipótesis para dos

varianzas poblacionales Ejemplo1: Suponga que el director de

capacitación de una compañía manufacturera

desea comparar dos enfoques de trabajo en

equipo. Cada miembro de un grupo de 16

empleados nuevos se asigna al azar a uno de

los tres métodos. Una vez terminada la

capacitación de los participantes, se evalúa el

tiempo que tardan (en minutos) en ensamblar

el producto. Los resultados se resumen como

sigue:

59

a) ¿Existe homogeneidad de varianzas?

Analice los datos considerando un nivel

de significación del 5%.

A 8.82 9.26 8.7 8.97 8.64 8.29 9.45 9.42

B 8.21 6.65 7.44 7.95 8.2 7.75 8.84 8.4

60

Pruebas de hipótesis para la

diferencia de medias (varianzas

desconocidas e iguales) Ejemplo2: Clean All es un nuevo limpiador de

uso múltiple cuya demanda se prueba

exhibiéndolo en dos lugares diferentes dentro

de varios supermercados. A continuación se

muestra el número de botellas de 12 onzas que

se vendieron en cada ubicación.

Cerca de las

cervezas

12 18 10 15

Con otros

limpiadores

25 28 30 32

61

a) Analice los datos, formule lashipótesis adecuadas y contrástelasconsiderando un nivel de significacióndel 5%.

b)Determine si es posible, ¿Cuál es ellugar dentro del supermercado másefectivo para la venta del limpiadorClean All?

62

Pruebas de hipótesis para la diferencia

de medias (varianzas desconocidas y

diferentes)

Ejemplo: Para investigar la influenciade la especialización en el salario inicialde los graduados en Ingeniería, seentrevistó a dos grupos de estudiantesrecién graduados especializados eningeniería y en otras profesiones. Losresultados fueron como sigue:

63

Si se asume poblaciones normales, ¿se puede concluir que el salario promedio de otras profesiones es mayor que en ingeniería? Use a = 0.05.

Ingeniería Otras

profesiones

70000 109000

95000 97000

100000 95000

110000 99000

85000 105000

75000 110000

70000 106000

98000