contraste de hipotesis en poblaciones normales

34
ecnicas de Inferencia Estad´ ıstica II Tema 2. Contrastes de hip´ otesis en poblaciones normales M. Concepci´ on Aus´ ın Universidad Carlos III de Madrid Grado en Estad´ ıstica y Empresa Curso 2011/12

Upload: danalejandro

Post on 17-Feb-2015

71 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Contraste de Hipotesis en Poblaciones Normales

Tecnicas de Inferencia Estadıstica II

Tema 2. Contrastes de hipotesis en poblacionesnormales

M. Concepcion AusınUniversidad Carlos III de Madrid

Grado en Estadıstica y EmpresaCurso 2011/12

Page 2: Contraste de Hipotesis en Poblaciones Normales

Tema 2. Contrastes de hipotesis en poblaciones normales

ContenidosI Contrastes para una muestra de una poblacion normal.

I Contrastes para la media con varianza conocida.I Contrastes para la media con varianza desconocida.I Contrastes para la varianza.

I Contrastes para dos muestras de dos poblaciones normalesindependientes.

I Contrastes para la igualdad de varianzas.I Contrastes para la igualdad de medias.

I Contrastes para una muestra bivariante de una poblacion normalbivariante (dos muestras no independientes).

I Contrastes para la igualdad de medias.

I Contrastes para muestras grandes.

Page 3: Contraste de Hipotesis en Poblaciones Normales

Contrastes para una muestra de una poblacion normal

Suponemos una muestra aleatoria simple (X1,X2, . . . ,Xn) de unapoblacion normal, N(µ, σ2). Queremos resolver contrastes del tipo:

Bilateral Unilateral Unilateralpor la derecha por la izquierda

H0 : θ = θ0 H0 : θ = θ0 H0 : θ = θ0

H1 : θ 6= θ0 H1 : θ > θ0 H1 : θ < θ0

donde θ representa el parametro de interes, que puede ser la media, µ, ola varianza, σ2.

I Las region de rechazo se obtiene usando un estadıstico de contraste,que es una medida de discrepancia entre la muestra de datos y lahipotesis nula.

I Un estadıstico de contraste sera cualquier funcion de la muestra ydel parametro especificado en H0 (con distribucion conocida cuandoH0 es cierta) que permita decidir hasta que punto la muestra dedatos esta de acuerdo o no con la hipotesis nula.

Page 4: Contraste de Hipotesis en Poblaciones Normales

Contrastes para la media con varianza conocidaSuponemos primero una muestra aleatoria (X1,X2, . . . ,Xn) de unapoblacion normal, N(µ, σ2), con la varianza, σ2 conocida.

Queremos resolver contrastes para la media del tipo:

H0 : µ = µ0

H1 : µ 6= µ0

H0 : µ = µ0

H1 : µ > µ0

H0 : µ = µ0

H1 : µ < µ0

El estadıstico de contraste en este caso es:

X − µ0

σ/√

n∼H0 N(0, 1)

I Este estadıstico proporciona una medida de discrepancia entre losdatos y la hipotesis nula.

I Para elegir la region de rechazo, de la hipotesis nula debemos defijar el nivel de significacion, α, donde recordamos que:

α = Pr(rechazar H0 | H0 cierta)

Page 5: Contraste de Hipotesis en Poblaciones Normales

Contrastes para la media con varianza conocidaI H0 : µ = µ0 vs H1 : µ 6= µ0

I Dados los datos, (x1, . . . , xn), si∣∣∣ x−µ0σ/√n

∣∣∣ es grande, se rechazara H0.

I La region de rechazo es:

R =

{∣∣∣∣ x − µ0

σ/√n

∣∣∣∣ > zα/2

}Bi

oesta

dísti

caC

ontra

stes d

e hi

póte

sis

Las regiones de aceptación-rechazo dependen de la hipótesis alternativa, H1:

a) 01 : θθ ≠H . La región de rechazo la forman

las dos colas de la distribución del

estadístico bajo H0, ambas con la misma

probabilidad α/2.

α−1

Aceptación

Rechazo

Rechazo

b) 01 : θθ <H . La región de rechazo la forman

la cola inferior de la distribución del

estadístico bajo H0, con la probabilidad α.

α−1

Aceptación

Rechazo

α

c) 01 : θθ >H . La región de rechazo la forman

la cola superior de la distribución del

estadístico bajo H0, con la probabilidad α. α−1

Aceptación

Rechazo

α

I p-valor = 2 Pr(Z > x−µ0

σ/√n

)

Page 6: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.1.Uno de los productos de una empresa es cafe molido en paquetes de 200gramos. Se disena un experimento en el que se pesan con precision elpeso de 15 paquetes, seleccionados aleatoriamente. Los pesos son 208,206, 210, 199, 202, 196, 198, 209, 211, 204, 206, 197, 196, 203 y 207.Se supone que el peso de estos paquetes sigue una distribucion normal yque su desviacion tıpica es conocida (no realista) e igual a 4.5 gramos.

I La empresa desea saber si el peso medio de los paquetes es distintode los 200 gramos que figuran en la etiqueta. Contrastar dichahipotesis usando el p-valor para α = 0.05 y 0.01.

I Construir dos intervalos de confianza al 95 % y al 99 % para el valorreal del peso medio de un paquete de cafe.

Page 7: Contraste de Hipotesis en Poblaciones Normales

Contrastes para la media con varianza conocidaI H0 : µ = µ0 vs H1 : µ > µ0

I Dados los datos, (x1, . . . , xn), si x−µ0σ/√n

es grande, se rechazara H0.

I La region de rechazo es:

R =

{x − µ0

σ/√n> zα

}

Bioes

tadí

stica

Con

traste

s de

hipó

tesis

Las regiones de aceptación-rechazo dependen de la hipótesis alternativa, H1:

a) 01 : θθ ≠H . La región de rechazo la forman

las dos colas de la distribución del

estadístico bajo H0, ambas con la misma

probabilidad α/2.

α−1

Aceptación

Rechazo

Rechazo

b) 01 : θθ <H . La región de rechazo la forman

la cola inferior de la distribución del

estadístico bajo H0, con la probabilidad α.

α−1

Aceptación

Rechazo

α

c) 01 : θθ >H . La región de rechazo la forman

la cola superior de la distribución del

estadístico bajo H0, con la probabilidad α. α−1

Aceptación

Rechazo

α

I p-valor = Pr(Z > x−µ0

σ/√n

)

Page 8: Contraste de Hipotesis en Poblaciones Normales

Contrastes para la media con varianza conocidaI H0 : µ = µ0 vs H1 : µ < µ0

I Dados los datos, (x1, . . . , xn), si x−µ0σ/√n

es pequeno, se rechazara H0.

I La region de rechazo es:

R =

{x − µ0

σ/√n< zα

}

Bioe

stadí

stica

Con

traste

s de

hipó

tesis

Las regiones de aceptación-rechazo dependen de la hipótesis alternativa, H1:

a) 01 : θθ ≠H . La región de rechazo la forman

las dos colas de la distribución del

estadístico bajo H0, ambas con la misma

probabilidad α/2.

α−1

Aceptación

Rechazo

Rechazo

b) 01 : θθ <H . La región de rechazo la forman

la cola inferior de la distribución del

estadístico bajo H0, con la probabilidad α.

α−1

Aceptación

Rechazo

α

c) 01 : θθ >H . La región de rechazo la forman

la cola superior de la distribución del

estadístico bajo H0, con la probabilidad α. α−1

Aceptación

Rechazo

α

I p-valor = Pr(Z < x−µ0

σ/√n

)

Page 9: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.2.Uno de los productos de una empresa es cafe molido en paquetes de 200gramos. Se disena un experimento en el que se pesan con precision elpeso de 15 paquetes, seleccionados aleatoriamente. Los pesos son 208,206, 210, 199, 202, 196, 198, 209, 211, 204, 206, 197, 196, 203 y 207.Se supone que el peso de estos paquetes sigue una distribucion normal yque su desviacion tıpica es conocida (no realista) e igual a 4.5 gramos.

I A la vista del resultado anterior, la empresa desea saber si el pesomedio de los paquetes es de hecho superior a los 200 gramos quefiguran en la etiqueta. Contrastar dicha hipotesis usando el p-valorpara α = 0.05 y 0.01.

Page 10: Contraste de Hipotesis en Poblaciones Normales

Contrastes para la media con varianza desconocida

En la practica, la varianza poblacional σ es casi siempre desconocida.

Consideramos ahora el caso para una muestra aleatoria (X1,X2, . . . ,Xn)de una poblacion normal, N(µ, σ2), con la varianza, σ2, desconocida.

Queremos resolver contrastes del tipo:

H0 : µ = µ0

H1 : µ 6= µ0

H0 : µ = µ0

H1 : µ > µ0

H0 : µ = µ0

H1 : µ < µ0

El estadıstico de contraste en los tres casos es:

X − µ0

S/√

n∼H0 tn−1

Gracias a la simetrıa de la distrbucion t, las regiones de rechazo seobtienen de manera equivalente a las de los contrastes para la media convarianza conocida.

Page 11: Contraste de Hipotesis en Poblaciones Normales

Contrastes para la media con varianza desconocida

Calculo del p-valor

I H0 : µ = µ0 vs H1 : µ > µ0

p-valor = Pr

(tn−1 >

x − µ0

s/√

n

)I H0 : µ = µ0 vs H1 : µ < µ0

p-valor = Pr

(tn−1 <

x − µ0

s/√

n

)I H0 : µ = µ0 vs H1 : µ 6= µ0

p-valor = 2 Pr

(tn−1 >

x − µ0

s/√

n

)

Page 12: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.3.Uno de los productos de una empresa es cafe molido en paquetes de 200gramos. Se disena un experimento en el que se pesan con precision elpeso de 15 paquetes, seleccionados aleatoriamente. Los pesos son 208,206, 210, 199, 202, 196, 198, 209, 211, 204, 206, 197, 196, 203 y 207.Se supone que el peso de estos paquetes sigue una distribucion normal yque su desviacion tıpica es desconocida.

I La empresa desea saber si el peso medio de los paquetes es distintode los 200 gramos que figuran en la etiqueta y, en ese caso,averiguar si es superior a 200 gramos. Contrastar dicha hipotesisusando el p-valor para α = 0.05 y 0.01.

I Construir dos intervalos de confianza al 95 % y al 99 % para el valorreal del peso medio de un paquete de cafe.

Page 13: Contraste de Hipotesis en Poblaciones Normales

Contrastes para la varianzaConsideramos una muestra aleatoria (X1,X2, . . . ,Xn) de una poblacionnormal, N(µ, σ2), con µ, desconocida. Queremos contrastar:

H0 : σ2 = σ20

H1 : σ2 6= σ20

H0 : σ2 = σ20

H1 : σ2 > σ20

H0 : σ2 = σ20

H1 : σ2 < σ20

El estadıstico de contraste en los tres casos es:

(n − 1)S2

σ20

∼H0 χ2n−1

Las regiones de rechazo se obtienen de manera equivalente a los casosanteriores, pero teniendo en cuenta que la distribucion χ2

n−1 es asimetrica.

Varianza de una poblacion normalProcedimiento

I Seleccionamos los valores como

P(χ2n−1 ≥ χ2

n−1,1−α/2) = 1− α/2, P(χ2n−1 ≥ χ2

n−1,α/2) = α/2

I Estos valores cumplen

P(χ2n−1,1−α/2 ≤ χ2

n−1 ≤ χ2n−1,α/2) = 1− α

!"# !"#1-!

$#%&'('&!"# $#%&'(!"#

Page 14: Contraste de Hipotesis en Poblaciones Normales

Contrastes para la varianza

Calculo del p-valor

I H0 : σ2 = σ20 vs H1 : σ2 > σ2

0

p-valor = Pr

(χ2n−1 >

(n − 1)s2

σ20

)I H0 : σ2 = σ2

0 vs H1 : σ2 < σ20

p-valor = Pr

(χ2n−1 <

(n − 1)s2

σ20

)I H0 : σ2 = σ2

0 vs H1 : σ2 6= σ20

p-valor = mın

{2 Pr

(χ2n−1 >

(n − 1)s2

σ20

), 2 Pr

(χ2n−1 <

(n − 1)s2

σ20

)}

Page 15: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.4.Un inversor quiere saber si la variacion del precio de las acciones de unacompanıa este mes sera superior a la variacion del mes pasado, que fuede 114.09. Ha observado que la varianza muestral de los precios de losprimeros 10 dıas de este mes ha sido igual a 110.2. Asumiendo que los 10datos pueden considerarse una muestra aleatoria de una poblacionnormal, contrastar al 5 % la hipotesis anterior.

Page 16: Contraste de Hipotesis en Poblaciones Normales

En las siguientes secciones, vamos a abordar problemas en los quedisponemos de dos muestras de poblaciones normales.

Distinguiremos dos casos:

I Dos muestras independientes: Suponemos dos muestras aleatoriassimples (X1,X2, . . . ,Xn) e (Y1,Y2, . . . ,Ym) de dos poblacionesnormales independientes:

X ∼ N(µ1, σ21) e Y ∼ N(µ2, σ

22).

I Una muestra bivariante: Suponemos una muestra bivariante,{(X1,Y1), . . . , (Xn,Yn)} de una poblacion normal bivariante,

(X ,Y ) ∼ N

((µ1

µ2

),

(σ2

1 σ12

σ12 σ22

)).

En el primer caso las variables X e Y son independientes. En el segundo,X e Y son dependientes (a no ser que σ12 = 0).

Supondremos siempre que las medias (µ1 y µ2), las varianzas (σ1 y σ2), yen su caso, la covarianza (σ12), son desconocidas.

Page 17: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.5.En los siguientes ejemplos distinguir si se trata de dos muestrasindependientes de dos variables X e Y independientes o de una muestrabivariante de una variable (X ,Y ) de modo que X e Y puedan serdependientes.

1. (X1,X2, . . . ,X10) e (Y1,Y2, . . . ,Y15) representan los salarios de 10mujeres y 15 hombres, respectivamente.

2. (X1,X2, . . . ,X8) e (Y1,Y2, . . . ,Y8) son las calificaciones de 8estudiantes en matematicas y estadıstica, respectivamente.

3. (X1,X2, . . . ,X16) e (Y1,Y2, . . . ,Y16) son las edades de 16 fumadoresy 16 no fumadores.

4. (X1,X2, . . . ,X20) e (Y1,Y2, . . . ,Y20) representan el numero deparados en 20 ciudades de dos paises distintos.

5. (X1,X2, . . . ,X32) e (Y1,Y2, . . . ,Y32) representan el peso de 32pacientes antes y despues de un tratamiento de adelgazamiento.

Page 18: Contraste de Hipotesis en Poblaciones Normales

Contrastes para dos muestras independientes de dospoblaciones normales

Suponemos ahora la primera situacion en la que disponemos de dosmuestras aleatorias simples (X1,X2, . . . ,Xn) e (Y1,Y2, . . . ,Ym) de dospoblaciones normales, N(µ1, σ

21) y N(µ2, σ

22), independientes.

Queremos resolver contrastes del tipo:

H0 : µ1 = µ2

H1 : µ1 6= µ2

H0 : µ1 = µ2

H1 : µ1 > µ2

H0 : µ1 = µ2

H1 : µ1 < µ2

H0 : σ21 = σ2

2

H1 : σ21 6= σ2

2

H0 : σ21 = σ2

2

H1 : σ21 > σ2

2

H0 : σ21 = σ2

2

H1 : σ21 < σ2

2

Page 19: Contraste de Hipotesis en Poblaciones Normales

Contrastes para la igualdad de varianzas

Se tienen dos muestras (X1,X2, . . . ,Xn) e (Y1,Y2, . . . ,Ym) de dospoblaciones normales e independientes, N(µ1, σ

21) y N(µ2, σ

22), con

medias, µ1 y µ2, desconocidas.

Queremos resolver contrastes del tipo:

H0 : σ21 = σ2

2

H1 : σ21 6= σ2

2

H0 : σ21 = σ2

2

H1 : σ21 > σ2

2

H0 : σ21 = σ2

2

H1 : σ21 < σ2

2

El estadıstico de contraste es:

S21

S22

∼H0 Fn−1,m−1

Las regiones de rechazo y el calculo del p-valor se realiza de maneraanaloga al contraste para la varianza, teniendo en cuenta que ladistribucion de Fn−1,m−1 es asimetrica.

Page 20: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.6.Se conjetura que las acciones de una companıa sufrirıan mas variacion enuna industria con competencia en precios que en una en la que existieraun duopolio y colusion tacita.

En un estudio sobre la industria de generadores mediante turbinas devapor, se hallo que en 4 anos de competencia en precios la variacion delas acciones de la General Electric fue de 114.09. En los siguientes 7anos, en los cuales hubo un duopolio y colusion tacita, esta varianza fuede 16.08.

Asumir que los datos pueden considerarse muestras aleatoriasindependientes de dos poblaciones normales y contrastar al 5 % laconjetura anterior.

Page 21: Contraste de Hipotesis en Poblaciones Normales

Contrastes para la igualdad de medias

Se tienen dos muestras (X1,X2, . . . ,Xn) e (Y1,Y2, . . . ,Ym) de dospoblaciones normales e independientes, N(µ1, σ

21) y N(µ2, σ

22), con

varianzas, σ21 y σ2

2 , desconocidas.

Queremos resolver contrastes del tipo:

H0 : µ1 = µ2

H1 : µ1 6= µ2

H0 : µ1 = µ2

H1 : µ1 > µ2

H0 : µ1 = µ2

H1 : µ1 < µ2

Page 22: Contraste de Hipotesis en Poblaciones Normales

Contrastes para la igualdad de medias

Si las varianzas son iguales: σ21 = σ2

2

El estadıstico de contraste es:

X − Y√(n−1)S2

1 +(m−1)S22

n+m−2

√1n + 1

m

∼H0 tn+m−2

Si las varianzas son distintas: σ21 6= σ2

2

El estadıstico de contraste es:

X − Y√S2

1

n +S2

2

m

∼H0 tf

donde:

f =

(S2

1

n +S2

2

m

)2

1n−1

(S2

1

n

)2

+ 1m−1

(S2

2

m

)2

Page 23: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.7.De una muestra aleatoria de 12 licenciados en Economicas en unaUniversidad publica, los sueldos de su primer empleo fueron los siguientes(expresados en miles de dolares):

26.2, 29.3, 31.3, 28.7, 27.4 , 25.1,26.0, 27.2, 27.5, 29.8, 32.6, 34.6

De otra muestra aleatoria independiente de 10 licenciados en Economicasen una Universidad privada los primeros sueldos fueron los siguientes:

25.3, 28.2, 29.2, 27.1, 26.8,26.5, 30.7, 31.3, 26.3, 24.2

Asumiendo normalidad en los datos, discutir si existen diferencias entrelos sueldos de los licenciados de Universidades publicas y privadas.

Page 24: Contraste de Hipotesis en Poblaciones Normales

Contrastes para una muestra bivariante de una poblacionnormal bivariante

Consideramos que se tiene una muestra (X1,Y1), (X2,Y2), . . . , (Xn,Yn)de una poblacion normal bidimensional:

(X ,Y ) ∼ N

((µ1

µ2

),

(σ2

1 σ12

σ12 σ22

)).

Queremos resolver contrastes del tipo:

H0 : µ1 = µ2

H1 : µ1 6= µ2

H0 : µ1 = µ2

H1 : µ1 > µ2

H0 : µ1 = µ2

H1 : µ1 < µ2

Page 25: Contraste de Hipotesis en Poblaciones Normales

Contrastes para una muestra bivariante de una poblacionnormal bivariante

Transformamos el problema en otro en el que se tiene una sola muestra(D1 = X1 − Y1,D2 = X2 − Y2, . . . ,Dn = Xn − Yn) de la variable:

D = X − Y ∼ N(µD , σ2D)

donde µD = E [X − Y ] = µ1 − µ2.

El problema se convierte en resolver los contrastes:

H0 : µD = 0H1 : µD 6= 0

H0 : µD = 0H1 : µD > 0

H0 : µD = 0H1 : µD < 0

El estadıstico de contraste es:

D

SD/√

n∼H0 tn−1

donde S2D es la cuasivarianza muestral de (D1, . . . ,Dn).

Page 26: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.8.Antes de lanzar una promocion muy agresiva de un cierto productodirigida a los hipermercados de grandes superficies, la directora demarketing de la empresa quiere saber si es o no rentable. Para ello seseleccionan al azar 5 hipermercados de Madrid para llevar a cabo lapromocion y se recogen datos de las ventas en miles de euros antes ydespues de la promocion. Se supone que las ventas se distribuyennormalmente.

Antes 102 120 135 114 175Despues 110 125 141 113 182

I Contrastar la hipotesis de que dicha promocion sea rentable,teniendo en cuenta que se trata de datos apareados.

I Contrastar la misma hipotesis, pero asumiendo que son muestrasindependientes.

I Comparar y explicar las diferencias en los dos apartados anteriores.

Page 27: Contraste de Hipotesis en Poblaciones Normales

Contrastes para muestras grandes: contraste para unamedia

Supongamos que se tiene una muestra (X1, . . . ,Xn) de una poblacioncualquiera con n grande (n >30).

Aunque la poblacion no sea normal, se pueden resolver contrastes para lamedia:

H0 : µ = µ0

H1 : µ 6= µ0

H0 : µ = µ0

H1 : µ > µ0

H0 : µ = µ0

H1 : µ < µ0

utilizando el Teorema Central del Lımite, que garantiza que:

X − µ0

S/√

n→H0 N(0, 1)

Page 28: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.9.La vida media de una muestra de 55 tubos fluorescentes producidos poruna empresa es de 1750 horas con una cuasi-desviacion tıpica de 120horas. Contrastar la hipotesis de que la vida media sea distinta de 1600horas, utilizando un nivel de significacion de 0.05.

Page 29: Contraste de Hipotesis en Poblaciones Normales

Contrastes para muestras grandes: contraste para laigualdad de dos medias

Consideramos ahora que se tienen dos muestras (X1,X2, . . . ,Xn) e(Y1,Y2, . . . ,Ym) de dos poblaciones no necesariamente normales demedias µ1 y µ2 y varianzas, σ2

1 y σ22 , resp., tales que n y m sean grandes

(n,m >30).

Aunque las poblaciones no sean normales, se pueden resolver contrastespara la diferencia de medias:

H0 : µ1 = µ2

H1 : µ1 6= µ2

H0 : µ1 = µ2

H1 : µ1 > µ2

H0 : µ1 = µ2

H1 : µ1 < µ2

utilizando el Teorema Central del Lımite, que garantiza que:

X − Y√S2

1

n +S2

2

m

→H0 N(0, 1)

Page 30: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.10.El metodo MATWES fue disenado para medir las actitudes hacia lasmujeres ejecutivas. Una puntuacion alta indica actitudes negativas hacialas mujeres ejecutivas. Se conjetura que la actitud hacia las mujeresejecutivas cambia en funcion del sexo.

Para contrastar esta hipotesis se tomaron muestras aleatoriasindependientes de 151 hombres y de 108 mujeres estudiantes de M.B.A.En el grupo de los hombres se obtuvo una puntuacion media de 85.8 conuna desviacion tıpica de 19.3. En el de mujeres se obtuvo una puntuacionmedia de 71.5 con una desviacion tıpica de 12.2.

I Plantea el contraste oportuno y resuelvelo para α = 0.01.

I ¿Como se construirıa un intervalo de confianza al 99 % para ladiferencia de puntuaciones medias? ¿contendrıa al 0?

Page 31: Contraste de Hipotesis en Poblaciones Normales

Contrastes para muestras grandes: contraste para unaproporcion

Consideramos que se tiene una muestra (X1,X2, . . . ,Xn) con n grande(n >30) de una poblacion Bernouilli, B(1, p):

X =

{1, con probabilidad p0, con probabilidad 1− p

Aunque la poblacion no sea normal, se pueden resolver contrastes para laproporcion:

H0 : p = p0

H1 : p 6= p0

H0 : p = p0

H1 : p > p0

H0 : p = p0

H1 : p < p0

utilizando el Teorema Central del Lımite, que garantiza que:

p − p0√p0(1−p0)

n

→H0 N(0, 1)

donde,

p =

∑ni=1 Xi

n.

Page 32: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.11.Se trabaja con la hipotesis de que uno de cada diez varones manifiestaalgun tipo de daltonismo.

I Elegidos 400 varones, se detectan 50 daltonicos. Con un nivel designificacion del 10 %, ¿se puede rechazar la hipotesis de partida? ¿seobtendra la misma conclusion si el nivel de significacion es del 2 %?

Page 33: Contraste de Hipotesis en Poblaciones Normales

Contrastes para muestras grandes: contraste para laigualdad de dos proporciones

Consideramos ahora que se tiene dos muestras independientes(X1,X2, . . . ,Xn) y (Y1,Y2, . . . ,Ym) con n y m grandes (n,m >30) de dospoblaciones Bernouilli, B(1, p1) y B(1, p2).

Aunque las poblaciones no sean normales, se pueden resolver contrastespara la diferencia de proporciones:

H0 : p1 = p2

H1 : p1 6= p2

H0 : p1 = p2

H1 : p1 > p2

H0 : p1 = p2

H1 : p1 < p2

utilizando el Teorema Central del Lımite, que garantiza que:

p1 − p2√p0(1− p0)

(1n + 1

m

) →H0 N(0, 1)

donde p0 = p1 = p2 es la proporcion comun bajo H0 que se estimamediante:

p0 =np1 + mp2

n + m.

Page 34: Contraste de Hipotesis en Poblaciones Normales

Ejemplo 2.12.Se quiere determinar si el paro en dos grandes areas urbanas del paıs,como son Madrid y Barcelona, es diferente. Para ello se toman muestrasaleatorias en ambas ciudades, cada una de 500 personas, obteniendoseque en Madrid 35 estaban desempleadas y en Barcelona 25. ¿Existealguna razon para creer que las frecuencias de paro en Madrid yBarcelona son diferentes?

I Plantea el contraste oportuno con un nivel de significacion del 5 %,especificando claramente la hipotesis nula y alternativa queconsideras, ası como las hipotesis de trabajo.