contrastes de hipótesisdmontoro/metodos/temas/tema8.pdf · 122 capítulo 8. contrastes de...

21
Capítulo 8 Contrastes de Hipótesis 8.1. Introducción. Conceptos básicos Una hipótesis estadística es una armación acerca de una característica poblacional formu- lada en base a los parámetros de su distribución. Existen diversos tipos de hipótesis : - Hacen referencia a un parámetro de una población. Por ejemplo, consideremos el rendimiento obtenido en un proceso químico,X, con dis- tribución N (µ, σ), siendo µ desconocido. Podríamos plantear las siguientes hipótesis: µ = 90 µ 6= 90 µ> 90 µ< 90 Si la hipótesis asigna un único valor al parámetro se le llama hipótesis simple, en ca- so contrario, hipótesis compuesta. En este ejemplo, la primera es simple y el resto son compuestas. - Comparan parámetros de varias poblaciones. Por ejemplo, supongamos que queremos contrastar si el fumar provoca cáncer. Esto equiv- ale a contrastar si la proporción de fumadores con cáncer, p 1 , es signicativamente mayor que la proporción de no fumadores con cáncer, p 2 . 119

Upload: hoanglien

Post on 19-Sep-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Capítulo 8

Contrastes de Hipótesis

8.1. Introducción. Conceptos básicos

Una hipótesis estadística es una afirmación acerca de una característica poblacional formu-

lada en base a los parámetros de su distribución.

Existen diversos tipos de hipótesis:

- Hacen referencia a un parámetro de una población.

Por ejemplo, consideremos el rendimiento obtenido en un proceso químico,X, con dis-

tribución N(µ, σ), siendo µ desconocido. Podríamos plantear las siguientes hipótesis:

µ = 90

µ 6= 90µ > 90

µ < 90

Si la hipótesis asigna un único valor al parámetro se le llama hipótesis simple, en ca-

so contrario, hipótesis compuesta. En este ejemplo, la primera es simple y el resto son

compuestas.

- Comparan parámetros de varias poblaciones.

Por ejemplo, supongamos que queremos contrastar si el fumar provoca cáncer. Esto equiv-

ale a contrastar si la proporción de fumadores con cáncer, p1, es significativamente mayor

que la proporción de no fumadores con cáncer, p2.

119

120 Capítulo 8. Contrastes de Hipótesis

Contrastar una hipótesis es comparar lo que dice la hipótesis con la información que nos

proporciona una muestra. Si hay coincidencia, dentro de un margen de error admisible entre la

hipótesis planteada (hipótesis nula, H0) y la información muestral entonces la mantendremos

como cierta, en caso contrario la rechazaremos. Rechazar una hipótesis es sustituirla por otra

que sea capaz de explicar la realidad observada en la muestra (hipótesis alternativa, H1).

Por ejemplo, supongamos que nos planteamos si el rendimiento del proceso puede ser en

media del 90%, H0 : µ = 90. Realizamos una serie de pruebas y el rendimiento medio muestral

resulta ser−x = 75, menor que 90. La información muestral parece ir más a favor de H1 : µ < 90

que de H0 : µ = 90.

Una cosa en la que hay que hacer hincapié es la siguiente: nunca podemos afirmar el que

una hipótesis sea verdadera o falsa, ya que para ello tendríamos que tener observaciones de

toda la población. Por lo tanto, al realizar un contraste y tomar una decisión siempre cabe

la posibilidad de equivocarnos. Existen dos tipos de errores asociados a cualquier contraste:

error tipo I, que tiene lugar cuando rechazamos H0 siendo cierta, y error tipo II, que ocurre si

aceptamos H0 siendo falsa.

H0 cierta H0 falsa

Acepto H0 No hay error Error tipo II

Rechazo H0 Error tipo I No hay error

A la probabilidad de que ocurra el error tipo I se le llama nivel de significación del contraste,

que denotamos por α y que fijamos antes de realizar un contraste. A la probabilidad de error

tipo II la denotamos por β.

A 1− α se le llama nivel de confianza, y a 1− β potencia del test.

α = P (error tipo I)=P (rechazar H0 /H0 es cierta) ,

β = P (error tipo II)=P (aceptar H0 /H0 es falsa)

Lógicamente, a medida que uno disminuye el otro aumenta.

Un ejemplo clásico es el siguiente: supongamos que un juez tiene que declarar a un individuo

culpable o inocente.

H0 : inocente

H1 : culpable

8.2. Pasos a seguir para realizar un contraste 121

Si rechaza H0 declara culpable al individuo, y si la acepta lo declara inocente. Comete un

error de tipo I si declara culpable al acusado siendo inocente, y un error de tipo II si lo declara

inocente siendo culpable. Desde el punto de vista moral parece más grave el primer error, de

ahí que en un contraste se fije el nivel de significación α y se minimice β.

8.2. Pasos a seguir para realizar un contraste

1. Planteamos la hipótesis nula H0 (de tipo igualdad) y la alternativa H1(a favor de la

información muestral).

H0 : θ = θ0

H1 : θ 6= θ0

θ < θ0

θ > θ0

2. Fijamos el nivel de significación del contraste α.Generalmente se fija en 0.05, 0.01 o 0.1.

3. Determinamos una medida de discrepancia entre la hipótesis nula y la información mues-

tral. Esta medida estará en función de la diferencia del valor que especifica H0 para el

parámetro y el estimador muestral del parámetro, y tendrá distribución conocida. A tal

medida la llamamos estadístico de contraste bajo H0.

4. Determinamos la discrepancia máxima que estamos dispuestos a admitir para aceptar H0.

Este valor dependerá de la distribución del estadístico de contraste bajo H0, del nivel de

significación α especificado y del tipo de hipótesis alternativa que tengamos. Delimita las

regiones de aceptación y rechazo de H0.

5. Concluimos: si el estadístico de contraste observado (empírico) cae en la región de rechazo,

rechazamos H0, en caso contrario, la mantendremos como cierta.

Ejemplo 8.1: Sea X → N(µ, σ) con µ, σ desconocidas, y sobre µ planteamos el siguiente

contraste:

H0 : µ = 90

H1 : µ > 90

Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

122 Capítulo 8. Contrastes de Hipótesis

Seleccionamos una muestra de tamaño n y el estadístico de contraste bajo H0 (suponiendo

H0 cierta) es:

T =

−X − 90

S√n

→ tn−1,

ya que Z =−X−µσ√n

→ N(0, 1), χ2 =(n− 1)S2

σ2→ χ2n−1, son independientes, y T =

Zrχ2

n− 1

.

Observemos que valores observados en−X mucho mayores que 90 irían claramente a favor

de H1 (en contra de H0). A su vez tales valores llevarían a un estadístico de contraste T

muy grande y positivo. En consecuencia, valores muy grandes y positivos en T nos llevarían a

rechazar H0.(siendo cierta). De ahí que la región de rechazo esté en este caso en la cola de la

derecha (de la distribución tn−1) y presente un aréa igual a α (probabilidad de rechazar H0

siendo cierta). El valor que delimita la región de rechazo es por lo tanto t1−α,n−1. Entonces

rechazaremos H0 si el estadístico de contraste observado, t, es mayor o igual que t1−α,n−1.

A la probabilidad de que el estadístico de contraste teórico, este caso T, sea mayor que el

observado, en este caso t, se le llama p-valor. Por lo tanto, el criterio de rechazo en base al

p-valor será: rechazar H0 siempre que el p-valor sea menor o igual que α.

Supongamos que una muestra seleccionada de tamaño 20 nos proporciona una media−x = 98

y una desviación típica s = 2,21. El estadístico observado es por tanto

t =98− 902,21√20

= 16,188

Para un nivel de significación α = 0,05, t1−α,n−1 = t0,95,19 = 1,73. Como 16,188 no es mayor

que 1,73 no podemos rechazar H0.

Ejemplo 8.2: Sobre el ejemplo anterior, consideremos ahora la hipótesis alternativa H1 :

µ < 90.

H0 : µ = 90

H1 : µ < 90

En este caso, valores en−X mucho menores que 90 irían a favor de H1 (en contra de H0).

Por lo tanto, valores muy grandes en valor absoluto y negativos en el estadístico de contraste

llevarían a rechazar H0. La región de rechazo está ahora en la cola de la izquierda, y el valor

que la delimita es tα,n−1. Rechazamos entonces H0 si t ≤ tα,n−1.

8.3. Contrastes de hipótesis clásicos 123

Si observamos una muestra de tamaño 20 y se obtiene una media muestral−x = 83 y una

desviación típica s = 1,96, el estadístico observado es:

t = −3,068,

y tα,n−1 = t0,05,19 = −1,73. Como −3,068 es menor que −1,73, rechazamos H0 para un nivel

de significación del 5%. Por lo tanto, el rendimiento medio es significativamente menor que 90.

Ejemplo 8.3: Consideremos por último la hipótesis alternativa H1 : µ 6= 90.

H0 : µ = 90

H1 : µ 6= 90

En este caso valores en el estadístico muy grandes en valores absoluto, negativos y positivos,

llevarían a rechazar H0. Existen ahora por lo tanto dos regiones de rechazo, una a la izquierda y

otra a la derecha, cada una de las cuales engloba un área de α/2. Los valores que las delimitan

son respectivamente tα/2,n−1 =-t1−α/2,n−1 y t1−α/2,n−1. Rechazamos H0 si t ≤-t1−α/2,n−1 o t≥ t1−α/2,n−1.

Para una muestra de tamaño 20 con media−x = 80 y desviación muestral s = 1,86,

t = −24,044,

y t1−α/2,n−1 = t0,975,19 = 2,09. Como −24,044 es menor que −2,09, rechazamos H0 para un

nivel de significación del 5%. El rendimiento medio es significativamente distinto de 90.

8.3. Contrastes de hipótesis clásicos

8.3.1. Contraste para la media de una normal con varianza conocida

Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), σ conocida.

Hipótesis nula Estadístico de contraste

H0 : µ = µ0 Z =X − µ0σ/√n

Hipótesis alternativa Criterios de rechazo

H1 : µ 6= µ0

H1 : µ > µ0

H1 : µ < µ0

Z ≤ zα/2 o Z ≥ z1−α/2

Z ≥ z1−α

Z ≤ zα

Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

124 Capítulo 8. Contrastes de Hipótesis

Ejemplo 8.4: Los sistemas de escape de emergencia para las tripulaciones de aeronaves son

impulsados por un combustible sólido. Una de las características de este producto es la rapidez

de combustión, que se supone con distribución Normal. Las especificaciones requieren que la

rapidez promedio de combustión sea de 50 cm/s. Se sabe que la rapidez estándar de la rapidez

de combustión es σ = 2cm/s. El experimentador decide especificar una probabilidad para el

error tipo I de α = 0,05. Selecciona una muestra aleatoria de tamaño 25 y se obtiene una media

muestral de 53.1 cm/s. ¿A qué conclusiones llega?.

Planteamos el siguiente contraste:

H0 : µ = 50

H1 : µ 6= 50

con varianza conocida.

El estadístico de contraste es:

Z =53,1− 502/√25

= 7,75

Rechazamos H0 si Z ≤ zα/2 o Z ≥ z1−α/2, siendo zα/2 = z0,025 = −1,96 y z1−α/2 =

z0,975 = 1,96. Por lo tanto, rechazamos H0 para un nivel de significación del 5%. La rapidez de

combustión es significativamente distinta de 50 cm/s.

8.3.2. Contraste para la media de una normal con varianza descono-

cida

Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), σ desconocida.

Hipótesis nula Estadístico de contraste

H0 : µ = µ0 T =X − µ0S/√n

Hipótesis alternativa Criterios de rechazo

H1 : µ 6= µ0

H1 : µ > µ0

H1 : µ < µ0

T ≤ tα/2,n−1 o T ≥ t1−α/2,n−1

T ≥ t1−α,n−1

T ≤ tα,n−1

8.3. Contrastes de hipótesis clásicos 125

Ejemplo 8.5: Un artículo publicado en la revista Materials Engineering describe los resul-

tados de pruebas de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga

para la que cada especimen falla es la siguiente (en MPa):

19.8 18.5 17.6 16.7 15.8

15.4 14.1 13.6 11.9 11.4

11.4 8.8 7.5 15.4 15.4

19.5 14.9 12.7 11.9 11.4

10.1 7.9

¿Sugieren los datos que la carga promedio de fallo es mayor que 10 MPa?. Realizar el

contraste a un 10% de significación.

El contraste a realizar es:

H0 : µ = 10

H1 : µ > 10

con varianza σ2 desconocida.

La media y desviación típica muestrales resultan 13.71 y 3.55 respectivamente, con lo cual:

t =13,71− 103,55/

√22

= 4,90

Dado que t = 4,90 > t1−α,n−1 = t0,95,21 = 1,72, rechazamos H0 al 5% de significación. La

carga promedio de fallo es significativamente mayor que 10.

8.3.3. Contraste para la varianza de una normal con media conocida

Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), con µ conocida.

Hipótesis nula Estadístico de contraste

H0 : σ2 = σ20 χ2 =

Pni=1 (xi − µ)2

σ20

Hipótesis alternativa Criterios de rechazo

H1 : σ2 6= σ20

H1 : σ2 > σ20

H1 : σ2 < σ20

χ2 ≤ χ2α/2,n o χ2 ≥ χ21−α/2,n

χ2 ≥ χ21−α,n

χ2 ≤ χ2α,n

Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

126 Capítulo 8. Contrastes de Hipótesis

8.3.4. Contraste para la varianza de una normal con media descono-

cida

Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), con µ desconocida.

Hipótesis nula Estadístico de contraste

H0 : σ2 = σ20 χ2 =

(n− 1)S2σ20

Hipótesis alternativa Criterios de rechazo

H1 : σ2 6= σ20

H1 : σ2 > σ20

H1 : σ2 < σ20

χ2 ≤ χ2α/2,n−1 o χ2 ≥ χ21−α/2,n−1

χ2 ≥ χ21−α,n−1

χ2 ≤ χ2α,n−1

Ejemplo 8.6: Un fabricante de detergente líquido está interesado en la uniformidad de la

máquina que utiliza para llenar las botellas. De manera específica, es deseable que la varianza

del proceso de llenado sea menor que 0.01, de otro modo existe un porcentaje mayor que el

deseable de botellas con un contenido menor de detergente. Supóngase que la distribución del

volumen de llenado es aproximadamente Normal. Al tomar una muestra aleatoria de 20 botellas

se obtiene una varianza muestral de 0.0153. ¿Tiene el fabricante problemas en el proceso de

llenado de las botellas?. Realizar el contraste al 5% de significación.

El contraste a realizar es:

H0 : σ2 = 0,01

H1 : σ2 > 0,01

con media desconocida.

El estadístico de contraste resulta:

χ2 =19 ∗ 0,01530,01

= 29,07

Puesto que 29.07 no es mayor que χ21−α,n−1 = χ20,95,19 = 30,14, no podemos rechazar H0,

no hay suficiente evidencia empírica para concluir que la varianza del proceso de llenado es

superior a la deseada.

8.3. Contrastes de hipótesis clásicos 127

8.3.5. Contraste para el cociente de varianzas de dos normales inde-

pendientes con medias conocidas

Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ1), y Y1, Y2, ..., Yn2

una muestra aleatoria de una población Y → N(µ2, σ2). Ambas poblaciones se suponen inde-

pendientes.

Hipótesis nula Estadístico de contraste

H0 : σ21 = σ22 F =

Pn1i=1 (xi − µ1)

2 /n1Pn2i=1 (yi − µ2)

2 /n2

Hipótesis alternativa Criterios de rechazo

H1 : σ21 6= σ21

H1 : σ21 > σ22

H1 : σ21 < σ22

F ≤ 1/f1−α/2,n2,n1 o F ≥ f1−α/2,n1,n2F ≥ f1−α,n1,n2

F ≤ 1/f1−α,n2,n1

8.3.6. Contraste para el cociente de varianzas de dos normales inde-

pendientes con medias desconocidas

Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ1), y Y1, Y2, ..., Yn2

una muestra aleatoria de una población Y → N(µ2, σ2). Ambas poblaciones se suponen inde-

pendientes.

Hipótesis nula Estadístico de contraste

H0 : σ21 = σ22 F =

S21S22

Hipótesis alternativa Criterios de rechazo

H1 : σ21 6= σ22

H1 : σ21 > σ22

H1 : σ21 < σ22

F ≤ 1/f1−α/2,n2−1,n1−1 o F ≥ f1−α/2,n1−1,n2−1

F ≥ f1−α,n1−1,n2−1

F ≤ 1/f1−α,n2−1,n1−1

8.3.7. Contraste para la diferencia de medias de dos normales inde-

pendientes con varianzas conocidas

Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

128 Capítulo 8. Contrastes de Hipótesis

Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ1), y Y1, Y2, ..., Yn2

una muestra aleatoria de una población Y → N(µ2, σ2). Ambas poblaciones se suponen inde-

pendientes.

Hipótesis nula Estadístico de contraste

H0 : µ1 − µ2 = δ0 Z =X − Y − δ0s

σ21n1+

σ22n2

Hipótesis alternativa Criterios de rechazo

H1 : µ1 − µ2 6= δ0

H1 : µ1 − µ2 > δ0

H1 : µ1 − µ2 < δ0

Z ≤ zα/2 o Z ≥ z1−α/2

Z ≥ z1−α

Z ≤ zα

8.3.8. Contraste para la diferencia de medias de dos normales inde-

pendientes con varianzas desconocidas pero iguales

Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ), y Y1, Y2, ..., Yn2

una muestra aleatoria de una población Y → N(µ2, σ). Ambas poblaciones se suponen inde-

pendientes.

Hipótesis nula Estadístico de contraste

H0 : µ1 − µ2 = δ0 T =X − Y − δ0sS2p

µ1

n1+1

n2

¶Hipótesis alternativa Criterios de rechazo

H1 : µ1 − µ2 6= δ0

H1 : µ1 − µ2 > δ0

H1 : µ1 − µ2 < δ0

T ≤ tα/2,n o T ≥ t1−α/2,n

T ≥ t1−α,n

T ≤ tα,n

,

donde

n = n1 + n2 − 2S2p =

(n1 − 1)S21 + (n2 − 1)S22n

8.3. Contrastes de hipótesis clásicos 129

Ejemplo 8.7: Se analizan dos catalizadores para determinar la forma en la que afectan

el rendimiento promedio de un proceso químico. De manera específica, el catalizador 1 es el

que se está empleando en este momento, pero el catalizador 2 también es aceptable. Como el

catalizador 2 es más caro, sólo interesará emplearlo siempre y cuando aumente el rendimiento

promedio del proceso. Se hace una prueba piloto, y los rendimientos obtenidos en% son los

siguientes:

Catalizador 1 Catalizador 2

91.5 89.19

94.18 90.95

92.18 90.46

95.39 93.21

91.79 97.19

89.07 97.04

94.72 91.07

89.21 92.75

(a) Contrastar al 10% de significación si la variabilidad en el rendimiento del proceso puede

considerarse independiente del catalizador empleado.

El contraste es:

H0 : σ21 = σ22

H1 : σ21 6= σ22

con medias desconocidas.

El estadístico de contraste resulta:

F =S21S22

=5,688

8,901= 0,639

Como F no es menor que 1/f1−α/2,n2−1,n1−1 = 1/f0,95,7,7 = 0,264 ni F es mayor que

f1−α/2,n1−1,n2−1 = f0,95,7,7 = 3,79, no podemos rechazar H0, por lo tanto, la variabilidad

en el rendimiento del proceso puede considerarse independiente del catalizador empleado.

(b) Contrastar al 5% si interesa emplear el catalizador 2.

Veamos si el catalizador 2 aumenta el rendimiento promedio del proceso.

Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

130 Capítulo 8. Contrastes de Hipótesis

Planteamos entonces el siguiente contraste:

H0 : µ1 − µ2 = 0

H1 : µ1 − µ2 < 0

con varianzas desconocidas pero iguales (según el contraste realizado anteriormente).

T =X − Y − δ0sS2p

µ1

n1+1

n2

¶ =92,255− 92,733− 0s7,295

µ1

8+1

8

¶ = −0,354

Como T no es menor que tα,n = t0,05,14 = −1,761 no podemos rechazar H0 para un nivel

de significación del 5%. Por lo tanto, el catalizador 2 no aumenta significativamente el

rendimiento promedio del proceso.

8.3.9. Contraste para la diferencia de medias de dos normales rela-

cionadas (muestras apareadas) con varianzas desconocidas pero

iguales

Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ1, σ), apareada con

una muestra Y1, Y2, ..., Yn de una población Y → N(µ2, σ).

Hipótesis nula Estadístico de contraste

H0 : µ1 − µ2 = δ0 T =D − δ0q

S2Dn

Hipótesis alternativa Criterios de rechazo

H1 : µ1 − µ2 6= δ0

H1 : µ1 − µ2 > δ0

H1 : µ1 − µ2 < δ0

T ≤ tα/2,n−1 o T ≥ t1−α/2,n−1

T ≥ t1−α,n−1

T ≤ tα,n−1

donde D = X − Y .

Ejemplo 8.8: Se desea comparar dos métodos para predecir la resistencia al corte de vigas

de placa de acero. Con este fin se selecciona una muestra de 9 vigas, a las que se aplican los

8.3. Contrastes de hipótesis clásicos 131

dos métodos. Los datos se presentan en la siguiente tabla:

Mét. 1 1.186 1.151 1.322 1.339 1.2 1.402 1.365 1.537 1.559

Mét. 2 1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052

Contrastar al 5% de significación si existe alguna diferencia entre estos dos métodos.

Claramente se trata de un contraste de igualdad de medias en muestras apareadas (se aplica

a las mismas vigas los dos métodos). Llamamos D a la diferencia de resistencia entre el método

1 y el método 2 y el contraste es:

H0 : µD = 0

H1 : µD 6= 0

Los valores muestrales de D son:

D 0.119 0.159 0.259 0.277 0.138 0.224 0.328 0.451 0.507 ,

que proporcionan una media de 0.2736 y una desviación de 0.1356.

El estadístico de contraste observado es:

T =0,2736q0,13562

9

= 6,05,

tα/2,n−1 = t0,025,8 = −2,306 y t1−α,n−1 = t0,975,8 = 2,306.

Al ser 6.05 mayor que 2.306, rechazamos H0, es decir, los métodos proporcionan resultados

diferentes.

8.3.10. Contraste para una proporción

Sea X1,X2, ...,Xn una muestra aleatoria de una población X →Bernoulli(p).

Hipótesis nula Estadístico de contraste

H0 : p = p0 Z =p− p0rp0 (1− p0)

n

Hipótesis alternativa Criterios de rechazo

H1 : p 6= p0

H1 : p > p0

H1 : p < p0

Z ≤ zα/2 o Z ≥ z1−α/2

Z ≥ z1−α

Z ≤ zα

Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

132 Capítulo 8. Contrastes de Hipótesis

Ejemplo 8.9: Un distribuidor adquirirá un lote de equipos si el porcentaje de defectuosos

no es mayor que el 3%, y se quiere una probabilidad del 5% de rechazar la compra aunque

verifique la condición requerida. Prueba 30 equipos y 2 de ellos resultan defectuosos. ¿Qué

decisión debe adoptar?.

Llamamos p a la proporción de equipos defectuosos en el lote, y queremos comprobar si es

mayor que 0.03. Realizamos para ello el siguiente contraste:

H0 : p = 0,03

H1 : p > 0,03

En este caso el nivel de significación viene dado por:

α = P (Rechazar H0 /H0 cierta)

= P (Rechazar el lote/no contiene más del 3% de defectuosos)=0.05

La proporción de defectuosos en la muestra esˆp = 2/30 = 0,067,con lo cual:

Z =0,067− 0,03r0,03 ∗ 0,97

30

= 1,188

Al ser no ser Z mayor que z1−α = z0,95 = 1,65 no se rechaza H0. Es decir, no hay suficiente

evidencia empírica para concluir que el porcentaje de defectuosos por lote es superior al 3%.

8.3.11. Contraste para la comparación de dos proporciones

SeanX1, ...,Xn1 una m.a.s. deX → Bernoulli(p1) y Y1, ..., Yn2una m.a.s. de Y → Bernoulli(p2).

Ambas poblaciones se suponen independientes.

Hipótesis nula Estadístico de contraste

H0 : p1 = p2 Z =p1 − p2r

ˆpT

³1− ˆ

pT

´/n1 +

ˆpT

³1− ˆ

pT

´/n2

Hipótesis alternativa Criterios de rechazo

H1 : p1 6= p2

H1 : p1 > p2

H1 : p1 < p2

Z ≤ zα/2 o Z ≥ z1−α/2

Z ≥ z1−α

Z ≤ zα

8.3. Contrastes de hipótesis clásicos 133

donde

pT =n1p1 + n2p2n1 + n2

Ejemplo 8.10: Una central de productos lácteos recibe diariamente la leche de dos granjas

A y B. Con el fin de estudiar la calidad de los productos recibidos se extraen dos muestras, una

de cada granja, y se analiza el contenido de materia grasa de cada producto. Se obtienen los

siguientes resultados:

Granja A Granja B

0.32 0.28

0.29 0.30

0.30 0.33

0.28 0.29

0.33 0.31

0.31 0.29

0.30 0.33

0.29 0.32

0.33 0.29

0.32 0.32

0.30 0.31

0.29 0.32

0.29

0.33

Si la central rechaza aquellos productos con un contenido graso superior a 0.32, ¿existen

diferencias significativas entre los porcentajes de productos de A y B que se tendrían que

rechazar?. Realizar el contraste al 5% de significación.

El contraste es:

H0 : p1 = p2

H1 : p1 6= p2

donde el subíndice 1 hace refencia a la granja A y el 2 a la B. Las proporciones de productos

que superan un contenido graso de 0.32 en las muestras son p1 = 0,167 y p2 = 0,214, y la

Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

134 Capítulo 8. Contrastes de Hipótesis

proporción muestral total es pT = 0,192. Por lo tanto, el estadístico de contraste resulta:

Z =0,167− 0,214p

0,192 (1− 0,192) /12 + 0,192 (1− 0,192) /14 = −0,303

Como Z no es menor que z0,025 = −1,96 ni Z es mayor que z0,975 = 1,96 no podemos

rechazar H0. No existen diferencias significativas en las proporciones de productos a rechazar

en ambas granjas.

8.4. Relación entre intervalos de confianza y contrastes de

hipótesis

Existe una estrecha relación entre la prueba de una hipótesis estadística sobre un parámetro

θ y el intervalo de confianza de θ. Si denotamos por [θL, θU ] el intervalo de confianza para θ a

un nivel de confianza del (1− α)100%, entonces el contraste bilateral (dos colas)

H0 : θ = θ0

H1 : θ 6= θ0

a un nivel de significación α conduce a rechazar H0 si θ0 no pertenece al intervalo [θL, θU ].

8.5. Ejercicios

1. Se utilizan dos máquinas diferentes de moldeo por inyección para la fabricación de piezas

de plástico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le

falta color. Se toman dos muestras aleatorias, ambas de tamaño 300, y se encuentan 15

piezas defectuosas en la muestra de la máquina 1 y 8 defectuosas en la muestra de la

máquina 2. ¿Podemos concluir que la máquina 2 produce menos piezas defectuosas que

la máquina 1?. Realizar el contraste para un nivel de significación a = 0,05. Suponer que

sendas muestras proceden de poblaciones normales e independientes.

2. En un proceso de fabricación de tubos de aluminio, la longitud de éstos se distribuye

según una normal de media 100 cm y varianza 16 cm2. Se realiza una reparación y ahora

se desea discernir si ha habido un cambio en la longitud media de los tubos. Para ello se

8.5. Ejercicios 135

selecciona una muestra de tamaño 9, obteniéndose una media muestral de 102 cm. Para

un nivel de significación del 5%, ¿a qué conclusión se llega?.

3. Dos laboratorios farmacéuticos presentan sendas vacunas contra la alergia en el mercado

al mismo tiempo. Una organización de consumidores desea comprobar cuál es más efectiva

de las dos. Con este fin, aplican cada vacuna a una muestra de 10 personas alérgicas y se

mide el nivel de alergia (de 0 a 3) que presentan en la primavera del año siguiente. Los

resultados son:

Vacuna 1 1 2 1 2 1 1 2 1 1 2

Vacuna 2 2 3 3 2 1 3 2 2 2 3

¿Es la vacuna 1 significativamente más eficaz que la 2? Realizar el contraste al 5% de

significación.

4. Un fabricante de monitores prueba dos diseños de microcircuitos para determinar si pro-

ducen un flujo de corriente distinto. El departamento de ingeniería ha obtenido los datos

siguientes:

Diseño 1 n1 = 15−x1 = 24,2 S21 = 10

Diseño 2 n2 = 10−x2 = 23,9 S22 = 10,89

Determinar si existe alguna diferencia significativa en el flujo de corriente de los dos

diseños. Tomar α = 0,05.

5. Dos compañías de compuestos químicos pueden surtir materia prima, y la concentración

de un elemento en particular en este material es importante. La concentración promedio

de ambos proveedores es la misma, pero se sospecha que la variabilidad en la concentración

puede diferir en las dos compañías. La desviación estándar de la concentración en una

muestra aleatoria de 15 lotes producidos por la compañía 1 es 4.7g/l, mientras para la

compañía 2, una muestra de 20 lotes proporciona una desviación estándar de 5.8 g/l.

¿Existe suficiente evidencia en los datos para concluir que la variabilidad en la compañía

1 es mayor que la variabidad de la compañía 2? Realizar el constraste para un nivel de

significación del 5%.

6. Un fabricante de lentes intraoculares evalúa una nueva máquina pulidora. El fabricante

aprobará la máquina si el porcentaje de lentes pulidos que contienen defectos en la su-

perficie no es mayor del 2%. Se toma una muestra aleatoria de 250 lentes y se encuentra

Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

136 Capítulo 8. Contrastes de Hipótesis

que 6 de ellos tienen defectos. ¿Aprueba el fabricante la nueva máquina pulidora?. Tomar

α = 0,1

7. Se utilizan dos máquinas diferentes de moldeo por inyección para la fabricación de piezas

de plástico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le

falta color. Se toman dos muestras aleatorias, cada una de tamaño 300, y se encuentran 15

defectuosas en la primera y 8 en la segunda. ¿Es razonable concluir que la proporción de

defectuosas es la misma en ambas máquinas?. Realizar el contraste al 5% de significación.

8. Quince hombres adultos con edades comprendidas entre 35 y 50 años participan en un

estudio para evaluar el efecto de la dieta y el ejercicio sobre el nivel de colesterol en la

sangre. Los niveles de colesterol medidos sobre cada individuo antes y después de haber

realizado el programa (dieta baja en grasas y ejercicio) aparecen en la siguiente tabla:

Sujeto Antes Después

1 265 229

2 240 231

3 258 227

4 295 240

5 251 238

6 245 241

7 287 234

8 314 256

9 260 247

10 279 239

11 283 246

12 240 218

13 238 219

14 225 226

15 247 233

Contrastar con un nivel de significación del 5% si el programa reduce el nivel de colesterol.

9. En la fabricación de semiconductores, a menudo se utiliza una sustancia química para

quitar el sicilio de la parte trasera de las obleas antes de la metalización. En este proceso

8.5. Ejercicios 137

es importante la rapidez con la que actúa la sustancia. Se han comparado dos soluciones

químicas, utilizando para ello dos muestras aleatorias de 10 obleas para cada solución. La

rapidez de acción observada es la siguiente (en mils/min):

Solución 1 9.9 9.4 9.3 9.6 10.2 10.1 10.3 10.0 9.3 10.1

Solución 2 10.2 10.6 10.7 11.4 10.5 11.0 10.2 10.7 10.4 10.3

a) Contrastar la igualdad de varianzas para un nivel de significación del 10%.

b) ¿Es significativamente mayor la rapidez (media) de actuación de la sustancia em-

pleada en la solución 2 ?. Realizar el contraste para un nivel de significación del

5%

10. Se mide la producción diaria de 2 máquinas durante 9 días seleccionados al azar. Los

datos obtenidos se recogen en la siguiente tabla:

Máquina 1 Máquina 2

103 101

115 98

101 110

105 99

107 98

110 110

105 109

110 99

115 100

a. Obtener un intervalo de confianza para la producción media de cada máquina con

un nivel de confianza del 95%.

b. Contrastar si las varianzas pueden suponerse iguales al 10% de significación.

c. Contrastar si la producción media diaria de la máquina 1 es significativamente mayor

que la producción media diaria de la máquina 2. Realizar el contraste para un nivel

de significación del 5%.

Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.

138 Capítulo 8. Contrastes de Hipótesis

11. Un sindicato pretende analizar los accidentes laborales en los sectores de la construcción

y la siderometalurgia. Para ello, toma una muestra aleatoria de 125 empresas dedicadas

a la construcción y otra de 75 pertenecientes al sector de la siderometalurgia. Una vez

analizados los porcentajes de accidentes en cada una de estas empresas, se obtienen los

siguientes datos:

No de empresas por sector con un %de accidentes menor del 10 %

No de empresas por sector con un %de accidentes mayor o igual del 10 %

Construcción 98 27

Siderometalurgia 54 21

¿Puede afirmarse al 5% de significación que el porcentaje de accidentes laborales es in-

dependiente del sector al que pertenece la empresa?.

12. La Consejería de Obras Públicas y Urbanismo de una Comunidad engarga un estudio para

comparar el precio de las viviendas nuevas de dos municipios, A y B. Con tal fin, se recoge

información sobre el precio del m2 de 42 viviendas de promotoras distintas, seleccionadas

al azar en el municipio A y de 40 viviendas en el municipio B. En la muestra de viviendas

del municipio A, el precio medio del m2 ha resultado ser de 0.98 miles de euros con

una desviación típica de 0.09 miles de euros, mientras que en la muestra de viviendas

del municipio B, el precio medio del m2 es de 0.95 y la desviación típica de 0.07. A

partir de esta información, ¿puede aceptarse que en los dos municipios no hay diferencias

significativas en el precio medio de las viviendas de nueva construcción para un nivel de

significación del 5%?.

13. Se investiga la temperatura de deflexión bajo carga para dos tipos diferentes de tubería de

plástico. Para ello se toman dos muestras aleatorias, cada una de 10 unidades, anotando

8.5. Ejercicios 139

las temperaturas de deflexión observadas (oF). Los resultados son los siguientes.

Tipo 1 Tipo 2

206 177

188 197

205 206

187 201

194 180

193 176

207 185

185 200

189 197

213 192

Suponiendo que sendas muestras proceden de poblaciones normales e independientes,

a. Obtén un intervalo de confianza para el cociente de varianzas con un nivel de con-

fianza del 95%. ¿Pueden considerarse iguales las varianzas?

b. ¿Apoyan los datos la afirmación de que la temperatura de deflexión bajo carga para

la tubería de tipo 2 es mayor que para la tubería de tipo 1?. Tomar α = 0,05.

Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.