contrastes de hipótesisdmontoro/metodos/temas/tema8.pdf · 122 capítulo 8. contrastes de...
TRANSCRIPT
Capítulo 8
Contrastes de Hipótesis
8.1. Introducción. Conceptos básicos
Una hipótesis estadística es una afirmación acerca de una característica poblacional formu-
lada en base a los parámetros de su distribución.
Existen diversos tipos de hipótesis:
- Hacen referencia a un parámetro de una población.
Por ejemplo, consideremos el rendimiento obtenido en un proceso químico,X, con dis-
tribución N(µ, σ), siendo µ desconocido. Podríamos plantear las siguientes hipótesis:
µ = 90
µ 6= 90µ > 90
µ < 90
Si la hipótesis asigna un único valor al parámetro se le llama hipótesis simple, en ca-
so contrario, hipótesis compuesta. En este ejemplo, la primera es simple y el resto son
compuestas.
- Comparan parámetros de varias poblaciones.
Por ejemplo, supongamos que queremos contrastar si el fumar provoca cáncer. Esto equiv-
ale a contrastar si la proporción de fumadores con cáncer, p1, es significativamente mayor
que la proporción de no fumadores con cáncer, p2.
119
120 Capítulo 8. Contrastes de Hipótesis
Contrastar una hipótesis es comparar lo que dice la hipótesis con la información que nos
proporciona una muestra. Si hay coincidencia, dentro de un margen de error admisible entre la
hipótesis planteada (hipótesis nula, H0) y la información muestral entonces la mantendremos
como cierta, en caso contrario la rechazaremos. Rechazar una hipótesis es sustituirla por otra
que sea capaz de explicar la realidad observada en la muestra (hipótesis alternativa, H1).
Por ejemplo, supongamos que nos planteamos si el rendimiento del proceso puede ser en
media del 90%, H0 : µ = 90. Realizamos una serie de pruebas y el rendimiento medio muestral
resulta ser−x = 75, menor que 90. La información muestral parece ir más a favor de H1 : µ < 90
que de H0 : µ = 90.
Una cosa en la que hay que hacer hincapié es la siguiente: nunca podemos afirmar el que
una hipótesis sea verdadera o falsa, ya que para ello tendríamos que tener observaciones de
toda la población. Por lo tanto, al realizar un contraste y tomar una decisión siempre cabe
la posibilidad de equivocarnos. Existen dos tipos de errores asociados a cualquier contraste:
error tipo I, que tiene lugar cuando rechazamos H0 siendo cierta, y error tipo II, que ocurre si
aceptamos H0 siendo falsa.
H0 cierta H0 falsa
Acepto H0 No hay error Error tipo II
Rechazo H0 Error tipo I No hay error
A la probabilidad de que ocurra el error tipo I se le llama nivel de significación del contraste,
que denotamos por α y que fijamos antes de realizar un contraste. A la probabilidad de error
tipo II la denotamos por β.
A 1− α se le llama nivel de confianza, y a 1− β potencia del test.
α = P (error tipo I)=P (rechazar H0 /H0 es cierta) ,
β = P (error tipo II)=P (aceptar H0 /H0 es falsa)
Lógicamente, a medida que uno disminuye el otro aumenta.
Un ejemplo clásico es el siguiente: supongamos que un juez tiene que declarar a un individuo
culpable o inocente.
H0 : inocente
H1 : culpable
8.2. Pasos a seguir para realizar un contraste 121
Si rechaza H0 declara culpable al individuo, y si la acepta lo declara inocente. Comete un
error de tipo I si declara culpable al acusado siendo inocente, y un error de tipo II si lo declara
inocente siendo culpable. Desde el punto de vista moral parece más grave el primer error, de
ahí que en un contraste se fije el nivel de significación α y se minimice β.
8.2. Pasos a seguir para realizar un contraste
1. Planteamos la hipótesis nula H0 (de tipo igualdad) y la alternativa H1(a favor de la
información muestral).
H0 : θ = θ0
H1 : θ 6= θ0
θ < θ0
θ > θ0
2. Fijamos el nivel de significación del contraste α.Generalmente se fija en 0.05, 0.01 o 0.1.
3. Determinamos una medida de discrepancia entre la hipótesis nula y la información mues-
tral. Esta medida estará en función de la diferencia del valor que especifica H0 para el
parámetro y el estimador muestral del parámetro, y tendrá distribución conocida. A tal
medida la llamamos estadístico de contraste bajo H0.
4. Determinamos la discrepancia máxima que estamos dispuestos a admitir para aceptar H0.
Este valor dependerá de la distribución del estadístico de contraste bajo H0, del nivel de
significación α especificado y del tipo de hipótesis alternativa que tengamos. Delimita las
regiones de aceptación y rechazo de H0.
5. Concluimos: si el estadístico de contraste observado (empírico) cae en la región de rechazo,
rechazamos H0, en caso contrario, la mantendremos como cierta.
Ejemplo 8.1: Sea X → N(µ, σ) con µ, σ desconocidas, y sobre µ planteamos el siguiente
contraste:
H0 : µ = 90
H1 : µ > 90
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
122 Capítulo 8. Contrastes de Hipótesis
Seleccionamos una muestra de tamaño n y el estadístico de contraste bajo H0 (suponiendo
H0 cierta) es:
T =
−X − 90
S√n
→ tn−1,
ya que Z =−X−µσ√n
→ N(0, 1), χ2 =(n− 1)S2
σ2→ χ2n−1, son independientes, y T =
Zrχ2
n− 1
.
Observemos que valores observados en−X mucho mayores que 90 irían claramente a favor
de H1 (en contra de H0). A su vez tales valores llevarían a un estadístico de contraste T
muy grande y positivo. En consecuencia, valores muy grandes y positivos en T nos llevarían a
rechazar H0.(siendo cierta). De ahí que la región de rechazo esté en este caso en la cola de la
derecha (de la distribución tn−1) y presente un aréa igual a α (probabilidad de rechazar H0
siendo cierta). El valor que delimita la región de rechazo es por lo tanto t1−α,n−1. Entonces
rechazaremos H0 si el estadístico de contraste observado, t, es mayor o igual que t1−α,n−1.
A la probabilidad de que el estadístico de contraste teórico, este caso T, sea mayor que el
observado, en este caso t, se le llama p-valor. Por lo tanto, el criterio de rechazo en base al
p-valor será: rechazar H0 siempre que el p-valor sea menor o igual que α.
Supongamos que una muestra seleccionada de tamaño 20 nos proporciona una media−x = 98
y una desviación típica s = 2,21. El estadístico observado es por tanto
t =98− 902,21√20
= 16,188
Para un nivel de significación α = 0,05, t1−α,n−1 = t0,95,19 = 1,73. Como 16,188 no es mayor
que 1,73 no podemos rechazar H0.
Ejemplo 8.2: Sobre el ejemplo anterior, consideremos ahora la hipótesis alternativa H1 :
µ < 90.
H0 : µ = 90
H1 : µ < 90
En este caso, valores en−X mucho menores que 90 irían a favor de H1 (en contra de H0).
Por lo tanto, valores muy grandes en valor absoluto y negativos en el estadístico de contraste
llevarían a rechazar H0. La región de rechazo está ahora en la cola de la izquierda, y el valor
que la delimita es tα,n−1. Rechazamos entonces H0 si t ≤ tα,n−1.
8.3. Contrastes de hipótesis clásicos 123
Si observamos una muestra de tamaño 20 y se obtiene una media muestral−x = 83 y una
desviación típica s = 1,96, el estadístico observado es:
t = −3,068,
y tα,n−1 = t0,05,19 = −1,73. Como −3,068 es menor que −1,73, rechazamos H0 para un nivel
de significación del 5%. Por lo tanto, el rendimiento medio es significativamente menor que 90.
Ejemplo 8.3: Consideremos por último la hipótesis alternativa H1 : µ 6= 90.
H0 : µ = 90
H1 : µ 6= 90
En este caso valores en el estadístico muy grandes en valores absoluto, negativos y positivos,
llevarían a rechazar H0. Existen ahora por lo tanto dos regiones de rechazo, una a la izquierda y
otra a la derecha, cada una de las cuales engloba un área de α/2. Los valores que las delimitan
son respectivamente tα/2,n−1 =-t1−α/2,n−1 y t1−α/2,n−1. Rechazamos H0 si t ≤-t1−α/2,n−1 o t≥ t1−α/2,n−1.
Para una muestra de tamaño 20 con media−x = 80 y desviación muestral s = 1,86,
t = −24,044,
y t1−α/2,n−1 = t0,975,19 = 2,09. Como −24,044 es menor que −2,09, rechazamos H0 para un
nivel de significación del 5%. El rendimiento medio es significativamente distinto de 90.
8.3. Contrastes de hipótesis clásicos
8.3.1. Contraste para la media de una normal con varianza conocida
Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), σ conocida.
Hipótesis nula Estadístico de contraste
H0 : µ = µ0 Z =X − µ0σ/√n
Hipótesis alternativa Criterios de rechazo
H1 : µ 6= µ0
H1 : µ > µ0
H1 : µ < µ0
Z ≤ zα/2 o Z ≥ z1−α/2
Z ≥ z1−α
Z ≤ zα
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
124 Capítulo 8. Contrastes de Hipótesis
Ejemplo 8.4: Los sistemas de escape de emergencia para las tripulaciones de aeronaves son
impulsados por un combustible sólido. Una de las características de este producto es la rapidez
de combustión, que se supone con distribución Normal. Las especificaciones requieren que la
rapidez promedio de combustión sea de 50 cm/s. Se sabe que la rapidez estándar de la rapidez
de combustión es σ = 2cm/s. El experimentador decide especificar una probabilidad para el
error tipo I de α = 0,05. Selecciona una muestra aleatoria de tamaño 25 y se obtiene una media
muestral de 53.1 cm/s. ¿A qué conclusiones llega?.
Planteamos el siguiente contraste:
H0 : µ = 50
H1 : µ 6= 50
con varianza conocida.
El estadístico de contraste es:
Z =53,1− 502/√25
= 7,75
Rechazamos H0 si Z ≤ zα/2 o Z ≥ z1−α/2, siendo zα/2 = z0,025 = −1,96 y z1−α/2 =
z0,975 = 1,96. Por lo tanto, rechazamos H0 para un nivel de significación del 5%. La rapidez de
combustión es significativamente distinta de 50 cm/s.
8.3.2. Contraste para la media de una normal con varianza descono-
cida
Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), σ desconocida.
Hipótesis nula Estadístico de contraste
H0 : µ = µ0 T =X − µ0S/√n
Hipótesis alternativa Criterios de rechazo
H1 : µ 6= µ0
H1 : µ > µ0
H1 : µ < µ0
T ≤ tα/2,n−1 o T ≥ t1−α/2,n−1
T ≥ t1−α,n−1
T ≤ tα,n−1
8.3. Contrastes de hipótesis clásicos 125
Ejemplo 8.5: Un artículo publicado en la revista Materials Engineering describe los resul-
tados de pruebas de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga
para la que cada especimen falla es la siguiente (en MPa):
19.8 18.5 17.6 16.7 15.8
15.4 14.1 13.6 11.9 11.4
11.4 8.8 7.5 15.4 15.4
19.5 14.9 12.7 11.9 11.4
10.1 7.9
¿Sugieren los datos que la carga promedio de fallo es mayor que 10 MPa?. Realizar el
contraste a un 10% de significación.
El contraste a realizar es:
H0 : µ = 10
H1 : µ > 10
con varianza σ2 desconocida.
La media y desviación típica muestrales resultan 13.71 y 3.55 respectivamente, con lo cual:
t =13,71− 103,55/
√22
= 4,90
Dado que t = 4,90 > t1−α,n−1 = t0,95,21 = 1,72, rechazamos H0 al 5% de significación. La
carga promedio de fallo es significativamente mayor que 10.
8.3.3. Contraste para la varianza de una normal con media conocida
Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), con µ conocida.
Hipótesis nula Estadístico de contraste
H0 : σ2 = σ20 χ2 =
Pni=1 (xi − µ)2
σ20
Hipótesis alternativa Criterios de rechazo
H1 : σ2 6= σ20
H1 : σ2 > σ20
H1 : σ2 < σ20
χ2 ≤ χ2α/2,n o χ2 ≥ χ21−α/2,n
χ2 ≥ χ21−α,n
χ2 ≤ χ2α,n
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
126 Capítulo 8. Contrastes de Hipótesis
8.3.4. Contraste para la varianza de una normal con media descono-
cida
Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), con µ desconocida.
Hipótesis nula Estadístico de contraste
H0 : σ2 = σ20 χ2 =
(n− 1)S2σ20
Hipótesis alternativa Criterios de rechazo
H1 : σ2 6= σ20
H1 : σ2 > σ20
H1 : σ2 < σ20
χ2 ≤ χ2α/2,n−1 o χ2 ≥ χ21−α/2,n−1
χ2 ≥ χ21−α,n−1
χ2 ≤ χ2α,n−1
Ejemplo 8.6: Un fabricante de detergente líquido está interesado en la uniformidad de la
máquina que utiliza para llenar las botellas. De manera específica, es deseable que la varianza
del proceso de llenado sea menor que 0.01, de otro modo existe un porcentaje mayor que el
deseable de botellas con un contenido menor de detergente. Supóngase que la distribución del
volumen de llenado es aproximadamente Normal. Al tomar una muestra aleatoria de 20 botellas
se obtiene una varianza muestral de 0.0153. ¿Tiene el fabricante problemas en el proceso de
llenado de las botellas?. Realizar el contraste al 5% de significación.
El contraste a realizar es:
H0 : σ2 = 0,01
H1 : σ2 > 0,01
con media desconocida.
El estadístico de contraste resulta:
χ2 =19 ∗ 0,01530,01
= 29,07
Puesto que 29.07 no es mayor que χ21−α,n−1 = χ20,95,19 = 30,14, no podemos rechazar H0,
no hay suficiente evidencia empírica para concluir que la varianza del proceso de llenado es
superior a la deseada.
8.3. Contrastes de hipótesis clásicos 127
8.3.5. Contraste para el cociente de varianzas de dos normales inde-
pendientes con medias conocidas
Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ1), y Y1, Y2, ..., Yn2
una muestra aleatoria de una población Y → N(µ2, σ2). Ambas poblaciones se suponen inde-
pendientes.
Hipótesis nula Estadístico de contraste
H0 : σ21 = σ22 F =
Pn1i=1 (xi − µ1)
2 /n1Pn2i=1 (yi − µ2)
2 /n2
Hipótesis alternativa Criterios de rechazo
H1 : σ21 6= σ21
H1 : σ21 > σ22
H1 : σ21 < σ22
F ≤ 1/f1−α/2,n2,n1 o F ≥ f1−α/2,n1,n2F ≥ f1−α,n1,n2
F ≤ 1/f1−α,n2,n1
8.3.6. Contraste para el cociente de varianzas de dos normales inde-
pendientes con medias desconocidas
Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ1), y Y1, Y2, ..., Yn2
una muestra aleatoria de una población Y → N(µ2, σ2). Ambas poblaciones se suponen inde-
pendientes.
Hipótesis nula Estadístico de contraste
H0 : σ21 = σ22 F =
S21S22
Hipótesis alternativa Criterios de rechazo
H1 : σ21 6= σ22
H1 : σ21 > σ22
H1 : σ21 < σ22
F ≤ 1/f1−α/2,n2−1,n1−1 o F ≥ f1−α/2,n1−1,n2−1
F ≥ f1−α,n1−1,n2−1
F ≤ 1/f1−α,n2−1,n1−1
8.3.7. Contraste para la diferencia de medias de dos normales inde-
pendientes con varianzas conocidas
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
128 Capítulo 8. Contrastes de Hipótesis
Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ1), y Y1, Y2, ..., Yn2
una muestra aleatoria de una población Y → N(µ2, σ2). Ambas poblaciones se suponen inde-
pendientes.
Hipótesis nula Estadístico de contraste
H0 : µ1 − µ2 = δ0 Z =X − Y − δ0s
σ21n1+
σ22n2
Hipótesis alternativa Criterios de rechazo
H1 : µ1 − µ2 6= δ0
H1 : µ1 − µ2 > δ0
H1 : µ1 − µ2 < δ0
Z ≤ zα/2 o Z ≥ z1−α/2
Z ≥ z1−α
Z ≤ zα
8.3.8. Contraste para la diferencia de medias de dos normales inde-
pendientes con varianzas desconocidas pero iguales
Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ), y Y1, Y2, ..., Yn2
una muestra aleatoria de una población Y → N(µ2, σ). Ambas poblaciones se suponen inde-
pendientes.
Hipótesis nula Estadístico de contraste
H0 : µ1 − µ2 = δ0 T =X − Y − δ0sS2p
µ1
n1+1
n2
¶Hipótesis alternativa Criterios de rechazo
H1 : µ1 − µ2 6= δ0
H1 : µ1 − µ2 > δ0
H1 : µ1 − µ2 < δ0
T ≤ tα/2,n o T ≥ t1−α/2,n
T ≥ t1−α,n
T ≤ tα,n
,
donde
n = n1 + n2 − 2S2p =
(n1 − 1)S21 + (n2 − 1)S22n
8.3. Contrastes de hipótesis clásicos 129
Ejemplo 8.7: Se analizan dos catalizadores para determinar la forma en la que afectan
el rendimiento promedio de un proceso químico. De manera específica, el catalizador 1 es el
que se está empleando en este momento, pero el catalizador 2 también es aceptable. Como el
catalizador 2 es más caro, sólo interesará emplearlo siempre y cuando aumente el rendimiento
promedio del proceso. Se hace una prueba piloto, y los rendimientos obtenidos en% son los
siguientes:
Catalizador 1 Catalizador 2
91.5 89.19
94.18 90.95
92.18 90.46
95.39 93.21
91.79 97.19
89.07 97.04
94.72 91.07
89.21 92.75
(a) Contrastar al 10% de significación si la variabilidad en el rendimiento del proceso puede
considerarse independiente del catalizador empleado.
El contraste es:
H0 : σ21 = σ22
H1 : σ21 6= σ22
con medias desconocidas.
El estadístico de contraste resulta:
F =S21S22
=5,688
8,901= 0,639
Como F no es menor que 1/f1−α/2,n2−1,n1−1 = 1/f0,95,7,7 = 0,264 ni F es mayor que
f1−α/2,n1−1,n2−1 = f0,95,7,7 = 3,79, no podemos rechazar H0, por lo tanto, la variabilidad
en el rendimiento del proceso puede considerarse independiente del catalizador empleado.
(b) Contrastar al 5% si interesa emplear el catalizador 2.
Veamos si el catalizador 2 aumenta el rendimiento promedio del proceso.
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
130 Capítulo 8. Contrastes de Hipótesis
Planteamos entonces el siguiente contraste:
H0 : µ1 − µ2 = 0
H1 : µ1 − µ2 < 0
con varianzas desconocidas pero iguales (según el contraste realizado anteriormente).
T =X − Y − δ0sS2p
µ1
n1+1
n2
¶ =92,255− 92,733− 0s7,295
µ1
8+1
8
¶ = −0,354
Como T no es menor que tα,n = t0,05,14 = −1,761 no podemos rechazar H0 para un nivel
de significación del 5%. Por lo tanto, el catalizador 2 no aumenta significativamente el
rendimiento promedio del proceso.
8.3.9. Contraste para la diferencia de medias de dos normales rela-
cionadas (muestras apareadas) con varianzas desconocidas pero
iguales
Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ1, σ), apareada con
una muestra Y1, Y2, ..., Yn de una población Y → N(µ2, σ).
Hipótesis nula Estadístico de contraste
H0 : µ1 − µ2 = δ0 T =D − δ0q
S2Dn
Hipótesis alternativa Criterios de rechazo
H1 : µ1 − µ2 6= δ0
H1 : µ1 − µ2 > δ0
H1 : µ1 − µ2 < δ0
T ≤ tα/2,n−1 o T ≥ t1−α/2,n−1
T ≥ t1−α,n−1
T ≤ tα,n−1
donde D = X − Y .
Ejemplo 8.8: Se desea comparar dos métodos para predecir la resistencia al corte de vigas
de placa de acero. Con este fin se selecciona una muestra de 9 vigas, a las que se aplican los
8.3. Contrastes de hipótesis clásicos 131
dos métodos. Los datos se presentan en la siguiente tabla:
Mét. 1 1.186 1.151 1.322 1.339 1.2 1.402 1.365 1.537 1.559
Mét. 2 1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052
Contrastar al 5% de significación si existe alguna diferencia entre estos dos métodos.
Claramente se trata de un contraste de igualdad de medias en muestras apareadas (se aplica
a las mismas vigas los dos métodos). Llamamos D a la diferencia de resistencia entre el método
1 y el método 2 y el contraste es:
H0 : µD = 0
H1 : µD 6= 0
Los valores muestrales de D son:
D 0.119 0.159 0.259 0.277 0.138 0.224 0.328 0.451 0.507 ,
que proporcionan una media de 0.2736 y una desviación de 0.1356.
El estadístico de contraste observado es:
T =0,2736q0,13562
9
= 6,05,
tα/2,n−1 = t0,025,8 = −2,306 y t1−α,n−1 = t0,975,8 = 2,306.
Al ser 6.05 mayor que 2.306, rechazamos H0, es decir, los métodos proporcionan resultados
diferentes.
8.3.10. Contraste para una proporción
Sea X1,X2, ...,Xn una muestra aleatoria de una población X →Bernoulli(p).
Hipótesis nula Estadístico de contraste
H0 : p = p0 Z =p− p0rp0 (1− p0)
n
Hipótesis alternativa Criterios de rechazo
H1 : p 6= p0
H1 : p > p0
H1 : p < p0
Z ≤ zα/2 o Z ≥ z1−α/2
Z ≥ z1−α
Z ≤ zα
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
132 Capítulo 8. Contrastes de Hipótesis
Ejemplo 8.9: Un distribuidor adquirirá un lote de equipos si el porcentaje de defectuosos
no es mayor que el 3%, y se quiere una probabilidad del 5% de rechazar la compra aunque
verifique la condición requerida. Prueba 30 equipos y 2 de ellos resultan defectuosos. ¿Qué
decisión debe adoptar?.
Llamamos p a la proporción de equipos defectuosos en el lote, y queremos comprobar si es
mayor que 0.03. Realizamos para ello el siguiente contraste:
H0 : p = 0,03
H1 : p > 0,03
En este caso el nivel de significación viene dado por:
α = P (Rechazar H0 /H0 cierta)
= P (Rechazar el lote/no contiene más del 3% de defectuosos)=0.05
La proporción de defectuosos en la muestra esˆp = 2/30 = 0,067,con lo cual:
Z =0,067− 0,03r0,03 ∗ 0,97
30
= 1,188
Al ser no ser Z mayor que z1−α = z0,95 = 1,65 no se rechaza H0. Es decir, no hay suficiente
evidencia empírica para concluir que el porcentaje de defectuosos por lote es superior al 3%.
8.3.11. Contraste para la comparación de dos proporciones
SeanX1, ...,Xn1 una m.a.s. deX → Bernoulli(p1) y Y1, ..., Yn2una m.a.s. de Y → Bernoulli(p2).
Ambas poblaciones se suponen independientes.
Hipótesis nula Estadístico de contraste
H0 : p1 = p2 Z =p1 − p2r
ˆpT
³1− ˆ
pT
´/n1 +
ˆpT
³1− ˆ
pT
´/n2
Hipótesis alternativa Criterios de rechazo
H1 : p1 6= p2
H1 : p1 > p2
H1 : p1 < p2
Z ≤ zα/2 o Z ≥ z1−α/2
Z ≥ z1−α
Z ≤ zα
8.3. Contrastes de hipótesis clásicos 133
donde
pT =n1p1 + n2p2n1 + n2
Ejemplo 8.10: Una central de productos lácteos recibe diariamente la leche de dos granjas
A y B. Con el fin de estudiar la calidad de los productos recibidos se extraen dos muestras, una
de cada granja, y se analiza el contenido de materia grasa de cada producto. Se obtienen los
siguientes resultados:
Granja A Granja B
0.32 0.28
0.29 0.30
0.30 0.33
0.28 0.29
0.33 0.31
0.31 0.29
0.30 0.33
0.29 0.32
0.33 0.29
0.32 0.32
0.30 0.31
0.29 0.32
0.29
0.33
Si la central rechaza aquellos productos con un contenido graso superior a 0.32, ¿existen
diferencias significativas entre los porcentajes de productos de A y B que se tendrían que
rechazar?. Realizar el contraste al 5% de significación.
El contraste es:
H0 : p1 = p2
H1 : p1 6= p2
donde el subíndice 1 hace refencia a la granja A y el 2 a la B. Las proporciones de productos
que superan un contenido graso de 0.32 en las muestras son p1 = 0,167 y p2 = 0,214, y la
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
134 Capítulo 8. Contrastes de Hipótesis
proporción muestral total es pT = 0,192. Por lo tanto, el estadístico de contraste resulta:
Z =0,167− 0,214p
0,192 (1− 0,192) /12 + 0,192 (1− 0,192) /14 = −0,303
Como Z no es menor que z0,025 = −1,96 ni Z es mayor que z0,975 = 1,96 no podemos
rechazar H0. No existen diferencias significativas en las proporciones de productos a rechazar
en ambas granjas.
8.4. Relación entre intervalos de confianza y contrastes de
hipótesis
Existe una estrecha relación entre la prueba de una hipótesis estadística sobre un parámetro
θ y el intervalo de confianza de θ. Si denotamos por [θL, θU ] el intervalo de confianza para θ a
un nivel de confianza del (1− α)100%, entonces el contraste bilateral (dos colas)
H0 : θ = θ0
H1 : θ 6= θ0
a un nivel de significación α conduce a rechazar H0 si θ0 no pertenece al intervalo [θL, θU ].
8.5. Ejercicios
1. Se utilizan dos máquinas diferentes de moldeo por inyección para la fabricación de piezas
de plástico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le
falta color. Se toman dos muestras aleatorias, ambas de tamaño 300, y se encuentan 15
piezas defectuosas en la muestra de la máquina 1 y 8 defectuosas en la muestra de la
máquina 2. ¿Podemos concluir que la máquina 2 produce menos piezas defectuosas que
la máquina 1?. Realizar el contraste para un nivel de significación a = 0,05. Suponer que
sendas muestras proceden de poblaciones normales e independientes.
2. En un proceso de fabricación de tubos de aluminio, la longitud de éstos se distribuye
según una normal de media 100 cm y varianza 16 cm2. Se realiza una reparación y ahora
se desea discernir si ha habido un cambio en la longitud media de los tubos. Para ello se
8.5. Ejercicios 135
selecciona una muestra de tamaño 9, obteniéndose una media muestral de 102 cm. Para
un nivel de significación del 5%, ¿a qué conclusión se llega?.
3. Dos laboratorios farmacéuticos presentan sendas vacunas contra la alergia en el mercado
al mismo tiempo. Una organización de consumidores desea comprobar cuál es más efectiva
de las dos. Con este fin, aplican cada vacuna a una muestra de 10 personas alérgicas y se
mide el nivel de alergia (de 0 a 3) que presentan en la primavera del año siguiente. Los
resultados son:
Vacuna 1 1 2 1 2 1 1 2 1 1 2
Vacuna 2 2 3 3 2 1 3 2 2 2 3
¿Es la vacuna 1 significativamente más eficaz que la 2? Realizar el contraste al 5% de
significación.
4. Un fabricante de monitores prueba dos diseños de microcircuitos para determinar si pro-
ducen un flujo de corriente distinto. El departamento de ingeniería ha obtenido los datos
siguientes:
Diseño 1 n1 = 15−x1 = 24,2 S21 = 10
Diseño 2 n2 = 10−x2 = 23,9 S22 = 10,89
Determinar si existe alguna diferencia significativa en el flujo de corriente de los dos
diseños. Tomar α = 0,05.
5. Dos compañías de compuestos químicos pueden surtir materia prima, y la concentración
de un elemento en particular en este material es importante. La concentración promedio
de ambos proveedores es la misma, pero se sospecha que la variabilidad en la concentración
puede diferir en las dos compañías. La desviación estándar de la concentración en una
muestra aleatoria de 15 lotes producidos por la compañía 1 es 4.7g/l, mientras para la
compañía 2, una muestra de 20 lotes proporciona una desviación estándar de 5.8 g/l.
¿Existe suficiente evidencia en los datos para concluir que la variabilidad en la compañía
1 es mayor que la variabidad de la compañía 2? Realizar el constraste para un nivel de
significación del 5%.
6. Un fabricante de lentes intraoculares evalúa una nueva máquina pulidora. El fabricante
aprobará la máquina si el porcentaje de lentes pulidos que contienen defectos en la su-
perficie no es mayor del 2%. Se toma una muestra aleatoria de 250 lentes y se encuentra
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
136 Capítulo 8. Contrastes de Hipótesis
que 6 de ellos tienen defectos. ¿Aprueba el fabricante la nueva máquina pulidora?. Tomar
α = 0,1
7. Se utilizan dos máquinas diferentes de moldeo por inyección para la fabricación de piezas
de plástico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le
falta color. Se toman dos muestras aleatorias, cada una de tamaño 300, y se encuentran 15
defectuosas en la primera y 8 en la segunda. ¿Es razonable concluir que la proporción de
defectuosas es la misma en ambas máquinas?. Realizar el contraste al 5% de significación.
8. Quince hombres adultos con edades comprendidas entre 35 y 50 años participan en un
estudio para evaluar el efecto de la dieta y el ejercicio sobre el nivel de colesterol en la
sangre. Los niveles de colesterol medidos sobre cada individuo antes y después de haber
realizado el programa (dieta baja en grasas y ejercicio) aparecen en la siguiente tabla:
Sujeto Antes Después
1 265 229
2 240 231
3 258 227
4 295 240
5 251 238
6 245 241
7 287 234
8 314 256
9 260 247
10 279 239
11 283 246
12 240 218
13 238 219
14 225 226
15 247 233
Contrastar con un nivel de significación del 5% si el programa reduce el nivel de colesterol.
9. En la fabricación de semiconductores, a menudo se utiliza una sustancia química para
quitar el sicilio de la parte trasera de las obleas antes de la metalización. En este proceso
8.5. Ejercicios 137
es importante la rapidez con la que actúa la sustancia. Se han comparado dos soluciones
químicas, utilizando para ello dos muestras aleatorias de 10 obleas para cada solución. La
rapidez de acción observada es la siguiente (en mils/min):
Solución 1 9.9 9.4 9.3 9.6 10.2 10.1 10.3 10.0 9.3 10.1
Solución 2 10.2 10.6 10.7 11.4 10.5 11.0 10.2 10.7 10.4 10.3
a) Contrastar la igualdad de varianzas para un nivel de significación del 10%.
b) ¿Es significativamente mayor la rapidez (media) de actuación de la sustancia em-
pleada en la solución 2 ?. Realizar el contraste para un nivel de significación del
5%
10. Se mide la producción diaria de 2 máquinas durante 9 días seleccionados al azar. Los
datos obtenidos se recogen en la siguiente tabla:
Máquina 1 Máquina 2
103 101
115 98
101 110
105 99
107 98
110 110
105 109
110 99
115 100
a. Obtener un intervalo de confianza para la producción media de cada máquina con
un nivel de confianza del 95%.
b. Contrastar si las varianzas pueden suponerse iguales al 10% de significación.
c. Contrastar si la producción media diaria de la máquina 1 es significativamente mayor
que la producción media diaria de la máquina 2. Realizar el contraste para un nivel
de significación del 5%.
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
138 Capítulo 8. Contrastes de Hipótesis
11. Un sindicato pretende analizar los accidentes laborales en los sectores de la construcción
y la siderometalurgia. Para ello, toma una muestra aleatoria de 125 empresas dedicadas
a la construcción y otra de 75 pertenecientes al sector de la siderometalurgia. Una vez
analizados los porcentajes de accidentes en cada una de estas empresas, se obtienen los
siguientes datos:
No de empresas por sector con un %de accidentes menor del 10 %
No de empresas por sector con un %de accidentes mayor o igual del 10 %
Construcción 98 27
Siderometalurgia 54 21
¿Puede afirmarse al 5% de significación que el porcentaje de accidentes laborales es in-
dependiente del sector al que pertenece la empresa?.
12. La Consejería de Obras Públicas y Urbanismo de una Comunidad engarga un estudio para
comparar el precio de las viviendas nuevas de dos municipios, A y B. Con tal fin, se recoge
información sobre el precio del m2 de 42 viviendas de promotoras distintas, seleccionadas
al azar en el municipio A y de 40 viviendas en el municipio B. En la muestra de viviendas
del municipio A, el precio medio del m2 ha resultado ser de 0.98 miles de euros con
una desviación típica de 0.09 miles de euros, mientras que en la muestra de viviendas
del municipio B, el precio medio del m2 es de 0.95 y la desviación típica de 0.07. A
partir de esta información, ¿puede aceptarse que en los dos municipios no hay diferencias
significativas en el precio medio de las viviendas de nueva construcción para un nivel de
significación del 5%?.
13. Se investiga la temperatura de deflexión bajo carga para dos tipos diferentes de tubería de
plástico. Para ello se toman dos muestras aleatorias, cada una de 10 unidades, anotando
8.5. Ejercicios 139
las temperaturas de deflexión observadas (oF). Los resultados son los siguientes.
Tipo 1 Tipo 2
206 177
188 197
205 206
187 201
194 180
193 176
207 185
185 200
189 197
213 192
Suponiendo que sendas muestras proceden de poblaciones normales e independientes,
a. Obtén un intervalo de confianza para el cociente de varianzas con un nivel de con-
fianza del 95%. ¿Pueden considerarse iguales las varianzas?
b. ¿Apoyan los datos la afirmación de que la temperatura de deflexión bajo carga para
la tubería de tipo 2 es mayor que para la tubería de tipo 1?. Tomar α = 0,05.
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.