Download - TEMA 13.- CONTRASTES DE HIPÓTESIS EN MODELOS …valentin/ging/materiales_web/Tema0013_resaltado.pdf · Si además queremos calcular el tamaño muestral necesario para que la probabilidad

ESTADÍSTICA GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL

Tema 13. Contrastes de hipótesis en modelos normales y de proporciones. 234

TEMA 13.- CONTRASTES DE HIPÓTESIS

EN MODELOS NORMALES Y SOBRE PROPORCIONES

- Contrastes de hipótesis en modelos normales. - Problemas de una muestra. - Problemas de dos muestras. - Test t por pares.

- Contraste de hipótesis sobre proporciones. - Problemas de una muestra. - Problemas de dos muestras.

- Dualidad IC – Test de Hipótesis




CONTRASTES DE HIPÓTESIS EN MODELOS NORMALES

ESTUDIO DE UNA POBLACIÓN NORMAL. (PROBLEMAS DE UNA MUESTRA)

Población: XN(,), Muestra: X1,...,Xn Estadísticos: X , S

Problemas de interés: Contrastes de hipótesis sobre la media . Contrastes de hipótesis sobre la varianza desviación típica

Hipótesis nula H. alternativa Estadístico test Región crítica Entrada curva CO Carta VI

H0: =0

conocida

H1: 0 H1: >0 H1: <0

nX

z

00

z0>z/2

z0>z

z0<zd=0/ (1)

a, b c, d c, d

H0: =0

desconocida

H1: 0 H1: >0 H1: <0 nS

Xt 0

0

t0>tn1,/2

t0>tn-1,

t0<tn1,

d=0/ (2)e, f g, h g, h

H0: =0 H1: 0 H1: >0 H1: <0

20

220

)1(

Sn

21,1

20

2,1

20

221,1

20

22,1

20

n

n

nn

=/0

i, j k, l m, n

(1) En este caso es preferible usar las fórmulas desarrolladas en el Tema 12 para calcular y n. (2) Como es desconocido podemos:

(a) Estimarla a partir de la muestra: S . Si aún no se tiene, se necesita una muestra piloto. (b) Expresar las alternativas en función de . P. ej. hallar para 0=1,5 (es decir d=1.5).

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Cuadro de texto

10

Departameto EIO

Cuadro de texto

11

Departameto EIO

Cuadro de texto

12




Ejemplo: Un producto limpiador debe contener 25 gr. de un determinado componente para ser eficaz, pero se sospecha por las muchas quejas de los consumidores que el proceso de fabricación no funciona bien y que esa cantidad es menor. Para ello se toma una muestra de 15 productos y en cada uno se mide la cantidad del componente obteniendo: X 24 1. gr. y S=0.6gr.

El contraste que hay que plantear es H H0 125 25: : contra pues queremos que los consumidores tengan que “demostrar” que el contenido medio está por debajo de los 25 gr.

Supongamos que se hace un test a nivel habitual .

05.0,140

,10 761.181.5

156.0251.24 t

nSXt

nSXC n

Entonces, rechazamos H0 y debemos revisar nuestro proceso de producción. El p-valor que corresponde al valor observado t= -5.81 es 0005.081.514 tP por lo que rechazamos Ho a cualquier nivel de significación habitual.

Si además queremos calcular el tamaño muestral necesario para que la probabilidad de NO detectar un contenido medio ineficaz de sea menor de 0.10 ((24.75)<0.10), utilizamos las curvas CO correspondientes a un test con distribución t y de nivel 0.05 entrando con

41.06.025.00

d

y obtenemos que, aproximadamente, debe ser n = 50. Con la muestra de tamaño 15 que hemos usado, la probabilidad de cometer Error de tipo II si la muestra nos hubiese conducido a No Rechazar H0 habría sido mucho mayor que 0.10. En las curvas CO obtenemos aproximadamente =0.55.

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Tachado

valentin

Cuadro de texto

11

Departameto EIO

Cuadro de texto

11

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado




Ejemplo: Para esmerilar discos de silicio al grueso apropiado se utiliza un cierto proceso de bruñido. Para dar sensación de homogeneidad en el producto, interesa que la variable "X=grosor de los discos" tenga una desviación típica lo menor posible, considerando satisfactorio el proceso si dicha desviación no supera los 0.5 mm. Se realiza un estudio sobre una muestra de 15 discos y se obtiene S=0.64 mm. ¿Hay evidencias de que el proceso no sea satisfactorio al nivel . Para saber si tenemos evidencias suficientes de que el proceso no funciona bien al nivel fijado debemos colocar esta situación en de modo que tendremos evidencias suficientes de ello si somos capaces de rechazar .

22

1

220

5.0:

5.0:

H

H 2

05.0,142

2

20

22

,120

2

68.23904.225.0

64.01411

SnSnC n

Por tanto no rechazamos H0 al nivel .

El p-valor es: 0618.0904.22214 P

Imaginemos que un incremento del 50% en respecto a H0 es preocupante y queremos saber qué riesgo de no detectarlo estaríamos corriendo al no rechazar H0. En este caso el valor de es 1.50.5=0.75. En las curvas CO, Carta VI (k), entrando con =1.5 y n=15 obtenemos 0.27.

Es decir, si ocurriera dicho incremento del 50% no lo detectaríamos con una muestra de tamaño 15 el 27% de las veces.

Para conseguir < 0.1 habríamos necesitado un número de observaciones de aproximadamente n=30 según las curvas CO.

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Tachado

Departameto EIO

Resaltado




Ejemplo: Un artículo publicado en la revista Materials Engineering (1989, Vol. II, No. 4, págs. 275-281) describe los resultados de pruebas de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga para la que cada espécimen falla es la siguiente (en MPa):

19.8, 15.4, 11.4, 19.5, 10.1, 18.5, 14.1, 8.8, 14.9, 7.9, 17.6, 13.6, 7.5, 12.7, 16.7, 11.9, 15.4, 11.9, 15.8, 11.4, 15.4, 11.4

¿Hay evidencias empíricas de que >10 Mpa con un nivel de significación =0.01? ¿Se puede descartar que =4 Mpa al nivel =0.01? ¿Es asumible la hipótesis de normalidad?(Plot de Normalidad visto en prácticas) Solución: Resolvemos el problema con ayuda de STATGRAPHICS

Resistencia7 8 9 10 11 12 13 14 15 16 17 18 19 20

Normal Probability Plot for Resistencia

7 10 13 16 19 22

Resistencia

0,115

2050809599

99,9

perc

enta

ge

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado




Summary Statistics for Resistencia

Count = 22 Average = 13,7136 Variance = 12,6279 Standard deviation = 3,55358 Minimum = 7,5 Maximum = 19,8 Skewness = -0,0151322 Kurtosis = -0,75137

Hypothesis Tests for Resistencia

t-test ------ Null hypothesis: mean = 10,0 Alternative: greater than

Computed t statistic = 4,90168 P-Value = 0,0000378127

Reject the null hypothesis for alpha = 0,01.

Hypothesis Tests for sigma

95,0% confidence interval for sigma: [2,73395;5,0783]

Null Hypothesis: std. deviation = 4,0 Alternative: not equal

Computed chi-squared statistic = 16,5742. P-Value = 0,526851

Do not reject the null hypothesis for alpha = 0,05.

CONCLUSIONES: 1. La media es significativamente superior a 10 Mpa. 2. No hay evidencias de que la desviación típica sea distinta de 4 Mpa. 3. La hipótesis de normalidad parece asumible. (Plot)

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado




COMPARACIÓN DE DOS POBLACIONES NORMALES, MUESTRAS INDEPENDIENTES

Población 1: X1N(1, 1), Muestra 1: 1,11,1 ,..., nXX Estadísticos: 11 , SX Población 2: X2N(2, 2), Muestra 2: 2,21,2 ,..., nXX Estadísticos: 22 , SX Las muestras de las dos poblaciones son independientes.

Problemas de interés: Comparación de medias: Inferencias sobre 12 (12=0 12). Comparación de varianzas: Inferencias sobre 1

2/22 (1

2/22 =1 1=2).


H0: 12=1 y 2 conocidas

H1: 12 H1: 12> H1: 12< 2

22

1

21

0210

nn

XXz

z0>z/2

z0>z z0<z

22

21021 d

2221

21

22

21

21 nnnónnn

a, b c, d c, d

H0: 12=1=2 desconocidas

H1: 12 H1: 12> H1: 12< 21

0210

11nn

S

XXt

p

,20

,20

2,20

21

21

21

nn

nn

nn

tttttt

Solo para n1=n2=n 2021 d (2)

n*=2n-1

e, f g, h g, h

H0: 12=12 desconocidas Behrens-Fisher

H1: 12 H1: 12> H1: 12< 2

22

1

21

0210

nS

nS

XXt

t0>t,/2

t0>t, t0<t,

No hay curvas CO 2

11 2

22

22

1

21

21

22

221

21

nnS

nnS

nSnS

solución aproximada

H0: 1=2 H1: 12 H1: 1>2

22

21

0 SSF

,1,10

21,1,102,1,10

21

2121

nn

nnnn

FF

FFFF Solo para n1=n2=n =1/2

o, p q, r

Muy frecuentemente la diferencia a contrastar es (2) Como es desconocido se adoptan las mismas soluciones (a) y (b) del caso de una muestra.

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

Departameto EIO

Cuadro de texto

14

Departameto EIO

Cuadro de texto

13

Departameto EIO

Cuadro de texto

15

Departameto EIO

Cuadro de texto

16




Ejemplo: En una investigación industrial se está buscando reducir el tiempo de secado de una pintura de imprimación. Se ponen a prueba dos formulaciones de la pintura; la formulación 1 es la estándar, y la formulación 2 tiene un nuevo ingrediente pensado para reducir el tiempo de secado. Por experiencia, se sabe que la desviación típica del tiempo de secado es de 8 minutos, y que esta variabilidad natural no se verá afectada por la adición del nuevo ingrediente. Se pintan 20 ejemplares en orden aleatorio, diez con cada una de las formulaciones. El promedio de los tiempos de secado de las muestras en minutos son 1211 X min. y 1122 X min. a) ¿Qué conclusiones se pueden extraer sobre la efectividad del ingrediente nuevo, usando =0.05? b) Si la verdadera diferencia entre los tiempos medios de secado fuera de 10 minutos, hallar la

potencia de la prueba realizada en a) para detectar esta diferencia. c) Si se quiere que dicha potencia sea al menos 0.95, hallar los tamaños muestrales necesarios. d) ¿Se puede afirmar a partir de la muestra, con un nivel de significación =0.05, que el tiempo

medio de secado se reduce en más de 5 minutos?.

Solución: a) Las hipótesis a contrastar son

::

211

210

HH

05.022

2

22

1

21

210

2

22

1

21

21 645.152.2

108

108

112121 z

nn

XXzz

nn

XXC

Entonces, rechazaremos H0 y concluimos que la nueva formulación reduce el tiempo de secado. El p-valor sería 0059.0)52.2(152.2 zP y habríamos rechazado H0 a cualquier nivel de significación de los habituales.

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado




b) Para calcular la potencia pedida, utilizamos las Curvas CO, Carta VI (c), con las entradas

1088.088

1021222

221

21

nnnd

y obtenemos 0.85.

c) El tamaño muestral necesario para que el test de a) tenga una potencia de 0.95 (es decir cometa un error de tipo II con una probabilidad <0.05) si falla H0 y ocurre que se obtiene también utilizando las curvas CO, la misma carta que en el apartado b):

1421 nnn .

d) Las hipótesis a contrastar son

5:5:

211

210

HH

05.022

2

22

1

21

210

2

22

1

21

21 645.112.1

108

108

51121215z

nn

XXzz

nn

XXC

Entonces, no rechazamos H0 y no queda probado que la nueva formulación reduce el tiempo de secado en más de 5 minutos. El p-valor sería 1314.0)12.1(112.1 zP y no rechazamos H0 a los niveles habituales.

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado




Ejemplo: La presencia de arsénico en el agua para consumo humano es un riesgo potencial para la salud. Un artículo publicado en Arizona Republic (Sunday, May 27, 2001) informó de las concentraciones de arsénico en el suministro de agua, en partes por billón (PPB), en 10 áreas metropolitanas de Phoenix y en 10 áreas rurales de Arizona. Los datos obtenidos fueron:

Metro Phoenix Rural Arizona Phoenix, 3 Rimrock, 48 Chandler, 7 Goodyear, 44 Gilbert, 25 New River, 40 Glendale, 10 Apachie Junction, 38 Mesa, 15 Buckeye, 33 Paradise Valley, 6 Nogales, 21 Peoria, 12 Black Canyon City, 20 Scottsdale, 25 Sedona, 12 Tempe, 15 Payson, 1 Sun City, 7 Casa Grande, 18

Procesando las muestras obtenemos:

Metro Phoenix: 63.75.12 11 SX Rural Arizona: 35.155.27 22 SX .

Se quiere determinar si hay diferencias entre las concentraciones medias de arsénico en el agua en ambas zonas para . Se supone normalidad para la distribución de ambas variables.

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado




Solución: Vamos a hacer en primer lugar un test de comparación de varianzas, por ejemplo, con :

::

211

210

HH

21,1,102,1,10 2121 nnnn FFFFC ; 95.0,9,92

2

22

21

0 18.312473.0

3.1563.7 F

SS

F

Luego rechazamos la igualdad de varianzas. El p-valor sería .04936,002468,022473,02 0 FP Así pues, para comparar las medias hay que trabajar con el test para varianzas distintas:

0:0:

211

210

HH

025.0,1322

2

22

1

21

2102/,

2

22

1

21

21 16.277.2

103.15

1063.7

5.275.12t

nS

nS

XXtt

nS

nS

XXC

Luego rechazamos la igualdad de medias y las concentraciones medias de arsénico en ambas zonas son diferentes para el nivel de significación usado. El p-valor sería .016.00.0079589277.2277.2 00 tPtP

Nota:

132.132

11 2

22

22

1

21

21

22

221

21

nnS

nnS

nSnS

En este problema no podríamos abordar el cálculo de la potencia y el tamaño muestral.

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado




Ejemplo: Se analizan dos catalizadores para ver la forma en que afectan al rendimiento promedio de un proceso químico. El Catalizador 1 es el que se está empleando en este momento, pero el Catalizador 2 también es aceptable y más económico. Por tanto, podría adoptarse éste siempre que no haya evidencias de que cambia el rendimiento medio del proceso. Se hace una prueba en una planta piloto y los resultados son:

Catalizador 1 Catalizador II 91,50 89,19 94,18 90,95 92,18 90,46 95,39 93,21 91,79 97,19 89,07 97,04 94,72 91,07 89,91 92,75

Solución con STATGRAPHICS:

Summary Statistics

Catalizador 1 Catalizador 2 ---------------------------------------------- Count 8 8 Average 92,3425 92,7325 Variance 5,14056 8,90099 Standard dev. 2,26728 2,98345 Minimum 89,07 89,19 Maximum 95,39 97,19 Skewness -0,0370055 0,732691 Kurtosis -1,26841 -0,827821

a) ¿Existen diferencias entre los rendimientos promedio? =0.05 b) ¿Se pueden considerar iguales las varianzas? =0.05 (verlo antes) c) ¿Los rendimientos siguen leyes normales?

89 90 91 92 93 94 95 96 97 98

Catalizador 1

Catalizador 2

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado




Comparison of Means 95,0% confidence interval for mean of Catalizador 1: 92,3425 +/- 1,8955 [90,447,94,238] 95,0% confidence interval for mean of Catalizador 2: 92,7325 +/- 2,49424 [90,2383,95,2267] 95,0% confidence interval for the differ. between the means assuming equal variances: -0,39 +/- 2,8415 [-3,2315,2,4515] t test to compare means Null hypothesis: mean1 = mean2 Alt. hypothesis: mean1 NE mean2 assuming equal variances: t = -0,294376 P-value = 0,77279

Comparison of Standard Deviations

95,0% Confidence Intervals Standard deviation of Catalizador 1: [1,49907;4,61453] Standard deviation of Catalizador 2: [1,97258;6,07214] Ratio of Variances: [0,115623;2,8847]

F-test to Compare Standard Deviations

Null hypothesis: sigma1 = sigma2 Alt. hypothesis: sigma1 NE sigma2 F = 0,577527 P-value = 0,485992

CONCLUSIONES: a) Las varianzas se pueden considerar iguales. b) No hay evidencias de que cambie el rendimiento medio. c) La hipótesis de normalidad se puede asumir.

Catalizador 1

perc

enta

ge

89 91 93 95 970,1

15

2050809599

99,9

Catalizador 2

perc

enta

ge

89 91 93 95 97 990,1

15

2050809599

99,9

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado




d) Supongamos que un cambio en el rendimiento medio de 2.5 puntos (2.5% ó |1-2|=2.5) se considera suficientemente importante. En caso de que se diera, interesaría detectarlo, es decir, rechazar H0. Sin embargo, la muestra actual nos ha conducido a "No rechazar" H0 y cabe preguntarse cuál era el riesgo de que eso ocurriese bajo el supuesto mencionado |1-2|=2.5.

Se trata de hallar el riesgo de error de tipo II, , que obtenemos en las curvas CO, Carta VI (e).

Entramos con 47.065.22

5.222

2121

pS

d

y cortamos con la curva a n*=2n-1=15.

Obtenemos: 0.55, con lo que el riesgo sería elevado. e) Si quisiéramos correr un riesgo de error de tipo II <0.1 en d), obtener el número de

observaciones necesarias.

En las Curvas CO Carta VI (e) obtenemos:

n* 50, es decir n (50+1)/2 = 25.5.

Por tanto, serían necesarias al menos 26 observaciones en cada muestra.

f) Obtener la potencia con que la prueba realizada en a) detectaría una diferencia de 1.5 en el rendimiento medio de los catalizadores.

Se trata de nuevo de hallar el riesgo de error de tipo II, , a través de las curvas CO, Carta VI (e).

En este caso, 75.025.1

221

d , cortamos con la curva a n*=2n1=15 y obtenemos 0.25.

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado

valentin

Resaltado




TEST t POR PARES

Hemos estudiado el problema de comparación de medias de dos poblaciones normales a partir de dos muestras aleatorias independientes, una de cada población.

El problema de comparación de medias se puede realizar también bajo un diseño muestral diferente (diseño de muestras apareadas) encaminado a obtener una mayor potencia para detectar las diferencias.

Ejemplo: Supongamos que estamos interesados en comparar la dureza de dos tipos diferentes de puntas. Para determinar la dureza, se presiona la punta sobre una pieza metálica mediante una máquina que aplica una fuerza determinada y se mide la profundidad de la depresión causada por la punta.

Diseño experimental 1: Seleccionamos varias piezas metálicas al azar, para ser probadas unas con la punta 1 y otras con la punta 2 (por ejemplo, la mitad con cada una). Podemos aplicar a los datos obtenidos el test t para muestras independientes estudiado anteriormente. El procedimiento estadístico aplicado es correcto, pero las diferencias de dureza entre las puntas quizás no se aprecien con total nitidez si las muestras de piezas metálicas se han fabricado en diferentes series y no son homogéneas en algún aspecto que pueda afectar a la dureza. Es decir, las diferencias en las lecturas de dureza observadas también incluyen las posibles diferencias de dureza entre las piezas metálicas.

Diseño experimental 2: Se selecciona al azar una única muestra de piezas y se prueba en cada una los dos tipos de puntas. A continuación se analizan las diferencias entre las lecturas de dureza de ambas puntas en cada pieza de la muestra (muestras pareadas). Parece claro que ahora las diferencias de dureza observadas se deberán fundamentalmente a las diferencias entre las puntas al haber eliminado la variabilidad entre las piezas metálicas probadas con cada tipo de punta.

Departameto EIO

Tachado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado




DISEÑO Y RESOLUCIÓN DEL TEST t POR PARES

1 2

11,1 1,2 1,1 1 1 1

22 22 2,1 2,2 2, 2

1 2 1 2

( , ) , 1: 1:, , ,..., Estadísticos :( , )2 : 2 : ,

: : , , .... , Estadísti

nX X

n

n

X X XX X SPoblación MuestraS

Población X Muestra X X X X SDiferencia D X X Muestra D D D

1 2 1, 2,

cos : , ( , ), , 1,...,

D

D D D i i i

D SD N D X X i n

21

2,1

1,,1 22

21

2

1

2221

1XXD

n

iiD

n

ii SSSSDD

nSXXDD

nD

Las observaciones bidimensionales son independientes entre sí, pero cada observación de la población 1 está relacionada con la que tiene el mismo subíndice de la población 2: Diseño de dos muestras relacionadas o pareadas (apareadas). Problema de interés: Comparación de medias: Inferencias sobre D=12 (D=0 12). El problema se convierte así en un problema de una muestra y se resuelve como un problema de contraste de hipótesis sobre la media de una población normal con desconocida. (La comparación previa de las varianzas carece aquí de interés)


H0: D=0 (1)

D desconocida

H1: D 0 H1: D >0 H1: D <0 nS

Dt

D

00

t0>tn1,/2

t0>tn-1,

t0<tn1,

d=D0/D (2)e, f g, h g, h

(1) Muy frecuentemente 0=0. (2) Como D es desconocido se adoptan las mismas soluciones (a) y (b) del caso de una muestra.

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Cuadro de texto

17




DISEÑOS DE MUESTRAS INDEPENDIENTES VS. MUESTRAS RELACIONADAS:

Para comparar las medias de dos poblaciones normales, en ocasiones el investigador puede plantearse realizar un diseño por muestras independientes o por muestras relacionadas.

Siempre que sea posible es preferible el diseño de muestras pareadas porque tiene más potencia para detectar diferencias entre las medias. La razón de esta mayor potencia estriba en que la diferencia de medias DXX 21 , que es el estadístico de contraste usado en ambos casos, tiene una varianza estimada mayor en el caso de muestras independientes si existe una asociación positiva entre las observaciones de los pares, es decir, 0

21XXS :

22

21

22

21

221

2 SSSSSS XXD PARES

DD

INDRP tnS

D

nS

XX

nS

nS

XXt 02

21

22

21

210

(la asociación entre variables cuantitativas se estudiará en el próximo tema).

Por tanto, una determinada diferencia observada entre las medias muestrales resulta mucho más significativa estadísticamente en el caso de muestras pareadas.

Cuanto mayores son los vínculos en el apareamiento, mayor es la ganancia de potencia y la ventaja del diseño por pares. Éste consigue eliminar la variabilidad debida a otros factores que no están en estudio.

Una vez realizado el diseño y obtenidas las muestras, el análisis de los datos sólo se puede realizar mediante la técnica correspondiente al diseño utilizado. Es decir, si las muestras son independientes no se pueden analizar como apareadas y si son apareadas no se pueden analizar como independientes.

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado




Ejemplo: Un artículo publicado en Journal of Strain Analysis (1983, Vol. 18, No. 2) compara dos métodos, Karlsruhe y Lehigh, para predecir la resistencia al corte de vigas de placa de acero. Se aplican ambos métodos a una muestra de nueve vigas y se obtienen los siguientes resultados: Viga S1/1 S2/1 S3/1 S4/1 S5/1 S2/1 S2/2 S2/3 S2/4 Karlsruhe Method 1.180 1.151 1.322 1.339 1.203 1.402 1.365 1.537 1.559 Lehigh Method 1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052 Diferencias 0.119 0.159 0.259 0.277 0.138 0.224 0.328 0.451 0.507

a) Determinar si hay alguna diferencia de medias entre los dos métodos para =0.05.

HH

D

D

0:0:

1

0

025.0,802/,1 306.205.691356.0

2736.0 tnS

Dtt

nS

DC

Dn

D

1356.0;2736.0 DSD Rechazamos la hipótesis nula. Los datos parecen indicar concretamente una mayor resistencia del Método Karlsruhe. El p-valor es prácticamente nulo.

b) Determinar si la media con el Método Karlsruhe es superior en más de 0.2 para =0.05.

HH

D

D

2.0:2.0:

1

0

05.0,80

0,10 86.163.1

91356.02.02736.0 t

nSD

ttnS

DC

Dn

D

. p-valor=0.070.

No se rechaza H0 ,y por tanto, no queda “probada” H1.

c) Hallar el tamaño muestral necesario para que la prueba realizada en b) detecte una diferencia de 0.25 favorable a Karlsruhe con una potencia de 0.9.

d) Curvas CO, Carta VI (g) .75501.0,37.01356.0

20.025.00 paresnynentredD

D

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Tachado




Ejemplo: Un Laboratorio lanza un producto dietético y anuncia en su publicidad que el uso del producto durante un mes conduce a una pérdida de peso promedio de al menos 2 kg. Ocho sujetos utilizan el producto durante un mes, y los datos de peso como resultado la pérdida se presentan a continuación.

a) ¿Los datos apoyan la afirmación del productor de los productos dietéticos con ?

b) En un esfuerzo por mejorar las ventas, el Laboratorio está considerando cambiar su eslogan de "al menos 2 kg." por "al menos 3 kg."

Sujeto 1 2 3 4 5 6 7 8 Peso Antes 75.6 83.1 98,4 67.9 102.6 88.3 72.5 97.9 Peso Después 70.3 82.2 92.3 66.1 100.2 82.7 68.6 91.4

Solución con STATGRAPHICS

Resumen Estadístico para ANTES - DESPUES Recuento 8 Promedio 4,0625 Desviación Estándar 2,1347 Mínimo 0,9 Máximo 6,5 Cuartil Inferior 2,1 Cuartil Superior 5,85 Sesgo -0,378689 Curtosis -1,69135

0 2 4 6 8ANTES - DESPUES

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado




Prueba de Hipótesis para ANTES - DESPUES Media Muestral = 4,0625 Mediana Muestral = 4,6 Desviación Estándar de la Muestra = 2,1347 Prueba t Hipótesis Nula: media = 2,0 Alternativa: mayor que Estadístico t = 2,73276 Valor-P = 0,014611 Se rechaza la hipótesis nula para alfa = 0,05.

Prueba de Hipótesis para ANTES - DESPUES Media Muestral = 4,0625 Mediana Muestral = 4,6 Desviación Estándar de la Muestra = 2,1347 Prueba t Hipótesis Nula: media = 3,0 Alternativa: mayor que Estadístico t = 1,40778 Valor-P = 0,10101 No se rechaza la hipótesis nula para alfa = 0,05.

Gráfico de Probabilidad Normal

0 2 4 6 8ANTES - DESPUES

0,1

1

5

20

50

80

95

99

99,9

porc

enta

je

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado




CONTRASTES DE HIPÓTESIS PARA MUESTRAS GRANDES

CONTRASTES DE HIPÓTESIS SOBRE PROPORCIONES

Sabemos que para tamaños muestrales grandes el estimador de la proporción sigue aproximadamente una distribución normal en aplicación del TCL (aproximación binomial normal).

ESTUDIO DE UNA PROPORCIÓN. (PROBLEMAS DE UNA MUESTRA) Población: X B(p), Muestra: X1, ...,Xn. Estadístico: Xp ˆ

Problema de interés: Contraste de hipótesis sobre la proporción p.

COMPARACIÓN DE PROPORCIONES (PROBLEMAS DE DOS MUESTRAS) Población 1: X1 B(p1), Muestra 1: 1,11,1 ,..., nXX Estadístico: 11ˆ Xp Población 2: X2 B(p2), Muestra 2: 2,21,2 ,..., nXX Estadístico: 22ˆ Xp Problema de interés: Contraste de hipótesis sobre p1p2 (p1p2=0 p1p2).

Hipótesis nula H. alternativa Estadístico test Región crítica Entrada curva CO Carta VI H0: pp0

H1: pp0 H1: p>p0 H1: p<p0 n

pppp

z)1(

ˆ

00

00

z0>z/2

z0>z

z0<z No hay curvas CO

H0: p1p2=

21

2211 ˆˆˆnn

pnpnp

H1: p1p2

H1: p1p2>

H1: p1p2<

21

210

11)ˆ1(ˆ

ˆˆ

nnpp

ppz z0>z/2

z0>z


Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Cuadro de texto

18

Departameto EIO

Cuadro de texto

19




Ejemplo: Un fabricante de lentes intraoculares evalúa una nueva máquina pulidora. El fabricante aprobará la máquina si el porcentaje de lentes pulidos que contienen defectos en la superficie está significativamente por debajo del 2%. Se toma una muestra aleatoria de 250 lentes y se encuentra que 6 de ellos tienen defectos. ¿Qué decisión debe tomar el fabricante a nivel =0.05? Contraste para “demostrar” que la máquina es buena: 02.0: contra 02.0: 10 pHpH

La región crítica para =0.05 es: 00 0

0 0

ˆ(1 )

p pC z z z zp p

n

Con los datos de la muestra tenemos: 05.000

0 645.145.0

25098.002.002.0024.0

)1(ˆ

z

npp

pp

Entonces, no rechazamos H0 y no queda probado el interés de la nueva máquina para =0.05.

El p-valor es 6736.045.0 zP ,

con lo que el riesgo de error de tipo I al rechazar H0 sería realmente grande.

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado




Ejemplo: Se utilizan dos máquinas diferentes de moldeo por inyección para la fabricación de piezas de plástico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le falta color. Se toman dos muestras aleatorias, cada una de tamaño 300, y se encuentran 15 piezas defectuosas en la muestra de la Máquina 1 y 8 piezas defectuosas en la muestra de la Máquina 2. ¿Queda con ello probado que existen diferencias entre las máquinas a nivel a nivel =0.05? El contraste que hay que plantear es: 211210 : contra : ppHppH

La región crítica es :

2

21

21

11)ˆ1(ˆ

ˆˆz

nnpp

ppC , con

21

2211 ˆˆˆ

nnpnpn

p

De los datos obtenemos: 0383.02

0266.005.0ˆ0266.0300

8ˆ05.030015ˆ 21

ppp

Es decir: 025.0

21

21 96.149.1

30029617.00383.0

0266.005.0

11)ˆ1(ˆ

ˆˆz

nnpp

pp

En consecuencia no rechazamos H0 al nivel pedido.

El p-valor es 13622.049.1 zP ,

con lo que el riesgo de error de tipo I al rechazar H0 sería superior al 10%.

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado




CONTRASTES DE HIPÓTESIS PARA COMPARACIÓN DE MEDIAS EN DE POBLACIONES INDEPENDIENTES CUALESQUIERA

Sabemos que para tamaños muestrales grandes la media muestral sigue aproximadamente una distribución normal en aplicación del TCL.


H0: =0 desconocida

H1: 0 H1: >0 H1: <0

nSX

z 00

z0>z/2

z0>z

z0<zNo hay curvas CO

H0: 12= 1, 2 desconocidas

H1: 12 H1: 12> H1: 12< 2

22

1

21

0210

nS

nS

XXz

z0>z/2

z0>z


Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Cuadro de texto

20

Departameto EIO

Cuadro de texto

21




DUALIDAD INTERVALOS DE CONFIANZATESTS DE HIPÓTESIS

Hemos comprobado que los mismos problemas inferenciales paramétricos se pueden abordar tanto desde la perspectiva de los Intervalos de Confianza como desde la de los Tests de Hipótesis.

La relación entre ambas metodologías es en realidad muy estrecha: Si somos capaces de construir un IC de nivel de confianza para un parámetro , este IC proporciona de manera natural un Test para realizar un contraste de hipótesis bilateral con nivel de significación sobre el parámetro.

Procedimiento dual:

Queremos contrastar las hipótesis

01

00

::

HH

con nivel de significación

Disponemos de una m.a.s. Construimos un IC para el parámetro con confianza . Regla de decisión:

Si IC Rechazo H0. Si IC No Rechazo H0.

.Re0

0

00

0

ICPH

CPciertaHHchazarPIErrorP

El riesgo y la potencia no tienen un equivalente dentro del esquema de los IC.

De manera análoga, los test unitaterales son duales de las cotas de confianza.

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado




De hecho, en todos los problemas inferenciales desarrollados en esta asignatura tendríamos la equivalencia de las dos reglas de decisión: La Regla de Decisión basada en el Test correspondiente desarrollado en este tema. La regla de Decisión dual basada en el IC desarrollado en el Tema 11.

Comprobación en el Contraste de Hipótesis sobre en el modelo N() con conocida:

Contraste bilateral: ::

01

00

HH

1. Regla de decisión basada en el Test desarrollado en Contraste de Hipótesis (Tema 12):

2. Regla de decisión basada en el IC desarrollado en el Tema 11:

Intervalo de Confianza:

De modo que los dos procedimientos conducen siempre a la misma decisión.

nzXnzC

nzXnzXCnzXCzn

XzZC

2/02/0

2/02/02/02/0

2/0

nzX

nzX

2/2/

CXn

zXn

zn

zXn

zXIC 2/02/02/02/0

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Departameto EIO

Resaltado

Download - TEMA 13.- CONTRASTES DE HIPÓTESIS EN MODELOS …valentin/ging/materiales_web/Tema0013_resaltado.pdf · Si además queremos calcular el tamaño muestral necesario para que la probabilidad

Top Related