inferencia estadística y prob_… · inferencia estadística unidad 10. introducción en la unidad...

65
Objetivos Al finalizar la unidad, el alumno: determinará si un estimador es sesgado o insesgado resolverá problemas de intervalos de confianza para la media, diferencia de medias, varianza y proporciones llevará a cabo pruebas de hipótesis para la media, diferencia de medias, varianza y proporciones en problemas de aplicación Inferencia estadística UNIDAD 10

Upload: others

Post on 19-Aug-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

Objetivos

Al finalizar la unidad, el alumno:

• determinará si un estimador es sesgado o insesgado• resolverá problemas de intervalos de confianza para la media, diferencia de medias, varianza y proporciones• llevará a cabo pruebas de hipótesis para la media, diferencia de medias, varianza y proporciones en problemas de aplicación

Inferencia estadística

UNIDAD

10

Page 2: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan
Page 3: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

Introducción

En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan estimaciones de parámetros en estudio; las multivariables aleatorias; se definió formalmente el muestreo aleatorio, y se estudiaron algunas distribuciones muestrales empleando el teorema central del límite. El objetivo general de dichos temas es la construcción de las bases teóricas para la inferencia estadística.

En esta unidad se analizará el proceso de inferencia estadística, el cual se puede hacer de tres maneras: por estimación puntual, intervalo de confianza o por prueba de hipótesis.

Los estimadores puntuales, como se verá, tienen gran importancia teórica en la infe-rencia estadística, pero en la cuestión práctica no es apropiado llevarlos a cabo con base en un solo punto; por consiguiente se harán estimaciones basadas en intervalos.

La otra área de inferencia estadística que se analizará es la prueba de hipótesis. Es decir, se formula una suposición del parámetro y bajo condiciones determinadas se comprobará si es válida o no.

En la unidad 1 se determinó que la estadística descriptiva trabaja con todos los individuos de la población o la muestra. En esta unidad se verá que la estadística inferencialse basa en el estudio de muestras, a partir de las cuales se pretende inferir aspectos relevantes de toda la población. En la unidad 9 se determinó que el método de seleccionar muestras tiene gran importancia en el desarrollo de la estadística. Cómo se realiza la inferencia yqué grado de confianza se puede tener en la muestra son aspectos fundamentales que se analizarán en esta unidad.

10.1 Inferencia estadística

La inferencia estadística consiste en crear métodos con los cuales se puedan realizar conclusiones o inferencias acerca de la población, con base en información muestral o apriori. Tales métodos se dividen en dos grupos:

1. Clásico.2. Bayesiano.

En el método clásico la inferencia se realiza mediante los resultados de un muestreo aleatorio. Mientras que en el método bayesiano las inferencias se realizan (deforma análoga a la asignación de probabilidades en la corriente bayesiana) con base en el conocimiento previo sobre la distribución de los parámetros desconocidos.

El desarrollo de la inferencia estadística en la presente unidad se hará sólo con el método clásico. El análisis comienza con la estimación de parámetros.

Page 4: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

286

10.1.1 Estimación puntual

Un estimador es un elemento descriptivo basado en las mediciones contenidas en una muestra. Por ejemplo, la media de la muestra

xn

xii

n1

1

es un estimador puntual para la media de la población 0.Supóngase que se quiere obtener una inferencia respecto de la calificación media

de todos los alumnosque cursan la materia de cálculo, para esto se analiza una muestra aleatoria de diez de ellos, cuyas calificaciones son

8, 4, 9, 9, 6, 8, 2, 7, 3 y 6

Mediante el promedio de los datos de una muestra se calcula un valor para el estadístico X

x110

8 4 9 9 6 8 2 7 3 6 6 2( ) .

Con base en el valor calculado del estadístico X se puede llevar a cabo una inferencia respecto del parámetro , es decir, una estimación puntual del parámetro media respecto de las calificaciones de la materia de cálculo. En este caso la calificación promedio es 6.2. En general

Dada una población en donde es un parámetro, y ˆ su estadística correspondiente, se le llama

estimador puntual de a cualquier valor ˆ de ˆ .

De la definición de estimador puntual no se puede esperar que dicho valor realice una estimación certera del parámetro, de hecho, ésta también depende del estadístico utilizado. Por ejemplo, si la población estudiantil de la materia de cálculo tiene calificación promedio = 6.5, y se considera una muestra al azar de tres estudiantes con calificaciones 3, 6 y 6, para realizar una estimación del parámetro, se tiene

x1

33 6 6 5( )

Es decir, el estadístico media difiere del parámetro en 1.5 unidades, mientras que el estadístico mediana x 6, difiere del parámetro en sólo 0.5.

Por tanto, con la muestra anterior, el estadístico mediana estima mejor el parámetro. Pero, qué pasará si en una segunda muestra aleatoria de tamaño tres, las calificaciones para la estimación del parámetro resultan 4, 4, y 10, se tiene

x1

34 4 10 6( )

Por tanto, para esta muestra el estadístico media difiere del parámetro en 0.5 unidades, mientras que el estadístico x 4, difiere del parámetro en 2.5.

Es decir, con la muestra anterior el estadístico media estima mejor el parámetro. Por tanto, puede ser de interes qué estimador puntual para un mismo parámetro es mejor elegir. La respuesta se encuentra en las siguientes definiciones.

Definición 10.1

Page 5: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

287

El estadístico ˆ se llama estimador insesgado del parámetro si E( ˆ ) = .

Dadas X1, X2, . . ., X5 una muestra aleatoria de una población cuya distribución es normal, con media y varianza 2, considerando los estadísticos

T X TX X X

TX X X X X

1 21 2 5

31 2 3 4 5

10 3, y

se comprueba cuáles son estimadores insesgados de .

Para verificar qué estimadores son insesgados, se emplea la definición y la propiedad del valor esperado en variables independientes

E a X a X a X a E X a E X a E Xn n n n( ) ( ) ( ) ( )1 1 2 2 1 1 2 2

Para el estadístico T1

E T E X EX X X X X

E X X X X X( ) ( )11 2 3 4 5

1 2 3 4 55

1

5

1

5EE X E X E X E X E X( ) ( ) ( ) ( ) ( )

( ) ( )

1 2 3 4 5

15

15

5

Se muestra que T1 es un estimador insesgado.Para el estadístico T2

E T EX X X X X

E X X X X X

E

( )

(

21 2 3 4 5

1 2 3 4 510

1

10

110

XX E X E X E X E X1 2 3 4 51

105

12

) ( ) ( ) ( ) ( ) ( )

Se muestra que T2 es un estimador sesgado.Para el estadístico T3

E T EX X X X X

E X X X X X

E X

( )

( )

31 2 3 4 5

1 2 3 4 5

1

3

1

3

13

E X E X E X E X( ) ( ) ( ) ( ) ( ) ( )2 3 4 513

13

3

Por tanto, T3 también es un estimador insesgado de la media.

En el ejemplo anterior se aprecia que a un mismo parámetro le pueden corresponder varios estimadores insesgados. Por consiguiente, en el estudio de la estadística resulta deinterés conocer el estimador insesgado que tenga la menor varianza, ya que en tal caso sudistribución está más cercana al parámetro.

Dado un parámetro y un conjunto de estimadores insesgados de él, ˆ , ˆ , , ˆ1 2 m , se llama

de al de menor varianza.

Definición 10.2

Definición 10.3

Ejemplo 1

Page 6: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

288

Dada la muestra aleatoria del ejemplo anterior X1, X2, . . ., X5 y considerando los estadísticos que resultaron insesgados de

T X TX X X X X

1 31 2 3 4 5

3y

se comprueba cuál es más eficiente. Para esto se usa la definición y la propiedad de la varianza en variables independientes

V a X a X a X a V X a V X a V Xn n n n( ) ( ) ( ) ( )1 1 2 2 12

1 22

22

Para el estadístico T1

V T VX X X X X

V X X X X X

V X

( )

(

11 2 3 4 5

2 1 2 3 4 55

1

5

1

25 11 2 3 4 52 2 2 2 21

25

1

255

) ( ) ( ) ( ) ( ) ( )

(

V X V X V X V X

22 21

5)

Para el estadístico T3

V T VX X X X X

V X X X X X

V X

( )

(

31 2 3 4 5

2 1 2 3 4 5

1

3

1

3

19

)) ( ) ( ) ( ) ( ) ( ) ( )

(

V X V X V X V X2 32

4 52 2 2 2 21

19

1

955

5

92 2)

De los cálculos anteriores, resulta que el estadístico T1 es más eficiente que T3, puesto que 1/ 5 5/ 9.

Entre los parámetros más comunes y sus estadísticos, existen los insesgados que se emplean con mayor regularidad:

Ejercicio 1

1. Dadas X1, X2, X3 y X4 una muestra aleatoria seleccionada de una población distribuida en forma normal con media y desviación estándar , considera los siguientes estimadores de

TX X X X

11 2 3 4

6 T

X X X X2

1 2 3 4

4 T

X X X X3

1 2 3 42 3 4

10

y determina cuáles son insesgados y entre éstos cuál es más eficiente.

Ejemplo 2

Page 7: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

289

2. La lectura en un voltímetro conectado a un circuito deprueba tiene una distribución uniforme en el intervalo de ( , + 1), donde es el parámetro para el voltaje del circuito. Supón que X1, X2, X3 y X4 es una muestra aleatoria de tales lecturas y verifica que ˆ .X 0 5 es un estimador insesgado.

3. Dadas X1, X2 y X3 y Y1, Y2 y Y3 como muestras aleatorias independientes de dos poblaciones con medias 1 y 2 y varianza 1

2 y 22, respectivamente

a) comprueba que X Y es un estimador insesgado de 1 y 2 b) calcula la varianza del estimador X Y

10.1.2 Estimación por intervalo

Después de iniciado el estudio de los estimadores puntuales es lógico suponer que la inferencia realizada mediante un valor puntual no es la más adecuada, ya que puede variar considerablemente de muestra en muestra, por tanto, es preferible indicar un intervalo en el que se pueda estimar, con cierto grado de confianza, la localización del parámetro en estudio.

Dada como parámetro, supóngase que, bajo ciertas condiciones (como se verá en las siguientes subsecciones), se encuentra que ( ˆ , ˆ )i s , donde los puntos extremos ˆ ˆi sy llamados extremo inferior y extremo superior , respectivamente, dependen del

valor de la estadística ˆ para una muestra particular. Como los extremos ˆ ˆi sy del

intervalo dependen de la muestra, resulta que sólo son valores de las variables aleatorias correspondientes ˆ ˆ

i sy . Con base en las variables aleatorias anteriores y sus valores correspondientes, se calcula la probabilidad de que el parámetro se encuentre en el intervalo establecido. Se simboliza por 1 – con (0, 1) a la probabilidad mencionada

P i s( ˆ ˆ ) 1

Es decir, se tiene una probabilidad de 1 – de seleccionar una variable aleatoria que con base en una muestra produzca un intervalo que contenga a .

El intervalo anterior en el que se localiza el parámetro , ˆ ˆi s, se llama intervalo de

de (1 – )100%; mientras que la fracción 1 – se le llama o grado

y los extremos ˆ ˆi sy , son los inferior y superior ,

respectivamente.

Por ejemplo, se tiene una muestra de 20 focos cuya duración promedio en horas es x 750 y con base en este valor se estima que el parámetro puede encontrarse con una probabilidad 1 – , establecida de antemano en el intervalo de confianza (740, 760), es decir

P( )740 760 1

En las siguientes subsecciones se analizarán los intervalos de confianza más comunes para los parámetros, medias, diferencia de medias, varianzas y proporciones.

Definición 10.4

Page 8: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

290

Intervalos de confianza para medias de poblaciones aproximadamente normales

Establecidas las bases generales de los intervalos de confianza y utilizando el teorema del límite central, los conceptos sobre estimadores puntuales ylas distribuciones determinadas en la unidad 9, se presentan métodos para el cálculo de intervalos de confianza. Uno de estos métodos se refiere a la media, y se divide en tres casos:

1. Intervalo de confianza para la media poblacional con distribución normal, cuando se conoce

Dada x la media de una muestra aleatoria de tamaño n de una población con distribución aproximadamente normal , de la cual se conoce 2, el intervalo de confianza (1 – ) de 100% para está dado por

x zn

x zn

2 2

donde z / 2 es el valor de la distribución normal estándar, a la derecha del cual tiene un área de / 2. Se denota en este caso que para poder aplicar la fórmula, la distribución tiene que ser normal o aproximadamente normal y se debe conocer el parámetro .

Una máquina de refrescos está ajustada de tal manera que la cantidad de líquido suministrado se distribuye en forma normal con desviación estándar de 0.15 dl. Se calcula 95% de intervalo de confianza para la media de refrescos servidos de una muestra de 36 vasos tomada al azar con un contenido promedio de 2.25 dl.

Se toman los datos: = 0.15 dl, el tamaño de la muestra es 36 con media muestral de x 2 25. dl. Para calcular el intervalo de confianza del parámetro media se emplea la fórmula anterior.

Primero se calcula el valor de z / 2, con 1 – = 0.95. De las tablas porcentuales para la distribución normal estándar se tiene z / 2 = 1.96. Por tanto,

2 25 1 960 15

362 25 1 96

0 15

36

2 201 2 299

. ..

. ..

. .

Es decir, con 95% de probabilidad se afirma que el parámetro media del líquido suministrado por la máquina de refrescos se encuentra entre 2.201 y 2.299 dl.

2. Intervalo de confianza para la media poblacional cuando se desconoce en muestras grandes.

Dada x la media de una muestra aleatoria de tamaño n (n 30) tomada al azar de una población de la cual se conoce su desviación estandar s y se desconoce , el intervalo de confianza (1 – ) de 100% para está dado por

x zs

nx z

s

n2 2

Ejemplo 3

Page 9: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

291

donde z / 2 es el valor de la distribución normal estándar, la cual tiene un área de / 2 y s es la desviación estándar obtenida del estadístico varianza insesgada. En este caso es posible notar que para poder aplicar la fórmula, a diferencia del anterior, se desconoce la distribución.

Se tiene una máquina de refrescos como en el ejemplo anterior, pero de la cual se desconoce su desviación estándar. Para estimar la cantidad promedio de líquido suministrado por la máquina se toma una muestra al azar de 50 vasos, con media de 240 ml y desviación estándar de 20. Se calcula 99% de intervalo de confianza para la media de refrescos servidos.

Se toman los datos: el tamaño de la muestra es 50, x 240 y s = 20 ml. El intervalo de confianza del parámetro media se obtiene sustituyendo estos valores en la fórmula anterior.

Se calcula primero el valor de z / 2, con 1 – = 0.99. De las tablas porcentuales para la distribución normal estándar se tiene z / 2 = 2.575. Por tanto,

240 2 57520

50240 2 575

20

50

232 72 247 28

. .

. .

Es decir, con 99% de probabilidad se afirma que el parámetro media del líquido suministrado por la máquina de refrescos se encuentra entre 232.72 y 247.28 ml.

3. Intervalo de confianza para la media poblacional cuando se desconoce en muestras pequeñas.

Dada x la media de una muestra de tamaño n (n 30) tomada al azar de una población con distribución normal de la cual se conoce s2, y se desconoce 2, el intervalo de con-fianza (1 – ) de 100% para está dado por

x ts

nx t

s

n2 2

donde t / 2 es el valor de la distribución t-Student con v = n – 1 grados de libertad, la cual tiene un área de / 2, y s es la desviación estándar obtenida del estadístico varianza insesgada. Se denota en este caso que la aplicación de la fórmula se puede realizar si la distri-bución de la población es normal o aproximadamente normal, pero a diferencia del caso 1, no se conoce el parámetro , y del caso 2, el tamaño de la muestra debe ser pequeño.

Un fabricante de máquinas de refrescos asegura que sus máquinas suministran en promedio 240 ml de refresco 99.9% de los casos. Un comprador decide verificar estos datos, por lo que toma una muestra al azar de 15 vasos, obteniendo los siguientes resultados

243 250 240 248 245 250 238 246 252 247 246 240 250 249 248 240 245 247 238 248 250 252 247 239 245 249 250 248 247 251

Se calcula con 99.9% de confianza si es válida la afirmación del fabricante.Para encontrar el intervalo de confianza se necesita calcular la media y la varianza

insesgada de la muestra obtenida: x 246 27. y sn 12 17 58. , es decir, s = 4.19.

Ejemplo 4

Ejemplo 5

Page 10: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

292

Siendo la muestra de 15 vasos, se aplica el caso 3, para lo cual se calcula el valor de t / 2, con v = 15 – 1 = 14 grados de libertad y 1 – = 0.999, donde = 0.001, es decir

/ 2 = 0.0005. Por tanto, aplicando las tablas porcentuales para la distribución t-Studentse tiene t0.0005 = 4.14. En conclusión

246 27 4 144 19

15246 27 4 14

4 19

15

241 79

. ..

. ..

. 2250 75.

Es decir, con 99.9% de probabilidad se determina que el parámetro media del líquido suministrado por la máquina de refrescos se encuentra entre 241.79 y 250.75 ml. Por tanto, la afirmación del fabricante no será válida con 99% de confianza, puesto que el valor 240 ml está fuera del intervalo.

Ejercicio 2

1. De la siguiente muestra aleatoria, tomada de un población normal

13 19 14 12 21 14 17 20 17

calcula 95% de intervalo de confianza para la media de la población

a) si se sabe que la varianza poblacional es 4 b) si no se conoce el valor de la varianza poblacional

2. Un ingeniero de control de calidad midió las paredes de 25 botellas de vidrio de dos litros. La media muestral fue 4.02 mm y la desviación estándar muestral 0.09, calcula 95% de intervalo de confianza respecto de la media del espesor de las paredes de lasbotellas.

3. Mientras se efectúa una tarea determinada en condiciones simuladas de ausencia de gravedad el ritmo cardiaco de 40 astronautas en adiestramiento se incrementa, 26.4 pulsaciones por minuto en promedio con desviación estándar de 4.28, calcula la verdadera media en el incremento del ritmo cardiaco si x 26 4. se utiliza como una estimación puntual del incremento medio en el ritmo cardiaco y se utiliza 95% de confianza.

4. Se realizan cinco mediciones en un medidor de volumen en la bomba de una estación de gasolina (10.5, 10.0, 9.90, 9.95 y 10.15), supón normalidad y calcula un intervalo de confianza para la media con = 0.05

5. Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra al azar de piezas cuyos diámetros son 10, 12, 11, 11.5, 9, 9.8, 10.4, 9.8, 10 y 9.8 mm. Supón que los diámetros tienen una distribución aproximadamente normal y

a) calcula 99% de intervalo de confianza para el diámetro promedio de todas laspiezas

b) calcula 99% de intervalo de confianza para el diámetro promedio de piezas si = 1.

Page 11: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

293

Intervalos de confianza para la diferencia de medias en poblaciones aproximadamente normales

Después de analizar los intervalos de confianza para la media poblacional, se continúa con el cálculo de intervalos de confianza para la diferencia de medias, el cual se divide en cinco casos.

1. Intervalo de confianza para 1 – 2 de poblaciones con distribuciones normales,

cuando se conocen 12

22y .

Dadas x x1 2y las medias de muestras aleatorias independientes de tamaños n1y n2, respectivamente, de poblaciones con distribuciones aproximadamente normales, de las cuales se conoce 1

222y , el intervalo de confianza de (1 – ) de 100% para

1 y 2 está dado por

( ) ( )x x zn n

x x zn n1 2

2

12

1

22

21 2 1 2

2

12

1

22

2

donde z / 2 es el valor de la distribución normal estándar, el cual tiene un área de / 2.

Se comparan dos tipos de rosca de tornillos para determinar su resistencia a la tensión. Se prueban doce piezas de cada tipo de cuerda bajo condiciones similares, obteniéndose los siguientes resultados (en kg)

Si 1 y 2 son resistencias promedio a la tensión de los tornillos tipo I y tipo II, respectivamente, con las variaciones a la tensión de los tornillos tipo I y tipo II 1

2 5 y

22 10, respectivamente, se calcula 90% de intervalo de confianza para 1 – 2.

Primero se calculan las medias muestrales: x x1 270 5 71 4. .y .Las muestras son de tamaño n1 = n2 = 12. Se calcula el valor para z / 2 con 90% de

intervalo de confianza usando las tablas porcentuales, z / 2 = 1.645.

( . . ) . ( . . ) .70 5 71 4 1 6455

121012

70 5 71 4 1 6455

1210121 2

22 74 0 941 2. .

Es decir, la diferencia de la resistencia promedio a la tensión al fabricar los tornillos tipos I y II se encuentra entre el intervalo (–2.74, 0.94), con 90% de confianza. Dado que en el intervalo se encuentra el 0, no hay diferencia significativa entre los dos tipos de rosca.

Ejemplo 6

1 2 3 4 5 6 7 8 9 10 11 12

68 70 72 69 71 72 70 69 75 69 70 71

75 73 73 68 68 67 69 75 74 68 73 74

Tipode rosca

1

2

Page 12: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

294

2. Intervalo de confianza para 1 – 2 de poblaciones cuando se desconocen 12

22y

en muestras grandes.

Dadas x x1 2y las medias de muestras aleatorias independientes de tamaños n1 y n2 (n1 30 y n2 30), respectivamente, de poblaciones de las cuales se desconocen

12

22y , el intervalo de confianza (1 – ) de 100% para 1 – 2 está dado por

( ) ( )x x zsn

sn

x x zsn

sn1 2

2

12

1

22

21 2 1 2

2

12

1

22

2

donde z / 2 es el valor de la distribución normal estándar, el cual tiene un área de / 2 y s s1

222, son las varianzas insesgadas respectivas de las muestras 1 y 2.

Retomando el ejemplo 6, se prueban 40 tornillos de cada tipo de cuerda bajo condiciones similares y se obtienen los siguientes resultados (en kg).

del tipo I x s n1 1 172 5 2 45 40. . ,y

del tipo II x s n2 2 269 8 1 75 40. . ,y

Si 1 y 2 son resistencias promedio a la tensión, de los tornillos tipo I y tipo II, respectivamente, se calcula 95% de intervalo de confianza para 1 – 2 con el fin de determinar con cuál tipo de tornillos es más resistente.

Como ya se conocen los valores muestrales para la media y la desviación estándar, y siendo las muestras grandes (n1 = n2 = 40 30), falta únicamente encontrar el valor para z / 2 con 95% de intervalo de confianza. Usando las tablas porcentuales, z / 2 = 1.96

( . . ) .. .

( . . ) ..

72 5 69 8 1 962 45

40

1 75

4072 5 69 8 1 96

2 452 2

1 2

22 2

1 2

40

1 75

40

1 78 3 62

.

. .

Puesto que el intervalo para la diferencia de las medias poblacionales siempre será positivo, se tiene 95% de confianza de que la resistencia a la tensión de los tornillos tipo I es mayor a la de los del tipo II

1 – 2 (1.78, 3.62) indica que 1 – 2 0, es decir 1 2

3. Intervalo de confianza para 1 – 2 de poblaciones normales cuando se desconocen

12

22y , pero se sabe que 1

222 en muestras pequeñas.

Dadas x x1 2y las medias de muestras aleatorias independientes de tamaños n1 y n2 (n1 30 y n2 30), respectivamente, de poblaciones aproximadamente normales de las que se desconocen 1

222y pero se conoce que 1

222, el intervalo de confianza

(1 – ) de 100% para 1 – 2 está dado por

( ) ( ) ( ) ( )x x t sn n

x x t sn np p1 2

2 1 21 2 1 2

2 1 2

1 1 1 1

Ejemplo 7

Page 13: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

295

donde t / 2 es el valor de la distribución t-Student con v = n1 + n2 – 2 grados de libertad, el cual tiene un área de / 2

sn s n s

n np( ) ( )1 1

22 2

2

1 2

1 1

2

es la estimación común de la desviación estándar poblacional y s s12

22y son las varianzas

insesgadas respectivas de las muestras 1 y 2.

Las pruebas de tracción en diez puntos de soldadura para un dispositivo semiconductor produjeron los siguientes resultados en libras requeridas para romper la soldadura

15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5

Un segundo conjunto de ocho puntos fue probado para determinar si la resistencia a la tracción se incrementa con un recubrimiento, produciendo los siguientes resultados

24.9 23.6 19.8 22.1 20.4 21.6 21.8 22.5

Se supone distribución normal, se calcula 90% de intervalo de confianza para 1 – 2, considerando 1

222, ambas desconocidas.

Primero se calculan las medias y varianzas muestrales

del conjunto 1 x s n1 12

114 29 7 50 10. . ,y

del conjunto 2 x s n2 22

222 09 2 68 8. . ,y

Con estos valores se calcula

sn s n s

n np( ) ( ) ( ) . ( ) .1 1

22 2

2

1 2

1 1

2

10 1 7 50 8 1 2 68

10 8 22..32

Falta determinar en las tablas porcentuales de la distribución t-Student el valor de t / 2 con 90% de confianza ( = 0.10 es decir, / 2 = 0.05) y v = n1 + n2 – 2 = 16 grados de libertad. Se determina en las tablas correspondientes que t0.05 = 1.746.

( . . ) . . ( . . ) .14 29 22 09 1 746 2 321

1018

14 29 22 09 1 746 21 2 ..

. .

321

1018

9 72 5 881 2

4. Intervalo de confianza para 1 – 2 de poblaciones normales cuando se desconocen

12

22y , pero se sabe que 1

222 en muestras pequeñas.

Dadas x x1 2y las medias de muestras aleatorias independientes de tamaños n1y n2 (n1 30 y n2 30), respectivamente, de poblaciones aproximadamente normales donde se desconocen 1

222y pero se sabe que 1

222 , el intervalo de confianza

(1 – ) de 100% para 1 – 2 está dado por

( ) ( )x x ts

n

s

nx x t

s

n

s

n1 22

12

1

22

21 2 1 2

2

12

1

22

2

Ejemplo 8

Page 14: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

296

donde t / 2 es el valor de la distribución t-Student con

sn

sn

sn n

sn

12

1

22

2

2

12

1

2

1

22

2

11

2

2

11n

grados de libertad, el cual tiene un área de / 2, y s s12

22y son las varianzas insesgadas

respectivas de las muestras. De la fórmula anterior se puede estimar que el resultado del cálculo de losgrados de libertad generalmente será una cantidad no entera, por lo que siempre se debe redondear al entero más próximo (no al siguiente), por ejemplo, si v = 14.3 14; v = 14.7 15; v = 14.5 15.

Se retoman los datos del ejemplo 8, considerando que 12

22 y son ambas desco-

nocidas. Se supone normalidad; se calcula 90% de intervalo de confianza para 1 – 2; se determina qué tipo de semiconductor sin recubrimiento (1) o con recubrimiento (2) tiene más resistencia a la tracción.

Las medias y varianzas muestrales se calcularon anteriormente

del conjunto 1 x s n1 12

114 29 7 50 10. . ,y

del conjunto 2 x s n2 22

222 09 2 68 8. . ,y

Con estos valores se calculan los grados de libertad

sn

sn

sn n

sn

12

1

22

2

2

12

1

2

1

22

2

11

2

2

2

21

1

7 5010

2 688

7 5010

110 1n

. .

. 2 688

18 1

14 99 152..

Falta determinar, usando las tablas porcentuales de la distribución t-Student, el valor de t / 2 con 90% de confianza ( = 0.10 es decir, / 2 = 0.05) y v = 15 grados de libertad. Se determina en las tablas correspondientes que t0.05 = 1.753.

( . . ) .. .

( . . ) .14 29 22 09 1 7537 50

10

2 68

814 29 22 09 1 753

71 2

.. .

. .

50

10

2 68

8

9 63 5 971 2

Como el intervalo de confianza siempre resulta negativo (de –9.63 a –5.97), se tiene 90% de confianza de que la resistencia a la tracción con recubrimiento es mayor que sin recubrimiento.

5. Intervalo de confianza para = 1 – 2 de poblaciones normales, cuando se desconocen

12

22y , pero se sabe que son observaciones por pares en m uestras pequeñas.

Dadas x sd dy la media y la desviación estándar de las diferencias normalmente distribuidas de n pares aleatorios y dependientes de mediciones de muestras de tamaño n(n 30), respectivamente, de poblaciones aproximadamente normales

Ejemplo 9

Page 15: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

297

donde se desconoce 12

22y , el intervalo de confianza (1 – ) de 100% para

d = 1 – 2 está dado por x t

s

nx t

s

nd

dd d

d

2 2

donde t / 2 es el valor de la distribución t-Student con v = n – 1 grados de libertad, el cual tiene un área de / 2.

En un proceso químico se comparan dos catalizadores para comprobar su efecto en el resultado de la reacción. Se preparó una muestra de doce procesos utilizando el catalizador marca L y también doce de la marca M; a continuación se muestran los datos con los rendimientos.

Se calcula 99% de intervalo de confianza para la diferencia de observaciones igua-ladas y se supone que los datos están distribuidos normalmente.

Primero se determinan las diferencias de los datos de la muestra

Con estas diferencias se calcula su valor medio y la desviación estándar

x sd d0 074 0 207. .y

El tamaño de la muestra es diez, por consiguiente los grados de libertad v = 10 – 1 = 9. De las tablas porcentuales correspondientes a la distribución t-Student con 99% de con-fianza ( = 0.01 y / 2 = 0.005), se tiene que t0.005 = 3.25. Por último el intervalo de confianza resulta

0 074 3 250 207

100 074 3 25

0 207

10

0 139

. ..

. ..

.

d

dd 0 287.

Ejercicio 3

1. Calcula si en una clase de diez estudiantes se tiene el mismo rendimiento en dos pruebas diferentes. Sus puntuaciones son

Considera 95% de intervalo de confianza para la diferencia de las puntuaciones igualadas y supón normalidad en las poblaciones.

Ejemplo 10

0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92

0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86

L

M

0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92

0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86

0.04 0.50 0.28 0.08 0.01 0.05 0.23 0.11 0.18 0.06

L

M

L – M

1 2 3 4 5 6 7 8 9 10

90 90 90 80 90 92 88 90 63 70

84 84 82 94 90 85 89 62 65 52

Estudiante:

Prueba 1:

Prueba 2:

Page 16: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

298

2. Se aplicó un examen de matemáticas financieras a un grupo de alumnos (grupo A), el cual obtuvo las siguientes calificaciones

3.0 3.5 4.0 8.1 7.2 8.9 8.2 10.0 10.0 9.0

A otro grupo se le aplicó un examen de álgebra lineal con las siguientes calificaciones

2.0 3.0 3.7 8.0 5.0 4.0 3.0 8.0 9.0 10.0 7.0 7.0 6.0

Calcula un intervalo de confianza para la diferencia de medias con 90% de nivel deconfianza.

3. Un centro de investigación en medicina del deporte dio a conocer las diferencias en las tasas de consumo de oxígeno para varones universitarios entrenados con dos métodos diferentes. Uno de ellos recibe entrenamiento continuo y el otro intermitente, los dos con igual duración. En la siguiente tabla se registran los tamaños de muestra, medias y desviaciones estándar respectivas, expresados en ml por kg/min

Calcula las medias de estas poblaciones con 99% de intervalo de confianza; supón que las varianzas poblacionales son diferentes y que su distribución es aproxima-damente normal.

4. Los datos que se muestran a continuación son los grados de dureza Brinell obtenidos para muestras de dos aleaciones de magnesio

Supón que provienen de poblaciones aproximadamente normales con varianzas que son distintas y considera 98% de intervalo de confianza para 1 – 2.

5. Se dice que una nueva dieta reduce el peso de una persona, 4.5 kg en promedio, en un periodo de dos semanas. Los pesos de siete mujeres que siguieron esta dieta fueron anotados antes y después de dicho periodo.

Determina la eficacia de la dieta considerando 95% de intervalo de confianza para la diferencia de media de los pesos; supón que su distribución aproximadamente normal.

a) si 12

22

b) si 12

22

Entrenamiento intermitenteEntrenamiento continuo

xc= 43.71

nc= 9

= 4.87sc

xi = 39.63

ni = 7

= 9.68si

1 2 3 4 5 6 7

58.5 60.3 61.7 69.0 64.0 62.6 56.7

60.0 54.9 58.1 62.1 58.5 59.9 54.4

Mujer

Peso anterior

Peso posterior

Page 17: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

299

Intervalos de confianza para la varianza de poblaciones aproximadamente normales

Cuando se trata de intervalos de confianza para la varianza, se consideran dos casos, unopara las varianzas poblacionales y el otro para una razón entre varianzas.

1. Intervalo de confianza para 2 de poblaciones normales en muestras pequeñas.

Dada s2 la varianza de una muestra aleatoria de tamaño n (n 30) de una pobla-ción aproximadamente normal, el intervalo de confianza (1 – ) de 100% para el parámetro 2 está dado por

( ) ( )n s n s1 12

22

22

1 22

donde 22

1 22y son valores de la distribución ji cuadrada

2 (ver tablas estadís-

ticas correspondientes) con v = n – 1 grados de libertad, los cuales tienen áreas de / 2 y 1 – / 2, respectivamente.

Un antropólogo midió el ancho (en centímetros) de una muestra tomada al azar de nueve cráneos de miembros de cierta tribu, y obtuvo los siguientes resultados

13.3 14.2 13.5 16.7 11.1 13.1 13.0 12.2 13.0

Se calcula 95% de intervalo de confianza para la varianza de dicha tribu.Primero se calcula la varianza insesgada de la muestra s2 = 2.33.El grado de confianza está dado por 1 – = 0.95, donde = 0.05, es deci r

/ 2 = 0.025 y 1 – / 2 = 0.975. Buscando en las tablas de la distribución ji cuadrada con v = 9 – 1 = 8 grados de libertad, se tiene

22

0 0252

1 22

0 975217 5345 2 1797. .. .y

Por último, resulta( ) .

.

( ) .

.

. .

9 1 2 33

17 5345

9 1 2 33

2 1797

1 06 8 55

2

2

2. Intervalo de confianza para 12

22 de poblaciones normales en muestras pequeñas.

Dadas s s12

22y las varianzas de muestras aleatorias independientes de tamaños n1 y

n2 (n1 30 y n2 30), respectivamente, de poblaciones normales, el intervalo de confianza (1 – ) de 100% para la razón de las varianzas 1

222 está dado por

s

s

s

s12

22

2 1 2

12

22

12

22 2 2 1

1f

f( , )

( , )

donde f 2 1 2( , ) es el valor de la distribución F (ver tablas correspondientes), con v1 = n1 – 1 grados de libertad del numerador y v2 = n2 – 1 grados de libertad del denominador el cual tiene un área de / 2, similarmente f 2 2 1( , ).

Ejemplo 11

Page 18: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

300

Retomando los datos del ejemplo 8 se hizo la suposición de que 12

22 y se calculó

un intervalo de confianza para la razón de varianzas y se determinó si fue válida lasuposición, con 90% de confianza.

Los resultados del conjunto 1 fueron

15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5

Los resultados del conjunto 2 fueron

24.9 23.6 19.8 22.1 20.4 21.6 21.8 22.5

Al calcular las varianzas muestrales, del conjunto 1 se obtuvo s12 7 50. , n1 = 10, y

del conjunto dos s22 2 68. , n2 = 8.

Falta determinar usando las tablas porcentuales de la distribución F los valores de f f2 1 2 2 2 1( , ) ( , )y con 90% de confianza ( = 0.10 es decir, / 2 = 0.05) y v1= n1 – 1 = 10 – 1 = 9 y v2 = n2 – 1 = 8 – 1 = 7 grados de libertad. Se busca en las tablas de la distribución F y se obtiene

f f f f2 1 2 0 05 2 2 1 0 059 7 3 677 7 9 3 29( , ) ( , ) . ( , ) ( , ) .. . y 33 El intervalo de confianza resulta

7 50

2 68

1

3 677

7 50

2 683 293

0 76

12

22

12

22

.

. .

.

..

. 9 22.

Del intervalo de confianza para la razón entre varianzas se determina que el valor 1 está contenido en el intervalo. Por tanto, con 90% de confianza se justifica la suposición de que 1

222, ya que 1

222 1 0 76 9 22( . , . ) y si se multiplican por 2

2 ambos miembros de la igualdad se obtiene 1

222.

Ejercicio 4

1. Un geólogo estudia el movimiento de los cambios relativos en la corteza terrestre en un sitio particular, en un intento por determinar el ángulo medio de las fracturas eligió n = 50 fracturas y determina que la media es de 39.8° y la desviación estándar muestral es de 17.20°. Considera 99% de intervalo d e confianza para estimar la varianza de la población (supón que la población está normalmente distribuida).

2. En un proceso químico se comparan dos catalizadores para verificar su efecto en el resultado de la reacción. Se preparó una muestra de diez procesos utilizando el catalizador marca L y diez con el de la marca M, a continuación se muestran los datos con los rendimientos

Ejemplo 12

0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92

0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86

L

M

Page 19: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

301

Considera 99% de intervalo de confianza para razón entre varianzas de los rendi-mientos de los catalizadores; supón que los datos están distribuidos normalmente.

3. El espesor de las paredes de 25 botellas de vidrio de dos litros fue medido por un ingeniero de control de calidad. La media muestral fue de 4.02 mm y la desviación estándar muestral de 0.09. Considera 95% de intervalo de confianza con respecto de la varianza del espesor de las paredes de las botellas.

4. Se realizan cinco mediciones en un medidor de volumen en la bomba de una estación de gasolina (10.5, 10.0, 9.90, 9.95 y 10.15), supón normalidad y calcula un intervalo de confianza para la varianza con = 0.05.

Intervalos de confianza para las proporciones en muestras grandes

1. Intervalo de confianza para el parámetro p en muestras grandes.

Si ˆ ˆ ˆp q py 1 son las proporciones respectivas de éxitos y fracasos en una muestra aleatoria de tamaño n (n 30), el intervalo de confianza (1 – ) de 100% para el parámetro binomial p está dado por

ˆˆ ˆ

ˆˆ ˆ

p zpq

np p z

pq

n2 2

donde z / 2 es el valor de la distribución normal estándar, el cual tiene un área de / 2.

En una muestra aleatoria de cien posibles clientes, 70 prefieren determinado producto. Se considera 95% de intervalo de confianza para la proporción de todos los posibles clientes que prefieren tal producto.

Para el intervalo de confianza de la proporción primero se determina el valor de ésta de personas que prefieren el producto

ˆ . ˆ .p q70

1000 70

30

1000 30y

En este caso se tiene 95% de confianza, por tanto, 1 – = 0.95, y usando las tablas porcentuales de la distribución normal se tiene z / 2 = 1.96. Por último

0 70 1 960 70 0 30

1000 70 1 96

0 70 0 30100

0 6102 0 78

. .. .

. .. .

. .

p

p 998

2. Intervalo de confianza para p1 – p2 de poblaciones en muestras grandes.

Dadas ˆ ˆp p1 2y las proporciones de éxitos de las muestras aleatorias de tamaños n1 y n2(n1 30y n2 30), respectivamente y ˆ ˆ ˆ ˆq p q p1 1 2 21 1y , el intervalo de confianza (1 – ) de 100% para la diferencia entre los dos parámetros binomiales p1 – p2 está dado por

(ˆ ˆ )ˆ ˆ ˆ ˆ

(ˆ ˆ )ˆ ˆ

p p zp q

n

p q

np p p p z

p q

n1 22

1 1

1

2 2

21 2 1 2

2

1 1

1

ˆ ˆp q

n2 2

2

donde z / 2 es el valor de la distribución normal estándar, el cual tiene un área de / 2.

Ejemplo 13

Page 20: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

302

Una firma manufacturera de cigarros distribuye dos marcas. Si se encuentra que 56 de 200 fumadores prefieren la marca A y que 29 de 150 fumadores prefieren la marca B, se considera 95% de intervalo de confianza para pA – pB; se determina si es válido suponer que la población de fumadores prefiere la marca B, sobre la marca A.

Dada pA la probabilidad de que 56 de 200 fumadores prefieran la marca A, su estadístico resulta

ˆ .pA56200

0 28

de tal forma que ˆ .qA 0 72 con n1 = 200. Asimismo la probabilidad de que 29 de 150 prefieran la marca B resulta

ˆ .pB29

1500 19

de tal forma que ˆ .qB 0 81 con n2 = 150. Por último para el intervalo de 95% de confianza, de las tablas porcentuales para la distribución normal resultaque z / 2 = 1.96, empleando la fórmula correspondiente para pA – pB

( . . ) .. . . .

( . .0 28 0 19 1 960 28 0 72

2000 19 0 81

1500 28 0 19p pA B )) .

. . . .

. .

1 960 28 0 72

2000 19 0 81

150

0 0018 0 1782p pA B

Como pA – pB 0 entonces pA pB.Por tanto, no es válida la suposición de que la población de fumadores prefiere la

marca B sobre la A con 95% de confianza.

Ejercicio 5

1. Para estimar la propuesta de los trabajadores desempleados en Panamá, un economista toma una muestra al azar de 400 personas de clase obrera, donde 25 resultaron sin empleo. Calcula la proporción real de trabajadores desempleados en Panamá considerando 97% de un intervalo de confianza.

2. Un rector registró debidamente el porcentaje de calificaciones D y F otorgadas a los estudiantes por dos profesores universitarios de historia. El profesor I alcanzó 32% contra 21% del profesor II, con 200 y 180 estudiantes, respectivamente. Considera90% de intervalo de confianza para la diferencia de proporciones.

3. Un antropólogo está interesado en la proporción de individuos que presentan braquicefalia en dos tribus indígenas. Supón que se toman muestras independientes de cada una de las tribus y se descubre que 24 de cada 100 nativos de la tribu A y 36 de cada 120 de la tribu B poseen dicha característica. Considera 95% de intervalo de confianza para la diferencia p1 – p2 entre las proporciones de estas dos tribus.

10.2 Pruebas de hipótesis

En la sección anterior se analizaron los intervalos de confianza para el cálculo de estimaciones sobre los parámetros y para tomar decisiones al trabajar con la población de interés. En esta sección se estudiará otro método estadístico que permita tomar deci-siones en problemas relacionados con poblaciones que resultan muy difíciles o imposibles de analizar en su totalidad. Por ejemplo, para poder concluir con cierta veracidad sobre la

Ejemplo 14

Page 21: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

303

vida promedio de focos de cierta marca, se puede formular una hipótesis, la cual se debe comprobar, es decir, buscar evidencias que ayuden a decidir si la hipótesis se acepta o se rechaza.

Se llama hipótesis estadística

La comprobación de una hipótesis estadística consiste en buscar evidencias para decidir sobre la aceptación o rechazo de la afirmación realizada. En el ejemplo de los focos se puede suponer que su vida promedio está por arriba de las 750 h de duración; después de elegir una muestra de tales focos, resulta que su vida promedio fue 730 h, con este análisis surge un cuestionamiento.

En la comprobación de hipótesis, la manera óptima de tomar la decisión de aceptar o rechazar la afirmación realizada sólo se puede conocer cuando se analiza toda la población; sin embargo, en la práctica, una afirmación se acepta con base en una muestra aleatoria de la población que sólo indica que con los resultados obtenidos no existe evidencia para rechazarla. Asimismo, cuando se rechaza una afirmación formulada sólo significa que no existen evidencias suficientes de la muestra para aceptarla.

Para formular unaafirmación sobre un suceso y realizar una prueba de aceptación o rechazo, surge la siguiente terminología: se llama hipótesis nula a la afirmación que se quiera probar y se simboliza por H0. A la afirmación que es opuesta a la hipótesis nula se le llama hipótesis alterna , y se simboliza por H1. Cabe aclarar que la hipótesis nula siem-pre deberá ser establecida de tal forma que especifique un valor exacto del parámetro en estudio, mientras que la hipótesis alterna debe representar un valor diferente al de la hipótesis nula. Por ejemplo en el caso de la duración promedio de los focos la muestra tuvo una vida promedio de 730 h, 20 menos que la conjetura del fabricante, por tanto, se formula la hipótesis nula como H0: 750, es decir, la vida promedio de los focos es menor o igual que 750.

La hipótesis alterna correspondiente se basa en la afirmación del fabricante, el cual asegura que la vida promedio de los focos está por arriba de las 750 h de duración, con lo que se establece la hipótesis alterna como H1: 750, es decir, la vida promedio de los focos es mayor a 750.

Como se aprecia, el valor del parámetro en la hipótesis alterna puede elegirse dentro de una infinidad de posibilidades ya que no se establece un valor concreto, en este caso sólo debe cumplir con ser mayor a 750.

10.2.1 Tipos de errores en una prueba de hipótesis

Al aceptar o rechazar una hipótesis nula se pueden cometer ciertos errores, los cuales deben ser mínimos.

Se llama error tipo I cuando se rechaza la hipótesis nula, dado que ésta es cierta. Asimismo, se llama error tipo II cuando no se rechaza la hipótesis nula, dado que es falsa.

Dadas las definiciones de los dos errores que van implícitos al aceptar o rechazar una hipótesis nula, surge de nuevo un cuestionamiento.

Definición 10.5

Definición 10.6

Page 22: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

304

La respuesta referente a la probabilidad de cometer un error tipo I o tipo II es fundamental en el desarrollo de la prueba de hipótesis.

Se llama a la probabilidad de cometer un error tipo I y se simboliza por ; si se comete un error tipo II, la probabilidad se simboliza por .

Se retoma el caso de la vida promedio de los focos y se consideran 49 focos de muestra y las hipótesis H0: 750, H1: 750, la evidencia de la muestra establece 760 h de vida promedio, se calcula el nivel de significancia.

= probabilidad de cometer un error tipo I = probabilidad de rechazar H0 siendo verdadera

Es decir

P X( ),760 750 cuando Para calcular la probabilidad anterior se usa el teorema central del límite

P X PX

n

P Z( ) ( . ) .760760 75025

49

2 8 0 0026

En tales condiciones, la probabilidad de cometer un error tipo I es pequeña; es decir, el nivel de significancia es 0.26%.

Se retoma el caso de la vida promedio de los focos y se calcula para = 765.

= probabilidad de cometer un error tipo II = probabilidad de aceptar H0, siendo falsa

Es decir,

P X( )760 765 cuando

se calcula la probabilidad anterior usando el teorema del límite central

P X PX

n

P Z( ) ( . ) .760760 76525

49

1 4 0 0808

La probabilidad de cometer un error tipo II es pequeña, es decir, 8.08% para el caso en que la verdadera vida promedio de los focos sea igual a 765 horas.

Definición 10.7

Ejemplo 16

Ejemplo 15

Page 23: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

305

Ejercicio 6

1. Se ha desarrollado una nueva preparación para cierto tipo de cemento con un coeficiente de compresión de 5 mil kg por cm2 y una desviación estándar de 120. Para comprobar la hipótesis de que = 5 000, en contraposición con la alternativa de 5 000 se verifica una muestra al azar de 50 piezas de cemento. Se determina que la región crítica es X 4 970 .

a) calcula la probabilidad de cometer el error tipo I cuando H0 es verdadera b) evalúa para la alternativa = 4 960

2. Supón que X es una variable aleatoria normal con varianza 100. Si se toma una muestra al azar de tamaño 16 de X, comprueba la hipótesis H0: = 10 contra H1: 10. Si se determinó una media muestral de 12.5, calcula la probabilidad de error

de tipo II. 3. Una lavandería afirma que un nuevo quitamanchas es efectivo en no más de 70%

de los casos en que se utiliza. Para comprobar esta afirmación se aplica el producto en doce manchas tomadas al azar. Si menos de once son eliminadas se acepta la hipótesis nula de que p = 0.7; de otra forma se concluye p 0.7.

a) evalúa , suponiendo p = 0.7 b) evalúa para la alternativa p = 0.9

Para la comprobación de hipótesis se tienen los mismos casos que en los intervalos de confianza. La formulación de las hipótesis nula y alterna comúnmente causa cierto desconcierto. Para diferenciar a la hipótesis nula de la alterna y simplificar los ejemplos y ejercicios, el análisis delimita que las hipótesis a verificar siempre estén formuladas con , o =. De tal forma que en los dos primeros casos éstas serán las hipótesis alternas

correspondientes, mientras que en el tercero se refiere a la hipótesis nula. Puesto que en la prueba de hipótesis y los intervalos de confianza se tienen los

mismos casos y sus condiciones para la aplicación son las mismas, se simplifica el trabajo, resumiendo únicamente las fórmulas para las hipótesis nulas y sus hipótesis alternas respectivas con sus estadísticos y regiones de rechazo correspondientes, para cada uno de los diferentes temas: medias (tres casos), diferencia de medias (cinco), varianzas (dos)y proporciones (dos).

Para la prueba de hipótesis se recomienda seguir los siguientes pasos:

• establecer la hipótesis nula• establecer la hipótesis alterna• fijar el nivel de significancia• elegir el estadístico para la prueba de hipótesis• con base en lo anterior encontrar la región de aceptación y rechazo• calcular el valor del estadístico correspondiente y, con base en éste, aceptar o

rechazar la hipótesis nula

Page 24: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

306

10.2.2 Pruebas de hipótesis para medias de poblaciones aproximadamente normales con valor crítico

1. Una máquina produce piezas metálicas de forma cilíndrica, se toma una muestra alazar de piezas cuyos diámetros son 9.8, 9.5, 9.8, 11.5, 9.0, 10.4, 9.8, 10.1 y 11.2 mm. Se supone que los diámetros tienen una distribución aproximadamente normal. Si el fabricante afirma que el diámetro promedio es 10 mm, se determina respecto de esta afirmación con 0.01 de nivel de significancia.

Se pide una prueba de hipótesis para la media, comprobando que ésta es igual a 10 mm, en tal caso, de acuerdo con datos muestrales, la hipótesis alterna será el opuesto, es decir, diferente de diez. Se siguen los pasos para una prueba de hipótesis.

a) H0: = 10 b) H1: 10 c) nivel de significancia = 0.01

d) estadístico de prueba, primero se identifica a cuál de los tres casos anteriores corres-ponde, se indica que no se conoce s y que la muestra es pequeña; por tanto,

tx

s n0

e) para localizar la región de aceptación y rechazo del inciso b), se determina que se trata de una prueba de dos colas, y del inciso d), que el estadístico de prueba está basado en la distribución t-Student, por lo que la región de rechazo está dada por

t –t / 2 y t t / 2

Con base en el inciso c), se tiene = 0.01, donde / 2 = 0.005. Por otro lado, el tamaño de la muestra es n = 9, donde v = 9 – 1 = 8 grados de libertad. Por tanto, de las tablas porcentuales de la distribución t-Studentresulta la región de rechazo

t –t0.005 = –3.355 y t t0.005 = 3.355

Ejemplo 17

Región de rechazo,cola derecha

Región de rechazo,cola izquierda

Page 25: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

307

f) para calcular el estadístico t, primero se determinan los datos de la media y la desviación estándar muestral calculando los nueve datos, se tiene x 10 1222. y s = 0.7981, donde

t10 1222 10

0 7981 90 4593

.

..

Como dicho valor se encuentra en la región de aceptación, la hipótesis nula se acepta y, por tanto, se determina que con nivel de significancia de = 0.01 es válida la afirmación del fabricante.

2. Se toma una muestra al azar de 36 vasos suministrados por una máquina de refrescos que sirve por vaso un contenido promedio de 21.9 dl, con desviación estándar de 1.42 dl. Se comprueba la hipótesis = 22.2 dl contra la hipótesis alterna 22.2 con nivel de significancia 0.05.

a) H0: = 22.2b) H1: 22.2c) nivel de significancia = 0.05d) estadístico de prueba; primero se identifica a cuál de los tres casos anteriores

corresponde, dado que no se conoce y la muestra es grande; por tanto

zx

s n0

e) para localizar la región de aceptación y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está basado en la distribución normal, por lo que la región de rechazo está dada por

z –z

Con base en el inciso c), se tiene = 0.05. Por tanto, de las tablas porcen-tuales de la distribución normal la región de rechazo resulta

z –z = –1.6449

f) de la muestra aleatoria de 36 servicios de la máquina de bebidas se obtuvo un contenido promedio de 21.9 dl, con desviación estándar de 1.42 dl, donde

z = 21 9 22 2

1 42 36

. .

. = –1.2676

Como dicho valor se encuentra en la región de aceptación, la hipótesis nula se acepta con un nivel de significancia de = 0.05.

3. De acuerdo con las normas establecidas para un examen de aptitud mecánica, las personas de 18 años deberían promediar 73.2 con desviación estándar de 8.6. Si de una toma al azar 45 personas promedian 76.7, se comprueba la hipótesis de que la media poblacional es mayor que 73.2. Se determina nivel de significancia de 2.5% y desviación estándar poblacional de 8.6.

Page 26: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

308

Se pide una prueba de hipótesis para la media, donde se comprueba que la media poblacional es mayor que 73.2, según los datos anteriores; en tal caso, lahipótesis alterna será la afirmación que se quiere probar: la media poblacional es mayor que 73.2.

a) H0: = 73.2b) H1: 73.2c) nivel de significancia = 0.025d) estadístico de prueba; primero se identifica a cuál de los tres casos corresponde,

siendo que se conoce ; por tanto,

zx

n0

e) para localizar la región de aceptación y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está basado en la distribución normal, por lo que la región de rechazo está dada por z z .

Con base en el inciso c), se tiene que = 0.025. Por tanto, de las tablas porcentuales de la distribución normal la región de rechazo resulta

z z0.025 = 1.96

f) se calcula el estadístico z, x 76 7. y = 8.6, donde

z76 7 73 2

8 6 452 73

. .

..

Como dicho valor se encuentra en la región de rechazo, la hipótesis nula se rechaza con nivel de significancia de 2.5%.

Ejercicio 7

1. Un fabricante de máquinas de refrescos asegura que sus máquinas suministran un promedio de 250 mm por vaso, pero debido a algunas quejas de los consumidoressobre una máquina en particular decide verificarla, para lo cual toma una muestra de 20 vasos, obteniendo 245 mm de media con desviación estándar de 11. Calcula con 0.10 de nivel de significación, si es cierta la afirmación del fabricante.

2. Comprueba la hipótesis de que el contenido promedio de los envases de un lubricante es de diez litros si los contenidos de una muestra aleatoria de diez envases son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 l. Utiliza 0.01 de nivel de significancia y supón que la distribución de los contenidos es normal.

3. Un investigador afirma que el promedio de accidentes en una fábrica es inferior a once. Al tomar una muestra al azar de tamaño 36, se obtiene que X 10 y S2 = 9. Calcula si se puede apoyar al investigador con base en los resultados de la muestra a nivel de 1%.

Page 27: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

309

4. Un investigador afirma que el promedio de accidentes en una fábrica es inferior a trece. Al tomar una muestra al azar de tamaño 36, se obtiene una media y una varianza de 10 y 9, respectivamente. Calcula si se puede apoyar al investigador con base en los resultados de la muestra a nivel de 1%.

10.2.3 Pruebas para la diferencia de medias de poblaciones aproximadamente normales con valor crítico

sn s n s

n np( ) ( )1 1

22 2

2

1 2

1 12

tx x d

s n np

( )

( ) ( )1 2 0

1 21 1

tx x d

s n s n

( )

( ) ( )

1 2 0

12

1 22

2

sn

sn

sn n

sn

12

1

22

2

2

12

1

2

1

22

2

11

2

2

11n

td d

s nd

0

Page 28: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

310

1. Para determinar el rendimiento de combustible en dos marcas de automóviles con características similares se experimentó con doce automóviles marca V y diez marca I en pruebas de velocidad fija de 90 kmph. Para los de la marca V se obtuvieron 16 kmpl con desviación estándar de 1.0 kmpl y para los de la marca I el promedio fue 11 kmpl, con desviación estándar de 1.8 kmpl. Se supone que la distancia por litro para cada modelo del automóvil se distribuye aproximadamente en forma normal con varianzas iguales. Se comprueba la hipótesis referente a que los automóviles marca V en promedio exceden a los de la marca I por 4 kmpl utilizando = 0.10 Las varianzas poblacionales son diferentes.

Se pide una prueba de hipótesis para la diferencia de medias, donde se tiene que comprobar que el rendimiento promedio por litro de los automóviles marca V excede el rendimiento de los de la marca I en 4 kmpl. De tal forma que la hipótesis alterna queda de dos colas. Se representa por 1 el promedio del rendimiento por litro de los automóviles marca V y por 2 a los de la marca I.

a) H0: 1 – 2 = 4b) H1: 1 – 2 4c) nivel de significancia = 0.10d) estadístico de prueba; primero se identifica a cuál de los cinco casos anteriores

corresponde, dado que no se conoce la varianza poblacional y las muestras son pequeñas, con varianzas poblacionales diferentes, se tiene

tx x d

s n s n

( )

( ) ( )

1 2 0

12

1 22

2

e) para localizar la región de aceptación y rechazo del inciso b), se determina que se trata de una prueba de dos colas, y del inciso d), que el estadístico de prueba está basado en la distribución t-Student, por lo que la región de rechazo está dada por

t –t / 2 y t –t / 2

Con base en el inciso c), se tiene que = 0.10, donde / 2 = 0.05. Los grados de libertad se calculan mediante

sn

sn

sn n

sn

12

1

22

2

2

12

1

2

1

22

2

11

2

2

2

21

1

112

3 2410

112

112 1

3

n

.

.22410

110 1

13 4946 132 .

Por tanto, usando las tablas porcentuales de la distribución t-Student con 13 grados de libertad resulta la región de rechazo

t –t0.05 = –1.796 y t t0.05 = 1.796

f) se calcula el estadístico t con los datos que se tienen

x s n x s n1 12

1 2 22 2

216 1 12 11 1 8 3 24 10, ; , ( . ) .y y

Page 29: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

311

tx x d

s n s n

( )

( ) ( )

( )

( ) ( . ).1 2 0

12

1 22

2

16 11 4

1 12 3 24 101 5668

Como dicho valor se encuentra en la región de aceptación, la hipótesis nula se acepta con nivel de significancia de 10%. Por tanto, el rendimiento por litro de los automóviles marca V sobrepasa en 4 kmpl a los de la marca I.

2. Se comparan dos tipos de rosca de tornillo para determinar su resistencia a la tensión. Se prueban doce piezas de cada tipo de cuerda bajo condiciones similares, obteniéndose los siguientes resultados (en kg)

Con 0.025 de nivel de significancia, se calcula que la resistencia promedio a la tensión de los tornillos tipo I es menor a la de los tipo II, Se supone que las varianzas poblacionales son iguales.

Se pide una prueba de hipótesis para la diferencia de medias, donde se tiene que comprobar que la resistencia promedio a la tensión de los tornillos tipo I es menor que la de los tipo II. De tal forma que la hipótesis alterna es de una cola. Se representa por 1 la resistencia promedio a la tensión de los tornillos tipo I y por 2 la resistencia promedio a la tensión de los tipo II.

a) H0: 1 – 2 = 0b) H1: 1 – 2 0c) nivel de significancia = 0.025d) estadístico de prueba; primero se identifica a cuál de los cinco casos anteriores

corresponde, dado que no conoce las varianza poblacional pero se sabe que son iguales y las muestras pequeñas; por tanto

tx x d

s n np

( )

( ) ( )1 2 0

1 21 1

e) para localizar la región de aceptación y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está basado en la distribución t-Student, por lo que la región de rechazo está dada por

t –t

Con base en el inciso c), se tiene que = 0.025. Los grados de libertad se calculan mediante v = n1 + n2 – 2 = 12 + 12 – 2 = 22. Por tanto, de las tablas porcentuales de la distribución t-Student con 22 grados de libertad, resulta la región de rechazo

t –t0.025 = –2.074

Tipo de rosca 1 2 3 4 5 6 7 8 9 10 11 12

1

2

78 76 80

80

80

80

80

80

82

82 8383 82

8281

81 81

79

79 78 79

8379 78

Page 30: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

312

f) se calcula el estadístico t con los datos de sus medias y varianzas

x s n x s n1 12

1 2 22

279 8333 3 9697 12 80 6667 2 6061 12. , . ; . , .y y

sn s n s

n np( ) ( ) ( ) . ( ) .1 1

22 2

2

1 2

1 12

12 1 3 9697 12 1 2 606112 112 2

1 8133.

Se sustituye en la fórmula del estadístico

tx x d

s n np

( )

( ) ( )

( . . )

. ( ) (1 2 0

1 21 1

79 8333 80 6667 0

1 8133 1 12 11 121 1257

).

Como dicho valor se encuentra en la región de aceptación, la hipótesis nula se acepta, con 2.5% de nivel de significancia, por tanto, la resistencia promedio a la tensión de los tornillos tipo I no es menor a la de los tipo II.

3. Se comparan dos tipos de rosca de anillo para determinar su resistencia a la tensión. Se prueban cien piezas de cadatipo de cuerdabajo condiciones similares, obteniéndose los siguientes resultados, la tipo I, presentó resistencia promedio de 88 kg, con desviación estándar de 5; la tipo II presentó resistencia promedio de 83 kg, con desviación estándar de 9. Se calcula con nivel de significancia de 0.05 si la rosca tipo I tiene mayor resistencia promedio a la tipo II en más de 3 kg.

Se pide una prueba de hipótesis para la diferencia de medias, donde se tiene que comprobar la resistencia a la tensión de la rosca de dos tipos de tornillos. De tal forma que la hipótesis alterna es de una cola. Se representa por 1 a la resistencia a la tensión de las cuerdas de los tornillos tipo I y por 2 a la de los tornillos tipo II;

a) H0: 1 – 2 = 3b) H1: 1 – 2 3c) nivel de significancia = 0.05.d) estadístico de prueba: primero se identifica a cuál de los cinco casos anteriores

corresponde, dado que no se conoce la varianza poblacional y las muestras son grandes, se tiene

zx x d

sn

sn

( )1 2 0

12

1

22

2

e) para localizar la región de aceptación y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está basado en la distribución normal, por lo que la región de rechazo está dada por

z z

Con base en el inciso c), se tiene que = 0.05. Por tanto, de las tablas porcentuales de la distribución normal resulta la región de rechazo

z z = z0.05 = 1.6449

Page 31: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

313

f) se calcula el estadístico z con los datos

x s n x s n1 12 2

1 2 22 2

288 5 25 100 83 9 81 100, ; ,y y

zx x d

sn

sn

( ) ( ).1 2 0

12

1

22

2

88 83 3

25100

81100

1 9426

Como dicho valor se encuentra en la región de rechazo, la hipótesis nula se rechaza con nivel de significancia de 5%, por tanto, la rosca de los tornillos tipo I tiene mayor resistencia promedio a la tipo II en más de 3 kg.

Ejercicio 8

1. Un grupo de personas requiere procesar trabajos de cálculo en un centro de cómputo para estimar la cantidad de tiempo requerida por la computadora para analizar el trabajo. Este tiempo se mide en una unidad central de procesamiento (UCP ). Se decide comparar el tiempo estimado contra el tiempo real en la UCP para un cliente y se obtienen los siguientes datos

Calcula si esta evidencia es suficiente para señalar que, en promedio, el cliente tiende a subestimar el tiempo en la UCP necesario para los trabajos; realiza la prueba con = 0.10 y varianzas poblacionales diferentes.

2. Cierto metal se obtiene mediante un proceso estándar. Se desarrolla un nuevo proceso en el que se añade una aleación a la producción del metal. Los fabricantes se encuentran interesados en estimar la diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos, el estándar y la aleación. Para cada metal se toman al azar ocho especificaciones, donde cada una se somete a tensión hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de los metales en kg/cm2.

Supón que el muestreo se lleva a cabo sobre dos distribuciones normales e independientes con varianzas iguales. Con base en los resultados, calcula si existe una diferencia real entre e y n, con nivel de significancia de 5% y varianzas poblacionales iguales.

3. Se realizó un experimento para comparar los tiempos medios necesarios para que dos empleados (A y B), completen el trámite de las cuentas corrientes personales para nuevos clientes. Se toman al azar diez clientes para cada empleado y se registran los tiempos de servicio obteniéndose los siguientes resultados

428 419

462

441

429 453

456

448 435 459

463

465

429

472

458 439

Page 32: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

314

Determina si existe evidencia suficiente para indicar una diferencia signifi-

cativa en los tiempos medios requeridos para completar los trámites necesarios mencionados. Los parámetros de las varianzas son diferentes; usa = 0.10.

4. Los siguientes datos fueron recabados en un experimento que se diseñó para verificar si existe una diferencia sistemática en los pesos obtenidos con dos escalas diferentes

Suponiendo normalidad, ¿se puede concluir que la escala 1 da menor peso promedio que la 2? Considérese = 5% y que las varianzas son diferentes.

10.2.4 Pruebas para las varianzas poblaciones normales de muestras pequeñas con valor crítico

1. Se determina que una máquina de refrescos está fuera de control si la varianza de los contenidos excede 1.15 dl. Se toma una muestra aleatoria de 25 refrescos con varianza de 2.03 dl. Se calcula con 0.05 de nivel de significancia si la máquina está fuera de control y se supone que los contenidos tienen una distribución normal.

En este ejercicio la prueba de hipótesis se refiere a una varianza, se comprueba si ésta es mayor que 1.15 dl.

a) H0: 2 = 1.15

b) H1: 2 1.15

c) nivel de significancia = 0.05

Xi = 222 Yi = 285

A B

Xi = 5075.642 2Yi = 8292.78

Ejemplo 19

Page 33: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

315

d) estadístico de prueba; aquí sólo se tiene un caso para la varianza; por tanto

22

021( )n s

e) para localizar la región de aceptación y rechazo del inciso b), se determina que se

trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está basado en la distribución ji por lo que la región de rechazo está dada por

2 2

área derecha. Con base en el inciso c), se tiene = 0.05. Por tanto, de las tablas porcentuales de la distribución ji2 con v = n – 1 = 25 – 1 = 24 grados de libertad, resulta la región de rechazo

2 20 052 36 415. .

Para calcular el estadístico 2, se tiene, de los datos del enunciado, s2 = 2.03

y n = 25.2

2

021 25 1 2 03

1 1542 365

( ) ( ) ..

.n s

Como dicho valor se encuentra en la región de rechazo, la hipótesis nula se rechaza con un nivel de significancia de 0.05, por tanto, la máquina está fuera decontrol.

2. Se comparan dos tipos de rosca de tornillo para determinar su resistencia a la tensión. Se prueban doce piezas de cada tipo de cuerda bajo condiciones similares, obteniéndose los siguientes resultados (en kg)

Con 0.10 de nivel de significancia, se comprueba si es justificable la suposición de que 1

222.

Como no se tiene ningún caso para diferencia de varianzas se puede dividir entre la varianza 2 y obtener una razón entre varianzas, de tal forma que

a) H012

22

1:

b) H112

22

1:

c) nivel de significancia = 0.10

Tipo de rosca 1 2 3 4 5 6 7 8 9 10 11 12

1

2

78 76 80

80

80

80

80

80

82

82 8383 82

8281

81 81

79

79 78 79

8379 78

Page 34: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

316

d) estadístico de prueba; aquí sólo se tiene un caso para la razón entre varianzas; por tanto

fs

s

12

22

e) para localizar la región de aceptación y rechazo del inciso b), se determina que se

trata de una prueba de dos colas, y del inciso d), que el estadístico de prueba está basado en la distribución F por lo que la región de rechazo está dada por

ff

f f1

2 2 12 1 2( , )( , )

y

Con base en el inciso c), se tiene = 0.10, donde / 2 = 0.05. Por tanto, de las tablas porcentuales de la distribución F con v1 = v2 = 11 grados de libertad, resulta la región de rechazo

ff

f f1

11 11

1

2 8180 355 11 11 2 818

0 050 05

..( , ) .

. ( , ) .

y

Para calcular el estadístico f se determinan las varianzas insesgadas de los datos muestrales

fs

s12

22

3 97

2 611 52

.

..

Como dicho valor se encuentra en la región de aceptación, la hipótesis nula se acepta con nivel de significancia de 0.10 y se justifica la suposición de que

12

22.

Ejercicio 9

1. Se conoce que la varianza de los puntajes de lectura para los estudiantes de sexto año de primaria es 1.44. Se toman al azar 21 estudiantes de sexto año a los que se les proporciona un curso especial de lectura, después del cual la varianza de los puntajes de lectura es 1.05. Calcula si ésta es suficiente con nivel de significación de 0.05 para determinar si el curso especial la reduce.

2. Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de piezas al azar cuyos diámetros son 9.8, 9.8, 9.8, 11.5, 9.0, 10.4, 10.0, 10.0, 11.0 y 12.0 mm. Supón que los diámetros tienen una distribución aproximadamente normal. Si el fabricante de las máquinas indica que su máquina está desajustada cuando la varianza de los diámetros de las piezas metálicas producidas excede 0.5 mm, calcula con nivel de significancia de 0.01 si la máquina está desajustada.

3. Se sabe que el contenido de nicotina de una cierta marca de cigarrillos está normalmente distribuida con una varianza de 1.3 mg. Comprueba la hipótesis

2 = 1.3 en contra de la alternativa 2 1.3 , si una muestra aleatoria de ocho cigarrillos tiene desviación estándar de 1.8. Utiliza 0.05 de nivel de significancia.

Page 35: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

317

10.2.5 Pruebas para muestras grandes

1. Una firma manufacturera de cigarros distribuye dos marcas. Si se determina que 56 de 200 fumadores prefieren la marca A y que 29 de 150 fumadores prefieren la marca B, se calcula con nivel de significancia de 0.06 si la marca A aventaja en ventas a la B.

Esto se puede comprobar mediante una diferencia de proporciones.

a) H p pA B0 0:b) H p pA B1 0:c) nivel de significancia = 0.06d) estadístico de prueba; aquí sólo se tiene un caso para la diferencia de proporciones;

por tanto

e) para localizar la región de aceptación y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está basado en la distribución Z, por lo que la región de rechazo está dada por

z z

Con base en el inciso c), se tiene = 0.06. Por tanto, de las tablas porcentuales de la distribución Z, resulta la región de rechazo

z z0.06 = 1.5548

Ejemplo 20

Page 36: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

318

Para calcular el estadístico z las variables son XA y XB, que representan a los fumadores en favor de las marcas A y B, respectivamente, de tal manera que las proporciones correspondientes están dadas por

ˆ . ˆ .px

np

x

nAA

AB

B

B

56

2000 28

29

1500 193y

mientras que

ˆ . ˆ ˆ . .px x

n nq pA B

A B

56 29

200 1500 243 1 1 0 243 0 757y

Por tanto,

Como dicho valor se encuentra en la región de rechazo, la hipótesis nula se rechaza con un nivel de significancia de 0.06; por tanto, la suposición de que la marca A aventaja en ventas a la marca B se justifica.

2. Un canal televisivo asegura que la audiencia que mira cierto programa el sábado por la noche es 40%. Se tomo al azar una muestra de cien televidentes, a quienes se entrevistó, dando como resultado que 45 de ellos veían el programa. Con 2.5% de nivel de significancia se comprueba si la afirmación es válida.

La prueba se trata de proporciones, donde se define una variable

X = “cantidad de personas que miran dicho programa los sábados por la noche”.

a) H0: p = 0.40 b) H1: p 0.40 c) nivel de significancia = 0.025 d) estadístico de prueba; aquí sólo se tiene un caso para las proporciones; por tanto,

zx np

np q0

0 0

e) para localizar la región de aceptación y rechazo del inciso b), se determina que se trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está basado en la distribución Z, por lo que la región de rechazo está dada por

z z

Con base en el inciso c), se tiene = 0.025. Por tanto, de las tablas porcentuales de la distribución z, resulta la región de rechazo

z z0.025 = 1.96

f) se calcula el estadístico z con los datos que se tienen, la variable X representa a los televidentes que ven dicho programa los sábados por la noche: se entrevista a n = 100 televidentes de los cuales x = 45 ven el programa; por tanto

Page 37: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

319

zx np

np q0

0 0

45 100 0 40

100 0 40 0 601 02

.

. ..

Como dicho valor se encuentra en la región de aceptación, la hipótesis nula se acepta con nivel de significancia de 0.025, por tanto, se puede asegurar que la proporción de televidentes que ven el programa del sábado por la noche es menor que 40%.

Ejercicio 10

1. En un estudio para estimar la proporción de amas de casa que tienen una secadora automática, se determina que 63 de cada 100 residentes urbanos y 59 de cada 125 residentes suburbanos la tienen. Calcula si la proporción de amas de casa urbanas que tienen secadora exceden en más de 7% a la proporción de amas de casa suburbanas que también tienen. Considera = 4%.

2. La industria cervecera está interesada en comparar dos marcas de cerveza (A y B), puesto que se presume que la marca B es preferida sobre la marca A. De 200 personas entrevistadas, 116 prefieren la marca B; y de 150 personas, 78 prefieren la marca A. Determina la veracidad de la hipótesis de la industria. Considera = 10%.

3. Se realizó un estudio para determinar si más italianos que estadounidenses prefieren el vino espumoso blanco que el vino espumoso rosado en las bodas. De una muestra aleatoria de 300 italianos, 72 prefirieron el blanco; y de 400 estadounidenses, 70también prefirieron el blanco. Calcula si más italianos que estadounidenses prefieren el vino espumoso blanco en las bodas. Utiliza 5% de nivel de significancia.

4. Un fabricante de cierto producto afirma que más de 40% de los consumidores prefiere su producto. Se entrevista a 60 personas al azar para verificar su afirmación. Si 28 personas de las entrevistadas prefiere dicho producto, entonces se considera válida la afirmación del fabricante, en caso contrario, se rechaza. Con un nivel designificancia de 5% prueba la afirmación del fabricante.

Autoevaluación

1. Dadas X1, X2, X3, y X4 variables de una muestra aleatoria tomada de una población distribuida en forma normal, de los siguientes estimadores indica cuál es un estimador insesgado de la media .

a) ˆ1

1 2 3 42 3 4

4

X X X X

b) ˆ2

1 2 3 42

4

X X X X

c) ˆ3 1 2 3 4X X X X

d) ˆ4

1 2 3 42 3 4

10

X X X X

2. De una máquina que produce piezas metálicas de forma cilíndrica, se toma una muestra al azar cuyos diámetros son 9.8, 10.5, 10.1, 9.9, 10.4, 10.6, 10.2, 10.8, 10.0,

Page 38: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

320

10.7 y 9.8 mm. Supón que los diámetros tienen una distribución aproximadamente normal, considera 95% de intervalo de confianza para el diámetro promedio de todas las piezas de esta máquina.

a) (9.29, 11.29) b) (8.46, 10.36) c) (8.95, 11.06) d) (10.05, 10.55)

3. Supón que la vidapromedio de los focos tiene 30 h de desviación estándar de vida, considerando una muestra de 50 focos y las hipótesis H0: = 750, H1: 750, con la región de rechazo establecida para medias mayores a 760, calcula el nivel designificancia.

a) 0.0091 b) 0.9919 c) 0.0182 d) 0.9818

4. El espesor de las paredes de 20 botellas de vidrio de dos litros fue medido por un ingeniero de control de calidad. La media muestral fue 3.98 mm y la desviación estándar muestral 0.09 mm. Considera 90% de intervalo de confianza respecto de la varianza del espesor de las paredes de las botellas.

a) (0.08, 0.010) b) (0.0051, 0.0152) c) (0.008, 0.010) d) (0.0152, 0.1520)

5. Se aplicó un examen de ecuaciones diferenciales a un grupo de alumnos (grupo A), obteniéndose las calificaciones 4.5, 3.5, 8.5, 9.5, 9.0, 6.0, 5.5, 7.5, 10, 4.0 y 8.0. A otro grupo de álgebra lineal se le aplicó otro examen obteniéndose las calificaciones 5.0, 6.0, 3.5, 8.0, 5.0, 7.0, 9.5, 8.0, 9.0, 10, 7.0, 4.5 y 6.5. Considera 95% de intervalo de confianza para la diferencia de medias, ¿existirá diferencia entre las medias de las calificaciones de los grupos?

a) (0.245, 3.562) b) (–2.476, 3.638) c) (–1.7673, 1.89325) d) (1.477, 4.604)

6. Un economista tomó al azar una muestra de 400 personas de clase obrera, de la cual 25 resultaron desempleadas. Calcula la proporción real de trabajadores desem-pleados considerando 97% de intervalo de confianza.

a) (0.018, 0.045) b) (0.360, 0.890) c) (0.036, 0.089) d) (0.046, 0.094)

Page 39: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

321

7. Un investigador afirma que el promedio de accidentes en una fábrica es inferior a trece. Al tomar una muestra al azar de 36, se obtuvo media y varianza de 10 y 9, respectivamente. Comprueba la hipótesis del investigador con 1% de nivel de significancia.

a) se acepta la afirmación con z = –2.3263 b) se rechaza la afirmación con z = –6 c) se rechaza la afirmación con z = 2.3263 d) se acepta la afirmación con z = –4.569

8. Considera un medidor de volumen en la bomba de una estación de gasolina en la cual se realizan cinco mediciones, 10.5, 10.0, 9.90, 9.95 y 10.15. Supón normalidad,calcula un intervalo de confianza para la varianza con = 0.05.

a) (6.799, 13.401) b) (9.799, 10.401) c) (8.799,12.401) d) (8.946, 10.984)

Respuestas de los ejercicios

Ejercicio 1

1. insesgados T2, T3, más eficiente T2

2. se comprueba que E( ˆ )

3. a) se comprueba que E X Y( ) 1 2

b) V X Yn n

( ) 12

1

22

2

Ejercicio 2

1. a) (15.03, 17.64) b) (13.84, 18.82)

2. (3.98, 4.06)

3. (25.07, 27.73)

4. (9.80, 10.40)

5. a) (9.40, 11.26) b) (9.52, 11.14)

Page 40: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

322

Ejercicio 3

1. (–1.50, 12.70)

2. (–0.55, 3.28)

3. (–9.35, 17.51)

4. (–4.96, 1.60)

5. a) (–0.96, 8.08) b) (–0.51, 7.62)

Ejercicio 4

1. (132.24, 1016.46)

2. (0.17, 7.16)

3. (0.0049, 0.0157)

4. (0.021, 0.485)

Ejercicio 5

1. (0.036, 0.089)

2. (0.036, 0.184)

3. (–0.177, 0.057)

Ejercicio 6

1. a) 0.0384 b) 0.2776

2. 0.1587

3. a) 0.085 b) 0.341

Ejercicio 7

1. t = –2.033; no es cierta la afirmación del fabricante

2. t = 2.44; se acepta que el contenido promedio es 10.l

Page 41: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

323

3. z = –4; el promedio de accidentes es menor que doce

4. z = –2, el promedio de accidentes es mayor o igual que once

Ejercicio 8

1. t = –0.408; el promedio real es mayor o igual al estimado

2. t = –1.456; los dos procesos son iguales

3. t = –0.18; los tiempos medios son iguales

4. t = 1.039; la escala 1 da un peso promedio mayor o igual que la 2

Ejercicio 9

1. 2 10 1273. ; los cursos disminuyen la varianza de los puntajes en la lectura

2. 2 29 76. ; sí, la máquina está desajustada

3. 2 7 45. ; la varianza es igual a 1.3

Ejercicio 10

1. z = 1.316; la proporción de amas de casa urbanas que poseen secadora no es mayor que la de las residentes suburbanas

2. z = 1.1176; la marca B no es preferida sobre la marca A

3. z = 5.2927; los italianos prefieren el vino espumoso blanco

4. z = 1.05; la afirmación no es válida

Respuestas de la autoevaluación

1. d)

2. d)

3. a)

4. b)

5. c); dado que el 0 está en el intervalo, no hay diferencia entre los grupos

6. c)

7. b)

8. b)

Page 42: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan
Page 43: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

Apéndice A

Uso de tablas alternativas para la distribución normal

La unidad 8 abordó la distribución normal y en la sección 8.3.3 se estudió el uso de las tablas normales que se encuentran en el apéndice B. En su momento, se mencionó que la distribución normal juega un papel muy importante en el estudio de la probabilidad y la inferencia estadística; por consiguiente, en diferentes textos, la presentación delas tablas normales es variable, obviamente el valor de la probabilidad que se calcula no cambiará. A causa de dichas variantes en su presentación se decidió dar al alumno una explicación sobre el uso de otros dos tipos de tablas, las cuales están al final de la presente explicación.

A.1 Uso de tablas de la distribución normal estándar, cola derecha

Las tablas de cola derecha tienen el siguiente aspecto:

En las tablas, los valores de Z varían de centésima en centésima desde 0 hasta 3.99. En la fila se ponen las décimas y en las columnas las centésimas.

Por tanto, el cálculo de probabilidades con base en esta función y las propiedades de simetría y el complemento estudiadas en la subsección 8.3.2, se podrá efectuar de la siguiente forma, para los diferentes casos que puedan ocurrir, y que ya se vieron en la sección 8.3.3:

Page 44: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

326

1. P Z ZF Z Z

F Z Z

d

d

( )( )

( ),0

0 0

0 0

0

1 0

, en caso de que

en caso de que

2. P Z ZF Z Z

F Z Z

d

d

( )( ),

( ),0

0 0

0 0

1 0

0

en caso de que

en caso de que

3. P Z Z Z F Zd( ) ( )0 0 01 2

4. P a Z b

F a F b a b

F b F a

d d

d d( )

( ) ( ), , ,

( ) ( ),

en caso de que

en caso

0

dde que

en caso de que y

a b

F b F a a bd d

, ,

( ) ( ),

0

1 0 0

En los siguientes ejemplos se empleará la función Fd(z).

Dada Z una variable aleatoria continua con distribución normal estándar, se calculan las probabilidades indicadas en el ejemplo 4 de la sección 8.3.3:

1. P Z Fd( . ) ( . ) . .1 25 1 1 25 1 0 1056 0 89442. P Z F Fd d( . ) ( ( . )) ( . ) .0 86 0 86 0 86 0 19493. P Z Fd( . . ) ( . ) . . .2 97 2 97 1 2 2 97 1 2 0 0015 1 0 0030 0 99704. P Z F Fd d( . . ) ( . ) ( ( . )) . . .0 67 1 24 1 1 24 0 67 1 0 1075 0 2514 0 664115. P Z F Fd d( . . ) ( . ) ( . ) . . .0 06 3 04 0 06 3 04 0 4761 0 0012 0 47496. P Z F Fd d( . . ) ( ( . )) ( ( . )) . .1 34 0 56 0 56 1 34 0 2877 0 0901 0..1976

Ejemplo

Page 45: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

327

Page 46: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

328

A.2 Uso de tablas de la distribución normal estándar, parte central

Las tablas de la parte central tienen el siguiente aspecto:

En las tablas, los valores de Z varían de centésima en centésima desde 0 hasta 3.99. En la fila se ponen las décimas y en las columnas las centésimas.

Por tanto, el cálculo de probabilidades con base en esta función y las propiedades de simetría y el complemento estudiadas en la subsección 8.3.2, se podrá efectuar de la siguiente forma, para los diferentes casos que puedan ocurrir, y que ya se vieron en la sección 8.3.3:

1. P Z ZF Z Z

F Z Z

c

c

( ). ( )

. ( ),0

0 0

0

0 5 0

0 5

, en caso de que

en caso de que 00 0

2. P Z ZF Z Z

F Z Z

c

c

( ). ( ),

( ),0

0 0

0 0

0 5 0

05

en caso de que

en caso de que 0

3. P Z Z Z F Zc( ) ( )0 0 02

4. P a Z b

F b F a a b

F a F b

c c

c c( )

( ) ( ), , ,

( ) ( ),

en caso de que

en caso

0

dde que

en caso de que y

a b

F b F a a bc c

, ,

( ) ( ),

0

0 0

En los siguientes ejemplos se empleará la función Fc(z).

Page 47: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

329

Dada Z una variable aleatoria continua con distribución normal estándar, se calculan las probabilidades indicadas en el ejemplo 4 de la sección 8.3.3:

1. P Z Fc( . ) ( . ) . . .1 25 05 1 25 0 5 0 3944 0 89442. P Z F Fc c( . ) . ( ( . )) . ( . ) . . .0 86 0 5 0 86 0 5 0 86 0 5 0 3051 0 19493. P Z Fc( . . ) ( . ) . .2 97 2 97 2 2 97 2 0 4985 0 99704. P Z F Fc c( . . ) ( . ) ( ( . )) . . .0 67 1 24 1 24 0 67 0 3925 0 2486 0 64115. P Z F Fc c( . . ) ( . ) ( . ) . . .0 06 3 04 3 04 0 06 0 4988 0 0239 0 47496. P Z F Fd d( . . ) ( ( . )) ( ( . )) . .1 34 0 56 1 34 0 56 0 4099 0 2123 0..1976

Ejemplo

Page 48: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan
Page 49: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

Apéndice B

Page 50: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

332

Función acumulada de la distribución normal estándar

Page 51: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

333

Page 52: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

334

Tabla porcentual de la distribución normal estándar

Page 53: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

335

Tabla t-Student

Page 54: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

336

Tabla de porcentajes de la función inversa acumulada, distribución -cuadrada, área de cola derecha

Page 55: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

337

Tabla de porcentajes de la función inversa acumulada, distribución F, área de cola derecha

Page 56: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

338

Tabla de porcentajes de la función inversa acumulada, distribución F, área de cola derecha

Page 57: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

339

Tabla de porcentajes de la función inversa acumulada, distribución F, área de cola derecha

Page 58: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

340

Tabla de porcentajes de la función inversa acumulada, distribución F, área de cola derecha

Page 59: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

341

Tabla de porcentajes de la función inversa acumulada, distribución F, área de cola derecha

Page 60: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

342

Tabla de porcentajes de la función inversa acumulada, distribución F, área de cola derecha

Page 61: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

343

Tabla de porcentajes de la función inversa acumulada, distribución F, área de cola derecha

Page 62: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

344

Tabla de porcentajes de la función inversa acumulada, distribución F, área de cola derecha

Page 63: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

345

Tabla de porcentajes de la función inversa acumulada, distribución F, área de cola derecha

Page 64: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

346

Tabla de porcentajes de la función inversa acumulada, distribución F, área de cola derecha

Page 65: Inferencia estadística y Prob_… · Inferencia estadística UNIDAD 10. Introducción En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se realizan

Bibliografía

Bibliografía básica

Mendenhall, William, Richard L. Scheaffer y Dennis D. Wackerly, Estadística matemática con aplicaciones, Grupo Editorial Iberoamérica, 1994.

Por medio de esta obra se pueden ampliar los conocimientos sobre las multivariables y distribuciones muestrales (unidad 9), así como los modelos continuos y discretos (unidades 5 a 8).

Meyer, Paul L., Probabilidad y aplicaciones estadísticas, Addison-Wesley Iberoamericana (edición revisada), 1992.

Este texto es propicio para los estudiantes que quieran resolver problemas referentes a los temas de las unidades 2-10 con mayor grado de dificultad.

Montgomery, Douglas C. y George C. Runger, Probabilidad y estadística aplicadas a la ingeniería, McGraw-Hill, México, 1996.

Este texto es propicio para ampliar los conocimientos sobre estadística descriptiva e inferencial (unidades 1 y 10 del presente libro, respectivamente) y los modelos continuos y discretos (unidades 5 a 8).

Walpole, Ronald E., y Raymond H. Myers, Probabilidad y estadística, Pearson Educación, 1998.

Este texto es propicio para ampliar los conocimientos sobre estadística inferencial (unidad 10) y modelos continuos y discretos (unidades 5 a 8).

Bibliografía complementaria

Devore, Jay L., Estadística matemática con aplicaciones, Thomson Editores, 1998.

Gutiérrez González, Eduardo y Olga Vladimirovna Panteleeva, Fundamentos de la teoría de las probabilidades para ingeniería y ciencias, Libudi, México, 2000.

________________ , Tablas y formulas estadísticas, Libudi, México, 2000.

Mendenhall, William, y Terry Sincich, Probabilidad y estadística para ingeniería y ciencias, Prentice-Hall, 1997.