004 mendenhall

60
, CAPITULO CUATRO ........ .... ........ •• .... ..... •• .... •...••...•• .... ••...• .... ....... Variables aleatorias discretas Objetivo Explicar qué significa el término variable aleatoria discreta; conocer la distribución de probabilidad y las correspondientes medidas descriptivas numéricas de las variables aleatorias discretas; presentar algunas distribuciones de probabilidad discreta útiles y mostrar cómo pueden utilizarse estas distribuciones para resolver problemas prácticos Contenido 4.1 Variables aleatorias discretas 4.2 La distribución de probabilidad para una variable aleatoria discreta 4.3 El valor esperado de una variable aleatoria y o una función g(y) de y 4.4 Algunos teoremas útiles de la esperanza 4.5 Pruebas de Bernoulli 4.6 La distribución de probabilidad binomial 4.7 La distribución de probabilidad multinomial 4.8 Las distribuciones de probabilidad binomial negativa y geométrica 4.9 La distribución de probabilidad hiper- geométrica 4.10 La distribución de probabilidad de Poisson 4.11 Momentos y funciones que generan momentos (opcional) 4.12 Resumen ••••••••••••••••••••••••••••••• 143

Upload: tukytutuky

Post on 31-Dec-2014

635 views

Category:

Documents


9 download

TRANSCRIPT

Page 1: 004 Mendenhall

,CAPITULO CUATRO........•....•........••....•.....••....•...••...••....••...•....•.......

Variables aleatorias discretas

Objetivo

Explicar qué significa el término variablealeatoria discreta; conocer la distribución deprobabilidad y las correspondientes medidasdescriptivas numéricas de las variables aleatoriasdiscretas; presentar algunas distribuciones deprobabilidad discreta útiles y mostrar cómopueden utilizarse estas distribuciones pararesolver problemas prácticos

Contenido

4.1 Variables aleatorias discretas4.2 La distribución de probabilidad para una

variable aleatoria discreta4.3 El valor esperado de una variable aleatoria y

o una función g(y) de y4.4 Algunos teoremas útiles de la esperanza4.5 Pruebas de Bernoulli4.6 La distribución de probabilidad binomial4.7 La distribución de probabilidad multinomial4.8 Las distribuciones de probabilidad binomial

negativa y geométrica4.9 La distribución de probabilidad hiper­

geométrica4.10 La distribución de probabilidad de Poisson4.11 Momentos y funciones que generan

momentos (opcional)4.12 Resumen

•••••••••••••••••••••••••••••••

143

Page 2: 004 Mendenhall

4.1 Variables aleatorias discretas...................................................................Como señalamos en el capítulo 1, los eventos experimentales de mayor interéscon frecuencia son numéricos, es decir, realizamos un experimento y observa­mos el valor numérico de alguna variable. Si repetimos el experimento n veces,obtenemos una muestra de datos cuantitativos. Como ilustración, supongamosque un producto fabricado (por ejemplo, un componente mecánico) se vendeen lotes de 20 cajas, cada una de las cuales contiene 12 artículos. A fin deverificar la calidad del producto, un ingeniero de control de proceso seleccionaal azar cuatro de entre los 240 artículos de un lote y determina si los artículosestán defectuosos o no. Si más de uno de los artículos muestreados resultadefectuoso, se rechazará todo el lote.

La selección de cuatro artículos fabricados de entre 240 produce un espacio

de muestra S que contiene [2:0Jeventos simples, cada uno. de los cuales co-

rresponde a una posible combinación de cuatro artículos que podrían seleccio­narse del lote. Aunque una descripción de un evento simple específico identi­ficaría los cuatro artículos adquiridos en una muestra en particular, el eventode interés para el ingeniero de control de procesos es una observación de lavariable y, el número de artículos defectuosos entre los cuatro que se prueban.A cada evento simple en S corresponde uno y sólo un valor de la variable y.Por tanto, existe una relación funcional entre los eventos simples de S y losvalores que y puede asumir. El evento y = Oes la colección de todos los eventossimples que no contienen artículos defectuosos. De forma similar, el eventoy = 1 es la colección de todos los eventos simples en los que se observa unartículo defectuoso. Puesto que el valor que y puede asumir es un evento nu­mérico (es decir, un evento definido por un número que varía de forma alea­toria de una repetición del experimento a otra), se dice que y es una variablealeatoria.

El número y de artículos defectuosos en una selección de cuatro artículosde entre 240 es un ejemplo de variable aleatoria discreta, que puede asumiruna cantidad de valores que se puede contar. En nuestro ejemplo, la variablealeatoria y puede asumir cualquiera de los cinco valores y = O, 1, 2, 3 o 4.Como ejemplo adicional, el número y de trabajos recibidos por un centro decómputo en un día también es una variable aleatoria discreta que, en teoría,podría asumir un valor de tal magnitud que rebase cualquier límite. Los posi­bles valores de esta variable aleatoria discreta corresponden a los enteros nonegativos, y = O, 1, 2, 3, ... , 00, y el número de tales valores se puede contar.

Las variables aleatorias que se observan en la naturaleza a menudo poseencaracterísticas similares y por ende se pueden clasificar según su tipo. En estecapítulo estudiaremos siete tipos distintos de variables aleatorias discretas y

Page 3: 004 Mendenhall

aplicaremos los métodos del capítulo 3 para deducir las probabilidades asocia­das a sus posibles valores. También comenzaremos a desarrollar ciertas ideasintuitivas acerca de la forma de aprovechar las probabilidades de los datos demuestra observados para hacer inferencias estadísticas.

4.2 la distribución de probabilidad para una variable aleatoria discreta••••••••••••••••••••••••••••••••• 11 •••••••••••••••••••••••••••••••••

Puesto que los valores que puede asumir una variable aleatoria y son eventosnuméricos, querremos calcular sus probabilidades. Una tabla, fórmula o gráficaque proporcione tales probabilidades será una distribución de probabilidadpara la variable aleatoria y. Ilustraremos el concepto con un sencillo ejemplode lanzamiento de una moneda.

,.'11 ••• 1•• 1••••••••••••••••••••••••••••••••• " ••• " •• ,.1, •••••

EJEMPLO 4.1

Solución

Se lanza dos veces una moneda balanceada y se observa el número y de caras.Calcule la distribución de probabilidad para y.

Denotemos con C¡ y X¡ la observación de una cara y una cruz, respectivamente,en el i-ésimo lanzamiento, para i = 1, 2. Los cuatro eventos simples y loscorrespondientes valores de y se muestran en la tabla 4.1.

Evento simple Descripción P(E¡) Número de carasy

El C¡Cz1 24

Ez C¡Xz1 14

E3 X¡Cz 1 14

E4X¡Xz 1 O4

El evento y = O es la colección de todos los eventos simples que producenun valor de y = O, a saber, el evento simple único E4• Por tanto, la probabilidadde que y asuma el valor O es

1P(y = O) = p(O) = P(E4 ) = "4

El evento y = 1 contiene dos eventos simples, Ez Y E3. Por tanto,

1 1 1P(y = 1) = P(l) = P(Ez) + P(E 3 ) = "4 + "4 = "2

Page 4: 004 Mendenhall

Por último,

1P(y = 2) = p(2) = P(E¡) = 4

La distribución de probabilidad p(y) se muestra en forma tabular en la tabla4.2 y como gráfica en la figura 4.1. Observe que en la figura las probabilidadesasociadas a y se ilustran con líneas verticales; la altura de la línea es proporcionalal valor de p(y). En la sección 4.6 demostraremos que esta distribución de pro­babilidad también puede calcularse con la fórmula

p(y) = G)4

donde

(~) 1p(O) = 4 = 4

~I) Jp ~ ~ ~ 4

P(2) = (D = l4 4

Podemos usar cualquiera de estas técnicas -tabla, gráfica o fórmula- paradescribir la distribución de probabilidad de una variable aleatoria discreta y.

..........................

y

o1

2

LP(y)=y

p(y)

141Z14

Page 5: 004 Mendenhall

FIGURA 4.1 ~Distribución de probabilidad paray,el número de caras en doslanzamientos de una moneda

p(y)

12

L-_----JL-__L..-__L..-__ y

o 2

La distribución de probabilidad p(y) para una variable aleatoria discre­ta debe satisfacer dos propiedades. Primero, dado que p(y) es una probabilidad,debe asumir un valor en el intervalo O~ p(y) ~ l. Segundo, la suma de los valoresde p(y) para todos los valores de y debe ser igual a l. Esto es así porque asig­namos uno y sólo un valor de y a cada uno de los eventos simples de S. Deesto se desprende que los valores que y puede asumir representan diferentesconjuntos de eventos simples y son, por tanto, eventos mutuamente exclusivos.Entonces, la sumatoria de p(y) para todos los posibles valores de y equivale ala sumatoria de las probabilidades de todos los eventos simples de S, y por lasección 3.2 sabemos que P(S) es igual a l.

Para concluir esta sección, analizaremos la relación entre la distribuciónde probabilidad de una variable aleatoria discreta y la distribución de frecuenciarelativa de los datos (que vimos en la sección 2.2). Suponga que lanza dos mo­nedas una y otra vez un número muy grande de veces y registra el número yde caras observadas en cada lanzamiento. Un histograma de frecuencia relativa parala colección de valores O, 1 y 2 tendría barras con alturas aproximadas de ¡,t y ¡, respectivamente. De hecho,' si fuera posible repetir el experimento unnúmero infinitamente grande de veces, la distribución se vería como la de lafigura 4.2 (página 148). Por tanto, el histograma de probabilidad de la figura4.2 constituye un modelo para una población conceptual de valores de y: los valoresde y que se observarían si el experimento se repitiera un número infinito de veces..

Page 6: 004 Mendenhall

148 Capítulo 4/ Variables aleatorias discretas

FIGURA 4.2 ~Histograma de frecuencia relativateórica para y,el número de carasen dos lanzamientos de una moneda

.~ .50'"~eeg....25::l

~'"-

o 2y

A partir de la seccion 4.5, introduciremos varios modelos para variablesaleatorias discretas que ocurren en las ciencias físicas, biológicas, sociales y dela información.

EJERCICIOS...................................................................j 4.1 El director de mercadeo de una fábrica pequeña de computadoras personales (PC) cree que la

distribución de probabilidad discreta que se muestra en la siguiente figura caracteriza a y, el númerode PC nuevas que la empresa arrendará el siguiente año.

p(y)

y13121110987

f-

.

II 1//

.15

.10

.20

a. ¿Es ésta una distribución de probabilidad válida? Explique.b. Muestre la distribución de probabilidad en forma tabular.c. ¿Qué probabilidad hay de que se arrendarán exactamente 9 PC?d. ¿Qué probabilidad hay de que se arrendarán menos de 12 PC?

4.2 Considere el segmento de circuito eléctrico con tres relevadores que se muestra en seguida. Lacorriente fluye de A a B si hay por 10 menos un camino cerrado cuando se cierra el interruptor.Cada uno de los tres relevadores tiene la misma probabilidad de permanecer abierto o cerradocuando se cierra el interruptor. Representemos con y el número de relevadores que se cierran cuandose cierra el interruptor.

Page 7: 004 Mendenhall

a. Calcule la distribución de probabilidad para y y muéstrela en forma tabular.b. ¿Qué probabilidad hay de que fluya corriente de A a B?

4.3 Refiérase al estudio publicado en el [ournal ofApplied Ecology (1993) de los rascones terrestres cantoresen peligro de extinción (ejercicio 2.2). Un censo reveló que 12 rascones habitan en las tierras bajas deEscocia. Suponga que se capturan dos de estos rascones escoceses con objeto de aparearlos. Sea y elnúmero de estos rascones capturados capaces de aparearse. Si exactamente cuatro de los 12 rasconesoriginales que habitan en Escocia son estériles y por tanto incapaces de aparearse, calcule la distribuciónde probabilidad para y.

4.4 Refiérase al estudio publicado en Metal Progress (mayo de 1986) de la utilización de lámina deacero en la Mazda Motor Corporation que presentamos en el ejercicio 3.10. Reproducimos aquí latabla que indica los ocho tipos de acero y los porcentajes utilizados en producción. Suponga quese escogen al azar tres láminas de acero (sin reemplazo) de entre las que se utilizan en la producciónde automóviles Mazda 626. Calcule y grafique la distribución de probabilidad de y, el número deláminas rodadas en frío en la muestra.

Tipo de lámina deacero Porcentaje utilizado

Rolada en frío, resistencia normal, no chapeada 27Rolada en frío, alta resistencia, no chapeada 12Rolada en frío, resistencia normal, chapeada 30Rolada en frío, alta resistencia, chapeada 15Rolada en caliente, resistencia normal, no chapeada 8Rolada en caliente, alta resistencia, no chapeada 5Rolada en caliente, resistencia normal, chapeada 3Rolada en caliente, alta resistencia, chapeada O

TOTAL 100

Fuente: Chandler, H. E., "MaterialsTrends at Mazda Motor Corporation", Metal Progress, vol.129, núm. 6, mayo de 1986, pág. 57 (figura 3).

4.5 Un ingeniero de control de calidad muestrea cinco piezas de un lote grande de percutores fabricadosy determina si tienen defectos. Aunque el inspector no lo sabe, tres de los cinco percutores mues­treados tienen defectos. El ingeniero prueba los cinco percutores en un orden escogido al azar hastaque observa un percutor defectuoso (en cuyo caso se rechazará todo el lote). Sea y el número depercutores que debe probar el ingeniero de control de calidad. Calcule y grafique la distribuciónde probabilidad de y.

Page 8: 004 Mendenhall

150 Capítulo 4/ Variables aleatorias discretas

4.6 Refiérase al estudio publicado en el [ournal of Engineering [or Industry (agosto de 1993) de unamáquina taladradora automatizada (ejercicio 3.43). Reproducimos aquí las ocho condiciones de ma­quinado que se emplearon en el estudio.

Material Tamaño taladro Velo taladro Velo alimentaciónExperimento del trabajo in. rpm ior

1 Hierro colado .25 1,250 .0112 Hierro colado .25 1,800 .0053 Acero .25 3,750 .0034 Acero .25 2,500 .0035 Acero .25 2,500 .0086 Acero .125 4,000 .00657 Acero .125 4,000 .0098 Acero .125 3,000 .010

Suponga que dos de las condiciones de maquinado enumeradas pueden detectar una falla en elsistema automatizado. Defina y como el número de las tres condiciones de maquinado con materialde acero y taladro de .25 pulgadas que detectan la falla. Antes de realizar el experimento, calculela distribución de probabilidad para y. [Sugerencia: Enumere todos los posibles pares de condi­ciones de maquinado que detectan la falla.]

EJERCICIO OPCIONAL4.7 Los ingenieros ambientales clasifican a los consumidores en una de cinco categorías (véase en el

ejercicio 3.1 una descripción de cada grupo). Las probabilidades asociadas a los grupos se indicanen la siguiente tabla.

Marrones básicos .28Verdes leales .11Verdes billete .11Retoños .26Refunfuñadores .24

Fuente: The O;angeCounty Register,7 de agosto de 1990.

Sea y el número de consumidores que es preciso muestrear hasta encontrar el primer ecologista.[Nota: Recuerde (ejercicio 3.1) que un ecologista es un verde fiel, un verde billete o un retoño.]a. Especifique la distribución de probabilidad para y en forma de tabla.b. Cite una fórmula para calcular la distribución de probabilidad de y. (Examinaremos esta variable

aleatoria en la sección 4.8.)

4.3 El valor esperado de una variable aleatoria youna función g(y) de y

Los datos que analizamos en ingeniería y ciencias a menudo se obtienen de laobservación de un proceso. Por ejemplo, en control de calidad se vigila unproceso y se registra el número de piezas defectuosas producidas por hora.

Page 9: 004 Mendenhall

4.3 / El valor esperado de una variable aleatoria ouna función 151

Como se apuntó antes, una distribución de probabilidad para una variablealeatoria y es un modelo de la distribución de frecuencia relativa de una po­blación, es decir, un modelo de los datos producidos por un proceso. En con­secuencia, podemos describir los datos de proceso con medidas descriptivasnuméricas, como su media y su desviación estándar, y podemos utilizar la ReglaEmpírica para identificar valores poco probables de y.

El valor esperado (o medio) de una variable aleatoria y, denotado por elsímbolo E(y), se define como sigue:

111 ••• 111 ••••••••••• 11 ••••••••••• 111.11 ••••••••••••••• """'1'

EJEMPLO 4.2

Solución

Refiérase al experimento de lanzar monedas del ejemplo 4.1 y a la distribuciónde probabilidad para la variable aleatoria y que se muestra en la tabla 4.1.Demuestre que la fórmula para E(y) produce la media de la distribución deprobabilidad para la variable aleatoria discreta y.

Si repitiéramos el experimento de lanzar monedas un número muy grande deveces -digamos, 400,000 veces- esperaríamos observar y = °caras aproxi­madamente 100,000 veces, y = 1 cara aproximadamente 200,000 veces, y y = 2caras aproximadamente 100,000 veces. Si calculamos la media de estos 400,000valores de y obtenemos

2: y 100,000(0) + 200,000(1) + 100,000(2),." = -n- = 400,000

= 0(100,000) 1(200,000) 2(100,000)400,000 + 400,000 + 400,000

= O(~) + l(i) + 2(~) = 2: yp(y)today ..........................

Si y es una variable aleatoria, también lo es cualquier función g(y) de y.El valor esperado de g(y) se define como sigue:

Page 10: 004 Mendenhall

152 Capítulo 41 Variables aleatorias discretas

Una de las funciones más importantes de una variable aleatoria discreta yes su varianza, es decir, el valor esperado, elevado al cuadrado, de la desviaciónde y respecto de su media f.l.

...............................................................EJEMPLO 4.3

Solución

Refiérase al experimento de lanzar monedas del ejemplo 4.1 y a la distribuciónde probabilidad de y que se muestra en la tabla 4.1. Calcule la varianza yla desviación estándar de y.

En el ejemplo 4.2 vimos que el valor medio de y es f.l = l. Entonces,

y

2

0'2 = E[(y - pi] = L (y - pip(y)y=o

= (O - l)2(~) + (l - 1?G) + (2 - l)2(~)

a = y¡;z = {i = .707

1"2

..........................•••••••••••••••••••••••••••••••••••••••••••••••••••••• 11'1'1'"

EJEMPLO 4.4

Solución

Refiérase al ejemplo 4.3 y calcule la probabilidad de que y caiga en el intervalof.l ± 20'.

Por los ejemplos 4.2 y 4.3 sabemos que zz = 1 YO' = .707. Entonces, el intervalof.l ± 20' es -.414 a 2.414. Puesto que y debe asumir uno de sólo tres valores,y = 0, 1 Y 2, todos los cuales caen en el intervalo calculado, la probabilidadde que y caiga en el intervalo f.l ± 20' es 1.0. Es obvio que la Regla Empírica(que utilizamos en el capítulo 2 para describir la variación de un conjuntofinito de datos y la dispersión de su histograma de frecuencia relativa) propor­ciona una descripción adecuada de la dispersión o variación de la distribución deprobabilidad de la figura 4.2. . .

Page 11: 004 Mendenhall

4.3 I El valor esperado de una variable aleatoria ouna función 153

••• 11 •• 11···· ••••••••••••••••••••••• 11 ••••••••••••••••••••• 11 ••

EJEMPLO 4.5 Un grupo de ingenieros meteorólogos y civiles que estudian planes de evacua­ción de emergencia para la Costa del Golfo de Florida en caso de un huracánestimó que se requerirían entre 13 y 18 horas para evacuar a las personas queviven en tierras bajas con las probabilidades que se muestran en la tabla 4.3

Tiempo para evacuar Probabilidadhora más cercana

131415161718

.04

.25

.40

.18

.10

.03

Solución

a. Calcule la media y la desviación estándar de la distribución de probabilidadde los tiempos de evacuación.

b. ¿Dentro de qué intervalo esperaría usted que cayera el tiempo de evacua­ción?

a. Representemos con y el tiempo requerido para evacuar a las personas queviven en terrenos bajos. Con base en las definiciones 4.4 y 4.6, calculamos

J-L = E(y) = L: yp(y) = 13(.04) + 14(.25) + 15(.40) + 16(.18) + 17(.10) + 18(.03)

= 15.14 horas

;2" = E[(y - J-L)Z] = L: (y - J-LJZP(y)

= (13 - 15.14)2(.04) + (14 - 15.14)2(.25) + ... + (18 - 15.14)2(.03)

= 1.2404

a = .y;z = Y1.2404 = 1.11 horas

b. Según la Regla Empírica, esperaríamos que cerca de! 95% de los tiemposde evacuación (y) cayeran dentro de! intervalo ¡.L ± 20", donde

J-L ± 2fT = 15.14 ± 2(1.11) = 15.14 ± 2.22 = (12.92, 17.36)

En consecuencia, esperaríamos que e! tiempo para evacuar estuviera entre12.92 horas y 17.36 horas. Con base en la distribución de probabilidad es­timada de la tabla 4.3, la probabilidad real de que y caiga entre 12.92 y17.36 es

P(12.92::5 y::5 17.36) = p(13) + p(14) + P(15) + p(16) + p(17)

= .04 + .25 + .40 + .18 + .10

= .97

Page 12: 004 Mendenhall

154 Capítulo 4 / Variables aleatorias discretas

Una vez más, la Regla Empírica proporciona una buena aproximación dela probabilidad de que una variable aleatoria y caiga en el intervalo f1 ± 20-.

EJERCICIOS...................................................................v/ 4.8

l 4.9

.1 4.10

/4.11

Calcule la media y la varianza de la distribución de probabilidad del ejercicio 4.1.

Calcule la media y la varianza de la distribución de probabilidad del ejercicio 4.2 .

Calcule la media y la varianza de la distribución de probabilidad del ejercicio 4.3.

Refiérase al estudio de exploración petrolera que se estudió en el ejercicio 3.23. Kinchen (1986)cita un ejemplo en el que un presupuesto de exploración de 50,000 dólares se asigna a un soloprospecto. El resultado puede ser un pozo seco, 50,000 barriles (bbl), 100,000 bbl, 500,000 bbl o1,000,000 bbl, con las probabilidades y resultados monetarios que se muestran en la tabla. Sea yel valor monetario de un solo prospecto petrolero. Calcule E(y) y 0-2

.

Posibles Resultadoresultados monetario Probabilidad

bbl $Pozo seco -50,000 .6050,000 -20,000 .10100,000 30,000 .15500,000 430,000 .101,000,000 950,000 .05

Fuente: Kinchen, A. L., "Projected outcomes of exploration programsbased on current program status and the impact of prospects under consi­deration", [ournalofPetroleum Technology, vol. 38, núm. 4, abril de 1986,pág. 462 (tabla 1).

4.12 Calcule la media ~ la varianza de la distribución de probabilidad del ejercicio 4.4.

4.13 Refiérase al ejemplo 4.5. Reproducimos aquí la distribución de probabilidad del tiempo necesariopara evacuar en caso de huracán (tabla 4.3). Los pronosticadores del clima dicen que no puedenpredecir con exactitud la hora en que un huracán tocará tierra con más de 12 horas de anticipación.Si el Departamento de Ingeniería Civil de la Costa del Golfo espera hasta la advertencia de 14horas antes de iniciar la evacuación, équé probabilidad hay de que todos los residentes de áreasbajas sean evacuados sin peligro (es decir, antes de que el huracán azote la Costa del Golfo)?

Tiempo para evacuar Probabilidadhora más cercana

13 .0414 .2515 .4016 .1817 .1018 .03

4.14 Refiérase al ejercicio 4.5. Suponga que el costo de probar un solo percutor es de 200 dólares.a. ¿Cuál es el costo esperado de inspeccionar el lote?

Page 13: 004 Mendenhall

4.4 / Algunos teoremas útiles de la esperanza 155

b. ¿Cuál es la varianza?c. ¿En qué intervalo esperaría usted que estuviera el costo de la inspección?

4.4 Algunos teoremas útiles de la esperanza...................................................................A continuación presentamos tres teoremas que resultan especialmente útilespara calcular el valor esperado de una función de una variable aleatoria. Deja­remos las demostraciones de estos teoremas como ejercicios opcionales.

Los teoremas 4.1-4.3 pueden servir para deducir una sencilla fórmula quenos permite calcular la varianza de una variable aleatoria, fórmula que estádada por el teorema 4.4.

Page 14: 004 Mendenhall

156 Capítulo 4/ Variables aleatorias discretas

DEMOSTRACiÓN DEL TEOREMA 4.4 Por la definición 4.6, tenemos la siguiente expresiónpara d:

0'2 = E[(y - JLf] = E(y2 - 2JLY + JL2)

La aplicación del teorema 4.3 produce

Ahora aplicamos los teoremas 4.1 y 4.2 para obtener

0'2 = E(y2) - 2JLE(y) + JL2 = E(y2) - 2JL(JL) + JL2

= E(l) - 2JL2 + JL2

= E(l) - JL2

Utilizaremos e! teorema 4.4 para derivar las varianzas de algunas de lasvariables aleatorias discretas que se presentarán en las siguientes secciones. Elmétodo se demuestra en el ejemplo 4.6.

11.11 •• 111 ••••• 11 ••••••• 11 •••••••••••••••• 11 ••••••••••• ' •• 1.1.1

EJEMPLO 4.6

Solución

EJERCICIOS

Utilice el teorema 4.4 para calcular la varianza de la variable aleatoria y delejemplo 4.1.

En el ejemplo 4.3 calculamos la varianza de y, e! número de caras que seobservan al lanzar dos monedas, calculando el- = E[ (y - ,u)2] directamente.Como esto puede ser un procedimiento tedioso, casi siempre es más fácil calcu­lar E(/) y luego aplicar el teorema 4.4 para calcular d. En nuestro ejemplo,

E(l) =to~y lp(y) = (WG) + (l)ZG) + (2)2(~) = 1.5

Si sustituimos el valor zz = 1 (que obtuvimos en e! ejemplo 4.2) en e! enun­ciado de! teorema 4.4, tenemos

0'2 = E(y2) - JL2

= 1. 5 - (l)2 = .5

Observe que éste es el valor de d que obtuvimos en el ejemplo 4.3.

En las secciones 4.6-4.1 Opresentaremos varios modelos útiles de distribu­ciones de probabilidad discretas y expresaremos sin demostración la media, lavarianza y la desviación estándar para cada uno. Algunas de estas cantidadesse deducirán en ejemplos opcionales; otras deducciones se dejarán como ejer­cicios opcionales.

...................................................................4.15 Refiérase a los ejercicios 4.1 y4.8. El fabricante arrienda PC nuevas con un costo de 15,000 dólares al año.

Calcule la media yla varianza de la cantidad total que la compañía ganará el próximo año por conceptode arrendamiento de PC.

Page 15: 004 Mendenhall

4.5 / Pruebas de Bernoulli 157

4.16 Utilice el teorema 4.4 para calcular la varianza de la distribución de probabilidad del ejercicio 4.2. Veri­fique que su resultado concuerde con el del ejercicio 4.9.

4.17 Utilice el teorema 4.4 para calcular la varianza de la distribución de probabilidad del ejercicio 4.3. Veri­fique que su resultado concuerde con el del ejercicio 4.10.

4.18 Refiérase al ejercicio 4.5, donde y es el número de percutores que se prueban en una muestra decinco seleccionada de un lote grande. Suponga que el costo de inspeccionar un solo percutor esde 300 dólares si el percutor está defectuoso y de 100 dólares .si no 10 está. Entonces, el costo total dela inspección C (en dólares) está dado por la ecuación C = 200 + 100y. Calcule la media y lavarianza de C.

EJERCICIOS OPCIONALES

4.19 Demuestre el teorema 4.1. [Sugerencia: Aproveche el hecho de que Ltoda yp(y) = 1.]

4.20 Demuestre el teorema 4.2. [Sugerencia: La demostración es consecuencia directa de la definición 4.5.]

4.21 Demuestre el teorema 4.3.

4.5 Pruebas de Bernoulli...................................................................Varias de las distribuciones de probabilidad discretas que veremos en este ca­pítulo se basan en experimentos o procesos en los que se realiza una secuenciade pruebas llamadas pruebas de Bernoulli.

Una prueba de Bernoulli tiene uno de dos resultados mutuamente exclu­sivos, que por lo regular se denotan con S (éxito) y F (fracaso). Por ejemplo,el lanzamiento de una moneda es una prueba de Bernoulli porque sólo puedeocurrir uno de dos resultados distintos, cara (C) o cruz (X).

Las características de una prueba de Bernoulli se resumen en el recuadro.

Una variable aleatoria de Bernoulli y se define como el resultado numéricode una prueba de Bernoulli, donde y = I si hay éxito y y = O si se fracasa.En consecuencia, la distribución de probabilidad para y se muestra en la tabla4.4 y en el siguiente recuadro.

Page 16: 004 Mendenhall

158 Capítulo 4 / Variables aleatorias discretas

Resultado y p(y)

S 1 PF O q

En el experimento de Bernoulli de lanzar una moneda, definimos e comoun éxito y X como un fracaso. Entonces, y = 1 si e ocurre y y = Osi X ocurre.Puesto que P(C) = P(X) = .5 si la moneda está balanceada, la distribuciónde probabilidad para y es

P(l) = P = .5p(O) = q = .5

••• 11, ••••••••• ".1111.11 •••••••••••••••••••• 11 ••••••••••••••••

EJEMPLO 4.7

Solución

Demuestre que para una variable aleatoria de Bernoulli y, /1 = p y a = --r¡;;¡.

Sabemos que P(y = 1) = p(l) = p y P(y = O) = p(O) = q. Entonces, por ladefinición 4.4,

J.L = E(y) = L yP(y) = (l)p(l) + (O)p(O) = P(l) = p

También, por la definición 4.5 y el teorema 4.4,

u 2 = E(y 2) - J.L2 = L y2p(y) - J.L2 = (1)2p(l ) + (0)2p(0) - J.L2

= P(l) - J.L2 = P - p2 = P(l - p) = pq

Page 17: 004 Mendenhall

4.6 / ladistribución de probabilidad binomial 159

En consecuencia, a = ...[(i'f = -v¡;q.. .

Una variable aleatoria de Bernoulli, por sí sola, tiene poco interés en lasaplicaciones de ingeniería y ciencias. En cambio, la realización de una serie depruebas de Bernoulli conduce a varias distribuciones de probabilidad discretasbien conocidas y útiles. Una de ellas se describe en la siguiente sección.

4.6 La distribución de probabilidad binomial•••••••• 11 ••••••••••••••••••••••••••••••••••••••••••••••••••••••••••

Muchos experimentos de la vida real consisten en efectuar una serie de pruebasde Bernoulli y son análogos al lanzamiento de una moneda no balanceada unnúmero n de veces. Suponga que 30% de los pozos privados que suministranagua potable a un área metropolitana contiene la impureza A. En este caso,seleccionar una muestra aleatoria de 10 pozos y analizar el agua para determinarsi contiene la impureza A sería análogo a lanzar una moneda no balanceada10 veces, siendo la probabilidad de obtener una cara (detectar la impureza A)en una sola prueba igual a JO. Las encuestas de opinión pública o preferenciasde los consumidores que generan una de dos respuestas -sí o no, apruebao desaprueba, etc.- también son análogas al experimento de lanzar una mo­neda no balanceada si el número N de la población es grande y el tamaño dela muestra n es relativamente pequeño, digamos .10N o menos. Todos estosexperimentos son ejemplos particulares de un experimento binomial. Este tipode experimentos y las variables aleatorias que resultan poseen las característicasque se enumeran en el recuadro.

La distribución de probabilidad binomial, su media y su varianza se mues­tran en el recuadro que sigue. En la figura 4.3 aparecen los histogramas defrecuencia relativa de distribuciones binomiales para una muestra de n = 10Y diferentes valores de p. Observe que la distribución de probabilidad estásesgada hacia la derecha si el valor de p es pequeño, está sesgada a la izquierdasi el valor de p es grande y es simétrica si p = .5.

Page 18: 004 Mendenhall

160 Capítulo 4/ Variables aleatorias discretas

FIGURA 4.1 ...Distribuciones de probabilidadbinomiales paran = 10,p = .1,.1, .5, .7,.9

p(y)

.4

.3

.2

.1 ....... ·1·

012345678910

p(y)

.4

.3

.2

.1

012345678910

p(y)

.4

.3

.2

.1

012345678910

a.p= .1 b.p= .3 C.p= .5

y012345678910

.1

.3

.2

y

p(y)

.4

012345678910

.3

.2

.1

p(y)

.4

d.p=.7 e.p= .9

Page 19: 004 Mendenhall

4.6 / ladistribución de probabilidad binomial 161

La distribución de probabilidad binomial se deduce como sigue. Un eventosimple de un experimento binomial que consiste en n pruebas de Bernoulli sepuede representar con el símbolo

SFSFFFSSSF ... SFS

donde la letra que está en la i-ésima posición de izquierda a derecha denotael resultado de la i-ésima prueba. Puesto que queremos calcular la probabilidadp(y) de observar y éxitos en las n pruebas, necesitaremos sumar las probabili­dades de todos los eventos simples que contengan y éxitos (S) y (n - y) fracasos(F). Tales eventos simples aparecerían simbólicamente como

y (n - y)

SSSS ... S FF ... F

o algún arreglo distinto de estos símbolos.Dado que las pruebas son independientes, la probabilidad de que un evento

simple en particular implique y éxitos es

y (n - y),.---'"------" , ,P(SSS ... S FF ... F) = pYqn-y

El número de estos eventos simples equiprobables es igual al número de formasen que podemos disponer las y S Ylas (n - y) F en n posiciones que corres­ponden a las n pruebas. Dicho número es igual al número de formas de selec­cionar y posiciones (pruebas para las y S de un total de n posiciones. Estenúmero, dado por el teorema 3.4, es

(n) n!y = y!(n - y)!

Hemos determinado la probabilidad de cada evento simple que produce yéxitos, y también el número de tales eventos. Ahora sumamos las probabi­lidades de estos eventos simples para obtener

(Número de eventos ) (probabilidad de uno de)

p(y) = simples~u~ implican estoseventossimplesy éxitos equiprobables

o bien

... , "., .EJEMPLO 4.8 Los ingenieros eléctricos saben que una corriente neutral elevada en los siste­

mas de alimentación de computadoras son un problema potencial. Un estudioreciente de las corrientes de carga en sistemas de alimentación de compu­tadoras en instalaciones estadounidenses reveló que 10% de las instalacionestenían razones de corriente neutral a corriente de carga total altas (IEEE Trans­actions on Industry Applications, julio/agosto de 1990). Si se escoge una muestraaleatoria de cinco sistemas de alimentación de computadora del gran númerode instalaciones del país, équé probabilidad hay de que

a. Exactamente tres tengan una relación de corriente neutral a corriente decarga total alta?

Page 20: 004 Mendenhall

162 Capítulo 4 / Variables aleatorias discretas

b. Por lo menos tres tengan una relación alta?

c. Menos de tres tengan una relación alta?

Solución El primer paso es confirmar que este experimento posee las características deun experimento binomial. El experimento consiste en n = 5 pruebas de Ber­noulli, cada una de las cuales corresponde a una instalación elegida al azar.Cada prueba produce una S (la instalación tiene un sistema de alimentaciónde computadora con una relación de corriente neutral a corriente de carga totalalta) o una F (el sistema no tiene una relación alta). Puesto que el númerototal de instalaciones con sistemas de alimentación de computadora en el países grande, la probabilidad de escoger una sola instalación y encontrar que tieneuna relación de corriente neutral a corriente de carga total alta es de .1, Yestaprobabilidad se mantendrá aproximadamente constante (para todos los propó­sitos prácticos) en cada una de las instalaciones escogidas. Es más, como elmuestreo fue aleatorio, suponemos que el resultado en cualquier instalaciónno afecta el resultado en ninguna otra y que las pruebas son independientes.Por último, nos interesa el número y de instalaciones en la muestra de n = 5que tienen razones de corriente neutral a corriente de carga total altas. Portanto, el procedimiento de muestreo representa un experimento binomial conn = 5 YP = .1.

a. La probabilidad de escoger exactamente y = 3 instalaciones con una rela­ción alta es

donde n = 5, P = .1 YY = 3. Entonces,

-~ 3 2_p(3) - 3!2,(.1) (.9) - .0081

b. La probabilidad de observar al menos tres instalaciones con razones altas es

P(y :::: 3) = p(3) + p(4) + p(5)

donde

_ 5! 4 1_p(4) - 4!l!(.1) (.9) - .00045

_~ 5 0_p(5) - 5!0,(.1) (.9) - .00001

Puesto que ya obtuvimos p(3) en el inciso a, tenemos

P(y:::: 3) = p(3) + p(4) + p(5)

= .0081 + .00045 + :00001 = .00856

c. Aunque P(y < 3) = p(O) + P(l) + p(2), podemos evitar calcular estasprobabilidades utilizando la relación complementaria y el hecho de queL;=ü p(y) = 1.

Page 21: 004 Mendenhall

4.6/ ladistribución de probabilidad binomial 163

Por tanto,

P(y < 3) = 1 - P(y ~ 3) = 1 - .00856 = .99144

..........................En la tabla 1 del apéndice II se presentan tablas de sumas parciales de la

forma

k

:¿ p(y)y=o

para probabilidades binomiales, para n = 5, 10, 15, 20 Y 25. Por ejemplo, ellector encontrará que la suma parcial dada en la tabla para n = 5, en la filacorrespondiente a k = 2 Yla columna correspondiente a p = .1, es

2

:¿ p(y) = p(O) + pO) + p(2) = .991y=o

Esta respuesta, correcta hasta tres posiciones decimales, concuerda con nuestrarespuesta al inciso e del ejemplo 4.8.

11 •• 111 •••• 111.' •••••••••••••••• 1 •••••••••••••••• 11 •••• 1.111 •••

EJEMPLO 4.9

Solución

Calcule la media, la varianza y la desviación estándar de una variable aleatoriabinomial con n = 20 YP = .6. Construya el intervalo u ± 20' y calcule P(¡..L ­20' < y < f..l + 20').

Si aplicamos las fórmulas proporcionadas anteriormente tenemos

JL = np = 20(.6) = 12

0'2 = npq = 20(.6)(.4) = 4.8

u=V4.8=2.19

La distribución de probabilidad binomial para n = 20 y P= .6 y el intervalof..l ± 20', o sea, 7.62 a 16.38, se muestran en la figura 4.4. Los valores de y quecaen en el intervalo f..l ± Za son 8, 9, ... , 16. Por tanto,

P(j1 - 20' < y < f..l + 20') = P(y = 8, 9, 10, ... , o 16)16 7

= :¿ p(y) - :¿ p(y)y=O y=O

Obtenemos los valores de estas sumas parciales de la tabla 1 del apén­dice 11:

16 7

P(JL - 20' < y < JL + 20') = :¿ p(y) - :¿ p(y)y=o y=o

= .984 - .021 = ·963

Page 22: 004 Mendenhall

164 Capítulo 4/ Variables aleatorias discretas

.20

p(y)FIGURA 4.4 ~Distribución de probabilidadbinomial parayen el ejemplo4.9(n = 20, P= .6)

.15

.10

.05

o 1 2 345 6 7 11 12I

11-1-

Puede verse que este resultado se acerca al valor de .95 especificado por laRegla Empírica que vimos en el capítulo 2.

11 ••••••••••• 11 ••••••••• 111 •• 11 •••••• 11 ••••• 1 ••••• 11.' •••• ' •• '1

EJEMPLO 4.10(OPCIONAL)

Solucién

Deduzca la fórmula para el valor esperado de la variable aleatoria binomial.

Por la definición 4.4,n 1

f.L = E(y) = 2: yp(y) = 2: y n. pYqn-ytoday y=ü y!(n - y)!

La forma más fácil de sumar estos términos es convertirlos en probabilidadesbinomiales y luego aprovechar el hecho de que :r.;=ü p(y) = 1. Si tomamos notadel hecho de que el primer término de la sumatoria es igual a O (puesto quey = O), tenemos

n~ n!

f.L = LJ Y pYqn-yy=l [y(y - 1) ... 3 . 2 • l](n - y)!

i n!= y=l (y - 1)!(n _ y)!pyqn-

y

Como n y p son constantes, podemos utilizar el teorema 4.2 para sacar np dela sumatoria por factorizacián:

_ p i (n - 1)! y-l n-yf.L - n y=l (y - 1)!(n - y)!p q

Page 23: 004 Mendenhall

4.6/ ladistribución de probabilidad binomial 165

Sea z = (y - 1). Entonces, cuando y = 1, z = OYcuando y = n, Z = (n - 1);entonces,

_ .¿. (n - 1)! y-l n-y

1-' - np f=l (y - l)!(n - y)!p q

n-l= n ¿ (n - 1)! zqr1)-z

p z=o z![(n - 1) - z]!P

La cantidad dentro del signo de sumatoria es p(z), donde z es una variablealeatoria binomial basada en (n - 1) pruebas de Bernoulli. Por tanto,

n-l

¿ p(z) = 1z=o

y

n-l

1-' = np ¿ p(z) = np(l) = npz=o

EJERCICIOS...................................................................4.22 Utilice la fórmula de la distribución de probabilidad binomial para calcular las probabilidades con n = 4,

p=.5yy=0,1,2,3y4.

4.23 Utilice las probabilidades binomiales de la tabla 1 del apéndice 11 para calcular p(y) con n = 10 Ya. p =.1 b. P =.5 c. P = .9d. Construya gráficas (similares a la figura 4.2) de las tres distribuciones de probabilidad de los

incisos a-c. Observe la simetría de la distribución para p = .5 y el sesgo para p = .1 y P = .9.

4.24 La Fundación Nacional de las Ciencias de Estados Unidos informa que 70% de los estudiantes deposgrado que obtienen grados de doctorado en ingeniería en ese país son ciudadanos de otros países(Science, 24 de. sept. de 1993). Considere el número de estudiantes extranjeros en una muestraaleatoria de 25 estudiantes de ingeniería que recientemente obtuvieron su doctorado.a. Calcule P(y = 10).b. Calcule P(y s 5).c. Calcule la media Ji y la desviación estándar a de y.d. Interprete los resultados del inciso c.

4.25 En el Occupational Outlook Quarterly (primavera de 1993) se informó que 1%de todos los instaladoresde pared seca empleados en la industria de la construcción son mujeres. En una muestra aleatoria de 10instaladores de pared seca, calcule la probabilidad de que, cuando más, uno de ellos sea mujer.

4.26 Los zoólogos han descubierto que los animales pasan mucho tiempo descansando, aunque estetiempo de reposo puede tener importancia funcional (por ejemplo, los depredadores que acechana su presa). Descontando el tiempo que pasan en sueño profundo, un investigador de la Universityof Vermont estimó el porcentaje del tiempo que diversas especies pasan descansando (NationalWildlife, agosto-septiembre de 1993). Por ejemplo, la probabilidad de que una lagartija hembraesté descansando en un momento dado es de aproximadamente .95.a. En una muestra al azar de 20 lagartijas hembra, ¿qué probabilidad hay de que por lo menos

15 estén descansando en un momento dado?

Page 24: 004 Mendenhall

166 Capítulo 4 / Variables aleatorias discretas

b. En una muestra al azar de 20 lagartijas hembra, ¿qué probabilidad hay de que menos de 10estén descansando en un momento dado?

c. En una muestra al azar de 200 lagartijas hembra, éesperaría usted observar menos de 190descansando en un momento dado? Explique.

4.27 En un estudio reciente, Consumer Reports (febrero de 1992) encontró un gran número de casos decontaminación y errores de etiquetación de mariscos en supermercados de las ciudades de NuevaYork y Chicago. El estudio reveló una estadística alarmante: 40% de los trozos de pez espadadisponibles para la venta tenía un nivel de mercurio superior al límite inferior establecido por laAdministración de Alimentos y Medicinas (FDA) de Estados Unidos. Para una muestra aleatoriade tres trozos de pez espada, calcule la probabilidad de que:a. Los tres trozos de pez espada tengan niveles de mercurio por encima del mínimo de la FDA.b. Exactamente un trozo de pez espada tenga un nivel de mercurio por encima del mínimo de

la FDA.c. Cuando más, un trozo de pez espada tenga un nivel de mercurio por encima del mínimo de la FDA.

4.28 Un estudio de las tendencias a lo largo de cinco años en los sistemas de información logística delas industrias reveló que los mayores avances en la computarización tuvieron lugar en el transporte(Industrial Engineering, julio de 1990). Actualmente, 90% de todas las industrias contiene archivosde pedidos abiertos de embarque en su base de datos computarizada. En una muestra aleatoria de10 industrias, sea y el número de ellas que incluyen archivos de pedidos abiertos de embarque ensu base de datos computarizada.a. Verifique que la distribución de probabilidad de y se puede modelar utilizando la distribución

binomial.b. Calcule P(y = 7).c. Calcule P(y > 5).d. Calcule la media y la varianza de y. Interprete los resultados.

4.29 Refiérase al estudio (aparecido en el IEEE Computer Applications in Power) de un sistema devigilancia automático para exteriores diseñado para detectar intrusos (ejercicio 3.13). En condicionesde clima nevoso, el sistema detectó 7 de 10 intrusos; por tanto, los investigadores estimaron quela probabilidad de detección de intrusos del sistema cuando está nevando es de .70.a. Suponiendo que la probabilidad de detectar intrusos cuando está nevando es de sólo .50, calcule

la probabilidad de que el sistema automático detecte por lo menos 7 de 10 intrusos.b. Con base en eJ resultado del inciso a, comente sobre la confiabilidad de la estimación que hicieron

los investigadores respecto a la probabilidad de detección del sistema en condiciones nevosas.

4.30 Refiérase al problema de transporte de partículas neutrales descrito en el ejercicio 3.25. Recuerdeque las partículas liberadas en un ducto evacuado chocan con la pared interior del ducto y sedispersan (reflejan) con probabilidad de .16 o bien se absorben con probabilidad de .84 (NuclearScience and Engineering, mayo de 1986).a. Si se liberan cuatro partículas en el dueto, zqué probabilidad hay de que las cuatro sean ab­

sorbidas por la pared interior del ducto? ¿y exactamente tres de las cuatro?b. Si se liberan 20 partículas en el dueto, ¿qué probabilidad hay de que por lo menos 10 serán

reflejadas por la pared interior del ducto? ¿y exactamente lO?

4.31 Durante la década de 1950 se realizaron varias pruebas de armas nucleares en el desierto en Nevada.Desde entonces, las estimaciones de exposición a la radiación de poblaciones fuera del sitio de laspruebas, sobre todo en Utah, han sido objeto de un gran esfuerzo de investigación científica. ElRegistro de Vigilancia, Epidemiología y Resultados Finales (SEER) recabó datos acerca de la inci­dencia de cáncer de la tiroides entre los residentes de Utah durante el periodo de 1973 a 1977. ElSEER averiguó que la tasa de incidencia de cáncer de la tiroides entre hombres de 50 años deedad es de 3.89 en una población de 100,000. Esto implica que la probabilidad de que un hombrede Utah de 50 años de edad desarrolle cáncer de la tiroides es de .0000389. En una muestra al

Page 25: 004 Mendenhall

4.7 / ladistribución de probabilidad multinomial 167

azar de 1,000 hombres de Utah de 50 años de edad, sea y el número de los que desarrollaron cáncerde la tiroides.a. Calcule la media y la varianza de y.b. ¿Esperaría usted observar por lo menos un hombre de 50 años con cáncer de la tiroides entre

los 1,000?4.32 La revista Organic Gardening realizó una encuesta para averiguar si los consumidores preferirían

frutas y verduras cultivadas orgánicamente a las cultivadas con fertilizantes y plaguicidas (New YorkTimes, 21 de marzo de 1989). Si los costos de los dos tipos de alimentos fueran los mismos, 85%dijo que preferiría la comida orgánica. Sorprendentemente, 50% dijo que preferiría la comida or­gánica incluso si tuviera que pagar más por ella. Considere las preferencias de una muestra aleatoriade n = 25 consumidores.a. Suponiendo que los porcentajes de la encuesta reflejan las preferencias de la población, calcule

la probabilidad de que por lo menos 20 de los 25 consumidores prefieran los alimentos culti­vados orgánicamente, si los costos fueran iguales.

b. Suponiendo que los porcentajes de la encuesta reflejan las preferencias de la población, calculela probabilidad de que por lo menos 20 de los 25 consumidores prefieran los alimentos culti­vados orgánicamente, incluso si los costos fueran mayores que los de los alimentos cultivadoscon fertilizantes y pesticidas.

EJERCICIOS OPCIONALES

4.33 Para la distribución de probabilidad binomial p(y), demuestre que L;~o p(y) = 1. [Sugerencia: Elteorema binomial, que se refiere a la expansión de (a + b)n, dice que

(a + b)n = (~)an + (7)an- 1b + (~)an-2b2 + ... + (~)bn

Sea a = q y b = p.]

4.34 Demuestre que, para una variable aleatoria binomial,

E[y(y - I)J = npq + 1J-2 - IJ-

[Sugerencia: Escriba el valor esperado como una suma, saque por factorización y(y-l) yluego factoricetérminos hasta ,que cada término de la suma sea una probabilidad binomial. Aproveche el hecho de queLyP(Y) = 1 para sumar la serie.J

4.35 Utilice los resultados del ejercicio 4.34 y el hecho de que

E[y(y - I)J = E(y2 - y) = E(i) - E(y) = E(i) - IJ­

para calcular E(i) para una variable aleatoria binomial.

4.36 Utilice los resultados de los ejercicios 4.34 y 4.35, junto con el teorema 4.4, para demostrar quecr = npq para una variable aleatoria binomial.

4.7 la distribución de probabilidad multinomial...................................................................Muchos tipos de experimentos producen observaciones de una variable cuali­tativa con más de dos posibles resultados. Por ejemplo, suponga que ciertacomputadora personal (PC) se fabrica en una de cinco líneas de produccióndistintas, A, B, C, D o E. A fin de comparar las proporciones de PC defectuosasque se pueden atribuir a las cinco líneas de producción, todas las computadoras

Page 26: 004 Mendenhall

168 Capítulo 4 / Variables aleatorias discretas

Línea de producción

A B

15 27

C

31

D

19

E

11

defectuosas detectadas por los ingenieros de control de calidad se clasificandiariamente según la línea en que se produjeron. Cada PC es una unidad ex­perimental y la observación es una letra que identifica la línea de producciónen la que se produjo. La línea de producción es evidentemente una variablecualitativa.

Suponga que n = 103 computadoras se producen con defectos en unasemana dada. Las n = 103 observaciones cualitativas, cada una de las cualeses una A, B, C, O o E, producen cuentas que indican los números de máquinasdefectuosas que salen de las cinco líneas de producción. Por ejemplo, si hubieraYl = 15 resultados A, Yz = 27 resultados B, Y3 = 31 resultados C, Y4 = 19resultados O y Y5 = 11 resultados E, los datos clasificados se verían comoaparecen en la tabla 4.5, que muestra las cuentas en cada categoría de la cla­sificación. Observe que la suma de los números de PC defectuosas producidaspor las cinco líneas debe ser igual al número total de máquinas defectuosas.

n = y¡ + yz + Y3 + Y4 + Y5 = 15 + 27 + 31 + 19 + 11 = 103

El experimento de clasificación que acabamos de describir se denominaexperimento multinomial y representa una extensión del experimento binomialque estudiamos en la sección 4.6. Un experimento así consiste en n pruebasidénticas, es decir, observaciones de n unidades experimentales. Cada prue­ba debe producir uno y sólo uno de k resultados, las k categorías de clasificación(para el experimento binomial, k = 2). La probabilidad de que el resultado deuna sola prueba caiga en la categoría i es Pi (i = 1, 2, ... , k). Por último, laspruebas son independientes y nos interesan los números de observaciones, y¡,Yz, ... , Yb que caen en las k categorías de clasificación.

La distribución multinomial, su media y su vananza se muestran en elsiguiente recuadro.

Page 27: 004 Mendenhall

4.7 / ladistribución de probabilidad multinomial 169

El procedimiento para derivar la distribución de probabilidad multinomialp(y¡, Y:z, ••• , Yk) para las cuentas de categoría nI. nz, ... , ni; es idéntico alque se sigue en un experimento binomial. A fin de simplificar nuestra notación,ilustraremos el procedimiento para k = 3 categorías. La deducción de p(y¡, Yz,... , Yk) para k categorías es similar.

Denotemos con A, B Y C los tres resultados que corresponden a las k = 3categorías, con sus respectivas probabilidades de categoría PI, pz y p,. Entonces,cualquier observación del resultado de n pruebas dará pie a un evento simpledel tipo que se muestra en la tabla 4.6. El resultado de cada prueba se indicacon la letra que se observó. Así, el evento simple de la tabla 4.6 es el que dacomo resultado C en la primera prueba, A en la segunda, A en la tercera, ... ,y B en la última.

Prueba

e

2

A

3

A

4

B

5

A

6

e

n

B

Consideremos ahora un evento simple que produzca y, resultados A, yzresultados B y y, resultados C, donde y¡ + yz + y, = n. Uno de estos eventossimples se muestra en la figura 4.5. La probabilidad del evento simple de lafigura, que produce y, resultados A, yz resultados B y y, resultados C, es

AAA ... A' 'BBB ... B eee ... eFIGURA 4.5 ~Evento simple que contiene YIresultados A, Y2 BYYl (

Yl Y2 YJ

¿Cuántos eventos simples habrá en el espacio de muestra S que impliqueny¡ resultados A, yz resultados B y y, resultados C? Esta cantidad es igual alnúmero de formas diferentes en que podemos acomodar los y¡ resultados A,

Page 28: 004 Mendenhall

170 Capítulo 4 / Variables aleatorias discretas

Yl resultados B y Y3 resultados C en las n posiciones distintas de la figura 4.5.El número de formas en que asignaríamos YI posiciones a A, Yl posiciones a By Y3 posiciones a C está dado por el teorema 3.3, y es

n!Y¡ !Yl!Y3!

Por tanto, hay n!/(YI!YZ!Y3!) eventos simples que producen YI resultados A, Yzresultados B y y3 resultados C, cada uno con probabilidad (p¡)YI, (pz)Y¡ y (P3)Y'En consecuencia, la probabilidad de observar Y¡ resultados A, Yl resultados B yY3 resultados C en n pruebas es igual a la suma de las probabilidades de estoseventos simples:

nIp(y¡, Yl, Y3) = (P¡)Yl(Pl)Yz(P3)Y3

Y¡!Yl!Y3!

El lector puede comprobar que ésta es la expresión que se obtiene al sustituirk = 3 en la fórmula para la distribución de probabilidad multinomial mostradaen el recuadro.

El valor esperado, o medio del número de cuentas para una categoría es­pecífica, digamos la categoría i, se puede obtener directamente de nuestroconocimiento de las propiedades de una variable aleatoria binomial. Si combi­namos todas las categorías distintas de la categoría i en una sola categoría, laclasificación multinomial se convierte en una clasificación binomial con Y¡ ob­servaciones en la categoría i y (n - Y¡) observaciones en la categoría combinada.Entonces a partir de lo que sabemos acerca del valor esperado y la varianza deuna variable aleatoria binomial, deducimos que

E(Yi) = np¡

V(y¡) = np¡(1 - Pi)

11111 •••• 1111 ••••••••• 11 •••• '1 •••• '11." •••••••• ,', ••••••••••••

EJEM PLO 4.11

Solución

Refiérase al estudio de razones de corriente neutral a corriente de carga totalen sistemas de alimentación de computadoras (ejemplo 4.8). Suponga que losingenieros eléctricos determinaron que 10% de los sistemas tiene razones altas,30% tiene razones moderadas y 60% tiene razones bajas. Considere una muestraaleatoria de n = 40 instalaciones con sistemas de alimentación para compu­tadoras.

a. Calcule la probabilidad de que 10 instalaciones tengan razones de corrienteneutral a corriente de carga total altas, 10 instalaciones tengan razones mo­deradas y 20 tengan razones bajas.

b. Calcule la media y la varianza del número de instalaciones que tienen ra­zones de corriente neutral a corriente de carga total altas. Utilice esta in­formación para estimar el número de instalaciones en la muestra de 40 quetendrán razones altas.

En la solución del ejemplo 4.8 verificamos que se satisfacen las propiedadesde un experimento binomial. Este ejemplo no es más que una extensión delexperimento binomial a uno que puede tener k = 3 posibles resultados -re­lación alta, moderada o baja- en cada instalación. Por tanto, se satisfacen laspropiedades de un experimento multinomial y podemos aplicar las fórmulasque se presentaron en el recuadro.

a. Defina lo siguiente:

Page 29: 004 Mendenhall

4.7 / ladistribución de probabilidad multinomial 171

y¡ = Número de instalaciones con razones altas

Yl = Número de instalaciones con razones moderadas

Y3 = Número de instalaciones con razones bajas

PI = Probabilidad de que una instalación tenga una relación alta

Pl = Probabilidad de que una instalación tenga una relación moderada

P3 = Probabilidad de que una instalación tenga una relación baja

Entonces lo que queremos es calcular la probabilidad, P(YI = 10, Yl = 10,Y3 = 30), utilizando la fórmula

n!p(y¡, Yl, Y3) = (p¡)Yl(Pl)Y2(P3)Y3

Y¡ !Yl!Y3!

donde n = 40 Y nuestras estimaciones de P" Pl YP3 son .1, .3 Y .6, respec­tivamente. Si sustituimos estos valores, obtenemos

b. Queremos calcular la media y la varianza de y" el número de instalacionescon razones de corriente neutral a corriente de carga total altas. Por lafórmula del recuadro, tenemos

JL¡ = np, = 40(.1) = 4

y

crÍ = np¡(l - PI) = 40(.1)(.9) = 3.6

Con base en la Regla Empírica, esperamos que y" el número de insta­laciones de la muestra que tienen razones altas, se encuentre a menos de2 desviaciones estándar de su media, esto es, entre

JL¡ - 2cr¡ = 4 - 2v'3.6 = .21

y

JL¡ + 2cr¡ = 4 + 2v'3.6 = 7.79

Puesto que y¡ sólo puede adoptar valores enteros, O, 1, 2, ... , esperaremosque el número de instalaciones con razones altas esté entre 1 y 7.

..........................EJERCICIOS...................................................................4.37 Para la distribución multinomial con n = 5, k = 3, PI = .2, Pl = ,5 YP3 = .3, calcule las siguientes

probabilidades:a. p(3, 1, 1) b. p(O, 5, O) c. p(l, 3, 1)

Page 30: 004 Mendenhall

172 Capítulo 4 / Variables aleatorias discretas

4.38 Refiérase a la distribución multinomial del ejercicio 4.37. Calcule la media yla varianza para cada una delas tres variabIes aleatorias, YI> Yz YY3-

4.39 A fin de compensar la desorientación que se experimenta en ausencia de gravedad, los astronautasse apoyan mucho en la información visual para establecer una orientación vertical de arriba haciaabajo. El potencial para utilizar la brillantez de color como indicio de la orientación de un cuerpose estudió en Human Factors (diciembre de 1988). Noventa estudiantes universitarios, recostadosboca arriba en la oscuridad, se sometieron a desorientación colocándoseles en una plataforma ro­tatoria bajo un disco que giraba lentamente y bloqueaba su campo de visión. Se les pidió a losestudiantes que dijeran "alto" cuando sintieran que estaban viendo hacia arriba. En ese momentose registró la posición del patrón de brillantez del disco en relación con la orientación del cuerpodel estudiante. Los sujetos seleccionaron sólo tres patrones de brillantez del disco como indiciossubjetivos de verticalidad: (1) lado más iluminado hacia arriba, (2) lado más oscuro hacia arriba y (3)lados iluminado y oscuro alineados a ambos lados de la cabeza del sujeto. Con base en los resultadosdel estudio, las probabilidades de que los sujetos seleccionen las tres orientaciones del disco son.65, .15 y .20, respectivamente. Suponga que n = 8 sujetos realizan un experimento similar.a. ¿Qué probabilidad hay de que los ocho sujetos escojan la orientación de lado más iluminado

hacia arriba?b. ¿Qué probabilidad hay de que cuatro sujetos escojan la orientación de lado más iluminado

hacia arriba, tres escojan la orientación de lado más oscuro hacia arriba y uno escoja la orien­tación alineada?

c. En promedio, écuántos de los ocho sujetos escogerán la orientación de lado más iluminadohacia arriba?

4.40 La piratería de software para computadora muy utilizado, como Lotus y WordStar, se está exten­diendo con una rapidez fenomenal. Decisiones judiciales recientes han determinado como respon­sables a las compañías por los empleados que copian sin autorización el software adquirido poraquéllas, incluso aunque la propia compañía se dé cuenta del hecho. ¿Están adoptando las com­pañías políticas más estrictas respecto al copiado de software, y están obligando a su cumplimiento?A fin de responder a esta pregunta, un investigador encuestó 121 compañías industriales incluidasentre las Fortune 500 (las 500 compañías más grandes según la revista Fortune) y que utilizancomputadoras personales (PC) en el trabajo (Journal of Systems Management, julio de 1989). Unaspecto de particular interés fue el de los métodos que utilizan las compañías para obligar el cum­plimiento de las. políticas. Las respuestas para las 121 compañías se resumen en la tabla.

Métodopara hacercumplirpolíticas

l. No se emprende acción alguna2. Auditorías internas3. Sistema de honor4. Auditorías gerenciales/revisiones aleatorias5. Otros

TOTAL

Númerodecompañías

1049281222

121

Fuente: Athey, S.A., "Software copyingpoliciesof the Fortune500",[ournalofSystems Ma­nagement, juliode 1989,pág.33 (tabla 6).

a. Verifique si este estudio satisface las propiedades de un experimento multimodal.b. Un investigador ha propuesto la teoría de que las compañías están igualmente divididas en

cuanto al método de obligación utilizado. Si así fuera, asigne valores a las probabilidades PI,Pz, P3' P4 YPs del experimento multinomial.

c. Utilice las probabilidades del inciso b para calcular la probabilidad de observar los resultadosque se muestran en la tabla.

Page 31: 004 Mendenhall

4.7 / La distribución de probabilidad multinomial 173

4.41 Una corriente eléctrica que viaja a través de un resistor puede tomar uno de tres caminos diferentes,con probabilidades PI = .25, pz = .30 YP3 = .45, respectivamente. Suponga que determinamos elcamino tomado en n = 10 ensayos consecutivos.a. Calcule la probabilidad de que la corriente eléctrica viajará por la primera trayectoria y, = 2

veces, por la segunda yz = 4 veces y por la tercera Y3 = 4 veces.b. Calcule E(yz) y V(yz). Interprete los resultados.

4.42 Los trabajos presentados a un centro de cómputo universitario pueden ejecutarse en una de cuatrodiferentes clases de prioridad: urgente, prioridad normal, baja prioridad y espera. El centro de cóm­puto estima que 10% de los trabajos se presentan como urgentes, 50% con prioridad normal, 20%con baja prioridad y 20% en fila de espera. Suponga que se presentan simultáneamente n = 20trabajos.a. Calcule la probabilidad de que dos trabajos se presentarán como urgentes, 12 con prioridad

normal, 5 con prioridad baja y 1 en fila de espera.b. Calcule el número esperado de trabajos de baja prioridad en la muestra.c. ¿Dentro de qué intervalo esperaría usted que cayera el número de trabajos de baja prioridad

de la muestra?

4.43 Se selecciona una muestra de tamaño n de un lote grande de brocas para taladro de corte. Supongaque una proporción PI contiene exactamente un defecto y una proporción pz contiene más de undefecto (con PI + pz < 1). El costo de reemplazar o reparar las brocas defectuosas es de C = 4y,+ Yz, donde YI denota el número de brocas con un defecto y yz denota el número de brocas condos o más defectos. Calcule el valor esperado de C.

4.44 En marzo de 1981 ocurrió un brote de gastroenteritis no bacterial de contagio a través del aguaen Colorado como resultado de una deficiencia prolongada y mal funcionamiento de los filtros enuna planta de tratamiento de aguas de albañal. Se realizó un estudio para determinar si la incidenciade enfermedades gastrointestinales durante la epidemia estaba relacionada con el consumo de agua(American Water Works Journal, enero de 1986). Una encuesta telefónica de los hogares produjola información que se presenta en seguida sobre el consumo diario de vasos de agua de 8 onzaspara una muestra de 40 residentes que presentaron síntomas de gastroenteritis durante la epidemia.

Consumo diario de vasos de aguade 8 onzas

O 1-2 3-4 5o más TotalNúmero d.e respondedores con síntomas 6 11 13 10 40

Fuente: Hopkins, R. S. etal., "Gastroenteritis: Case studyofa Colorado outbreak".JournalAmerican Water WorksAssociation, vol. 78, núm. 1,enero de 1986, pág. 42, tabla 1.Copyright © I986, American Water WorksAssociation.Reproducción autorizada.

a. Si el número de respondedores con síntomas no depende de la cantidad de agua consumidadiariamente, asigne probabilidades a las cuatro categorías que se muestran en la tabla.

b. Utilice la información del inciso a para calcular la probabilidad de observar el resultado demuestreo que se presenta en la tabla.

EJERCICIO OPCIONAL

4.45 Para una distribución multinomial con k = 3 y n = 2, verifique que

L P(YI, Yz, Y3) = 1y¡, Yz, Y3

[Sugerencia: Utilice el teorema binomial (vea el ejercicio opcional 4.33) para expandir la suma[a + (b + c)j2, luego sustituya la expansión binomial de (b + c)Z en la expresión resultante. Porúltimo, sustituya a = p¡, b = pz y c = pd

Page 32: 004 Mendenhall

174 Capítulo 4 / Variables aleatorias discretas

4.8 las distribuciones de probabilidadbinomial negativa ygeométrica...................................................................

En muchos casos nos interesará medir el tiempo transcurrido antes de queocurra un evento; por ejemplo, el tiempo que un cliente debe esperar en unafila antes de ser atendido, o el tiempo que tarda en fallar un equipo.

Para esta aplicación, consideramos cada unidad de tiempo como una prue­ba de Bernoulli que puede tener como resultado un éxito (5) o un fracaso (F¡y estudiamos una serie de pruebas idénticas a las que describimos para el ex­perimento binomial (sección 4.6). A diferencia de los experimentos binomialesen los que y es el número total de éxitos, la variable aleatoria de interés aquíes y, el número de pruebas (unidades de tiempo) hasta que se observa el T-ésimoéxito.

La distribución de probabilidad para la variable aleatoria y se conoce comodistribución binomial negativa. La fórmula de esta distribución se presenta enel siguiente recuadro, junto con la media y la varianza de una variable aleatoriabinomial negativa.

Por el recuadro podemos ver que la distribución de probabilidad binomialnegativa es una función de dos parámetros, p y T. Para el caso especial en quer = 1, la distribución de probabilidad de y se denomina distribución de proba­bilidad geométrica.

Page 33: 004 Mendenhall

4.8 / Las distribuciones de probabilidad binomial negativa ygeométrica 175

Para deducir la distribución de probabilidad binomial negativa, observe quecada evento simple que resulte en y pruebas hasta el r-ésimo éxito contendrá(y - r) resultados F y r resultados S, como se muestra aquí:

(y- r) resultados Fy (r-l) resultados S r-ésimo S, ,,.....-"-,

F F S F F ... S F S

El número de eventos simples diferentes que resultan en (y - r) resultados Fantes del r-ésimo resultado S es el número de formas en que podemos acomo­dar los (r - 1) resultados S y los (y - r) resultados F, a saber,

((y - r) + (r - 1)) = (y - 1)

r-l r-l

Entonces, dado que la probabilidad asociada a cada uno de estos eventos sim­ples es prqr--r, tenemos

p(y) = (y - l)prqy-rr - 1

Los ejemplos 4.12 y 4.13 demuestran la aplicación de las distribuciones deprobabilidad binomial negativa y geométrica, respectivamente.

,··., ••••••••••••••••••••••••••••••••••••••• ".,1,.,1111, ••••••

EJEMPLO 4.12

Solución

Para instalar el alojamiento de un motor, un ensamblador de línea de produc­ción debe utilizar una herramienta manual eléctrica para colocar y apretar cua­tro pernos. Suponga que la probabilidad de colocar y apretar un perno encualquier intervalo de tiempo de 1 segundo es p = .8. Si el ensamblador fallaen el primer segundo, la probabilidad de éxito durante el segundo intervalo de1 segundo es .8, y así sucesivamente.

a. Calcule la distribución de probabilidad de y, el tiempo que transcurre antesde instalarse un alojamiento completo.

b. Calcule p(6).

c. Calcule la media y la varianza de y.

a. Puesto que el alojamiento contiene r = 4 pernos, utilizaremos la fórmulapara la distribución de probabilidad binomial negativa. Si sustituimos p = .8Y r = 4 en la fórmula de p(y) obtenemos

p(y) = (~ =t)prqy-r = (y ~ 1)(.8)4(.2)Y-4

Page 34: 004 Mendenhall

176 Capítulo 4 / Variables aleatorias discretas

b. Para calcular la probabilidad de que la operación de ensamblado completarequiera y = 6 segundos, sustituimos y = 6 en la fórmula que obtuvimosen el inciso a y vemos que

p(y) = G)(.8)\2)2 = (10)(.4096)(.04) = .16384

c. Para esta distribución binomial negativa,

r 4 dJL = - = - = 5 segun osp .8

y

2 _ rq _ 4(.2) - 1 25(T - p2 - (.8)2 - .

•••••• 11 ••••••••••••••••••• ,1, ••••••••••••••• " ••••••••••••••••

EJEMPLO 4.13

Solución

Un fabricante utiliza fusibles eléctricos en un sistema electrónico. Los fusiblesse compran en lotes grandes y se prueban secuencialmente hasta que se observael primer fusible defectuoso. Suponga que el lote contiene 10% de fusiblesdefectuosos.

a. ¿Qué probabilidad hay de que el primer fusible defectuoso sea uno de losprimeros cinco fusibles probados?

b. Calcule la media, la varianza y la desviación estándar de y, el número defusibles probados hasta observarse el primer fusible defectuoso.

a. El número y de fusibles probados hasta observarse el primer fusible defec­tuoso es una variable aleatoria geométrica con

p =.1 (probabilidad de que un solo fusible sea defectuoso)

q = 1 - P = .9

y

p(y) = pqy-I (y = 1, 2, ... )= (.1)(.9)r1

La probabilidad de que el primer fusible defectuoso sea uno de los primeroscinco fusibles probados es

P(y:5 5) = p(l) + p(2) + ... + p(5)

= (.1)(.9)° + (.1)(.9)1 + ... + (.1)(.9)4 = .41

b. La media, la varianza y la desviación estándar de esta variable aleatoriageométrica son

1 1p.=-=-=1O

P .1

(T2 = !L =~ = 90p2 (.1)2

(T = y;;:z = v'9O = 9.49

Page 35: 004 Mendenhall

4.8 / Las distribuciones de probabilidad binomial negativa ygeométrica 177

EJERCICIOS...................................................................4.46 Suponga que y es una variable aleatoria binomial negativa. Calcule p(y) para cada una de las siguien­

tes situaciones:a. p= .2, T = 2, Y = 3 b. P=.5, T = 3, Y = 5 c. P= .8, T = 3, Y = 5

4.47 Suponga que y puede modelarse mediante una distribución de probabilidad binomial negativa conp = .6 Y T = 3.a. Calcule p(y) para y = 6, 7, 8 Y9.b. Construya un histograma de probabilidad para p(y).c. Calcule u y u para la distribución de probabilidad.d. Localice los puntos u + 2s y f.1 - 2u en el eje y de la gráfica del inciso b. Calcule P(¡.L - 2u

s y ~ f.1 + Zer).4.48 Sea y una variable aleatoria geométrica con p = .7.

a. Calcule p(y) para y = 1, 2, ... , 5.b. Construya un histograma de probabilidad para p(y).c. Calcule f.1 y 2u para la distribución de probabilidad geométrica.d. Localice los puntos f.1 + Zcr y f.1 - 2u en el eje y de la gráfica del inciso b. Calcule P(¡.L - Za

~ y ~ f.1 + Zcr).

4.49 Se utilizó la distribución binomial negativa para modelar la distribución de parásitos (solitarias)encontrados en varias especies de peces del Mediterráneo (Journal of Fish Biology, agosto de 1990).Suponga que el evento de interés es el hallazgo de un parásito en el sistema digestivo de rodaballos,y sea y el número de rodaballos que es preciso muestrear hasta encontrar una infección por parásitos.Los investigadores estiman la probabilidad de observar un pez infectado en .544. Utilice esta in­formación para estimar las siguientes probabilidades:a. P(y = 3) b. P(y s 2) c. P(y > 2)

4.50 La Administración Nacional de Aeronáutica y el Espacio (NASA) de Estados Unidos estima que laprobabilidad de que falle un "componente crítico" dentro del motor principal de un transbordadorespacial es de aproximadamente 1 en 63 (Tampa Tribune, 3 de diciembre de 1993). La falla de uncomponente crítico durante el vuelo conducirá directamente a una catástrofe del transbordador.a. En promedio, écuántas misiones del transbordador volarán antes de que ocurra una falla de

componente crítico?b. ¿Cuál es la desviación estándar del número de misiones antes de que ocurra una falla de

componente crítico?c. Especifique un intervalo que capture el número de misiones antes de que ocurra una falla de

componente crítico con una probabilidad de aproximadamente .95.

4.51 Los ingenieros ambientales clasifican a los consumidores en una de cinco categorías (véase el ejer­cicio 3.1 para una descripción de cada grupo). Las probabilidades asociadas a cada grupo son:

Marrones básicos .28Verdes leales . 11Verdes billete .11Retoños .26Refunfuñadores .24

Fuente: The Orange County Register,7 de agosto de 1990.

Sea y el número de consumidores que es preciso muestrear antes de encontrar al primer ecologista.[Nota; Según se explica en el ejercicio 3.1, un ecologista es un verde leal, un verde billete o unretoño.]

Page 36: 004 Mendenhall

178 Capítulo 4 / Variables aleatorias discretas....................................................

a. Calcule ¡..t y O; la media y la desviación estándar de y.b. Utilice la información del inciso a para establecer un intervalo con una probabilidad elevada

de incluir a y.

4.52 Refiérase al estudio publicado en Nuclear ScienceandEngineering (ejercicio-l.Hl). Si seliberan partículasneutrales una por una en el dueto evacuado, calcule la probabilidad de que se tengan que liberar más decinco partículas antes de que observemos dos partículas reflejadas por la pared interior del dueto.

4.53 Suponga que el hecho de encontrar petróleo en un sitio de perforación es independiente de en­contrarlo en otro y que, en una región determinada, la probabilidad de éxito en un sitio individuales de .3.a. ¿Qué probabilidad hay de que un perforador encuentre petróleo en su tercera perforación, o

antes?b. Si Y es el número de perforaciones hasta que ocurre el primer éxito, calcule la media y la

desviación estándar de y.c. ¿Es probable que y sea mayor que lO? Explique.d. Suponga que la compañía perforadora cree que una serie de exploración será rentable si el

número de pozos perforados hasta que ocurra el segundo éxito es menor o igual que 7. Calculela probabilidad de que la exploración tendrá éxito.

4.54 Refiérase al ejercicio 4.31. Sea y el número de hombres de 50 años residentes en Utah que seexaminan hasta que se detecta la primera incidencia de cáncer de la tiroides.a. Calcule P(y = 1,000)b. Calcule la media y la varianza de y.c. ¿Es verosímil que y excederá 100,000? Explique.

EjERCl(lO OP(lONAl

4.55 Sea y una variable aleatoria binomial negativa con parámetros r y p. Es posible demostrar quew = y - r también es una variable aleatoria binomial negativa, donde w representa el número defracasos antes de observarse el r-ésimo éxito. Aproveche el hecho de que

rE(y) = ­p y

para demostrar que

E(w) = rq y (T2 = rqp W p2

[Sugerencia: Utilice los teoremas 4.1, 4.2 y 4.3.]

4.9 la distribución de probabilidad hipergeométrica...................................................................Cuando se muestrea de una población finita de éxitos y fracasos (como seríauna población finita de respuestas relativas a las preferencias de los consumi­dores o una colección finita de observaciones en un embarque que contieneproductos fabricados con y sin defectos), los supuestos de un experimento bi.­nomial se satisfacen con exactitud sólo si el resultado de cada prueba se observay luego se reincorpora a la población antes de hacerse la siguiente observación.Este método de muestreo se denomina muestreo con reemplazo. Sin embargo,en la práctica lo usual es utilizar muestreo sin reemplazo, es decir, selecciona-

Page 37: 004 Mendenhall

4.9/ ladistribución de probabilidad hipergeométrica 179

mas al azar n elementos diferentes de entre los N elementos de la población.Como se apuntó en la sección 4.6, cuando N es grande y n/N es pequeño(digamos, menor que .05), la probabilidad de observar un S se mantiene apro­ximadamente constante de una prueba a la siguiente, las pruebas son (en esen­cia) independientes y la distribución de probabilidad del número de éxitos, y,es aproximadamente una distribución de probabilidad binomial. Sin embargo,cuando N es pequeño o n/N es grande (digamos, mayor que .05), seguramentequerremos utilizar la distribución de probabilidad exacta de y. Esta distribución,denominada distribución de probabilidad hipergeométrica, es el tema de estasección. Las cáracterísticas que definen una variable aleatoria hipergeométrica,y su distribución de probabilidad, se resumen en los recuadros.

Page 38: 004 Mendenhall

180 Capítulo 4 I Variables aleatorias discretas

Para derivar la distribución de probabilidad hipergeométrica, primero ob­servamos que el número total de eventos simples en el espacio de muestra es

el número de formas de seleccionar n elementos de N, a saber (~J' Un evento

simple que implica y éxitos es una selección de n elementos en los que y sonS y (n - y) son F. Puesto que hay r resultados S de los cuales escoger, el número

de formas diferentes de seleccionar y de ellos es a = ~J. De forma similar, el

número de formas de seleccionar (n - y) resultados F del total de (N - r) es

b = (N - rJ. Ahora aplicamos el teorema 3.1 para determinar el número den-y

formas de seleccionar y resultados S y (n - y) resultados F, es decir, el númerode eventos simples que implican y éxitos:

Por último, puesto que la selección de cualquier conjunto de n elementos estan probable como la de cualquier otro, todos los eventos simples son equi­probables y, por tanto,

P(y)= Número de eventos simples que implican y éxitos =

Número de eventos simples

••• " ••••• " ••••••••••••••• " ••••••••• "." ••••••••••• 111, •••• ,

EJEMPLO 4.14

Solución

- Se realiza un experimento para seleccionar un catalizador apropiado para laproducción comercial de etilendiamina (EDA), un producto que se utiliza enjabones. Suponga que un ingeniero químico selecciona al azar tres catalizadorespara probarlos de entre un grupo de 10 catalizadores, seis de los cuales tienenbaja acidez y cuatro de los cuales son muy ácidos.

a. Calcule la probabilidad de que no se escogerá un catalizador muy ácido.

b. Calcule la probabilidad de que se escoja exactamente un catalizador muyácido.

Sea y el número de catalizadores de alta acidez seleccionados. Entonces, y esuna variable aleatoria hipergeométrica con N = 10, n = 3, r = 4 y

Page 39: 004 Mendenhall

4.9 I La distribución de probabilidad hipergeométrica 181

b (1) = (i)(n = (4)(15) = l. p e~) 120 2

..........................

11 ••• 11 ••••••••••••••••••••••••••••••••• 1111 ••••••••• , •••••••• 1

EJEMPLO 4.15

Solución

Refiérase al experimento con EDA, ejemplo 4.14.

a. Calcule 11, a 2 y a para la variable aleatoria y.

b. Calcule P{jl - 2a < y < 11 + 20}. Compare este resultado con la ReglaEmpírica.

a. Puesto que y es una variable aleatoria hipergeométrica con N = 10, n = 3Y r = 4, la media y la varianza son

= nr = (3)(4) = 1 2JL N 10 .

2 _ r(N - r)n(N - n) _ 4(10 - 4)3(10 - 3)u - N2(N - 1) - (10)2(10 - 1)

= (4)(6)(3)(7) = 56(100)(9) .

La desviación estándar es

u = \f56 = .75

b. La distribución de probabilidad y el intervalo 11 ± 20; es decir -.3 a 2.7, semuestran en la figura 4.6. El único valor posible de y que cae fuera delintervalo es y = 3. Por tanto,

. G)(~)P(JL - La < y < JL + 2u) = 1 - P(3) = 1 - en

4= 1 - 120 = .967

Page 40: 004 Mendenhall

182 Capítulo 4/ Variables aleatorias discretas

.40

.50

.20

_lLy

o 1 I 2 I 3

-20"~1-20"~

p(y)

.30

.10

FIGURA 4.6 ~Distribución de probabilidad parayen el ejemplo 4.15

Según la Regla Empírica, esperaríamos que alrededor de 95% de las y ob­servadas cayeran en este intervalo. Por tanto, la Regla Empírica proporcionauna estimación aceptable de esta probabilidad.

. .•••• 11 •• 11 ••••••••••••••••••••••••••••••••••••••• 11.11.11 ••••• 1

EJEMPLO 4.16 Refiérase al ejemplo 4.14. Calcule la media, 11, de la variable aleatoria y.

Solución Por la definición 4.4,

". ~ E(y) ~ ¿ yp(y) ~ ±y(;)\;0: ,)today y=o

Si utilizamos los valores de p(y) que calculamos en los ejemplos 4.14 y 4.15, y

P(2) = (1) (n = (6)(6) = ~120 120 10

obtenemos la sustitución:

¡..L = OP(O) + lp(l) + 2P(2) + 3p(3)

= O + 1G) + 2({0) + 3(310)=

1.2

Observe que éste es el valor que obtuvimos en el ejemplo 4.15 aplicando lafórmula dada en el recuadro anterior.

..........................

Page 41: 004 Mendenhall

4.9 / La distribución de probabilidad hipergeométrica 183

EJERCICIOS...................................................................4.56 Suponga que y es una variable aleatoria hipergeométrica con N = 12, n = 8 Y r = 7.

a. Presente la distribución de probabilidad para y en forma tabular.b. Calcule P(y < 3).c. Calcule P(y ~ 5).d. Calcule 11 y a para y.e. Grafique p(y) y localice 11 y el intervalo 11 ± La en la gráfica.f. ¿Qué probabilidad hay de que y caiga en el intervalo 11 ± 2a?

4.57 Suponga que y es una variable aleatoria hipergeométrica. Calcule p(y) para cada uno de los siguientes casos:a. N = 5, n = 3, r = 4, Y = 1 b. N = 10, n = 5, r = 3, Y = 3c. N = 3, n = 2, r = 2, Y = 2 d. N = 4, n = 2, r = 2, Y = O

4.58 Los "puntos cálidos" son áreas geográficas ricas en especies (véase el ejercicio 3.7). Un estudiopublicado en Nature (septiembre de 1993) estimó en .70 la probabilidad de que una especie deave en Gran Bretaña habite en un punto cálido de mariposas. Considere una muestra aleatoria de 4especies de ave británicas seleccionadas de un total de 10 especies marcadas. Suponga que 7 delas 10 especies marcadas habitan en un punto cálido de mariposas.a. ¿Qué probabilidad hay de que exactamente la mitad de las 4 especies de ave muestreadas

habiten en un punto cálido de mariposas?b. ¿Qué probabilidad hay de que al menos una de las 4 especies de ave muestreadas habiten en

un punto cálido de mariposas?

4.59 Con base en datos suministrados por el Departamento de Salud y Recursos Humanos de EstadosUnidos, U.S. News & World Report (28 de septiembre de 1992) estima que uno de cada cinco tras­plantes de riñón falla en menos de un año. Suponga que exactamente 3 de los siguientes 15 trasplantesde riñón fallarán en menos de un año. Considere una muestra aleatoria de tres de estos 15 pacientes.a. Calcule la probabilidad de que los tres trasplantes muestreados fallen en menos de un año.b. Calcule la probabilidad de que por lo menos uno de los tres trasplantes muestreados fallen en

menos de un año.

4.60 Refiérase al ejercicio 4.29. Según se informó en IEEEComputerApplicationsin Power (abril de 1990), unsistema de vigilancia de vídeo computarizado automático detectó 7 de 10 intrusos cuando estaba nevan­do. Suponga que dos de los intrusos tenían intenciones criminales. ¿Qué probabilidad hay de que ambosintrusos hayan Sido detectados por el sistema?

4.61 Suponga que va a comprar lotes pequeños de tubos de rayos catódicos (CRT) para terminales decomputadora. Puesto que el costo de probar un CRT es muy elevado, puede ser deseable probaruna muestra de CRT del lote en lugar de todos los CRT del lote. Un plan de muestreo semejantese basaría en una distribución de probabilidad hipergeométrica. Por ejemplo, suponga que cadalote contiene siete CRT. Usted decide muestrear tres CRT de cada lote y rechazar el lote si observauno o más CRT defectuosos en la muestra.a. Si el lote contiene un CRT defectuoso, équé probabilidad hay de que usted acepte el loté?b. ¿Qué probabilidad hay de que usted acepte el lote si contiene tres CRT defectuosos?

4.62 Un equipo de trabajo establecido por la Agencia de Protección Ambiental de Estados Unidos pro­gramó visitas a 20 empresas industriales para investigar la posibilidad de violaciones a los regla-,mentas para el control de la contaminación. Sin embargo, los recortes presupuestales han reducidodrásticamente el tamaño del equipo de trabajo, por lo que sólo podrán investigar tres de las 20empresas. Si se sabe que cinco de las firmas están operando realmente sin cumplir con los regla­mentos, calcule la probabilidad de que:a. En ninguna de las tres empresas muestreadas se encuentren violaciones a los reglamentos.b. En las tres empresas investigadas se encuentren violaciones a los reglamentos.

Page 42: 004 Mendenhall

184 Capítulo 4/ Variables aleatorias discretas

c. Al menos una de las tres empresas estará operando en contravención de los reglamentos parael control de la contaminación.

4.63 Un artículo en The American Siatistician (mayo de 1991) describió el empleo de la probabilidaden una operación para atrapar a traficantes de cocaína. Agentes de la policía de una ciudad deFlorida de mediano tamaño habían confiscado 496 paquetes envueltos en papel metálico durantela captura de ciertos traficantes de drogas. A fin de probar la culpabilidad de los traficantes, lapolicía tenía que demostrar que los paquetes contenían cocaína pura. En consecuencia, el labora­torio de policía seleccionó al azar y analizó químicamente cuatro de los paquetes. Los cuatro dieronresultados positivos para cocaína. Este resultado condujo a que se declarara culpables a los trafi­cantes.a. De los 496 paquetes confiscados, suponga que 331 contenían cocaína pura y 165 contenían un

polvo inerte (legal). Calcule la probabilidad de que cuatro paquetes escogidos al azar denresultados positivos en un ensayo de cocaína.

b. La policía utilizó los 492 paquetes restantes (es decir, los que no se ensayaron) en una operaciónpara atrapar a los involucrados. Se seleccionaron al azar dos de los 492 paquetes, mismos queagentes disfrazados vendieron a un comprador. Sin embargo, entre la venta y el arresto elcomprador logró deshacerse de las pruebas. Dado que cuatro de los 496 paquetes originalesdieron resultados positivos en un ensayo de cocaína, équé probabilidad hay de que los dospaquetes vendidos en la operación de captura no hayan contenido cocaína? Suponga que lainformación proporcionada en el inciso a es correcta.

c. El artículo de The American Statistician demuestra que la probabilidad condicional del incisob se maximiza cuando de los 496 paquetes originales 331 contienen cocaína pura y 165 con­tienen polvo inerte. Vuelva a calcular la probabilidad del inciso b suponiendo que 400 de los496 paquetes originales contienen cocaína.

nr( r - 1) (N - 1 - (r - 1))N Y - 1 n - 1 - (y - 1)

(N- 1)n - 1

~JER(I(IO OPCIONAL

4.64 Demuestre que la media de una variable aleatoria hipergeométrica es ¡.L = nr/N. [Sugerencia:muestre que

yG)(~~;)---'-'--'----7--;--'-"- =

(~)y luego utilice el hecho de que

De-

(r - 1) (N - 1- (r - 1))y - 1 n - 1 - (y - 1)

(~=nes la distribución de probabilidad hipergeométrica para z = (y - 1), donde z es el número deresultados S en (n - 1) pruebas, con un total de (r - 1) resultados S en (N - 1) elementos.]

4.10 La distribución de probabilidad de Poisson...................................................................La distribución de probabilidad de Poisson, así llamada en honor del mate­mático francés S. D. Poisson (1781-1840), proporciona un modelo para la fre­cuencia relativa del número de "eventos poco comunes" que ocurren en unaunidad de tiempo, área, volumen, etc. El número de trabajos nuevos presen-

Page 43: 004 Mendenhall

4.10/ La distribución de probabilidad de Poisson 185

tados a una computadora en un minuto dado, el número de accidentes fatalespor mes en una planta de fabricación y el número de defectos visibles en undiamante son variables cuyas distribuciones de frecuencia relativas se puedenaproximar bien con distribuciones de probabilidad de Poisson. Las caracterís­ticas de una variable aleatoria de Poisson se enumeran en el recuadro.

Las fórmulas para la distribución de probabilidad, la media y la varianzade una variable aleatoria de Poisson se muestran en el siguiente recuadro. Ellector observará que en la fórmula interviene la cantidad e = 2.71828 ... , labase de los logaritmos naturales. En la tabla 2 del apéndice 11 se dan valoresde e-Y, que son necesarios para calcular los valores de p(y).

La forma de la distribución de Poisson cambia conforme cambia su medía,)1,. Este hecho se ilustra en la figura 4.7, que muestra histogramas de frecuenciarelativa para una distribución de Poisson con ).l = 1, 2, 3 y 4.

Page 44: 004 Mendenhall

186 Capítulo 4/ Variables aleatorias discretas....................................................

FIGURA 4.7 ~p(y)

.36Histogramas para la distribución .33

de Poisson con f1. = 1,2,3 Y4 '".30

.::: .27'¡;j .241! .21.~ .18

~ .15.12e .09~

.06

.03Yo 2 3 4 5 6 7 8 9 10 II 12

a.JI = 1

p(y)

.26

.24

.22'" .20.::: .18'¡;j

1! .16

'" .14'0<:: .128 .10e .08~ .06

.04

.02

9Y

b.JI =2o 2 3 4 5 6 7 8 10 II 12

p(y)

.22

'".20

.> .181ií .161! .14'""g .12

~.10.08

~ .06.04.02

2 4 8 9 IIY

e.JI =3o 3 5 6 7 10 12

p(y)

.18

'" .16>1ií .141! .12.; .10

.08

.06e .04~

.02

2 3 8 10 12Y

O 4 5 6 7 9 IId.JI =4

Page 45: 004 Mendenhall

4.10 / La distribución de probabilidad de Poisson 187

111 •••••••••••••••••••••••••• 11 ••••• 11 •••••• 11 •••••• , ••••••• 1 ••

EJEMPLO 4.17 Suponga que el número y de grietas por espécimen de concreto con cierto tipode mezcla de cemento tiene una distribución de probabilidad de Poisson apro­ximada. Además, suponga que el número medio de grietas por espécimen esde 2.5.

a.

b.

c.

d.

Solución a.

Calcule la media y la desviación estándar de y, el número de grietas porespécimen de concreto.

Calcule la probabilidad de que un espécimen de concreto escogido al azartenga exactamente cinco grietas.

Calcule la probabilidad de que un espécimen de concreto escogido al azartenga dos o más grietas.

Calcule P(,u - 20" < y < Jl + 2a). ¿El resultado concuerda con la ReglaEmpírica?

Tanto la media como la varianza de una variable aleatoria de Poisson soniguales a A. Por tanto, en este ejemplo,

¡.L = A = 2.5 0'2 = A = 2.5

Entonces, la desviación estándar es

O' = v'T5 = 1.58

b. Queremos conocer la probabilidad de que un espécimen de concreto tengaexactamente cinco grietas. La distribución de probabilidad de y es

AYe-A.p(y) = T

Entonces, dado que A = 2.5, y = 5 Y e-2.5 = .082085 (de la tabla 2 delapéndice 11),

(5) = (2.5)5e- 2. 5 = (2.5)\ 082085) = 067p 5! 5 . 4 . 3 • 2 • 1 .

c. Para determinar la probabilidad de que un espécimen de concreto tengados o más grietas necesitamos calcular

P(y 2: 2) = p(2) + P(3) + p(4) + ... = L p(y)y=2

Si queremos calcular la probabilidad de este evento, es preciso considerarel evento complementario. Así,

P(y 2: 2) = 1 - P(y :s; 1) = 1 - [p(O) + P(l)](2.5)Oe- 2.5 (2.5)ie- 2. 5

= 1 - 01 - 11

= 1 _ 1(.082085) _ 2.5(.082085)1 . 1

= 1 - .287 = .713Según nuestro modelo de Poisson, la probabilidad de que un espécimen der.nn¡:r~tn t~nJ!a .dos n má~)!J~ta~~sd.e.]J 3. ...~ ...

~- ~~~~~~~~=~~--=-;~~:-:::~'-~-~~=~--~~~~~~~,-~~--~ r» - ~- -- ---:=-~~~~~~~ -

Page 46: 004 Mendenhall

188 Capítulo 4 / Variables aleatorias discretas

fiGURA 4.8 ~Distribución de probabilidad dePoisson para yen el ejemplo 4.17

p(y)

.30

98

.20

-,--l--I:::I::::J:::::::I:=:L.-l- Y

-11 O 1 2 Ji 3 4 5 16

r-2a~2a--l

d. La distribución de probabilidad de y se muestra en la figura 4.8 para valoresde y entre Oy 9. Se indican la media 11 = 2.5 Y el intervalo 11 ± Za, o sea-.7 a 5.7. En consecuencia, P(.u - 2a < y < 11 + Zcr) = P(y ~ 5). Estaprobabilidad está sombreada en la figura 4.8.

Las probabilidades p(O), p(1), ... , p(5) se pueden calcular y sumarigual que en el inciso c. Sin embargo, utilizaremos una tabla de probabilida­des de Poisson acumulativas para obtener la suma. La tabla 3 del apéndice 11proporciona la sumatoria parcial, :E~ = o P(y), para diferentes valores de lamedia de Poisson A. Para A = 2.5, la sumatoria ~=o P(y), = p(O) + p(l)+ ... + p(5) es .9581 según la tabla. Entonces, P(y ~ 5) = .9581; observeque esta probabilidad concuerda con la aproximación de la Regla Empíricade .95. . .

La distribución de probabilidad de Poisson está relacionada con una dis­tribución de probabilidad binomial cuando n es grande y 11 = np es pequeña,digamos np ~ 7, Y puede utilizarse como aproximación. La demostración deeste hecho rebasa el alcance del presente texto, pero se puede encontrar enFeller (1968) .

.... ' .. , " .EJEMPLO 4.18 Sea y una variable aleatoria binomial con n = 25 YP = .1.

a. Utilice la tabla 1 del apéndice 11 p<lra determinar el valor exacto de P(y ~ 1).

b. Obtenga la aproximación de Poisson a P(y a 1). [Nota: Aunque preferiría­mos comparar la aproximación de Poisson a probabilidades binomiales paravalores más grandes de n, estamos restringidos en este ejemplo por las li­mitaciones de la tabla 1.]

Page 47: 004 Mendenhall

Solución

4.10 / La distribución de probabilidad de Poisson 189

a. De la tabla 3 del apéndice 11, con n = 25 YP = .1, tenemos

I

P(y:5 1) == L p(y) == .271y=o

b. Puesto que n = 25 YP= .1, aproximaremos p(y) utilizando una distribuciónde probabilidad de Poisson con media de

A == np == (25)(.1) == 2.5

Localizamos A = 2.5 en la tabla 3 del apéndice 11 y obtenemos la sumatoriaparcial

I

P(y:5 1) == L p(y) == .2873y=o

Esta aproximación, .2873, al valor exacto de P(y :S 1) = .271 es razonable­mente buena si consideramos que el procedimiento de aproximación porlo común se aplica a distribuciones de probabilidad binomiales en las quen es mucho mayor que 25. . .

11 ••••••••••••••••••••• 11 •••••••••••••••••••• 111 •••••••••••••••

EJEMPLO 4.19

Solución

EJERCICIOS

Demuestre que el valor esperado de una variable aleatoria de Poisson es A.

Por la definición 4.4, tenemos

00 Ay-ÁE(y) == L yp(y) == L Y_ye,

toda)' y=o·

El primer término de esta serie es igual a O porque y = O. Por tanto,

~ yAYe-Á ~ AYe-Á ~ A' Ay-le-ÁE(y) == L.J -- == L.J == L.J

y=o y! yw l (y - 1)! y=1 (y - 1)!

Si sacamos la constante A de la sumatoria por factorización y hacemosz = (y - 1), obtenemos

00 AZ -Á 00

E(y) == A L _e_, == A L p(z)z=o z. z=o

donde z es una variable aleatoria de Poisson con una media de A. Entonces,

E(y) == A L p(z) == A(l) == Az=o

...................................................................4.65 Suponga que y es una variable aleatoria para la cual una distribución de probabilidad de Poisson

con A = 5.5 constituye una buena caracterización.a. Grafique p(y) para y = O, 1, 2, ... , 9, 10.b. Calcule J.1 y O- para la variable aleatoria y y localice J.1 y el intervalo J.1 ± 20- en la gráfica del inciso a.c. ¿Qué probabilidad hay de que y caiga dentro del intervalo J.1 ± 20-?

Page 48: 004 Mendenhall

190 Capítulo 4 / Variables aleatorias discretas

4.66 Suponga que y es una variable aleatoria para la cual una distribución de probabilidad de Poissonconstituye una buena caracterización. Calcule lo siguiente:a. P(y ~ 2), cuando A = 2 b. P(y = 1), cuando A = 5c. P(y ~ 1), cuando A = 3 d. P(y = O), cuando A = 9

4.67 Refiérase al estudio publicado en Science (abril de 1993) relativo a las propiedades espectroscópicasde los asteroides de la franja principal (ejercicio 2.1O). Las investigaciones revelaron que, en pro­medio, se observan 2.5 exposiciones de imagen espectral independientes por asteroide.a. Suponiendo una distribución de Poisson, calcule la probabilidad de observar exactamente una

exposición de imagen espectral independiente durante la observación de un asteroide de lafranja principal.

b. Suponiendo una distribución de Poisson, calcule la probabilidad de observar cuando más dosexposiciones de imagen espectral independientes durante la observación de un asteroide de lafranja principal.

c. ¿Esperaría usted observar siete o más exposiciones de imagen espectral independientes durantela observación de un asteroide de la franja principal? Explique.

4.68 Un estudio reciente de movimientos naturales del talud rocoso en las Rocallosas canadienses durantelos últimos 5,000 años reveló que el número de avalanchas importantes por cada 100 kilómetroscuadrados tenía un valor esperado de 1.57 (Canadian Geotechnical [outnal, noviembre de 1985).a. Calcule la media y la desviación estándar de y, el número de avalanchas importantes por cada

100 kilómetros cuadrados en las Rocallosas canadienses durante un periodo de 5,000 años.b. ¿Qué probabilidad hay de observar tres o más avalanchas importantes en un área de 100 kiló­

metros cuadrados durante un periodo de 5,000 años?

4.69 La variable aleatoria y, el número de automóviles que llegan a una intersección durante un periodoespecífico, a menudo posee una distribución de probabilidad de Poisson (aproximada). Si se conocela tasa media de llegada A, la distribución de probabilidad de Poisson puede servir para ayudar aun ingeniero de tránsito a diseñar un sistema de control del tráfico. Suponga que estima en unautomóvil por minuto el número medio de llegadas a la intersección.a. ¿Qué probabilidad hay de que en un minuto dado el número de llegadas sea de tres o más?b. ¿Puede usted asegurar al ingenieroque el número de llegadas casi nunca será mayor que tres por minuto?

4.70 La Agencia de Protección Ambiental de Estados Unidos (EPA) ha establecido normas nacionalespara la calidad del aire en un esfuerzo por controlar la contaminación de éste. Actualmente, ellímite de la EPh .para los niveles de ozono en el aire es de 12 partes por cien millones (pphm).Un estudio de 1990 examinó la tendencia a largo plazo en los niveles de ozono en Houston, Texas. *Una de las variables de interés es y, el número de días en un año en los que el nivel de ozonoexcede el umbral de 12 pphm de la EPA. Se estima que el número total de rebases del umbral enun año es de 18. Suponga que la distribución de probabilidad de y se puede modelar con la dis­tribución de Poisson.a. Calcule P(y ~ 20).b. Calcule P(5 ~ Y s 10).c. Estime la desviación estándar de y. ¿Dentro de qué intervalo esperaría usted que estuviera y

en un año dado?d. El estudio reveló una tendencia decreciente en el número de rebases del nivel de umbral de

la EPA en los últimos años. Los valores observados de y para los últimos 6 años fueron 24, 22,20,15,14 y 16. Explique por qué esta tendencia pone en entredicho la validez de la distribuciónde Poisson como modelo para y. [Sugerencia: Considere la característica #3 de las variablesaleatorias de Poisson.]

• Shively, Thomas S., HAn Analysis of the Trend in Ozone Using Nonhomogeneous Poisson Processes". Artículopresentado en la reunión anual de la American Statistical Association, Anaheim, Calif., agosto de 1990.

Page 49: 004 Mendenhall

4.10 I La distribución de probabilidad de Poisson 191

4.71 La industria nuclear ha hecho un esfuerzo concertado por reducir significativamente el número dedesactivaciones rápidas de emergencia no planeadas de los reactores nucleares, llamadas scrams.Hace una década, el número anual medio de scrams no planeados en reactores nucleares estadou­nidenses fue de cuatro (véase el ejercicio 2.47). Suponga que el número anual de scrams no pla­neados que ocurren en un reactor nuclear sigue, aproximadamente, una distribución de Poisson.a. Si la media no ha cambiado, calcule la probabilidad de que un reactor nuclear experimente 10

o más scrams no planeados este año.b. Suponga que un reactor nuclear escogido al azar en realidad experimenta 10 o más scrams no

planeados este año. ¿Qué puede usted inferir acerca del número anual medio real de scramsno planeados? Explique.

4.72 Refiérase al informe del American [ournal of Public Health (AJPH) sobre muertes por accidentesde tránsito en autopistas interestatales rurales (ejercicio 3.29). Un año antes del informe del AJPH,la Asociación Estadounidense de Automóviles (AAA) patrocinó un análisis del efecto del límite de65 mph en el estado de Indiana. El estudio de la AAA reveló que en ese estado hubo en promedio90 decesos al año en autopistas interestatales rurales. Para un año dado, Zen qué intervalo esperaríausted que cayera el número de muertes por accidentes en autopistas interestatales rurales en 19­diana?

4.73 Se utiliza la tasa de descarga (o respuesta) de las fibras nerviosas auditivas [registrada como elnúmero de picos por 200 milisegundos (ms) de una ráfaga de ruido] para medir el efecto deestímulos acústicos sobre el nervio auditivo. Un estudio empírico de las tasas de respuesta delnervio auditivo en gatos arrojó una media de 15 picos/m s (Joumal of the Acoustical Society ófAmerica, febrero de 1986). Sea y la tasa de respuesta de las fibras del nervio auditivo de un gatoescogido al azar entre los que intervinieron en el estudio.a. Si y es aproximadamente una variable aleatoria de Poisson, calcule la media y la desviación

estándar de y.b. Suponiendo que y es Poisson, équé probabilidad aproximada hay de que y exceda 27 picos/ms?c. En el estudio se determinó que la varianza de y era "considerablemente menor" que 15 picos/ms.

¿Es razonable esperar que y siga un proceso de Poisson? ¿Cómo afectará esto la probabilidad calcu­lada en el inciso b?

4.74 El benceno, un disolvente comúnmente utilizado para sintetizar plásticos y que se encuentra enproductos de consumo como removedores de pintura y gasolina de alto octano sin plomo, ha sidoclasificado por, los científicos como agente causante de leucemia. Sea y el nivel (en partes pormillón) de benceno en el aire en una planta petroquímica. Entonces y puede adoptar los valoresO, 1,2, 3, ... , 1,000,000 y aproximarse mediante una distribución de probabilidad de Poisson. En1978, el gobierno federal de Estados Unidos bajó el nivel máximo permisible de benceno en el airede los lugares de trabajo de 10 partes por millón (ppm) a 1 ppm. Cualquier industria que violeestas normas gubernamentales está sujeta a castigos severos, incluida la implementación de medidascostosas para reducir el nivel de benceno.a. Suponga que el nivel medio de benceno en el aire en las plantas petroquímicas es de /l = 5

ppm. Calcule la probabilidad de que una planta petroquímica exceda la norma gubernamentalde 1 ppm.

b. Repita el inciso a, suponiendo que /l = 2.5 ppm.c. En el Florida Times-Union (2 de abril de 1984) se informó de un estudio de la Gulf Oil que

reveló que 88% de las industrias que utilizan benceno exponen a sus trabajadores a 1 ppm omenos del disolvente. Suponga que muestrea al azar 55 de las industrias que utilizan bencenoen el país y determinó y, el número de las que violan las normas gubernamentales. Utilice laaproximación de la distribución de Poisson a la distribución binomial para calcular la proba­bilidad de que ninguna de las industrias muestreadas esté violando las normas gubernamentales.Compare esta probabilidad con la probabilidad exacta calculada empleando la distribución deprobabilidad binomial. (Puede calcular la probabilidad binomial con una calculadora de bolsillo.)

Page 50: 004 Mendenhall

192 Capítulo 4 / Variables aleatorias discretas

d. Refiérase al inciso c. Utilice el hecho de que 88% de las industrias que utilizan benceno exponena sus trabajadores a 1 ppm o menos de benceno para aproximar 11, el nivel medio de bencenoen el aire en dichas industrias. [Sugerencia: Busque en la tabla 4 del apéndice II el valor de 11que produzca el valor de P(y s 1) más cercano a .88.]

EJERCICIOS OPCIONALES

4.75 Demuestre que para una variable aleatoria de Poisson y,a. O:s p(y) :s 1b. 00

2: p(y) = 1y=o

c. E( y2) = A2 + A

[Sugerencia: Deduzca primero el resultado E[y(y - 1)] = ,1.2 del hecho de que

00 AY -A 00 Ay-2 -A 00 Az-A

E[y(y - 1)] = ~o y(y - 1)+ = A2 Y~2 (y _e 2)! = A2 t:o +

Luego aplique el resultado E[y(y - 1)] = E(y2) - E(y).]4.76 Demuestre que para una variable aleatoria de Poisson, y, dl = ,1.. [Sugerencia: Utilice el resultado del

ejercicio 4.75 yel teorema 4.4.]

4.11 Momentos yfunciones que generan momentos (opcional)...................................................................Los momentos de una variable aleatoria pueden servir para describir totalmentesu distribución de probabilidad.

El lector ya conoció dos momentos importantes de las variables aleatorias.La media de una variable aleatoria es ¡JI = 11 Yla varianza es 112 = d. Podemosutilizar otros momentos alrededor del origen o alrededor de la media para medirla falta de simetría o la tendencia de una distribución a tener un pico grandecerca del centro. De hecho, si existen todos los momentos de una variablealeatoria discreta, definen totalmente su distribución de probabilidad. Este he-

Page 51: 004 Mendenhall

4.11 / Momentos yfunciones que generan momentos (opcional) 193

cho a menudo se utiliza para demostrar que dos variables aleatorias tienen lasmismas distribuciones de probabilidad. Por ejemplo, si dos variables aleatoriasdiscretas, x y y, poseen momentos alrededor del origen, P'Ix, p~x> p~x> ... yP;y, P~y, P~y, ... , respectivamente, y si todos los momentos correspondientesson iguales, es decir, P;x = P;y> P;x = P;y> etc., entonces las dos distribuciones deprobabilidad discretas, p(x) y p(y), son idénticas.

Los momentos de una variable aleatoria discreta se pueden calcular direc­tamente utilizando la definición 4.7, pero como indican los ejemplos 4.10 y4.19, sumar las series necesarias para obtener E(y), E(/), etc., puede ser tedioso.En algunos casos se puede facilitar el cálculo de los momentos de una variablealeatoria utilizando la función generadora de momentos de dicha variable.

La función generadora de momentos de una variable aleatoria discreta noes más que una expresión matemática que condensa todos los momentos enuna sola fórmula. Para extraer momentos específicos de ella, primero observa­mos que, por la definición 4.9,

E(ety) = L etyp( y)toda y

donde

Entonces, si p', es finita para i = 1, 2, 3, 4, ... ,

m(t) = E(ety) = ¿ etyp(y) = L [1 + ty + (ty:z + (t

y:3 + .. ']P(y)toda)' toda)' 2. 3.

t~Jp(y) + typ(y) + ~>Zp(y) + ~>3P(y) + ...]

Ahora aplicamos los teoremas 4.2 y 4.3 para obtener

'" '" t Zm(t) = t~/(y) + t l~/P(y) + 2! t~/zp(y) + ...

Sin embargo, por la definición 4.7, L ykP(y) = f.L~. Por tanto,todo y

( ) li t Z I t3

I

m t = + tILI + 2! ILz + 3! IL3 + ...

Page 52: 004 Mendenhall

194 Capítulo 4 / Variables aleatorias discretas

Esto indica que si contamos con la función generadora de momentos de unavariable aleatoria y podemos expandirla a una serie de potencias en t, es decir,

m(t) = 1 + a¡t + a2t2 + a3t3 + ...

entonces se sigue que el coeficiente de t será p; =u, el coeficiente de t2 será/1; / 2! y, en general, el coeficiente de t k será /1~ / k!

Si no resulta fácil expandir m(t) a una serie de potencias en t, podemosobtener los momentos de y diferenciando m(t) respecto a t y haciendo luegot = O. Así,

dm(t) d(l I t2

I t3

I )-- = - + t!J-¡ + -!J-2 + -!J-3 + ...dt dt 2! 3!

(O I 2t I 3t2I )= + !J-¡ + 2!!J-2 + l!!J-3 + ...

Haciendo t = O, obtenemos

dm(t)] (' O O ) I-- =!J-¡ + + +... =!J-¡ = !J-dt t=O

Si sacamos la segunda derivada de m(t) respecto a t obtenemos

d2m(t) (O I 3! I )---¡¡¡z = + !J-2 + 3!t!J-3 + ...

Si después hacemos t = O, queda

d2m(t)] (' O O ) I--2- =!J-2 + + +... =!J-2

dt t=O

El teorema 4.5 describe la forma de extraer /1~ de la función generadora demomentos m(t).

A fin de ilustrar el empleo de la función generadora de momentos, consi­deremos los siguientes ejemplos.

EJEMPLO 4.20

Solución

Deduzca la función generadora de momentos para una variable aleatoria bino­mial.

La función generadora de momentos está dada por

m(t) = E(ety) = i etyp(y) = i ety(n)pYqn- y = i (n)(pet)Yqn- yy=o y=o Y y=o Y

Page 53: 004 Mendenhall

4.11 / Momentos yfunciones que generan momentos (opcional) 195

Recordemos ahora el teorema binomial (véase el ejercicio opcional 4.33):

(a + b)n = ±(n)aYbn- yy=o y

Si hacemos a = pe! y b = q, obtenemos el resultado deseado:

m(t) = (pet + q)n

..........................

11 ••••••• " •••••••••• ,1, •••••••••••••••• ,1, •••••••••••• " ••••••

EJEMPLO 4.21

Solución

EJEMPLO 4.22

Solución

Utilice el teorema 4.5 para deducir ¡.t'l = J.l Y J.lz para la variable aleatoria bino­mial.

Por el teorema 4.5,

JL\ = JL = dm(t)] = n(pet + q)n-I(pe t)]dt t=O t=O

= n(peO+ q)n-l(peO)

Pero eO = l. Por tanto,

JL\ = JL = n(p + q)n-Ip = n(1)n-Ip = nb

De forma similar,

d2m(t)] d _ ]JLz = -2- = np-[et(pet + q)n 1]dt t=O dt t=O

= np[et(n - l)(pet + q)n-Zpet + (pet + q)n-Iet]l=o

= np[(l)(n - l)(l)p + (1)(1)] = np[(n - l)p + 1]

= np(np - p + 1) = np(np + q) = nZpz + npq

Utilice los resultados del ejemplo 4.21, junto con el teorema 4.4, para deducirla varianza de una variable aleatoria binomial.

Por el teorema 4.4,

0'2 = E( yZ) - JLz = JLz - (JLD2

Si sustituimos los valores de pz y PI = J.l del ejemplo 4.21, tenemos

0'2 = n2p2 + nbq - (np)Z = npq

..........................

Page 54: 004 Mendenhall

196 Capítulo 4 / Variables aleatorias discretas

Variable aleatoria p(y) f.L a 2 m(t)

Bemoulli p(y) = pYql-Y P pq pet + qdonde q = 1 - p, y = 0, 1

Binomial p(y) = (~)pyqn-Y np npq (pe! + q)n

donde q = 1 - Py = 0, 1, ... , n

G)(~ ~;) nr r(N - r)n(N - n)Hipergeométrica p(y) =

(~)N NZ(N - 1) Noseda

Poisson,\.l'e-A

Á eA(e'-l)P(Y)=T

y = 0, 1, 2, ...

Geométrica p(y) = P(l - W- 1 1 1 - P pet- ----¡;z 1 - (1 - p)e/

Y = 1,2, ...p

p(y) = (y - l)pr(l - W-r r r(l - p) ( pe! )'Binomial - pZ 1 - (l - p)e/negativa

r - 1 PY = r, r + 1, ...

Multinomial n' np¡(l - Pi)P(YI' yz, ... , ») = -,-'-,-, (p¡)Yl(pZ)Y2 ... (Pk)Y' np, NosedaYI-Yz.Y3·

Como se demostró' en los ejemplos 4.21 y 4.22, es más fácil utilizar lafunción generadora de momentos para obtener P'I y P; de una variable aleatoriabinomial gue calcular P'I = E(y) YP; = E(y2) por separado. Basta con obtenerla sumatoria de una sola serie para calcular m(t). Éste también es el mejormétodo para calcular ¡il y P; de muchas otras variables aleatorias, pero no de

•. todas.Las distribuciones de probabilidad, medias, varianzas y funciones genera­

doras de momentos para algunas variables aleatorias discretas útiles se resumenen la tabla 4.7.

EJERCICIOS

4.77 Deduzca la función generadora de momentos para la variable aleatoria de Poisson. [Sugerencia:Escriba

Page 55: 004 Mendenhall

Ejercicios suplementarios 197

Después, observe que la cantidad que se está sumando es una probabilidad de Poisson con parámetroAet

. ]

4.78 Utilice el resultado del ejercicio 4.77 para deducir la media y la varianza de la distribución de Poisson.

4.79 Utilice la función generadora de momentos dada en la tabla 4.7 para deducir la media y la varianzade una variable aleatoria geométrica.

4.12 Resumen...................................................................En este capítulo presentamos los conceptos de eventos numéricos y variablesaleatorias discretas. Una variable aleatoria es una regla que asigna uno y sóloun valor de una variable y a cada evento simple del espacio de muestra. Sedice que una variable aleatoria es discreta si puede asumir sólo una cantidadde valores susceptible de ser contada.

La distribución de probabilidad de una variable aleatoria discreta es unatabla, gráfica o fórmula que proporciona la probabilidad asociada a cada valorde y. El valor esperado E(y) = f..l es la media de esta distribución de proba­bilidad y E [(y - f..l )2] = d es su varianza.

Se presentaron siete variables aleatorias discretas -la de Bernoulli, labinomial, la multinomial, la binomial negativa, la geométrica, la hipergeomé­trica y la de Poisson- junto con sus distribuciones de probabilidad. Señala­mos las características físicas de los experimentos que generan estas variablesaleatorias e identificamos algunas situaciones de muestreo prácticas que seajustan, con un grado de aproximación razonable, a estas condiciones experi­mentales. Presentamos la media y la varianza de cada una de las variablesaleatorias, vimos cómo f..l y (5 proporcionan medidas de la ubicación y variaciónde las distribuciones de probabilidad y, en algunos casos, dedujimos estas can­tidades. Por último, mostramos cómo puede utilizarse la distribución de pro­babilidad para calcular probabilidades y, con ellas, evaluar la verosimilitud dela ocurrencia de ciertos eventos numéricos.

EJERCICIOS SUPLEMENTARIOS...................................................................4.80 Un laboratorio de desarrollo en ingeniería realizó un experimento para investigar las características

de duración de un nuevo panel de calentamiento solar, diseñado con el objetivo de que tenga unavida útil de por lo menos cinco años con una probabilidad p = .95. Se escogió una muestra al azarde 20 de estos paneles solares y se registró la vida útil de cada uno.a. ¿Qué probabilidad hay de que exactamente 18 tengan una vida útil de por lo menos cinco

años?b. ¿Qué probabilidad hay de que cuando más 10 tengan una vida útil de por lo menos cmca

años?c. Si sólo 10 de los 20 paneles solares tienen una vida útil de por lo menos cinco años, ¿qué

inferiría usted acerca del verdadero valor de p?4.81 Los riesgos económicos que corren las empresas del ramo de la ingeniería se pueden clasificar como

riesgos puros o bien riesgos especulativos. Se enfrenta un riesgo puro cuando existe la posibilidadde incurrir en una pérdida económica pero no hay oportunidad de beneficio. Se enfrenta un riesgoespeculativo cuando hay la posibilidad de un beneficio además de una posibilidad de pérdida. En

Page 56: 004 Mendenhall

198 Capítulo 4 / Variables aleatorias discretas

ocasiones el riesgo se mide calculando la varianza o la desviación estándar de la distribución deprobabilidad que describe los beneficios o pérdidas potenciales de la empresa. Las dos distribucionesde probabilidad discretas que se dan en la tabla se desarrollaron a partir de datos históricos: des­criben las pérdidas potenciales totales en el próximo año por daños físicos a los robots computari­zados que operan en dos empresas de ingeniería distintas. Ambas empresas tienen 10 robots indus­triales, y ambas tienen la misma pérdida esperada para el año próximo.

EmpresaAPérdida próximo año Probabilidad

$ O .01500 .01

1,000 .011,500 .022,000 .352,500 .303,000 .253,500 .024,000 .014,500 .015,000 .01

EmpresaBPérdida próximo año Probabilidad

$ O .00200 .01700 .02

1,200 .021,700 .152,200 .302,700 .303,200 .153,700 .024,200 .024,700 .01

a. Verifique que ambas empresas tienen la misma pérdida total esperada por daños físicos.b. Calcule la desviación estándar de ambas distribuciones de probabilidad y determine cuál em­

presa enfrenta el mayor riesgo de daños físicos a sus robots industriales el próximo año.e.. ¿El inciso b tiene que ver con medir riesgo especulativo o riesgo puro? Explique.

4.82 La Agencia de Protección Ambiental (EPA) emite normas sobre contaminación del aire y el aguaque afectan de forma crucial la seguridad de los consumidores y las operaciones de la industria.Por ejemplo, la EPA señala que los fabricantes de cloruro de vinilo y compuestos similares debenlimitar la cantidad de estos compuestos en las emisiones de aire de las plantas a 10 partes pormillón (ppm). Suponga que usted representa uno de los fabricantes y sabe que la emisión mediade cloruro de vinilo de su planta es de 4 ppm. Sea y la emisión de cloruro de vinilo (en ppm) parauna muestra de aire específica de su planta; suponga que la probabilidad de que una muestra deaire esté contaminada con el compuesto es constante.a. ¿Cuál es la desviación estándar de y para su planta?b. Si la concentración media en partes por millón para su planta es en realidad igual a 4, ées

probable que una muestra produzca un valor de y que excede los límites de la EPA? Explique.

4.83 Refiérase al ejercicio 4.82. Los ejecutivos de la industria química aseguran que sólo 5% de todaslas plantas químicas de Estados Unidos descargan más de la cantidad máxima de desechos tóxicossugerida por la EPA hacia el aire y el agua. Suponga que la EPA muestrea al azar 20 del enormenúmero de plantas químicas con el fin de inspeccionarlas. Si la aseveración de los ejecutivos escierta, équé probabilidad hay de que el número y de plantas que violan la norma de la EPA sea:a. Menor que l? b. Menor o igual que 1? c. Menor que 2? d. Mayor que l?e. ¿Qué inferiría usted acerca de la aseveración de los ejecutivos si el valor observado de y es 3?

4.84 Dos de los cinco ingenieros mecánicos empleados por el departamento de higiene del condadotienen experiencia en el diseño de plantas de energía eléctrica de turbinas de vapor. Se le ha pedidoa usted escoger al azar dos de los cinco ingenieros para que trabajen en un proyecto de una nuevaplanta de energía.

Page 57: 004 Mendenhall

Ejercicios suplementaríos 199

a. ¿Qué probabilidad hay de que usted escoja los dos ingenieros que tienen experiencia en eldiseño de plantas de energía eléctrica de turbinas de vapor?

b. ¿Qué probabilidad hay de que usted escogerá al menos uno de los ingenieros que tienen talexperiencia?

4.85 Engineering News-Record (23 de diciembre de 1982) informó sobre una encuesta acerca de si sedebía exigir a la industria instalar la mejor tecnología disponible (BAT, best available technology)para el control de la contaminación. Cerca de 50% de los encuestados dijeron que preferirían so­portar cierres de fábricas y pérdida de empleos que permitir exenciones de las normas de BAT.Suponga que se escogen 10 personas al azar y se les pide que opinen acerca del control de lacontaminación mediante BAT. Calcule la probabilidad de que:a. Ninguna de ellas preferirá los cierres de fábricas y la pérdida de empleos a las exenciones de

las normas de BAT.b. Al menos cinco preferirían los cierres de fábricas y la pérdida de empleos a las exenciones de

las normas de BAT.c. Al menos una preferiría los cierres de fábricas y la pérdida de empleos a las exenciones de las

normas de BAT.

4.86 Cierto sistema de un vehículo espacial debe funcionar correctamente para que la nave pueda rein­gresar en la atmósfera terrestre. Un componente del sistema opera sin problemas sólo 85% del tiempo.A fin de aumentar la confiabilidad del sistema, cuatro de estos componentes se instalarán de modotal que el sistema opere sin problemas si por 10 menos uno de los componentes está funcionando sinproblemas.a. ¿Qué probabilidad hay de que falle el sistema? Suponga que los componentes operan de forma

independiente.b. Si el sistema falla, zqué inferiría usted acerca de la tasa de éxito de 85% que se dice tiene un

solo componente?

4.87 Los países menos desarrollados que experimentan un crecimiento rápido de la población a menudoenfrentan graves problemas de control del tránsito en sus grandes ciudades. Los ingenieros detránsito han determinado que los sistemas de trenes elevados pueden ofrecer una solución viablea estos problemas de tráfico. Los estudios indican que el número de cierres relacionados con elmantenimiento del sistema de trenes elevados en cierto país tiene una media igual a 6.5 por mes.a. Calcule la probabilidad de que por lo menos cinco cierres del sistema de trenes elevados ocu­

rrirán el próximo mes en el país.b. Calcule la probabilidad de que ocurran exactamente cuatro cierres el próximo mes..

4.88 El manganeso, ún metal escaso e indispensable, se ha encontrado en abundancia en nódulos sobre elpiso oceánico profundo (American Scientist, septiembre-octubre de 1976). A fin de investigar la relaciónentre la edad magnética de la corteza terrestre en el piso de los océanos y la abundancia de manganeso,se recolectaron varios cientos de nódulos de manganeso y se determinó la posición (edad magné­tica) de cada nódulo. Los datos, convertidos en probabilidades, se muestran en la siguiente tabla.

Edad Probabilidad

Oligoceno .20Eoceno .15Paleoceno .20Cretácico .30Jurásico .10Otro .05

Total 1.00

a. En una muestra de 10 nódulos de manganeso hallados en el piso oceánico, calcule la proba­bilidad de que uno provenga del oligoceno, dos del eoceno, dos del paleoceno, cuatro del ere­tácico, uno del jurásico y ninguno de las otras divisiones del tiempo geológico.

Page 58: 004 Mendenhall

200 Capítulo 4 / Variables aleatorias discretas

b. En una muestra futura de 100 nódulos de manganeso hallados en el piso oceánico, calcule lamedia y la varianza del número de especímenes provenientes del eoceno. ¿Dentro de qué in­tervalo esperaría usted que esté ese número?

4.89 Refiérase al ejercicio 4.11. Suponga que un presupuesto para exploración de 100,000 dólares sedivide equitativamente entre dos prospectos de yacimiento petrolífero idénticos e independientes, conlas probabilidades y resultados monetarios que se muestran en la tabla dada en el ejercicio 4.11.a. Sea x la suma de los valores monetarios de los dos prospectos. Calcule la distribución de probabi­

lidad para x.b. Calcule E(x) y d. Compare estos valores con sus resultados del inciso a.c. ¿Qué probabilidad hay de duplicar la inversión de 100,000 dólares en los dos prospectos de

yacimiento? Compáre1a con la probabilidad de duplicar la inversión de 50,000 dólares en unsolo prospecto que se calculó en el ejercicio 4.11.

d. ¿Qué probabilidad hay de una "ruina de tahúr" (es decir, dos pozos secos) en los dos prospectosde yacimiento? Compárela con la probabilidad de una "ruina de tahúr" en un solo prospectoque se calculó en el ejercicio 4.11.

4.90 Refiérase al estudio (Mining Engineering, abril de 1986) sobre la seguridad en las minas subterráneasde carbón que se analizó en el ejercicio 2.51. Las investigaciones revelaron que las "lesiones inter­medias", es decir, lesiones incapacitantes que resultan de derrumbes del techo y avalanchas, trans­porte, maquinaria y accidentes explosivos, constituyen 41% de todas las lesiones incapacitantes y98% de todas las lesiones fatales en las minas subterráneas de carbón.a. Calcule la probabilidad de que, en una muestra aleatoria de cinco lesiones incapacitantes, exacta­

mente tres hayan sido lesiones intermedias.b. Calcule la probabilidad de que por lo menos dos de las cinco lesiones incapacitantes hayan

sido lesiones intermedias.c. En una muestra al azar de cinco lesiones fatales, calcule la probabilidad de que por 10 menos

dos hayan sido lesiones intermedias.

4.91. El fabricante de un lector óptico de precios asegura que la probabilidad de que su aparato lea malel precio de cualquier producto al interpretar mal el "código de barras" de la etiqueta es de .001.En el momento en que uno de los lectores se instaló en un supermercado, el gerente de la tiendaprobó su desempeño. Sea y el número de pruebas (es decir, el número de precios leídos por elaparato) hasta que se observa el primer error en la lectura de un precio.a. Si la aseveración del fabricante es correcta, calcule la distribución de probabilidad para y. (Su­

ponga que las- pruebas representan eventos independientes.)b. Si 10 que dice el fabricante es cierto, ¿qué probabilidad hay de que el lector leerá bien por lo

menos los primeros cinco precios?c. Si de hecho se lee mal el tercer precio, équé inferencia haría usted acerca de 10 que el fabricante

asegura? Explique.

4.92 Cuando se introdujo por primera vez el radar durante la Segunda Guerra Mundial, era muy difícilpara un operador a cargo de la pantalla distinguir una señal de interferencia estática de una señalcausada por un avión enemigo real. Aunque el operador no quisiera sonar la alarma innecesaria­mente, la omisión de poner sobre aviso a las defensas podría tener consecuencias graves. Los registrosindican que 60% de todas las señales observadas representaban aviones enemigos. Suponga quedurante cierto sitio se detectaron cinco señales en la pantalla en diferentes momentos y que el.operador del radar puso sobre aviso a las defensas en cada ocasión. Suponga que los eventos sonindependientes y calcule la probabilidad de cada uno de los siguientes eventos:a. El operador del radar tomó la decisión correcta en las cinco ocasiones.b. El operador del radar tomó la decisión correcta en por 10 menos tres ocasiones.c. El operador del radar se equivocó las cinco veces (y por tanto hizo sonar cinco falsas alarmas).

4.93 Un estudio de las características de flujo de vehículos en los carriles de aceleración (es decir, rampasde incorporación) eIT una autopista importante de Israel reveló que uno de cada seis vehículos

Page 59: 004 Mendenhall

Ejerciciolluplementarios 201

utiliza menos de un tercio del carril de aceleración antes de incorporarse al tráfico (Journal ofTransportation Engineering, noviembre de 1985). Suponga que se registra la posición de la incor­poración para los siguientes cinco vehículos que entran en el carril de aceleración.a. ¿Qué probabilidad hay de que ninguno de los vehículos utilizará menos de un tercio del carril

de aceleración?b. ¿Qué probabilidad hay de que exactamente dos de los vehículos utilicen menos de un tercio

del carril de aceleración?

4.94 Refiérase al ejercicio 4.93. Suponga que el número de vehículos que utilizan el carril de aceleracióncada minuto tiene una media igual a 1.1.a. ¿Qué probabilidad hay de que más de dos vehículos utilicen el carril de aceleración en el

siguiente minuto?b. ¿Qué probabilidad hay de que exactamente tres vehículos utilicen el carril de aceleración en

el siguiente minuto?

4.95 Hoy día, la mayor parte de los robots industriales se programan para operar mediante microproce­sadores. La probabilidad de que un robot computarizado de este tipo se descomponga durante unturno de ocho horas es de .2. Calcule la probabilidad de que el robot operará durante cuando máscinco turnos antes de descomponerse dos veces.

4.96 "La continuación suficientemente prolongada de una probabilidad baja hace que un resultado dadosea inevitable", escribió A. J. Coale en Population and Development Review (septiembre de 1985).El evento "inevitable" al que Coale se refería específicamente es una guerra nuclear. Los expertoscoinciden en que la probabilidad de que ocurra una guerra nuclear en un año dado es pequeña,pero no cero. Según Coale, entonces, "a lo largo de cientos de años esto hace que la guerra nuclearsea virtualmente una certeza". Suponga que la probabilidad de que ocurra una guerra nuclear encualquier año dado es de sólo .01.a. ¿Qué probabilidad hay de que ocurra una guerra nuclear en los próximos cinco años?b. ¿Qué probabilidad hay de que ocurra una guerra nuclear en los próximos 10 años?e. ¿Qué probabilidad hay de que ocurra una guerra nuclear en los próximos 15 años?d. ¿Qué probabilidad hay de que ocurra una guerra nuclear en los próximos 20 años?e. ¿Qué suposición debe hacerse para contestar los incisos a-d? ¿Qué tan probable es que este

supuesto se cumpla?

4.97 Una compañía que fabrica latas informa que el número medio de descomposturas por turno deocho horas en su línea de ensamble operada por máquinas es de 1.5. Suponga que la probabilidadde una descompostura es constante para todos los turnos.a. ¿Qué probabilidad hay de que ocurran exactamente dos descomposturas durante el turno de

la medianoche?b. ¿Qué probabilidad hay de que ocurran menos de dos descomposturas durante el turno de la

tarde?c. ¿Qué probabilidad hay de que no ocurran descomposturas durante tres turnos consecutivos de

ocho horas cada uno? (Suponga que la máquina opera independientemente de un turno alsiguiente. )

EJERCICIOS SUPLEMENTARIOS OPCIONALES

4.98 Suponga que la variable aleatoria y tiene una función generadora de momentos dada por

1 2 2m(t) = "5et + "5e2t + "5e3t

a. Calcule la media de y.b. Calcule la varianza de y.

Page 60: 004 Mendenhall

202 Capítulo 4 / Variables aleatorias discretas

4.99 Sea y una variable aleatoria geométrica con la distribución de probabilidad que se da en la tabla4.7. Demuestre que E(y) = l/p. [Sugerencia: Escriba

E(y) = P 2: yqy-l donde q = 1 - Py=l

Y tome nota de que

dqY_ = yqy-ldq

Entonces,

00 d '"E(y) = P 2: yqy-l = P-

d(L qr)

y= 1 q r~l

Luego utilice el hecho de que00

2: qy = -q­y=l 1 - q

(La suma de esta serie infinita se da en la mayor parte de los manuales de matemáticas.)]

4.\00 La función generadora de probabilidades P(t) para una variable aleatoria discreta y se define como

P(t) = E(tY) = Po + Plt + PztZ + ...

donde Pi = P(y = i).a. Calcule P(t) para la distribución de Poisson. [Sugerencia: Escriba

E(tY) = i (At)Ye-A = eA(t-l) i (At)Ye-

At

y=o y! y=o y!

y observe que la cantidad que se suma es una probabilidad de Poisson cuya media es íli.]b. Aproveche el hecho de que

E(y) = d~~t)l=l Y E[y(y - 1)] = d~~t)l=l

para deducir ~é! media y la varianza de una variable aleatoria de Poisson.

Referencias'.

Feller, W. An Introduction to Probability Theory and ItsApplications, Vol. 1,3a. ed. New York: Wiley, 1968.

Hogg, R. v., y Craig, A T. Introduction to MathematicalStatistics,4a. ed. New York: Macmillan, 1978.

Mendenhall, W., Scheaffer, R. L. YWackerly, D. Mathe­matical Statistics with Applications, 4a. ed. Boston:Duxbury Press, 1989.

Mood, A M., Craybill, F. A, YBoes, D. C. Introduction tothe Theory of Statistics, 3a. ed. New York: McCraw­Hill, 1963.

Mosteller, F., Rourke, R. E.K., yThomas, C. B.Probabilitywith Statistical Applications, 2a. ed. Reading Mass.:Addison-Wesley, 1970.

Parzen, E.Modern Probability Theory andIts Applications.New York: Wiley, 1964.

Parzen, E. Stochastic Processes. San Francisco: Holden­Day,1962.

StandardMathematical Tables, 17a. ed. Cleveland: Che­mical Rubber Company, 1969.