libroestadistica.pdf

UNIVERSIDAD POPULAR DEL CESARFACULTAD DE CIENCIAS BASICAS Y EDUCACIONDEPARTAMENTO DE MATEMATICAS Y ESTADISTICA

INTRODUCCION A LA PROBABILIDAD Y A LAESTADISTICA CON APLICACIONES

A B C D E

05

1015

2025

3035

HUMBERTO BARRIOS ESCOBAR

Indice general

1. ESTADISTICA DESCRIPTIVA 41

1.1. INTRODUCCION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES . . . . . . . . . . . . . . . . . . . . . . 43

1.2.1. DISTRIBUCIONES DE FRECUENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

1.2.2. METODO GRAFICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

1.3. MEDIDAS NUMERICAS DESCRIPTIVAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

1.3.1. MEDIDAS DE TENDENCIA CENTRAL . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

1.3.2. MEDIDAS DE DISPERSION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

1.3.3. OTRAS MEDIDAS DESCRIPTIVAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

1.4. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

2. PROBABILIDAD 67

2.1. INTRODUCCION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2.2. PROPIEDADES BASICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2.3. DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES . . . . . . . . . . . . . . . . . . . . 73

2.4. PROBABILIDAD CONDICIONAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

2.5. EVENTOS INDEPENDIENTES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

2.6. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

3. VARIABLES ALEATORIAS 98

3.1. VARIABLES ALEATORIAS DISCRETAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

3.2. VARIABLES ALEATORIAS CONTINUAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA . . . . . . . . . . . . . . 106

3.4. FUNCIONES GENERADORAS DE MOMENTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

3.5. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

II

INDICE GENERAL Universidad Popular del Cesar

4. DISTRIBUCIONES DISCRETAS 127

4.1. Distribucion Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

4.2. Distribucion Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

4.3. Distribucion Geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

4.4. Distribucion Binomial Negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

4.5. DISTRIBUCION HIPERGEOMETRICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

4.6. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

5. ALGUNAS DISTRIBUCIONES CONTINUAS 107

5.1. Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

5.2. Distribucion Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

5.3. Distribucion Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5.4. Distribucion Chi Cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

5.5. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

6. VECTORES ALEATORIOS Y DENSIDADES CONJUNTAS 123

6.1. INTRODUCCION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

6.2. Distribuciones de probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

6.3. Variables aleatorias independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

6.4. Variables aleatorias independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

6.5. Valor esperado y momentos para distribuciones conjuntas . . . . . . . . . . . . . . . . . . . . . . . . 135

6.6. La distribucion multinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

6.7. Distribucion normal bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

6.8. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

III Humberto Barrios. mail: [email protected]

CAPITULO 1

ESTADISTICA DESCRIPTIVA

1.1. INTRODUCCION

Estamos en una epoca en la que nos agobian acontecimientos y numeros, las llamadas, estadısticas, acerca de

cualquier tema comprensible. Se escuchan o se leen indagaciones de los medios de comunicaciones del numero de

personas desplazadas por la violencia a las que ayuda el gobierno, el numero de hectareas sembradas de coca radicadas

diariamente por el actual gobierno y cronicas deportivas sobre el numero promedios de goles en los partidos de futbol

en una semana determinada. En este sentido para mucha gente, el termino estadıstica significa descripcion numerica.

En un sentido mas amplio, se puede establecer que el objetivo de la estadıstica es hacer inferencias con respecto a una

poblacion a partir de la informacion contenida en una muestra y proporcionar una medida (probabilidad) correspondi-

ente para la bondad de la inferencia. Es decir, la estadıstica trata del diseno de experimento o encuestas (investigacion)

mediante muestras para obtener una cantidad determinada de informacion a un costo mınimo y del uso optimo de esta

informacion para sacar conclusiones (inferencias inductivas) con respecto a una poblacion.

En estadıstica la inferencia es inductiva porque se proyecta de lo especifico (la muestra) hacia lo general (poblacion).

En un procedimiento de esta naturaleza siempre existe la posibilidad de error. Nunca se tendrıa el cien por ciento de

seguridad sobre una proporcion en la que se basa la inferencia estadıstica. Sin embargo, lo que hace de la estadıstica

una ciencia (separandola del arte de adivinar la suerte) es que, unida cualquiera proposicion o afirmacion, existe una

medida de la confiabilidad de esta. En estadıstica se mide la confiabilidad en terminos de probabilidad (un tema que

se estudiara mas adelante). En otras palabras, para cada inferencia estadıstica se identifica la probabilidad de que la

inferencia sea correcta. Los problemas estadısticos se caracterizan por los siguientes cuatro elementos:

1. La poblacion de interes y el procedimiento cientıfico que se emplea para seleccionar la muestra.

2. La muestra y el analisis matematico de la informacion.

3. Las inferencias estadısticas que resulten del analisis de la muestra.

4. La probabilidad o confiabilidad de que las inferencias sean correctas.

41

1.1. INTRODUCCION Universidad Popular del Cesar

Para comprender la naturaleza de la estadıstica inferencial, es necesario precisar algunos conceptos.

Definicion 1.1. Una poblacion es el conjunto de todas las mediciones de interes para determinado problema. En

estadıstica, poblacion es un concepto mucho mas general del que tiene el concepto comun de esta palabra.

En este sentido, una poblacion es cualquier coleccion ya sea de un numero finito de mediciones o una coleccion grande,

virtualmente infinita, de datos acerca de algo de interes.

Definicion 1.2. Una muestra es un subconjunto de la poblacion que contiene las mediciones obtenidas mediante un

experimento. De esta forma, una buena muestra es aquella que refleja las caracterısticas esenciales de la poblacion

de la cual se obtuvo.

En estadıstica, el objetivo de las tecnicas de muestreo es asegurar que cada observacion en la poblacion tiene una

oportunidad igual e independiente de ser incluida en la muestra. Tales procesos de muestreo conducen a una muestra

aleatoria. Las observaciones de la muestra aleatoria se usan para calcular ciertas caracterısticas de la muestra llamadas

estadısticas. Las estadısticas se usan como base para hacer inferencias de ciertas caracterısticas de la poblacion, que

reciben el nombre de parametros.

En cada uno de los siguientes casos se describe la poblacion correspondiente, el objetivo inferencial y que es lo que se

harıa para obtener una buena muestra.

Ejemplo 1.1. La Facultad de Ciencias de la Salud de la UPC quiere hacer un estudio acerca de los niveles de

resistencia fısica de estudiantes varones que recientemente ingresaron a la universidad.

Poblacion: Son todos los estudiantes varones de primer semestre de la UPC.

Objetivo inferencial: Estimar la distribucion de frecuencias, por edades, la resistencia fısica de estudiantes varones

que recientemente ingresaron a la universidad.

Muestra: Seleccionar una muestras de estudiantes varones que ingresaron a la UPC, en el primer semestre.

Ejemplo 1.2. Un ingeniero desea estimar el consumo semanal promedio de agua por familias en Valledupar.

Poblacion: Todas las familias que viven en Valledupar.

Objetivo inferencial: Estimar el consumo semanal promedio de agua por familias.

Muestra: Tomar un subconjunto de todas las familias de Valledupar, de tal manera que estas familias sean “represen-

tativas”.

42 Humberto Barrios. mail: [email protected]

1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES Universidad Popular del Cesar

Ejemplo 1.3. Un ingeniero electronico desea determinar si la duracion promedio de cierto tipo de transistores supera

las 500 horas.

Poblacion: En este caso, la poblacion puede estar constituida por todos los transistores producidos por una fabrica

durante una semana o tambien se puede considerar los que se pueden fabricar en el futuro. En este caso, la poblacion

es virtualmente infinita.

Objetivo inferencial: Estimar si la duracion promedio de cierto tipo de transistores supera las 500 horas.

Muestra: Seleccionar una muestra aleatoria de la produccion de un lote de varios dıas.

1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES

1.2.1. DISTRIBUCIONES DE FRECUENCIAS

En el sentido mas amplio, hacer inferencias implica la descripcion parcial o total de un fenomeno u objeto fısico.

Por consiguiente, un preludio necesario a la explicacion de como hacer inferencias, es la elaboracion de un metodo

para describir un conjunto de numeros. La descripcion debe ser tal, que el conocimiento de las medidas descriptivas

nos permita tener una apreciacion clara del conjunto de datos. Ademas es de esperarse que la descripcion posea un

sentido pragmatica, para que el conocimiento de las medidas descriptivas de una poblacion nos ayude a resolver un

problema practico no estadıstico, por ejemplo, en la toma de decisiones.

Ejemplo 1.4. Si se seleccionaron aleatoriamente en un proceso de fabricacion de una semana, 100 baterıas para

hallar algun tipo de regularidad en el proceso de fabricacion. En el cuadro 1.1 se dan los datos que representan el

tiempo de duracion en dıas de las 100 baterıas:

Cuadro 1.1: Tiempo de duracion de 100 baterıas

178 221 157 153 107 188 220 157 184 173

221 153 177 173 182 185 111 151 178 167

164 234 151 169 174 229 192 109 118 135

205 181 155 176 146 187 168 188 222 156

200 134 174 200 191 165 187 175 169 162

206 139 176 160 226 188 155 185 187 184

199 174 165 168 124 149 203 159 164 166

226 191 195 182 160 193 140 167 218 183

122 224 187 104 173 194 181 151 198 172

218 236 176 150 158 199 144 202 208 178



Si quisieramos buscar algun tipo de regularidad en este conjunto de datos serıa imposible encontrarla a simple vista.

Una manera sencilla para organizar datos es preparar un arreglo ordenado. Un arreglo ordenado es una lista de valores

de una poblacion o muestra en orden de magnitud de menor a mayor valor. Un arreglo ordenado permite determinar con

rapidez los valores de las mediciones mas pequenos, de los mas grandes. A continuacion se muestra la construccion

de un arreglo ordenado con los datos que se muestran en el cuadro 1.1.

Cuadro 1.2: Tiempo de duracion de 100 baterıas ordenadas de menor a mayor

104 107 109 111 118 122 124 134 135 139

140 144 146 149 150 151 151 151 153 153

155 155 156 157 157 158 159 160 160 162

164 164 165 165 166 167 167 168 168 169

169 172 173 173 173 174 174 174 175 176

176 176 177 178 178 178 181 181 182 182

183 184 184 185 185 187 187 187 187 188

188 188 191 191 192 193 194 195 198 199

199 200 200 202 203 205 206 208 218 218

220 221 221 222 224 226 226 229 234 236

Facilmente es posible identificar rapidamente la baterıa que duro menos dıas (104) y la que duro mas dıas (236).

Pero para identificar los patrones en un conjunto de datos es necesario agrupar las observaciones en un numero rel-

ativamente pequeno de clases que no se intercepten entre sı, de tal manera que no exista ninguna ambiguedad con

respecto a la clase que pertenece una observacion en particular. El numero de observaciones que caen en una clase

recibe el nombre de frecuencia de clase ( fi), mientras que el cociente de una frecuencia de clase con respecto al

numero de observaciones (n) en la muestra se conoce como frecuencia relativa ( fi/n) de la clase. Los lımites de las

clases se denominan fronteras de clases, y el promedio aritmetico entre los lımites superior (Li) e inferior (Ls) recibe

el nombre de marca de clase o punto medio de clase (xi).

El numero de clase que se emplean para clasificar a un conjunto de datos depende del numero total de observaciones.

Si el numero de observaciones es relativamente pequeno, el numero a emplear serıa cinco o mas. Si existe un numero

sustancial de datos, el numero de clases debe ser de quince clases o menos. Es decir, el numero de clases que se deben

tomar no debe ser mayor a quince ni menor de cinco. Un numero muy pequeno de clases puede ocultar la distribucion

real del conjunto de datos, mientras que una muy numerosa puede dejar sin observaciones a algunas clases, limitando

de esta forma su uso.

Para determinar el numero aproximado de clases, tambien se puede hacer uso de la Regla de Sturges:

k = 1+3.3logn



donde

K es el numero de clases

n es el numero total de observaciones de la muestra

log es el logaritmo comun base 10.

Se debe dejar en claro que la Regla de Sturges es una aproximacion del numero de clases, siempre es posible tomar

una mas o una menos de lo que la formula nos da.

Una buena practica es la creacion de clases que tengan longitudes iguales. Esto puede lograrse tomando la diferencia

entre los valores extremos del conjunto de los datos, lo que se conoce como rango (R), y dividiendolo sobre el numero

de clases, el resultado sera aproximadamente la longitud para cada clase. Sin embargo, existen casos donde esta regla

no se puede aplicar o no debe aplicarse. Como ilustracion, tomemos los datos de la tabla 1, para establecer un esquema

de agrupamiento para este conjunto de datos y determinar las frecuencias de clases, frecuencias relativas de clases,

marcas de clases y fronteras de clases. Agrupar los datos en clases de igual longitud.

El rango = valor mayor - valor menor = 236−104 = 132

Por ejemplo, si aplicamos la Regla de Sturges el numero de clases que deberıamos serıa de 8.

Pero supongamos que decidimos tomar diez clases: clases = 10

Por lo tanto, la Longitud de clase = 13.1' 13.

Para establecer las fronteras de cada clase, es necesario considerar la unidad mas cercana con respecto a la cual se

mide las observaciones. Ası, las diez clases a considerar son:

104-117, 118-131, 132-145, 146-159, 160-173

174-187, 188-201, 202-215, 216-229, 230-243

Por lo tanto, una manera de representar a un conjunto de datos es como se muestra en el siguiente cuadro, distribucion

de frecuencias correspondiente a la duracion de 100 baterıas, seleccionadas de manera aleatoria, de la produccion de

una fabrica en una semana.



Cuadro 1.3: Distribucion de frecuencias del tiempo de duracion de 100 baterıas

Li Ls LI LS xi fi fi % Fi Fi %

104 117 103.5 117.5 110.5 4 4% 4 4%

118 131 117.5 131.5 124.5 3 3% 7 7%

132 145 131.5 145.5 138.5 5 5% 12 12%

146 159 145.5 159.5 152.5 15 15% 27 27%

160 173 159.5 173.5 166.5 18 18% 45 45%

174 187 173.5 187.5 180.5 24 24% 69 69%

188 201 187.5 201.5 194.5 14 14% 83 83%

202 215 201.5 215.5 208.5 5 5% 88 88%

216 229 215.5 229.5 222.5 10 10% 98 98%

230 243 229.5 243.5 236.5 2 2% 100 100%

Donde

Li limite inferior de la clase i-esima.

Ls limite superior de la clase i-esima.

xi marca de clase de la clase i-esima.

LI limite inferior real de la clase i-esima.

LS limite superior real de la clase i-esima.

fi frecuencia absoluta de la clase i-esima.

fi % frecuencia porcentual de la clase i-esima.

Fi frecuencia acumulada absoluta de la clase i-esima.

Fi % frecuencia acumulada porcentual de la clase i-esima.

El cuadro 1.3 de frecuencias proporciona mucha mas informacion a simple vista que los datos originales, cuadro

1.1. En un estudio de la vida de las baterıas, hay muchas preguntas que pueden ahora responderse. ¿Que fraccion o

porcentaje de las baterıas puede esperarse de la poblacion en estudio tengan una duracion entre 174 a 187 dıas?

Es claro, que si la muestra es el reflejo de la poblacion, o como dicen mis companeros de la UPC es “representativa”,

entonces la respuesta es 0.25, es decir, el 25%. Muchas preguntas mas se pueden responder con la tabla anterior,

como por ejemplo, ¿Cuantas baterıas fallarıan antes de 187 horas? La respuesta a esta pregunta serıa sumar todas las

frecuencias que ocurren antes de 187, esto es, sumar las frecuencias: 4%, 3%, 5%, 15%, 16%, y 25% lo que suma



68%. La suma de las frecuencias ( fi ) de las observaciones cuyos valores son menores o iguales al lımite superior de

una clase dada se denomina frecuencia acumulada (Fi). De la misma manera se definen la frecuencia acumulada

relativa (Fi/n).

1.2.2. METODO GRAFICO

Otra manera util de representar los datos de una muestra es a traves de graficos. El principal objetivo de la rep-

resentacion grafica de las frecuencias de clases como las frecuencias acumuladas es mostrar el perfil de distribucion

de los datos. El conocimiento de este perfil es util en varias formas, para los analisis apropiados para las inferencias

estadısticas o con el fin de comparar los perfiles de dos o mas conjunto de datos.

Histograma de frecuencias. Un histograma es una representacion grafica de los datos que muestra la frecuencias de

los casos (valores de los datos) en categorıas. Las frecuencias se representan para examinar la forma de la distribucion

de las respuestas. El histograma de frecuencias se construye levantando rectangulos con centros en las marca de

clases, con base de longitud igual a la longitud real del intervalo de clase (L = LS−LI) y altura igual a la frecuencia

de la respectiva clase, en un eje de coordenadas. Para la distribucion de frecuencias del cuadro 1.3, el histograma de

frecuencias es:

Frecuencias del tiempo de duración de 100 baterías

Duración en días

Fre

cuen

cias

100 120 140 160 180 200 220 240

05

1015

2025

Polıgono de frecuencias. Los polıgonos de frecuencias son otra forma de representar graficamente distribuciones de

clases (o distribuciones relativas de clases). Para construir un polıgono de frecuencias senalamos en el eje horizon-

tal las marcas de clases, en el eje vertical las frecuencias correspondientes y en los extremos se anaden dos clases

con frecuencia cero, en un sistema de coordenadas, y conectamos con segmentos los puntos sobre el plano. Para la

distribucion de frecuencias del cuadro 1.3, el polıgono de frecuencias es:



100 150 200 250

05

1015

2025

Frecuencias del tiempo de duración de 100 baterías

Duración en días

Fre

cuen

cias

Los histogramas y los polıgonos de frecuencias son parecidos. Como se puede observar en los graficos anteriores. Pero

se pueden senalar las ventajas de los histogramas, las que se pueden resumir ası: los rectangulos muestran cada clase

de la distribucion por separado y el area de cada rectangulo, en relacion con el resto, muestra la proporcion del numero

total de observaciones que se encuentra en cada clase.

Los polıgonos, sin embargo, tambien poseen ciertas ventajas, de las cuales se pueden resaltar: el polıgono de frecuen-

cias es mas sencillo que el histograma, traza con mas claridad el perfil de patron de los datos y por ultimo, el polıgono

se vuelve mas liso y parecido a una curva conforme aumenta el numero de clases y el numero de observaciones. Un

polıgono como el que acabamos de describir, alisado mediante el aumento de clases y de puntos de datos, se conoce

como curva de frecuencias.

Diagrama de tallo y hojas. Una variante del histograma es el diagrama de tallo y hoja que tiene la misma similitud y

proposito pero que tambien proporciona una enumeracion completa de los valores de los datos reales. Para construirlo

basta separar en cada dato el ultimo dıgito de la derecha (que constituye la hoja) del bloque de cifras restantes (que

formara el tallo). El siguiente ejemplo ilustra la construccion del diagrama de tallo y hojas.

Ejemplo 1.5. Utilice los datos de los tiempo de duracion del cuadro 1.1 para construir diagrama de tallo y hojas.

Solucion 4. Puesto que todas las mediciones son numeros de tres dıgitos, se tiene tallos de dos dıgitos y hojas de un

solo dıgito. Por ejemplo, la medicion 175 tiene un tallo 17 y una hoja de 5. La siguiente figura muestra el diagrama

de tallo y hojas para los datos.



Cuadro 1.4: Diagrama de tallo y hojas para la

duracion de 100 baterıas

10 47918

12 24459

14 04690111335567789

16 00244556778899233344456667888

18 1122344557777888112345899

20 002356888

22 0112466946

Ojiva. Para graficar la distribucion de frecuencias acumulada (o relativa acumulada), sobre un eje de coordenadas, se

ubican los limites reales de las clases sobre el eje horizontal contra las frecuencias acumuladas (o relativas acumuladas)

en el eje vertical y se unen todos los puntos consecutivos. Para la distribucion de frecuencias acumulada del cuadro

1.3 , la ojiva de las frecuencias acumuladas (o relativas acumuladas) es:

100 150 200 250

020

4060

8010

0

Ojiva de la duración de 100 baterías

Duración en días

Fre

cuen

cias

acu

mul

adas

En este contexto el principal uso de la distribucion acumulada (o acumulada relativa) es lo que comunmente se denom-

ina como cantiles. Con respecto a una distribucion relativa acumulada, se define un cuantil como el valor bajo el cual

se encuentra una determinada proporcion de los valores de la distribucion. En la proxima seccion se dara una formula

para calcular los cantiles correspondiente a una distribucion de frecuencia acumulada.


1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar

1.3. MEDIDAS NUMERICAS DESCRIPTIVAS

Las descripciones graficas de los datos presentadas en la seccion anterior proporcionan una informacion util re-

specto al conjunto de mediciones, pero no es adecuado para hacer inferencias, sobre todo porque ninguna de las

representaciones (tablas y graficas) no estan bien definidas. Por ejemplo, se podrıan elaborar muchos histogramas sim-

ilares a partir del mismo conjunto de mediciones. Para poder hacer inferencias con respecto a una poblacion, basada

en la informacion contenida en una muestra y medir la confiabilidad de la inferencia, en terminos de probabilidades, se

requieren cantidades obtenidas de expresiones rigurosamente definidas para analizar la informacion de la muestra. Es

posible obtener, mediante las matematicas, ciertas propiedades de esas cantidades muestrales y establecer conclusiones

probabilısticas con respecto a la validez de las inferencias.

Las cantidades que se pretenden definir son medidas numericas descriptivas de un conjunto de datos. Se buscan

numeros que describan la distribucion de frecuencias para cualquier conjunto de mediciones.

Existen dos medidas de interes para cualquier conjunto de datos: la localizacion de su centro y su variabilidad.

1.3.1. MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central de un conjunto de datos es la disposicion de estos para agruparse ya sea alrededor

del centro o de ciertos valores numericos. Existen principalmente tres medidas de tendencia central: la media, la

mediana y la moda.

Definicion 1.3. Sean x1, x2, x3, . . ., xk marcas de clases con frecuencias de clases f1, f2, f3, . . . fk, respectivamente,

en una distribucion de frecuencias. Entonces la media es

x =1n

k

∑i=1

xi fi (1.1)

Donde n= f1+ f2+ f3+ . . .+ fk. En el caso, f1 = f2 = f3 = . . .= fk = 1 entonces los datos se dicen no agrupados.

Ası, la formula para la media se convierte en

x =1n

n

∑i=1

xi (1.2)

La media es una medida apropiada de tendencia central para muchos conjuntos de datos. Sin embargo, dado que todas

las mediciones se emplean para su calculo, el valor de la media puede afectarse por la existencia de algunos valores

extremos.



Definicion 1.4. La mediana en un conjunto de datos no agrupados, ordenados de menor a mayor, es el valor medio

si el numero de datos es impar o el promedio de los dos valores centrales cuando el numero de datos es par. Se notara

la mediana por x.

Para el caso de datos agrupados o para una distribucion de frecuencias, se procede como sigue:

a. Se identifica la clase mediana, la cual sera la que contiene el elemento para el cual la mitad de todas las observa-

ciones es menor y la otra mitad es mayor.

b. Lm = limite real inferior de la clase mediana

c. fm = frecuencia de la clase mediana

d. Fm−1 = frecuencia acumulada anterior a la clase mediana

e. c = ancho real de la clase mediana

f. n = numero de observaciones en la muestra o tamano de muestra.

Por consiguiente, la ecuacion para la mediana con datos agrupados serıa:

x = Lm +n2 −Fm−1

fmc (1.3)

Puesto que la mediana es un valor que se basa en la secuencia ordenada de las n mediciones, es necesario saber que la

existencia de valores extremos y agregado muy alto de observaciones, no afecta su valor, en este sentido la mediana es

mejor que la media. Generalmente los conjuntos de datos que describen informacion de ingresos caen en esta categorıa.

Definicion 1.5. La moda para un conjunto de datos no agrupados es el valor de las observaciones que ocurre con

mayor frecuencia. La cual notaremos por: Mo.

Cuando los datos se encuentran agrupados en una distribucion de frecuencias, se puede suponer que la moda esta lo-

calizada en la clase de mayor frecuencia. Para determinar un solo valor para la moda a partir de esta clase modal,

identifica:

a. LMo = limite real inferior de la clase modal

b. ∆1 = frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por encima de ella

c. ∆2 = frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por debajo de ella

d. c = ancho real de la clase modal



Entonces se utiliza la siguiente ecuacion:

Mo = LMo +

(∆1

∆1 +∆2

)c (1.4)

En muchas ocasiones en una serie de datos, puede ocurrir mas de una observacion con la misma frecuencia. En este

caso, se dice que la distribucion de frecuencias es multimodal. Como en todos los aspectos de la vida, el azar puede

desempenar un papel importante en la organizacion en un conjunto de mediciones. En ocasiones, el azar hace que un

solo elemento no representativo se repita lo suficiente para ser el valor mas frecuente del conjunto de mediciones. Es

por esta razon que rara vez se utilice la moda de un conjunto de datos no agrupados como medida de tendencia central.

Se explicaran el calculo de la media, mediana y moda con los ejemplos siguientes:

Ejemplo 1.6. (Para datos no agrupados). El tiempo de reparacion, medido en horas, de un instrumento electronico

tiene un comportamiento aleatorio. Los tiempos de reparacion de 16 de tales instrumentos, elegidos a traves de un

mecanismo aleatorio, son los siguientes:

5 6 3 6 11 7 9 10 2 4 10 6 2 8 1 5

Calcular la media, mediana y moda de este conjunto de datos.

Para calcular la media se utiliza la formula (1.2), es decir,

x =1n

n

∑i=1

xi =116

(5+6+3+6+11+7+9+10+2+4+10+6+2+8+1+5) = 5.94

Para el caso de la mediana se ordenan los datos de menor a mayor, como en este caso el numero de elementos es par,

la mediana sera el promedio de los dos valores centrales.

1 2 2 3 4 5 5 6 6 6 7 8 9 10 10 11

Es decir,

x =6+6

2= 6

La moda en una serie de datos es el valor con mayor frecuencia, en este caso el valor con mayor frecuencia es el 6.

Entonces



Mo = 6

Ejemplo 1.7. (Para datos agrupados). Con la distribucion de frecuencias del cuadro 1.5. Calcular la media, mediana

y moda.

Solucion 5. De la distribucion de frecuencias correspondiente a la duracion de 100 baterıas, para calcular la media

multiplicamos las marcas de clases por las respectivas frecuencias de clase y dividimos por las suma de las frecuen-

cias. Es decir,

x =1n

L

∑i=1

xi fi

=1

100[110.50(4)+124.50(3)+138.50(5)+152.50(15)+166.50(18)

+180.50(24)+194.50(14)+208.50(5)+222.50(10)+236.50(2)] = 175.88

Otra manera para calcular la media es utilizando la tabla 2, en este caso multiplicamos las marcas de clases por sus

respectivas frecuencias. Ası:

Cuadro 1.5: Calculo de la media en una distribucion de frecuenciasxi Li Ls fi xi fi

110.5 103.5 117.5 4 442.0

124.5 117.5 131.5 3 373.5

138.5 131.5 145.5 5 692.5

152.5 145.5 159.5 15 2287.5

166.5 159.5 173.5 18 2997.5

180.5 173.5 187.5 24 4332.0

194.5 187.5 201.5 14 2723.0

208.5 201.5 215.5 5 1042.5

222.5 215.5 229.5 10 2225.0

236.5 229.5 243.5 2 473.0

Total 100 17588.0



x =1n

L

∑i=1

xi fi =1

100(17588) = 175.88

Para calcular la mediana de la distribucion de frecuencias de la Tabla 3.

1. Se identifica la clase mediana, la cual sera la que contiene el elemento para el cual la mitad de todas las

observaciones es menor y la otra mitad es mayor. Por lo tanto la clase mediana es: 173.5-187.5.

2. Lm = limite real inferior de la clase mediana = 173.5

3. fm = frecuencia de la clase mediana = 24

4. Fm−1 = frecuencia acumulada anterior a la clase mediana = 45

5. c = ancho real de la clase mediana = 14

6. n = numero de observaciones en la muestra o tamano de muestra = 100.

Por consiguiente, la ecuacion para la mediana con datos agrupados serıa:

x = Lm +

( n2 −Fm−1

fm

)c = 173.5+

(50−45

24

)(14) = 176.42

Para determinar el valor para la moda, identificamos la clase modal es: 173.5-187.5.

a. LMo = lımite real inferior de la clase modal= 173.5

b. ∆1 = frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por encima de ella =

24-18 = 6

c. ∆2 = frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por debajo de ella = 24

-14 = 10

d. c = ancho real de la clase modal = 14

Entonces se utiliza la siguiente ecuacion:

Mo = LMo +

(∆1

∆1 +∆2

)c = 173.5+

(6

6+10

)(14) = 178.75



Cuando se trabaja un problema en estadıstica, se debe decidir cual de las medidas de tendencia central se va ha utilizar.

Por ejemplo, si la distribucion es simetrica, es claro que en este caso solo tienen una moda. Por lo tanto el mismo valor

para la media, la mediana y la moda. En tales casos, no es necesario escoger la medida de tendencia central, pues ya

esta hecha la seleccion, cualquiera de ellas es una buena opcion.

En una distribucion sesgada positiva. Es decir, sesgada hacia la derecha, la moda se encuentra en el punto mas alto de

la distribucion, la mediana esta a la derecha de la moda y la media se encuentra todavıa mas a la derecha de la moda y

la mediana. Es decir, se tiene la siguiente relacion:

Mo < x < x

En una distribucion sesgada negativa. Es decir, sesgada hacia la izquierda, la moda se encuentra en el punto mas alto

de la distribucion, la mediana esta hacia la izquierda de la moda y la media se encuentra todavıa mas a la izquierda de

la moda y la mediana. Es decir, se tiene la siguiente relacion:

Mo > x > x

Cuando la poblacion esta sesgada negativamente o positivamente, con frecuencia la mediana resulta ser la mejor

medida de posicion, debido a que siempre esta entre la moda y la media. La mediana no se ve influida por la frecuencia

de aparicion de un solo valor como es el caso de la moda, ni se distorsion con la presencia de valores extremos como

la media.

En cualquier otro caso, no existen reglas universales para la aplicacion de la media, la mediana o la moda como

medidas de tendencia central para diferentes poblaciones. Cada caso debera considerarse de manera independiente, de

acuerdo con las lıneas generales que se ha analizado.

1.3.2. MEDIDAS DE DISPERSION

Las medidas de tendencia central de un conjunto de mediciones solamente localizan el centro de la distribucion de

los datos. Por si mismo, no ofrecen una descripcion adecuada de los datos. Por ejemplo, dos conjuntos de mediciones

podrıan tener sus distribuciones de frecuencias muy diferentes pero con la misma media. La diferencias entre dos

distribuciones, puede estar en variacion o dispersion a ambos lados de la media. Una descripcion adecuada de los

datos requiere de la definicion de una medida de variabilidad de los datos. La medida mas comun de variabilidad

usada en la estadıstica es la varianza, que es una funcion de las desviaciones (o distancia) de las mediciones con

respecto a su media.




en una distribucion de frecuencias. Entonces la varianza es

s2 =1

n−1

k

∑i=1

(xi− x)2 fi (1.5)

Donde n = f1 + f2 + f3 + . . .+ fk. En el caso, f1 = f2 = f3 = . . .= fk = 1 entonces los datos se dicen no agrupados.

Ası, la formula para la varianza se convierte en

s2 =1

n−1

n

∑i=1

(xi− x)2 (1.6)

La varianza es util en la comparacion de la variacion relativa de dos conjuntos de mediciones, pero solo aporta infor-

macion con respecto a la variacion en un solo conjunto cuando se interpreta en terminos de la desviacion estandar. La

desviacion estandar de un conjunto de medidas es la raız cuadrada positiva de la varianza, es decir,

s =√

s2 (1.7)

La varianza y la desviacion estandar no son medidas de variabilidad distintas, debido a que la ultima no puede deter-

minarse a menos que se conozca la primera. A menudo se prefiere la desviacion estandar en relacion con la varianza,

porque se expresa en las mismas unidades fısicas de las observaciones.

Otra medida util de la variabilidad tiene base en el valor absoluto de las diferencias entres el conjunto de mediciones

y la media o la mediana, dependiendo de cual de las dos se emplee como medida de tendencia central.


en una distribucion de frecuencias. Entonces la desviacion media esta dada por

DM =1n

k

∑i=1|xi− x| fi (1.8)

Donde n = f1 + f2 + f3 + . . .+ fk. En el caso, f1 = f2 = f3 = . . .= fk = 1 entonces los datos se dicen no agrupados.

Ası, la formula para la desviacion media esta se convierte en

DM =1n

n

∑i=1|xi− x| (1.9)



Cuando se sustituye la media por la mediana en (1.8) y (1.9) se obtiene la desviacion mediana, la que se notara por

DMd.

La desviacion media es una medida de la variacion de un conjunto de mediciones, especialmente en el contexto de la

evidencia empırica, debido a que en muchas ocasiones el interes se centra en las desviaciones y no en los signos de

estas. Sin embargo, desde un punto de vista teorico, el empleo de desviacion media como medida de dispersion esta en

desventaja dado que, matematicamente, es difıcil de obtener. De cualquiera manera, la desviacion media es menos

sensible a los efectos inducidos por las observaciones extremas del conjunto de datos que la varianza o la desviacion

estandar. Sin importar la presencia de pocos valores extremos, la desviacion media puede proporcionar una medida de

dispersion mucho mas real que la obtenida por la desviacion estandar.

Cuando la mediana se utiliza como medida de tendencia central con el proposito de amortiguar los efectos de la

existencia de algunos valores extremos en el conjunto de mediciones, debe preferirse a la desviacion mediana como

una medida de dispersion por la misma razon, es decir, con la intencion amortiguar los efectos de la existencia de

valores extremos en el conjunto de mediciones.

A continuacion se ilustran los pasos que se deben seguir para los calculos de la varianza, desviacion estandar, desviacion

media y desviacion mediana, para los datos no agrupados del ejemplo 1 y para los datos agrupados de la tabla 2.

Ejemplo 1.8. El tiempo de reparacion, medio en horas, de un instrumento electronico tiene un comportamiento

aleatorio. Los tiempos de reparacion de 16 de tales instrumentos, elegidos a traves de un mecanismo aleatorio, son

los siguientes:

5 6 3 6 11 7 9 10 2 4 10 6 2 8 1 5

Calcular la varianza, desviacion estandar, desviacion media y desviacion mediana de este conjunto de datos.

Solucion 6. Para la varianza se tiene



s2 =1

n−1

n

∑i=1

(xi− x)2

=1

16−1[(5−5.94)2 +(6−5.94)2

+(3−5.94)2 +(6−5.94)2 +(2−5.94)2

+(4−5.94)2 +(11−5.94)2 +(7−5.94)2

+(9−5.94)2 +(10−5.94)2 +(10−5.94)2

+(6−5.94)2 +(2−5.94)2 +(8−5.94)2

+(1−5.94)2 +(5−5.94)2]

= 9.53

La desviacion estandar es

s =√

9.5333 = 3.0876

Para la desviacion media se tiene

DM =1n

n

∑i=1|xi− x|

=116

[|5−5.94|+ |6−5.94|+ |3−5.94|+ |6−5.94|

+ |2−5.94|+ |4−5.94|+ |11−5.94|+ |7−5.94|

+ |9−5.94|+ |10−5.94|+ |10−5.94|+ |6−5.94|

+ |2−5.94|+ |8−5.94|+ |1−5.94|+ |5−5.94|

= 2.445

Para la desviacion mediana se tiene



DMd =1n

n

∑i=1|xi− x|

=1

16[|5−6|+ |6−6|+ |3−6|+ |6−6|

+ |2−6|+ |4−6|+ |11−6|+ |7−6|+ |9−6|

+ |10−5.94|+ |10−6|+ |6−6|+ |2−6|

+ |8−6|+ |1−6|+ |5−6|

= 2.4375

Ejemplo 1.9. Con la distribucion de frecuencias de la tabla 2. Calcular la varianza, desviacion estandar, desviacion

media y desviacion mediana.

Solucion 7. Utilicemos el cuadro 1.5, para la varianza, desviacion estandar, desviacion media y desviacion mediana.

Cuadro 1.6: Calculo de las medidas de dispersion en una distribucion de frecuencias

xi fi (xi− x)2 fi |xi− x| fi |xi− x| fi

110.5 4 17098.18 261.52 263.68

124.5 3 7919.71 154.14 155.76

138.5 5 6986.32 186.90 189.60

152.5 15 8199.37 350.70 358.80

166.5 18 1583.72 168.84 178.56

180.5 24 512.27 110.88 97.92

194.5 14 4853.86 260.68 253.12

208.5 5 5320.32 163.10 160.40

222.5 10 21734.24 466.20 460.80

236.5 2 7349.57 121.24 120.16

total 100 81557.56 2244.20 2238.8

Por lo tanto la

varianza es: s2 = 823.81

Desviacion estandar es: s = 28.70

Desviacion media es: D.M.= 22.44

Desviacion mediana es: D.Md.= 22.39



1.3.3. OTRAS MEDIDAS DESCRIPTIVAS

El principal uso de la distribucion acumulada es lo que comunmente se conoce como cuantiles. Con respecto a

una distribucion de frecuencias relativa acumulada, se define un cuantil como el valor bajo el cual se encuentra una

determinada proporcion de los valores de la distribucion. Para identifica la clase cuantil, la cual sera la que contiene el

elemento para el cual la proporcion 100q% de todas las observaciones es menor y la otra proporcion 100(1−q)% es

mayor en una distribucion de frecuencias.

Definicion 1.8. Para calcular el cuantil q se utiliza la siguiente formula

xq = Lq +nq−Fq−1

fqc (1.10)

a. Se identifica la clase cuantil, la cual sera la que contiene el elemento para el cual la q% de todas las observaciones

es menor y la otra (100−q)% es mayor.

b. Lq = limite real inferior de la clase cuantil

c. fq = frecuencia de la clase cuantil

d. Fq−1 = frecuencia acumulada anterior a la clase cuantil

e. c = ancho real de la clase cuantil

f. n = numero de observaciones en la muestra o tamano de muestra.

Definicion 1.9. Una medida que compara la dispersion relativa de dos distribuciones de frecuencias es el coeficiente

de variacion, que esta definido por:

cv =sx

100% (1.11)

Los cantiles comunmente mas utilizados son los percentiles, deciles y cuartiles. Los percentiles son los puntos que

dividen a la distribucion de frecuencias en 100 pares iguales, cada uno con una frecuencia relativa q = 0.01; los deciles

y cuartiles son los puntos que dividen a la distribucion de frecuencias en 10 y 4 partes iguales, cada uno con frecuencia

relativa q = 0.1 y q = 0.01, respectivamente. Notese que la mediana es el cincuentavo percentil, el quinto decil y el

segundo cuartil.

Definicion 1.10. La diferencia entre los percentiles 90 avo y 10 avo recibe el nombre de recorrido interdecil.

Definicion 1.11. La diferencia entre los percentiles 75avo y 25avo recibe el nombre de recorrido intercuartil.



En este contexto el recorrido interdecil es una medida de la dispersion del 80% de la distribucion de frecuencia,

en tanto que el recorrido intercuartil refleja la variacion del 50% de la distribucion de frecuencia. En ambos casos,

al excluir los efectos de los valores extremos de la distribucion de frecuencia, se tiene la capacidad de medir la

variabilidad del conjunto de mediciones de la mitad de una distribucion de frecuencia.

Los recorridos interdecil e intercuartil, son dos medidas de dispersion que se emplean en disciplinas como educacion,

economıa, finazas e ingenierıa. El recorrido interdecil se emplea muchas veces en pruebas educacionales para medir la

variabilidad en el desempeno sin importar los valores por arriba o por debajo de un 10% de un valor predeterminado.

El recorrido intercuartil se emplea en muchas ocasiones, en economıa y finanzas, para medir la variabilidad de un

conjunto de mediciones de una proporcion de su distribucion de frecuencia.

El coeficiente de variacion expresa la magnitud de la dispersion de un conjunto de mediciones con respecto a la

media, es una medida estandarizada de la variacion con respecto a la media, especialmente util para comparar dos

distribuciones de frecuencias cuando la escala de medicion difiere de manera apreciable entre estas. Es decir, como

el coeficiente de variaciones la razon de dos promedios, es independiente de las unidades de medidas usadas, por

ejemplo, da igual que se usen libras o gramos para medir el peso.

Ejemplo 1.10. . Para la distribucion de frecuencia de la Tabla 2. Calcular los recorrido interdecil, recorrido inter-

cuartil y el coeficiente de variacion.

Solucion 8. Las clases percentiles 10ava y 90ava son respectivamente (132-145) y (216-229), entonces para calcular

a x0.1 se tiene:

(a) Se identifica la clase cuantil, la cual sera la que contiene el elemento para el cual la q% de todas las observaciones

es menor y la otra (100−q)% es mayor.

(b) Lq = limite real inferior de la clase 10ava = 131.5

(c) fq = frecuencia de la clase 10ava = 5

(d) Fq−1 = frecuencia acumulada anterior a la clase cuantil =7

(e) c = ancho real de la clase cuantil =14

(f) n = numero de observaciones en la muestra o tamano de muestra =100.

Se utiliza la siguiente formula:


fqc = 131.5+

0.1(100)−75

(14) = 139.5

De la misma manera se calcula x0.9,




fqc = 215.5+

0.9(100)−8810

(14) = 217.8

Ası, el recorrido interdecil es = 217.80-139.50 = 78.3.

De igual forma se realizan los calculos para el recorrido intercuartil.

El coeficiente de variacion es:

cv =sx

100 =28.70

175.88(100) = 0.16 = 16%

En la siguiente tabla se resumen las medidas numericas descriptivas para la distribucion de frecuencia de la Tabla 2.

Medidas descriptivas

Media 175.88

Mediana 176.42

Moda 178.75

Varianza 823.81

Desviacion estandar 28.70

Desviacion media 22.44

Desviacion mediana 22.39

Recorrido 140.00

Recorrido intercuartil 34.89

Recorrido interdecil 78.3

Observese (tabla 5) que los valores de las medidas de tendencias central se encuentran muy cerca entre si, tambien se

puede afirmar lo mismo de las desviaciones estandar, media y mediana. Sin embargo, no es de esperar que todas las

distribuciones de frecuencia tengan este comportamiento.

Estas comparaciones aclaran lo que las medidas numericas y las distribuciones de frecuencia pueden hacer para de-

scubrir la naturaleza inherente de un conjunto de mediciones. En consecuencias, el usuario debe tener cuidado tanto

en la eleccion como en la interpretacion de estas medidas. A pesar que la media y la desviacion estandar se han em-

pleado de manera extensa como medidas de tendencia central y dispersion respectivamente, aunque tiene propiedades

matematicas muy interesantes existen problemas para los cuales no puede ser las medidas mas deseables. Para con-

juntos de mediciones fısicas como lecturas de instrumentos, especificaciones de partes, pesos, etc., la media y la

desviacion estandar o desviacion media, son medidas anheladas. Para conjunto de mediciones afines con ingresos y

otras informaciones de tipo economico y financieros, la mejor eleccion para la medida de tendencia central y dispersion

son la media y la desviacion de la mediana respectivamente.


1.4. EJERCICIOS Universidad Popular del Cesar

En muchas investigaciones de tipo economico y social proporcionan informacion en tablas de frecuencia que no solo

contienen clases de diferentes amplitudes sino tambien clases abiertas como mayores que o menor que con el proposito

de tener mayor cobertura de los datos. Estas clases se presentan en los extremos de la distribucion de frecuencia y no

se especifica los lımites de las clases. Como resultado, no se encuentra definido el punto medio de la clase abierta y

en consecuencias no se puede calcular la media, varianza, desviacion estandar y desviacion media, a menos que se

conozca un valor particular de la clase o que sea conocido su promedio aritmetico.

1.4. EJERCICIOS

1. Los siguientes datos son los tiempos, en minutos, correspondiente a una muestra aleatoria de 50 personas que

estuvieron cobrando un cheque, un fin de mes en un banco de la cuidad

17 16 39 30 23 38 32 20 43 32

44 41 23 17 29 26 21 34 44 24

21 27 36 21 17 28 29 34 24 28

25 29 45 23 16 34 20 30 23 35

35 27 19 31 45 40 14 29 23 19

a) Construir una distribucion de frecuencias, de clases, relativa, acumulada y relativa acumulada.

b) Construir histograma, polıgono y ojiva con los resultados obtenidos en a.

c) Con los datos agrupados calcula: la media, mediana, moda, desviacion estandar, desviacion media, desviacion

mediana, y los recorridos intercuartil e interdecil.

2. Con los siguiente tres conjuntos de datos:

1 2 3 4 5 6

1 1 1 6 6 6

−13 2 3 4 5 20

Calcular la media y la varianza para cada conjunto de datos. ¿Que se puede concluir?

3. Con los datos del ejercicio 1, sea xi el tiempo que gasta el i-esimo cliente en cobrar un cheque para i =

1,2, . . . ,50. Transformar los datos por medio de la relacion

zi = (xi−28.2)/8.928



Con los datos transformados

a) Construir una distribucion de frecuencias, de clases, relativa, acumulada y relativa acumulada.


c) Con los datos agrupados calcula: la media, mediana, moda, desviacion estandar, desviacion media, desviacion

mediana, y los recorridos intercuartil e interdecil.

d) ¿Ha ocurrido algun cambio en la naturaleza de la distribucion de frecuencia cuando esta se compara con

los del ejercicio 1?

4. Los datos que tienen una distribucion acampanada tienen caracterısticas bien definidas con respecto a la variacion,

que se puede expresar en el siguiente enunciado:

Regla empırica. Para una distribucion de mediciones que es aproximadamente acampanada (forma normal), el

intervalo

(µ−σ ,µ +σ) Contiene aproximadamente el 68% de las mediciones

(µ−2σ ,µ +2σ) Contiene aproximadamente el 95% de las mediciones

(µ−3σ ,µ +3σ) Contiene casi todas las mediciones

Donde µ y σ son la media poblacional y desviacion estandar poblacional respectivamente.

Calcular el intervalo (x− kσ , x+ kσ) para k =1, 2, y 3, del ejercicio 1, cuenta el numero de mediciones que se

ubican dentro de cada intervalo y compara estos resultados con el numero que podrıa esperarse de acuerdo a la

regla empırica.

5. Los siguientes datos agrupados representan las ventas ($1000) de 50 tiendas, seleccionadas aleatoriamente del

municipio de Valledupar, de un dıa cualquiera de la semana.

Clases Frecuencias

110-186 4

187-263 14

264-340 11

341-417 9

418-494 7

495-571 1

572-648 2

649-727 2

a) Construir una distribucion de frecuencia acumulada y relativa acumulada.




c) Calcular la media, mediana, moda, desviacion estandar, desviacion media, desviacion mediana, y los recor-

ridos intercuartil e interdecil.

La regla empırica senala que se puede aproximar la desviacion estandar de un conjunto de mediciones por una

cuarta parte del rango. Calcule esta aproximacion para la desviacion estandar en los conjunto de datos de la tabla

1 y del ejercicio 1.

6. Las siguiente tres propiedades son importante cuando se emplea el sımbolo de la sumatoria.

a)n∑

i=1c = nc

b)n∑

i=1cxi = c

n∑

i=1xi

c)n∑

i=1(xi + yi) =

n∑

i=1xi +

n∑

i=1yi

1. Demostrar las siguientes identidades algebraicas:

a)n∑

i=1(xi− x) = 0

b) s2 = 1n−1

[k∑

i=1x2

i fi−nx2]

2. Demuestre que la funcion

h(y) =n

∑i=1

(xi− y)2

Tiene un mınimo en x . Utilice sus conocimientos de Calculo Diferencial.

7. Sea k≥ 1. Demuestre que para cualquier conjunto de n mediciones, la fraccion que queda incluida en el intervalo

(x− ks, x+ ks) es por lo menos (1− 1k2 ). Este resultado se conoce con el nombre de teorema de Tchbysheff.

8. Supongamos que tenemos las siguientes medias: x1 = 37, x2 = 41 y x3 = 28, basadas en 50, 20 y 10 observa-

ciones respectivamente. Si hay que escoger una sola media, ¿Cual serıa su eleccion? ¿Por que? ¿Cuales son los

totales de las muestras originales? ¿Como se usarıa estos totales para hallar la media de las 80 observaciones?

9. Sea x1,x2, . . . ,xn una muestra aleatoria de una poblacion. Demuestre que

max1≤i≤n

|xi− x|< (n−1)s√n

a menos que todas las n observaciones sean iguales o exactamente n−1 de las xi son iguales.



10. Sean x1,x2, . . . ,xk marcas de clases diferentes con frecuencias f1, f2, . . . , fk respectivamente. Si yi = axi +c, son

las marcas de clases de una nueva variable aleatoria yi. Demuestre que:

a) y = ax+ c

b) s2y = a2s2.

11. Los siguientes datos corresponden a una muestra aleatoria simple de tamano n = 100 seleccionadas de los

N = 365 dıas de las ventas (en millones) de un supermercado de la ciudad, los datos se muestra en la tabla

siguiente:

Cuadro 1.7: Datos78 113 94 101 87 88 75 87 110 92

100 116 102 105 89 104 111 93 114 95

107 117 109 117 100 104 127 112 120 117

108 121 126 127 124 106 127 120 121 118

108 124 128 135 131 114 128 122 129 119

126 131 129 138 139 121 129 128 129 126

129 136 130 140 140 124 130 141 130 135

137 143 132 141 143 133 137 143 138 140

139 144 146 153 146 135 142 151 142 147

142 146 149 175 155 135 167 151 147 152

a) Encuentre las clases para el conjunto de datos anteriores, si se sabe que la primera clase tiene como limite

inferior 75 y la longitud de cada clase es c = 10.

b) Hallar las frecuencias absolutas y acumuladas para cada clase.

c) Que interpretacion se le da a las frecuencias absolutas y acumuladas en cada clase.

d) Hallar los limites reales para cada clase y sus marcas de clases e interprete.

e) Que porcentajes de dıas al ano tienen ventas superiores a $140.000.000 (ciento cuarenta millones de pesos).

f ) Que porcentajes dıas tiene ventas superiores o iguales a $173.000.000 y superiores o iguales $108.000.000.

g) Construir el histograma de frecuencias, polıgono de frecuencias y ojiva e indicar cual debe ser el perfil de

la poblacion.

h) Calcular la media, mediana y moda e interprete su significados en terminos poblacionales.

i) Calcular el rango, varianza, desviacion estandar, desviacion media y desviacion mediana e interprete su

significados.

j) Calcular todos los deciles y cuartiles de la distribucion de frecuencias.

k) Calcular el recorrido interdecil y el recorrido intercuartil e interprete.


CAPITULO 2

PROBABILIDAD

2.1. INTRODUCCION

La teorıa de probabilidad comenzo en siglo XVII con dos grandes matematicos franceses, Blaise Pascal (1961-

1668) y Pierre de Fermat (1623-1662), aunque algunos matematicos anteriores, como Gerolamo Cardano (1501-1576)

en el siglo XVI, habıan hecho importantes contribuciones a su desarrollo. La probabilidad, como una rama de la

matematica, comenzo como un intento de responder a varias preguntas que surgıan en los juegos de azar, convir-

tiendose en una herramienta poderosa en las mas variadas ramas del conocimiento. Es ası, que encuentra aplicaciones

en cada una de las area de la actividad humana desde la musica a la fısica, y en experiencia diarias como es la de

pronosticar el tiempo a la prediccion de los riesgos de nuevos tratamientos medicos.

El objetivo principal de este capıtulo es proporcionar al estudiante una formacion solida y sistematica en los

principios, metodos, resultados y aplicaciones de la teorıa de la probabilidad, ası como la habilidad de razonar bajo

estos modelos. El primer paso de esta capıtulo es describir la estructura generica del concepto de probabilidad a traves

de un conjunto de axiomas, y sus propiedades basicas. Para esto, se empezara con una revision corta de la teorıa de

conjuntos.

2.2. PROPIEDADES BASICAS

La teorıa de la probabilidad fue establecida sobre una base axiomatica idonea por el matematico ruso Andrei

Nikolayevich Kolmogorov (1903-1987) en la decada de los anos treinta. Por supuesto, los axiomas y teoremas de

Kolmogorov son mas rigurosos que la version simplificada que presentaremos a continuacion, para ilustrar el enfoque

axiomatico comenzaremos con la siguiente definicion.

Definicion 2.1. Un experimento aleatorio es el proceso por medio del cual se obtiene una observacion.

Por ejemplo, el lanzamiento de un dado, el numero de carros que llegan a la universidad en una hora determinada, se

les puede considerar un experimento. En el contexto de las ciencias sociales, la mayor parte de los procedimientos de

67

2.2. PROPIEDADES BASICAS Universidad Popular del Cesar

recogida de datos se pueden considerar como experimentos aleatorios. Cuando se efectua un experimento se pueden

tener uno o mas resultados posibles, los cuales se denominan eventos.

Definicion 2.2. Un espacio muestral Ω asociado a un experimento es el conjunto de todo los resultados posibles de

un experimento.

Por ejemplo, para el lanzamiento del dado el espacio muestral puede ser

Ω = 1, 2, 3, 4, 5, 6

o tambien

Ω = pares, impares.

Para el numero de carros que llegan a la universidad en una hora determinada, el espacio muestral es

Ω = x| x un numero entero mayor o igual a cero.

Donde x es el numero de carros que llegan en una hora determinada.

Si w es un elemento de Ω lo notaremos w ∈ Ω, y diremos que w pertenece a Ω. La definicion de un espacio muestral

Ω en un problema concreto depende de cuales son los aspectos que se desean analizar.

Definicion 2.3. Un evento es cualquier subconjunto A del espacio muestral Ω, y lo notaremos A⊆Ω.

Para el espacio muestral asociado con el lanzamiento de un dado, se tiene que cualquier subconjunto de

Ω = 1, 2, 3, 4, 5, 6

es un evento de Ω.

Al conjunto formado por todos los subconjuntos de Ω, el cual notaremos P(Ω), lo denominaremos el conjunto de

partes Ω. Por ejemplo, si Ω = a, b, c conjunto de partes de Ω es:

P(Ω) = /0, a, b, c, a, b, a, c, b, c, Ω.

Definicion 2.4. Sean A y B eventos cualesquiera del espacio muestral Ω. Entonces

1. La interseccion de los eventos A y B es otro evento, lo cual escribimos A∩B, cuyo elementos son los elementos

comunes a A y B.

x ∈ A∩B si y solo si x ∈ A y x ∈ B



2. La union de los eventos A y B es otro evento, lo cual escribimos A∪B, cuyos elementos son todos los elementos

de A o B.

x ∈ A∩B si y solo si x ∈ A y x ∈ B

3. Los eventos A y B se dicen disjuntos o mutuamente excluyentes si su interseccion es el conjunto vacıo:

A∩B = /0

4. El complemento de A es otro evento, lo escribimos Ac, cuyos elementos son todos los del espacio muestral

Omega excepto los que estan en A:

x ∈ Ac si y solo si x no esta en A

En lo sucesivo, cualquier evento de un espacio muestral se puede representar mediante los diagramas de Veen. Por

ejemplo, la interseccion, la union, la disyuncion y el complemento entre conjuntos se representan como se muestran

en las figuras siguientes respectivamente

A∩B

ΩA∩B

A B

ΩA∪B

A B

ΩA∩B = /0 Ω

A

Ac



Ejemplo 2.1. Sea Ω = 1, 2, 3, 4, 5, 6 el espacio muestral asociado al experimento el lanzamiento de un dado, y

sean los eventos A = 2, 4, 6 y B = 3, 6. Entonces

A∩B = 6

A∪B = 2, 3, 4, 6

Ac = 2, 3, 4, 6

Definicion 2.5. Sea Ω un espacio muestral asociado a un experimento. Una probabilidad es una funcion P de valor

real que asigna a cada evento A de Ω un numero real de tal manera que sean validos los siguientes axiomas:

P1. Para todo evento A de P(A) ≥ 0. Es decir, la probabilidad de cualquier evento A de Ω es un numero real no

negativo.

P2. P(Ω) = 1

P3. Si A1,A2,A3, . . . es una sucesion de eventos de Ω mutuamente excluyentes, es decir, Ai∩A j = Φ para todo i 6= j ,

entonces

P(∞⋃

n=1

An) =∞

∑n=1

P(An).

La pareja (Ω,P) se llama un espacio de probabilidad. Un espacio de probabilidad es una descripcion del experimento

que informa de cual es el conjunto de posibles resultados del experimento, Ω de los sucesos cuya realizacion interesa,

los eventos A de Ω, los cuales permiten cuantificar la incertidumbre de que produzcan los sucesos que interesan.

Teorema 2.1. P(Φ) = 0.

Demostracion 1. Sea A1 = Ω y Ai = Φ para i = 2,3, . . . , es claro que Ai∩A j = Φ para todo i 6= j.

Por el axioma (P3) de la definicion (2.5) tenemos que

P(∞⋃

n=1

An) =∞

∑n=1

P(An) (2.1)

como

Ω =∞⋃

n=1

An (2.2)

De (2.1) y (2.2) se infiere que

P(Ω) = P(Ω)+∞

∑n=2

P(An)

y puesto que P(Ai)≥ 0 para todo i = 1,2,3, . . .. Entonces P(Ai)≥ 0 para todo i = 2,3, . . .. En consecuencia

P(Φ) = 0.



Teorema 2.2. Sean A y B eventos de Ω si A∩B = Φ. Entonces

P(A∪B) = P(A)+P(B).

Demostracion 2. Considerese A1 = A, A2 = B, Ai = Φ, aplicando el axioma ?? se deduce

P(∞⋃

n=1

An) =∞

∑n=1

= P(A1)+P(A2)+∞

∑n=3

P(An)

puesto que P(Φ) = 0 se concluye

P(∞⋃

n=1

An) =∞

∑n=1

P(An) = P(A1)+P(A2) (2.3)

pero

A∪B =∞⋃

n=1

An (2.4)

De (2.3) y (2.4) se obtiene

P(A∪B) = P(A)+P(B).

Teorema 2.3. Sea A evento de Ω. Entonces

P(Ac) = 1−P(A).

Demostracion 3. Como se puede ver en la figura 2.1, Ω = A∪Ac y A∩Ac = Φ.

Figura 2.1: Ac

Ω

A

Ac

Aplicando el axioma P2 y el teorema 2, se tiene

P(Ω) = P(A∪Ac) = P(A)+P(Ac) = 1

En consecuencia

P(Ac) = 1−P(A).



Teorema 2.4. Sean A y B eventos de Ω, tales que A⊆ B. Entonces

P(A)≤ P(B).

Demostracion 4. Notese que el evento B se puede escribir como

B = A∪ (Ac∩B)

Figura 2.2: A⊆ BΩ

A

Ac∩B

B

donde los eventos A y (Ac∩B) son mutuamente excluyentes. En consecuencia, por teorema 2 se tiene

P(B) = P(A)+P(Ac∩B)

como

P(Ac∩B)≥ 0

se sigue

P(A)≤ P(B).

Teorema 2.5. Sean A y B eventos de Ω. Entonces

P(A∪B) = P(A)+P(B)−P(A∩B)

Demostracion 5. Es facil comprobar, mediante la figura 2.3, que

Figura 2.3: A∪B

A BA∩B

ΩA∪B


2.3. DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES Universidad Popular del Cesar

A∪B = A∪ (Ac∩B) y A∩ (Ac∩B) = Φ (2.5)

tambien

B = (A∩B)∪ (Ac∩B) y A∩B)∩ (Ac∩B) = Φ (2.6)

de (2.5) y teorema 2, se infiere

P(A∪B) = P(A)+P(Ac∩B) (2.7)

por (2.6) y teorema 2, se obtiene

P(B) = P(A∩B)+P(Ac∩B) (2.8)

De (2.7) y (2.8) se establece

P(A∪B) = P(A)+P(B)−P(A∩B).

Observemos que la definicion de probabilidad solamente expresa cuales son las propiedades que tiene una funcion de

probabilidad, pero no expresa como asignar las probabilidades especıficas de los eventos.

2.3. DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES

En un experimento aleatorio no es posible determinar con absoluta precision cual sera el resultado. Sin embargo,

unos resultados suelen ser mas verosımiles que otros. Intuitivamente, la probabilidad indica el grado de confianza en

que ocurra cada suceso. Existen diferentes interpretaciones del concepto de probabilidad que pretenden dar sentido a

esta idea. Algunas de ellas son las siguientes:

Definicion 2.6 (Probabilidad clasica). Se define la probabilidad como el cociente entre el numero de casos favorables

y el numero total de casos posibles, siempre que no exista razon alguna para creer que un resultado ocurra mas que

otro. Es decir, si A es un evento del espacio muestral Ω entonces la probabilidad del evento A es:

P(A) =numero de casos favorables de A

numero de casos posibles=

#(A)#(Ω)

Por ejemplo, si se lanza un dado, la probabilidad de cada cara es 16 . Esta definicion no implica que se realice verdader-

amente el experimento. La probabilidad se define independientemente de que el experimento se lleve a cabo o no, y

depende unicamente de la geometrıa o las propiedades fısicas del objeto en cuestion.



Definicion 2.7 (Probabilidad frecuentista). Supongamos que se lanza un dado N veces en las mismas condiciones

y sale la cara un numero n de veces. La definicion frecuentista de la probabilidad de obtener n veces caras en el

resultado es:

P(c) = lımn→∞

nN

Al igual que en el caso anterior, esta definicion es una forma conceptual de entender lo que es un experimento aleatorio

(por ejemplo, lanzar un dado), y no significa que en la practica haya que repetirlo un numero ilimitado de veces para

calcular la probabilidad. Esto se debe a dos razones: en la practica es imposible repetir un mismo experimento en

identicas condiciones; el dado se deteriorara cuantas mas veces se lance, la velocidad del aire cambiara, etc. Ademas,

si se pudiera repetir el fenomeno en identicas condiciones el resultado serıa el mismo en todos los lanzamientos, por

lo que el concepto de probabilidad perdera su sentido.

Ejemplo 2.2. Considerese el experimento de lanzamiento de un dado.

1. Hallar el espacio muestral

2. Asigne probabilidades a cada resultado posible

3. Hallar la probabilidad de obtener un numero par.

Solucion 9. El espacio muestral asociado al experimento, del lanzamiento de un dado,

1. es

Ω = 1,2,3,4,5,6.

2. El axioma P2 dice que la suma de todas las probabilidades de los elementos de Ω debe ser igual a uno. Por lo

tanto una forma de asignar probabilidades es suponer a priori que el dado es perfecto, y en consecuencia cada

una de las caras tiene la misma posibilidad de salir, en este caso,

P(i) = 16

; i=1, 2, 3, 4, 5, 6.

Esta forma de asignar probabilidad se denomina clasica.

3. El evento obtener un numero par es el subconjunto

A = 2,4,6

P(A) =numero de casos favorables

numero de caso posibles=

36=

12.



Ejemplo 2.3. Un fabricante tiene cinco terminales de computador aparentemente identicos listos para ser enviados

a su destino. El no sabe que dos son defectuosos. Recibe un pedido especial de dos terminales y lo surte seleccionado

al azar dos de los cinco disponibles.

1. Encuentren el espacio muestral para este experimento

2. Sea A el evento en que el pedido se surte con dos terminales no defectuosos. Liste los puntos muestrales de A

3. Asigne probabilidades a cada resultado posible

4. Calcular la probabilidad del evento A.

Solucion 10. Sean d1,d2 los dos terminales defectuoso y b1,b2,b3 los terminales buenos.

1. Los eventos simples pueden representarse como sigue:

e1 = d1,d2 e6 = d2,b2

e2 = d1,b1 e7 = d2,b3

e3 = d1,b2 e8 = b1,b2

e4 = d1,b3 e9 = b2,b3

e5 = d2,b1 e10 = b3,b3.

Por lo tanto el espacio muestral es:

Ω = e1,e2,e3,e4,e5,e6,e7,e8,e9,e10.

2. El evento A = e8,e9,e10

3. Como las terminales son identicos se puede asumir que tiene la misma posibilidad de ser seleccionado cualquiera

de los elementos del espacio muestral, luego

P(ei=1

10; i=1, 2, 3, 4, 5, 6, 7, 8, 9, 10.

4. Puesto que el evento A = e8,e9,e10= e8∪e9∪e10 , aplicando el teorema 2, se obtiene

P(A) = P(e8)+P(e9)+P(e10) =3

10.

Ejemplo 2.4. Una empresa dedicada a la busqueda de petroleo o gas natural encuentra en 10% de sus perforaciones.

Si la companıa perfora dos pozos, los cuatro eventos simples posibles y tres de sus probabilidades asociadas son:



RESULTADOS

EVENTOS 1 perforacion 2 perforacion Probabilidad

e1 Exito Exito 0.01

e2 Exito Fracaso

e3 Fracaso Exito 0.09

e4 Fracaso fracaso 0.81

1. Obtenga la probabilidad de que la companıa encuentre petroleo o gas en la primera perforacion y falle en la

segunda

2. Obtenga la probabilidad de que la companıa encuentre petroleo o gas en al menos una de las dos perforaciones.

Solucion 11. El experimento consiste en la perforacion de pozos en busca de petroleo o gas. El espacio muestral es:

Ω = e1,e2,e3,e4

donde, por ejemplo, e3 significa fracaso en la primera perforacion y exito en la segunda.

1. El evento de encontrar petroleo o gas en la primera perforacion y fracaso en la segunda perforacion es:

A = e2.

Por otro lado, se tiene por axioma P2, que

P(Ω) = P(e1)+P(e2)+P(e3)+P(e4) = 1

entonces

P(e2) = 1− (P(e1)+P(e3)+P(e4)) = 1− (0.01+0.09+0.81) = 0.09.

2. El evento de que encuentre petroleo o gas en al menos en una de las dos perforaciones es

B = e1,e2,e3

por lo tanto

P(B) = P(e1)+P(e2)+P(e3) = 0.01+0.09+0.09 = 0.19

Otra forma de calcular la probabilidad de P(B) es:

P(B) = 1−P(e4) = 1−0.81 = 0.19.



Ejemplo 2.5. Una agencia comercial compra papelerıa a uno de los tres vendedores v1, v2 y v3. Se ordena el pedido

en dos dıas consecutivos, un pedido por dıa, tal que (v1,v2) significa que el vendedor v1 recibe el pedido el primer dıa

y el vendedor v2 lo recibe el segundo dıa.

1. Determine los puntos muestrales de este experimento

2. Supongamos que se seleccionan los vendedores al azar cada dıa, asigne una probabilidad a cada punto muestral

3. Sean A el evento de que el mismo vendedor recibe los dos pedidos y el evento B de que el vendedor v2 consigue

por lo menos un pedido. Calcular: P(A), P(B), P(A∩B) y P(A∪B).

Solucion 12. El experimento consiste en la solicitud de papelerıa que hace una agencia comercial en dos

dıas consecutivos. Como (vi,v j) representa que el vendedor i recibio el primer pedido y j el segundo pedido.

Entonces

1. el espacio muestral es:

Ω = (v1,v1),(v1,v2),(v1,v3),(v2,v1),(v2,v2),(v2,v3),(v3,v1),(v3,v2),(v3,v3)

2. Como la seleccion se hace de manera aleatoria cada dıa, es natural suponer que todos los vendedores tienen la

misma posibilidad de ser seleccionados por lo tanto

P((vi,v j)) =19

; i,j=1, 2, 3.

3. Los eventos

A = (v1,v1),(v2,v2),(v3,v3)

B = (v1,v2),(v2,v1),(v2,v2),(v2,v3),(v3,v2)

A∩B = (v2,v2)

se tiene

P(A) = P((v1,v1),(v2,v2),(v3,v3)) =13

P(B) = P((v1,v2),(v2,v1),(v2,v2),(v2,v3),(v3,v2)) =59

P(A∩B) = P((v2,v2)) =19.

Por lo tanto

P(A∪B) = P(A)+P(B)−P(A∩B) =13+

59

19=

77.


2.4. PROBABILIDAD CONDICIONAL Universidad Popular del Cesar

2.4. PROBABILIDAD CONDICIONAL

La probabilidad condicional nos permite ajustar un evento si se sabe que ha ocurrido un evento relacionado con el

primero.

Definicion 2.8. . Sea B un evento del espacio muestral Ω tal que P(B)> 0. Entonces la probabilidad condicional del

evento A, dado que el evento B ocurrio, se define como la razon

P(A|B) = P(A∩BP(B)

.

De la misma manera se define

P(B|A) = P(A∩BP(A)

.

Tambien de la definicion de probabilidad condicional se obtiene lo que se conoce como teorema de multiplicacion

P(A∩B) = P(A|B)P(B) = P(B|A)P(A).

Ejemplo 2.6. Supongamos que en una oficina hay 100 maquinas calculadoras. Algunas de esas maquinas son electric-

as (E), mientras otras son manuales (M). Ademas, algunas son nuevas (N), mientras otras son usadas (U). La siguiente

tabla da el numero de maquinas de cada categorıa.

E M Total

N 40 30 70

U 20 10 30

Total 60 40 100

Una persona entra a la oficina, escoge una maquina al azar y descubre que es nueva. ¿Cual es la probabilidad de que

sea electrica?

Solucion 13. Se sabe que la persona escogio una maquina nueva de la 70 y se tienen 40, por lo tanto

P(E|N) =47.

Otra forma es calcular la probabilidad que se nueva y electrica,

P(E|N) = 0.40 y P(N) = 0.70.

Entonces

P(E|N) =P(E ∩N

P(N)=

0.400.70

=47.



Ejemplo 2.7. Considerese las familias que tienen dos hijos y supongamos que varones y mujeres son igualmente

probables. Si se escoge una familia al azar y en la familia hay un hijo varon ¿cual es la probabilidad de que el otro

sea varon?

Solucion 14. En este caso el espacio muestral es

Ω = (v,v),(v,m),(m,v),(m,m).

Donde v es varon, m es mujer y el orden del par es el orden de los nacimientos. Cada uno de los puntos tiene la

probabilidad 14 . Sean los eventos A: uno de los hijos es varon y B: ambos son varones, entonces

A = (v,v),(v,m),(m,v)

y

A = (v,v)

como B⊆ A entonces B = A∩B. Por lo tanto

P(A|B) = P(A∩B)P(B)

=13.

Definicion 2.9. Se dice que los eventos B1,B2,B3,B4, . . .Bn representa una particion del espacio muestral Ω si:

1. Bi∩B j = Φ para todo i 6= j.

2.n⋃

i=1Bi = Ω

3. P(Bi)> 0 para todo i = 1,2,3, . . . ,n.

Teorema 2.6 (Teorema de la Probabilidad Total). Sea B1,B2,B3, . . . ,Bn una particion del espacio muestral Ω y A un

evento de Ω. Entonces

P(A) =n

∑i=1

P(A|Bi)P(Bi).

Demostracion 6. Es facil observar en la figura 2.4 que A es la union disjunta de elementos de Ω, como se muestra en

la siguiente grafica.

Esto es:

A = (A∩B1)∪ (A∩B2)∪ (A∩B3)∪ . . .∪ (A∩Bn)

donde

(A∩B1)∩ (A∩B2 = Φ; para todo i 6= j



Figura 2.4: Particion de Ω

B1

B2

B3

Bn

A

entonces

P(A) =n

∑i=1

P(A∩Bi) (2.9)

pero tenemos que para i = 1,2, . . . ,n

P(A∩Bi) = P(A|Bi)P(Bi) (2.10)

sustituyendo (2.10) en (2.9), se obtiene

P(A) =n

∑i=1

P(A|Bi)P(Bi).

Ejemplo 2.8. Cierto artıculo se hace en una de tres fabricas, digamos 1,2 y 3. Se sabe que la primera produce

el doble de artıculos que la segunda. Tambien se sabe que la segunda y la tercera producen el mismo numero de

artıculo(durante un periodo de produccion especıfico). Se conoce tambien que el 2% de los artıculos producidos por

cada una de las dos primeras son defectuosos; mientras que 4% de los manufacturados por la tercera son defectuosos.

Todos los artıculos se colocan en una fila y se escoge uno al azar.

1. ¿Cual es la probabilidad de que este artıculo sea defectuoso?

2. Si las tres fabricas producen 10000 artıculos ¿Cual es el numero de artıculos defectuosos que produce cada

fabrica?

3. Si se sabe que el artıculo es defectuoso ¿Cual es la probabilidad de que este articulo proceda de la fabrica dos?

Solucion 15. Definamos

1. los siguientes eventos:



A = el artıculo es defectuoso

B1 = el artıculo proviene de la fabrica 1

B2 = el artıculo proviene de la fabrica 2

B3 = el artıculo proviene de la fabrica 3.

Entonces para i = 1,2,3

(A∩B1) = el articulo es defectuoso y proviene de la fabrica i

Luego

A = (A∩B1)∪ (A∩B2)∪ (A∩B3)

por otra parte se tiene que

P(A|B1) = 0.02

P(A|B2) = 0.02

P(A|B3) = 0.04

P(B1) = 0.5

P(B2) = 0.25

P(B3) = 0.25.

Reemplazando los valores anteriores en

P(A) = P(A|B1)P(B1)+P(A|B2)P(B2)+P(A|B3)(B3)

se obtiene

P(A) = (0.02)(0.5)+(0.02)(0.25)+(0.04)(0.25) = 0.025.

Por lo tanto la probabilidad que un artıculo sea defectuoso es 0.025.

Los puntos 2. y 3. se dejan al lector.



Ejemplo 2.9. Supongase que tenemos una urna con cuatro monedas de oro y tres de bronce, y una segunda urna

contiene tres de oro y cinco de bronce. Las monedas en las dos urnas son todas identicas. Se selecciona una moneda

de la primera urna y se coloca sin verla en la segunda urna. ¿Cual es la probabilidad de que ahora se seleccione una

moneda de bronce de la segunda?

Solucion 16. Sean B1 y B2, la seleccion de una moneda de bronce de la urna 1 y una moneda de bronce de la segunda

urna respectivamente, y O1 una moneda de oro de la urna 1. Debemos calcular la probabilidad de la union de los

eventos B1 ∩B2 y O1 ∩B2. Las diferentes posibilidades que se pueden dar se muestran el diagrama de arbol, figura

2.5. Entonces

Figura 2.5:

P(B 1)

=3

7

P(B2|B1)=

69 P(B1∩B2) = P(B2|B1)P(B1) =

1863

P(O2 |B1 ) = 39

P(B1∩O2) = P(O2|B1)P(B1) =963

P(O1 ) =

47

P(B2 |O1 ) = 59

P(O2|O1)=

49 P(O1∩O2) = P(O2|O1)P(O1) =

1663

P(B2∩O1) = P(B2|O1)P(O1) =2063

Por lo tanto, la probabilidad se seleccionar una moneda de bronce de la segunda urna es:

P((B1∩B2)∪ (O1∩B2)) = P(B1∩B2)+P(O1∩B2)

= P(B2|B1)P(B1)+P(B2|O1)P(O1)

=1863

+2063

=3863

.

Teorema 2.7 (Teorema de Bayes). Sea B1,B2,B3, . . . ,Bn una particion del espacio muestral Ω. Para cualquier evento

A de Ω, done P(A)> 0 y cualquier j, 1≤ j ≤ n. Entonces

P(B j|A) =P(A|B j)P(B j)n∑

i=1P(A|Bi)P(Bi)

.

Demostracion 7. Por la definicion de probabilidad condicional se tiene



P(B j|A) =P(A∩B j)

P(A)(2.11)

Por otra parte se tiene que

P(B j ∩A) = P(A | B j)P(B j) (2.12)

por teorema de la probabilidad total

P(A) =n

∑i=1

P(A | Bi)P(Bi) (2.13)

reemplazando (2.12) y (2.13) en (2.11) se obtiene

P(B j|A) =P(A | B j)P(B j)n∑

i=1P(A|Bi)P(Bi)

.

Ejemplo 2.10. Supongamos que varias cajas son de dos tipos B1 y B2 . El tipo B1 contiene 70% de caramelos dulces

y 30% de caramelos acidos, mientras que el tipo B2 dicho porcentaje esta invertido. Supongamos ademas que el 60%

de todas las cajas son del tipo B1 , mientras que el resto son del tipo B2. Si se escoge un caramelo dulce al azar de

una caja desconocida. Decidir de que tipo proviene.

Solucion 17. Se tienen dos tipos de cajas B1 y B2 con probabilidades de seleccion

P(B1) = 0.60

y

P(B2) = 0.40.

Sea los eventos

D = conjunto de caramelos dulces

A = conjunto de caramelos acidos

por otra parte se tiene que


2.5. EVENTOS INDEPENDIENTES Universidad Popular del Cesar

P(D|B1) = 0.70

P(D|B2) = 0.30

P(A|B1) = 0.30

P(A|B2) = 0.70.

Ası

P(B1|D) =P(D|B1)P(B1)

P(D|B1)P(B1)+P(D|B2)P(B2)=

(0.7)(0.6)(0.7)(0.6)+(0.3)(0.4)

=79

y

P(B2|D) =P(D|B2)P(B2)

P(D|B1)P(B1)+P(D|B2)P(B2)=

(0.3)(0.4)(0.7)(0.6)+(0.3)(0.4)

=29

Por lo tanto se decide a favor de los caramelos que provienen de las cajas B1.

2.5. EVENTOS INDEPENDIENTES

Definicion 2.10. Los eventos A1,A2,A3, . . . ,An de Ω se dicen independientes si para todo conjunto de ındices i1, i2, i3, . . . , ik

entre 1 y n se tiene que

P(Ai1 ∩Ai2 ∩Ai3 ∩ . . .∩Aik) = P(Ai1)P(Ai2)P(Ai3) . . .P(Aik).

En particular, los eventos A y B son eventos independientes en Ω, si

P(A∩B) = P(A)P(B).

Es facil verificar que los eventos Φ y Ω son independientes.

Ejemplo 2.11. Un lote de diez objetos contiene cuatro defectuosas y seis en buen estado. Se extraen dos objetos

sucesivamente y sin reemplazo. Sea

D1 = el primer objeto es defectuoso

D2 = el segundo objeto es defectuoso



1. ¿Son independientes estos eventos?

2. ¿Que sucede si los objetos se extraen con reemplazo?

Solucion 18. Si D1, el primer objeto es defectuoso, entonces

P(D1) =25

y la probabilidad del evento D2 el segundo objeto es defectuoso, es

P(D2) = P(D2|D1)P(D1)+P(D2|Dc1)P(D

c1) =

13

25+

49

35=

25.

Por otra parte, la probabilidad de D2 dado que ocurrio D1 es:

P(D2|D1) =39

de lo cual se tiene que

P(D2|D1) 6= P(D2)

En el segundo caso se tiene

P(D1) = P(D2) =25

y

P(D1∩D2) = P(D1)P(D2) =4

25.

Por lo tanto, si la seleccion se realiza con reemplazo los eventos son independientes.

Si A1,A2,A3, . . . ,An son eventos tales que Ai1 ,Ai2 ,Ai3 , . . . ,Aik son independientes para todos los indices distintos

i1, i2, . . . , ik, k = 1,2, . . . ,n−1, de esto no se sigue que

A1,A2,A3, . . . ,An

son independientes. Por ejemplo, se el lanzamiento de una moneda dos veces, y signemos una probabilidad de 1/4

a cada resultado de Ω = cc,cs,sc,ss. Sean los eventos

A = cc,cs

B = cc,sc

C = cc,ss

Entonces se tiene



P(A∩B) = P(cc) = 14 = P(A)P(B) = 1

212

P(A∩C) = P(cc) = 14 = P(A)P(C) = 1

212

P(B∩C) = P(cc) = 14 = P(B)P(C) = 1

212

pero

P(A∩B∩C) = P(cc) = 146= 1

8= P(A)P(B)P(C) =

12

12

12.

Entonces A y B, A y C, B y C son independientes pero A, B y C no lo son.

Inversamente, si P(A1∩A2∩ . . .∩An) = P(A1)P(A2) . . .P(An), esto no implica que

P(Ai1 ∩Ai2 ∩ . . .∩Aik) = P(Ai1)P(Ai2) . . .P(Ain)

cuando k < n. Por ejemplo, supongamos el lanzamiento de dos dados. Es claro, que el espacio muestral Ω es conjunto

formado por todas las parejas (i, j), i, j = 1,2,3,4,5,6 con probabilidad 1/36. Sean los siguientes eventos

A = el segundo dado muestra 1, 2, o 5

B = el segundo dado muestra 4, 5 , o 6

B = la suma de las dos caras sea nueve

En este caso, es facil ver que

P(A∩B) 6= P(A)P(B)

P(A∩C) 6= P(A)P(C)

P(B∩C) 6= P(B)P(C)

pero

P(A∩B∩C) = P(A)P(B)PC).

Por lo tanto los eventos A, B y C no son independientes.



Ejemplo 2.12. El siguiente circuito (figura 2.6) funciona si y solo si hay un camino en el cual todos los dispositivos

funcionan de izquierda a derecha. Suponga que los dispositivos funcionen de forma independiente y que la probabili-

dad de que funcione un dispositivo es como se muestra en la grafica.

1. ¿Cual es la probabilidad de que el circuito funcione?

2. ¿Cual es la probabilidad de que el no circuito funcione?

Figura 2.6:

0.90 0.90

0.97

0.98

0.98

0.99

A1 A2

A3

A4

A5

A6

Solucion 19. Para solucionar este problema procedemos como sigue:

1. La trayectoria de A1 a A2 funciona si y solo si los dispositivos A1 y A2 funcionan simultaneamente. Por lo tanto,

la probabilidad de que funciona, dado que los dispositivos funcionan de manera independiente, es:

P(A1∩A2) = P(A1)P(∩A2) = (0.90)(0.90) = 0.81

Ası, se tiene el siguiente circuito equivalente al dado en la figura 2.6

Figura 2.7:

0.81

0.97

0.98

0.98

0.99

A1

A3

A4

A5

A6

Por otra parte, la trayectoria del rectangulo en el circuito de la 2.7 funciona si los dispositivos A1 o A3 funciones,

es decir, no funciona si y solo si los dispositivos A1 y A3 no funcionan simultaneamente. En consecuencia, la

probabilidad que no funcione es:



P(Ac1∩Ac

3) = P(Ac1)P(A

c3) = (1−P(Ac

1))(1−P(Ac3)) = (1−0.81)(1−0.97) = 0.0057

Luego la probabilidad que funcione la trayectoria del rectangulo es:

P(A1∪A3) = 1−P((A1∪A3)c) = 1−P(Ac

1∩Ac3) = 1−0.0057 = 0.9943

De manera similar se resuelve para el caso de la trayectoria compuesta por el cuadrado

P(A4∪A5) = 1− (1−P(Ac4))(1−P(Ac

5)) = 0.9996

Resumiendo lo anterior se llega al circuito

Figura 2.8:

0.994 0.999 0.990

A1 A2 A3

Para que el circuito de la figura 2.8 funcione es necesario que los tres dispositivos funciones simultaneamente,

y por ser independientes, la probabilidad que funcione el circuito es:

P(A1∩A2∩A3) = P(A1)P(A2)P(A3) = 0.983.

2. La probabilidad que no funcione el circuito de la figura 2.6 es: 0.017.

2.6. EJERCICIOS

1. F Supongamos que se lanzan tres monedas perfectas y se observa el resultado de las caras que quedan hacia

arriba.

a) Establezca los puntos muestrales de este experimento.

b) Asigne una probabilidad razonable a cada punto.

c) Sea A el evento de observar exactamente una cara y B el evento de observar al menos una cara. Obtenga

los puntos muestrales de los eventos A y B.

d) De la respuesta de (c), calcular P(A), P(B), P(A∩B), P(A∪B) y P(Ac∩B).

2. F Cuatro administradores de empresa solicitan dos puestos en una companıa. Uno y solamente uno de los

aspirantes es miembro de una etnica de la Sierra Nevada de Santa Marta. Los puestos se otorgan seleccionado

aleatoriamente dos de los aspirantes.




b) Asigne las probabilidades a los resultados del espacio muestral.

c) Encuentre la probabilidad de que el aspirante de la etnica de la Sierra Nevada de Santa Marta se selec-

cionado para un puesto.

3. F Un equipo de comunicacion contiene seis sistemas electronicos complejos. Se seleccionan aleatoriamente

dos de los seis para someterlos a pruebas rigurosas y clasificarlos como defectuosos y no defectuosos.

a) Si dos de los seis sistemas son realmente defectuosos, encuentre la probabilidad que al menos uno de los

dos sistemas probados sean defectuosos. Encuentre la probabilidad que los dos sean defectuosos.

b) Encuentre la probabilidad indicada en (a) para el caso en que cuatro de los seis sistemas sean realmente

defectuosos.

4. F Un supermercado vende solamente dos tipos de lamparas electricas y la experiencia muestra que tienen

igual demanda. Cuatro clientes entran uno tras otro para comprar una lampara. El vendedor se interesa por la

preferencia de sus clientes.



c) Sea A el evento de que los cuatro clientes prefieren el mismo tipo de lampara. Calcular P(A).

5. F Dos equipos de futbol, I Y II, tienen la misma capacidad y juegan uno contra el otro una serie de cuatro

juegos. Se registra el resultado de cada juego.

a) Establezca los puntos del espacio muestral de este experimento.


c) Sea A el evento de que el equipo I gana exactamente tres veces. Calcular P(A).

6. F Los enfermos no hospitalizados que acuden a una clınico pueden elegir una de tres secciones para ser aten-

didos. Suponga que los medicos son asignados aleatoriamente a tales secciones y que por esto los pacientes no

presentan preferencia alguna con respecto a una seccion. Tres pacientes acuden a la clınico y se observan la

seccion que eligen.

a) Establezca los puntos del espacio muestral de este experimento.


c) Sea A el evento de que cada seccion recibe un paciente. Establezca los puntos muestrales de A. Calcular

P(A).



7. Se tienen 3 libros: uno de aritmetica (A), uno de biologıa (B) y otro de calculo(C). ¿De cuantas maneras se

pueden ordenar en un estante?

8. Se tienen 7 libros y solo 3 espacios en una biblioteca, suponiendo que no existan razones para preferir alguno.

¿De cuantas maneras se pueden colocar 3 libros elegidos; entre los siete dados?

9. ¿Cuantas permutaciones pueden formarse con las letras de la palabra BONDAD?

10. Cuantos grupos de 5 alumnos pueden formarse con los treinta alumnos de una clase. (Un grupo es distinto de

otro si se diferencia de otro por lo menos en un alumno).

11. Una aerolınea tiene seis vuelos diarios Barranquilla a Medellın y siete vuelos de Medellın a Cali. Si los vuelos

se hacen en dıas separados. ¿Cuantos arreglos diferentes de vuelos puede ofrecer la aerolınea de Barranquilla a

Cali?

12. Una operacion de montaje en una fabrica manufacturara requiere tres pasos que pueden realizarse en cualquier

orden. ¿De cuantas maneras se puede hacer el montaje?

13. Cierta marca de automovil tiene cinco modelos diferentes, con cuatro tipo de motores, con dos tipos de trans-

mision, y en ocho colores.

a) ¿Cuantos automoviles tendrıa que adquirir un distribuidor si quiere incluir un carro por combinacion

modelo-motor-trasmision?

b) ¿Cuantos automoviles tendrıa que tener en existencia un centro de distribucion si almacenara los carros de

todos los colores disponibles para cada combinacion en (a.)?

14. Un investigador quiere determinar el efecto de tres variables, presion, temperatura y el tipo de catalizador, en

el proceso de refinacion. Si el investigador tiene la intencion de utilizar tres temperaturas, tres presiones y dos

tipos de catalizador. ¿ Cuantos experimentos habrıa que hacer si quiere incluir todas las posibles combinaciones

de temperaturas, de presiones y tipos de catalizador?

15. F Cinco empresas F1,F2,F3,F4 y F5, hacen propuestas con respecto a tres contratos separados, C1,C2 y C3.

Una empresa solo puede obtener a lo mas un contrato. Los contratos son bastante diferentes, de tal manera que

la asignacion de C1 a F1 se debe diferenciar de la asignacion de C2 a F2.

a) ¿Cuantos puntos muestrales tiene este experimento que trata de la asignacion de los contratos a las empre-

sas?

b) Encuentre la probabilidad de que se conceda un contrato a la empresa F3, bajo el supuesto de que los

puntos muestrales son equiprobable.

16. F Dado los siguientes eventos A y B, tales que P(A) = 0.5, P(B) = 0.3, y P(A∩B) = 0.1, encontrar lo siguiente:



a) P(A|B)

b) P(B|A)

c) P(A|A∩B)

d) P(A|A∪B)

e) P(A∪B|A∩B)

17. F Un armador de ventiladores electricos usa motores de dos proveedores. La companıa A le suministra el 70%

y la companıa B el otro 30% de los motores. Supongamos que sabe que el 5% de los motores que suministra la

companıa A son defectuosos que el 3% de los que suministra B tambien lo son. Se selecciona un ventilador ya

armado.

a) ¿Cual es la probabilidad que tenga un motor defectuoso?

b) ¿Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido suministrado por la companıa

A?

c) ¿Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido suministrado por la companıa

B?

18. F Los empleados de un supermercado se encuentra clasificado en tres categorıas: administradores, supervisores

y vendedores. La siguiente tabla indica el numero de empleados en cada division clasificados por sexo:

Mujeres (M) Hombres (H) Total

Administradores (A) 20 30 50

Supervisores (S) 50 20 70

Vendedores (V) 100 80 180

Total 170 130 300

a) Si elige aleatoriamente un empleado:

1) ¿Cual es la probabilidad que sea mujer?

2) ¿Cual es la probabilidad que sea un vendedor?

3) ¿Cual es la probabilidad que sea mujer y trabaje en la seccion de administracion?

4) ¿Cual es la probabilidad que sea mujer si trabaja en la division de supervision?

b) ¿Son los eventos V y H estadısticamente independientes?

c) ¿Son los eventos A y M estadısticamente independientes?

d) Determine las siguientes probabilidades:

1) P(A∪M)

2) P(A∪Mc)



3) P(S∩M)

4) P(M|A)

19. Sean A y B dos eventos cualesquiera de un espacio muestral Ω. Si A y B son mutuamente excluyentes, muestrese

que no pueden ser independientes. Deduzcase que dos eventos independientes son, tambien, mutuamente.

20. Se lanza una moneda diez veces y en todos los lanzamientos el resultado es cara.

a) ¿Cual es la probabilidad de este evento?

b) ¿Cual es la probabilidad de que en el decimoprimero lanzamiento el resultado sea cara?

21. Una agencia de automoviles recibe un embarque de 20 automoviles nuevos. Entre estos, dos tienen defectos. La

agencia decide seleccionar, aleatoriamente, dos automoviles entre los 20 y aceptar el embarque si ninguno de

los dos vehıculos seleccionados tienen defectos. ¿Cual es la probabilidad de aceptar el embarque?

22. F Se lanza una moneda con una probabilidad de 23 que el resultado sea cara. Si aparece una cara, se extrae una

pelota, aleatoriamente, de una urna que contiene dos pelotas rojas y tres verdes. Si el resultado es sello se extrae

una pelota, de otra urna, que contiene dos rojas y dos verdes. ¿Cual es la probabilidad de extraer una pelota roja?

23. De entre 20 tanques de combustible fabricados para el trasbordador espacial, tres se encuentran defectuosos. Si

se seleccionan aleatoriamente cuatro tanques:

a) ¿Cual es la probabilidad que ninguno de los tanques se encuentre defectuoso?

b) ¿Cual es la probabilidad de que uno de los tanques tenga defectos?

24. F La probabilidad de que cierto componente electrico funcione es de 0.9. un aparato contiene dos de estos

componentes. El aparato funciona mientras lo haga, por lo menos, uno de los componentes.

a) Sin importar cual de los dos componente funcione o no. ¿Cuales son los posibles resultados y sus respec-

tivas probabilidades?. Suponga independencia en la operacion entre los componentes.

b) ¿Cual es la probabilidad que el aparato funcione?

25. F Con base en varios estudios una companıa ha clasificado, de acuerdo con la posibilidad de descubrir petroleo,

las formaciones geologicas en tres tipos. La companıa pretende perforar un pozo en determinado sitio, al que

le asigna las probabilidades 0.35, 0.40 y 0.25 para los tres tipos de formaciones respectivas. De acuerdo con la

experiencia, se sabe que el petroleo se encuentra en un 40% de formaciones de tipo I, en un 20% de formaciones

de tipo II y en un 30% de formaciones de tipo III. Si la companıa no descubre petroleo en ese lugar, determınese

la probabilidad de que exista una formacion de tipo II.

26. F Se debe examinar un grupo grande de personas respecto a dos sıntomas comunes de cierta enfermedad. Se

considera que el 20% de las personas presentan solamente el sıntoma A, el 30% tienen solamente el sıntoma B,



10% tienen ambos sıntomas, y el resto no tiene sıntoma alguno. Para una persona escogida aleatoriamente de

este grupo, encuentre las probabilidades de los eventos siguientes:

a) ¿Que la persona presente al menos un sıntoma?

b) ¿Que la persona no presente sıntoma alguno?

c) ¿Que la persona presente ambos sıntoma, dado que presenta el sıntoma B?

27. F Una planta ensambladora recibe circuitos proveniente de tres fabricas distintas B1, B2 y B3. El 50% del total

se compran a B1 mientras que a B2 y B3 se les compra un 25% a cada una. El porcentaje de circuitos defectuosos

para B1, B2 y B3 es 5, 10 y 12% respectivamente. Si los circuitos se almacenan en la planta sin importar quien

fue el proveedor:

a) Determinar la probabilidad de que una unidad armada en la planta contenga un circuito defectuoso

b) Si un circuito no es defectuoso. ¿Cual es la probabilidad de que haya sido vendido por el proveedor B2?

28. Supongamos que hay nueve lugares disponibles en un estacionamiento, uno junto al otro. Un acomodador tiene

que estacionar nueve carros. Tres son carros deportivos, tres son carros grandes nacionales, y tres son carros com-

pactos importados. ¿Cual es la probabilidad de que los tres carros deportivos se encuentren juntos, suponiendo

que el acomodador estaciona los carros de manera aleatoria?

29. Se clasifican ocho marcas de llantas de 1 a 8 (de la mejor a la peor) segun el kilometraje que aguanten. Si

un comprador escoge cuatro llantas aleatoriamente, encuentre la probabilidad de que la mejor llanta entre las

seleccionadas por el comprador se encuentre realmente en el tercer lugar entre las ocho llantas originales.

30. Una maquinaria para producir un nuevo tubo electronico experimental genera tubos defectuosos de vez en cuan-

do, de una manera aleatoria. El ingeniero supervisor de una maquina en particular, ha notado que los tubos defec-

tuosos parecen agruparse (y, por tanto, aparecen de manera no aleatoria) y esto sugiere el mal funcionamiento

de alguna de la maquina. Una prueba para detectar la no aleatoriedad de un evento, se basa en el numero de

corridas de artıculos defectuosos y buenos (una corrida es una sucesion no interrumpida de artıculos defectu-

osos o buenos). Mientras mas pequena sea el numero de corridas, mas grande es la evidencia que indica la no

aleatoriedad. De 12 tubos producidos por la maquina, los 10 primeros eran buenos y los dos ultimos defectuosos

(BBBBBBBBBBDD). Suponga la aleatoriedad.

a) ¿Cual es la probabilidad de observar la secuencia antes mencionada (resultante de dos corridas) dado que

los 10 tubos de 12 son buenos?

b) ¿Cual es la probabilidad de observar dos corridas?

c) ¿Cual es la probabilidad de que el numero de corridas R sea R=3?

31. F Suponga que la probabilidad de exposicion a la gripe durante una epidemia es 0.6. La experiencia ha mostrado

que una vacuna tiene 80% de efectividad en proteger a una persona sobre la gripe, si esta expuesta a la epidemia.



Una persona tiene una probabilidad de 0.90 de ser afectada por la gripe al ser expuesta. Dos personas, una

vacunada y la otra no, realizan una tarea altamente especializada en un negocio. Suponga que no se ubican en la

misma localizacion, que no entra en contacto con la misma persona, y no se expone la una a la otra. ¿Cual es la

probabilidad de que al menos una sea afectada por la gripe?

32. F Si A y B son eventos tales que A⊆ B. Demuestrese que P(A)≤ P(B).

33. F Sean A, B y C eventos mutuamente excluyentes. Entonces

P(A∪B∪C) = P(A)+P(B)+P(C)

34. F Sean A y B eventos cualesquiera. Entonces

P(A∩B)≥ P(A)+P(B)−1

35. F Sean A, B y C eventos cualesquiera. Entonces

P(A∪B∪C) = P(A)+P(B)+P(C)−P(A∩B)−P(A∩C)−P(B∩C)+P(A∩B∩C)

36. F Sea (Ω,P) un espacio de probabilidad. Dada la funcion PH :℘(Ω) 7→ℜ, definida por

PH(A) =P(A∩H)

P(H)

donde A y H son subconjuntos de Ω y P(H)> 0.

Demuestrese que

a) PH es un funcion de probabilidad

b) PH(Φ) = 0

c) PH(A∪B) = PH(A)+PH(B), si A∩B = Φ

d) PH(Ac) = 1−P(A)

e) PH(A∪B) = PH(A)+PH(B)−PH(A∩B), para A y B eventos cualesquiera.

37. F Sean A1,A2, . . . ,An eventos definidos en el espacio muestral Ω y Ai∩A j = Φ, i 6= j. Demostrar que

P(n⋃

i=1

Ai) =n

∑i=1

P(Ai)

38. Sea A evento tal que A⊆Ω. Demuestrese que P(A)≤ 1.

39. F Sea A1,A2, . . . ,An una particion del espacio muestral Ω y B un evento de Ω. Entonces

P(B) =n

∑i=1

P(Ai∩B)



40. F Sean A1,A2, . . . ,An eventos del espacio muestral Ω. Entonces

P(n⋃

i=1

Ai)≤n

∑i=1

P(Ai)

41. F Sean A1,A2, . . . ,An eventos del espacio muestral Ω. Entonces

P(n⋃

i=1

Ai) =n

∑i=1

P(Ai)−n

∑i< j

P(Ai∩A j)+n

∑i< j<k

P(Ai∩A j ∩Ak)− . . .+(−1)n+1P(A1∩A2∩ . . .∩An

42. F Sean A y B eventos cualesquiera del espacio muestral Ω, tales que P(A) = 0.2, P(B) = 0.3 y P(A∪B) = 0.4.

Calcular:

a) P(A∩B)

b) P(Ac∪B)

c) P(Ac∩Bc)

d) P(Ac∪Bc)

43. F Sean A y B eventos independientes del espacio muestral Ω tales que P(A) = 0.5 y P(B) = 0.4. Calcular:

a) P(A∩B)

b) P(Ac∪B)

c) P(Ac∩Bc)

d) P(Ac∪Bc)

44. F Sean A y B eventos cualesquiera del espacio muestral Ω. Demuestrese:

a) Si A∩B = Φ =⇒ P(A|B) = 0

b) Si A⊆ B =⇒ P(B|A) = 1

45. Se lanzan dos dados hasta que la suma de los dos puntos sea 7 u 8. si sale 7, gana el jugador A, y si sale 8 gana

el jugador B. ¿Cual es la probabilidad que gane B?

46. F En el control preventivo de una poblacion donde la proporcion de enfermos es, se usa el examen radiologi-

co para detectar posibles enfermos. Se sabe que la probabilidad de que, aplicando el examen a un enfermo,

la muestra como tal, es 0.90; y que la probabilidad de que el examen aplicado a una persona sana la senale

como enfermo es 0.01. calcular la probabilidad de que una persona dada este realmente enferma, si el examen

radiologico lo mostro como tal. Considerese el experimento de elegir una persona de la poblacion de manera

aleatoria.

47. F Supongamos que tenemos tres escritorios identicos, A, B y C, cada uno con dos cajones. En A, cada cajon

contiene una moneda de oro; en B, un cajon contiene una moneda de oro y el otro una de plata, y en C, cada

cajon contiene una de plata. Se elige un escritorio al azar, se abre uno de los cajones y encontramos una moneda

de oro. ¿Cual es la probabilidad de que el escritorio elegido sea el B?



48. F Sean A y B dos eventos independientes tales que con probabilidad 16 ocurren simultaneamente, y con proba-

bilidad 13 ninguno ocurre. Halle P(A) y P(B). ¿Estan determinadas en forma unica estas probabilidades?

49. F Sean A y B dos eventos independientes tales que con probabilidad 16 ocurren simultaneamente, y con proba-

bilidad 13 ocurre A y B no ocurre. Halle P(A) y P(B). ¿Estan determinadas en forma unica estas probabilidades?

50. F ¿Cual es el menor valor de n para el cual la probabilidad de obtener al menos un 6 en una serie de n lanza-

mientos de un dado es mayor que 34 ?

51. Los A1,A2, . . . son independientes y P(Ai) = p, i = 1,2, . . . . Hallar el menor n para el cual P(n⋃

i=1Ai)≥ p0, donde

p0 es un numero fijo.

52. F Sean A y B dos eventos cualesquiera. ¿Cual de las siguientes afirmaciones es falsa?

a) P(A|B)+P(Ac|Bc) = 1

b) P(A|B)+P(A|Bc) = 1

c) P(A|B)+P(Ac|B) = 1

53. Sean A y B dos eventos cualesquiera tales que P(A|B) = P(B|A), P(A∪B) = 1 y P(A | B) > 0. Demostrar que

P(A)> 1/2.

54. Sean A1,A2, . . . ,An eventos independientes en el espacio muestral Ω si 0 < P(A j) < 1 para todo j. Demostrar

que Ω tiene por lo 2n puntos.

55. Demuestre que si P(A|C)≥ P(B|C) y P(A|Cc)≥ P(B|Cc), entonces P(A)≥ P(B).

Sean A y B dos eventos cualesquiera del espacio muestral Ω. Diremos que el evento A atrae al evento B si

P(B|A)> P(B) y rechaza a B si P(B|A)< P(B).

56. Probar que A atrae a B si y solo si B atrae a A. Luego diremos que A y B son mutuamente atractivos si A atrae B.

57. Probar que A no atrae ni rechaza a B si y solo si A y son B independientes.

58. Probar que A y B son mutuamente atractivos si y solo si P(B|A)> P(B|Ac).

59. Probar que A atrae a B, entonces A rechaza a Bc.

60. Probar que si A atrae B y C, y A rechaza a B∩C, entonces A atrae B∪C. Hallar un ejemplo en el cual A atrae a

B y C y rechace a B∪C?

61. Probar que si B1,B2, . . . ,Bn es una coleccion mutuamente disjunta y si A atrae algun Bi, entonces A rechaza

algun B j.

62. Muestre que para A y B eventos en un espacio de probabilidad:



a) P((A∩Bc)∪ (B∩Ac)) = P(A)+P(B)−2P(A∩B)

b) P(A∩B)≤ P(A)≤ P(A∪B)≤ P(A)+P(B)

c) Si P(A) = α y P(B) = β entonces P(A∩B)≥ α +β −1.

63. Un suero de la verdad tiene la propiedad de que el 90% de los sospechosos culpables se juzgan de forma

adecuada; mientras que, por supuesto, 10% de lo sospechosos erroneamente se consideran inocentes. Por otro

lado, a los sospechosos inocentes se les juzga de manera erronea 1% de las veces. Si el sospechoso se selecciona

de un grupo de sospechosos, de los cuales solo el 5% alguna vez han cometido un delito, y el suero indica que

es culpable, ¿cual es la probabilidad de que sea inocente?


CAPITULO 3

VARIABLES ALEATORIAS

En el capıtulo anterior se estudio los conceptos basicos de probabilidad con respecto a los resultados posibles

de un experimento aleatorio. Se considero al espacio muestral Ω, como el conjunto de todos los resultados posibles

de un experimento aleatorio. Estos resultados pueden ser cualitativos o cuantitativos. Por ejemplo, en un proceso

de fabricacion se puede estar interesado en el hecho si el producto es defectuoso o no defectuoso o una persona

puede estar interesada en el consumo de agua diarias de una familia en Valledupar. Con frecuencia puede ser util la

cuantificacion de los resultados de un espacio muestral y, mediante la asignacion de un numero real a cada elemento

de Ω, estudiar su comportamiento aleatorio. El concepto de variable aleatoria facilita un medio para relacionar un

resultado de un espacio muestral con un numero real. Es decir, utilizaremos el concepto de variable aleatoria para

referirnos a experimentos donde cada resultado posible queda caracterizado por un valor numerico.

3.1. VARIABLES ALEATORIAS DISCRETAS

Hasta ahora, estamos familiarizados con una funcion cuyo dominio y recorrido son subconjuntos de los numeros

reales. Una funcion que tiene como dominio un espacio muestral y su recorrido es un subconjunto de los numeros

reales la llamaremos variable aleatoria.

Definicion 3.1. Sea (Ω,P) un espacio de probabilidad. Una funcion

X : Ω→ℜ

se llama una variable aleatoria real.

Es decir, una funcion X que asigna a cada uno de los elementos w ∈ Ω, un numero real X(w), se llama una variable

aleatoria.

Ejemplo 3.1. Considerese el experimento del lanzamiento de dos monedas una sola vez. El espacio muestral es:

Ω = cc,cs,sc,ss

98

3.1. VARIABLES ALEATORIAS DISCRETAS Universidad Popular del Cesar

Sea la variable aleatoria X =“numero de sellos en el lanzamiento de las dos monedas”, entonces los posibles valores

de esta variable aleatoria son: X(cc) = 0, X(cs) = 1, X(sc) = 1 y X(ss) = 2.

Ejemplo 3.2. Supongase que se lanza un dado corriente dos veces consecutivas. Entonces en este caso el espacio

muestral es:

Ω =

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

y definamos la variable aleatoria X =“suma de las dos caras”, entonces los posibles valores de esta variable aleatoria

son: X = 2,3,4,5,6,7,8,9,10,11,12.

En un espacio muestral, se puede definir mas de una variable aleatoria. Ası, por ejemplo, X(x,y) = max(x,y) es otra

variable aleatoria definida en el anterior espacio muestral, cuyo valores son: X = 1,2,3,4,5,6.

Definicion 3.2. Sea X una variable aleatoria definida sobre el espacio muestral Ω. Si el numero de valores posibles

de X es a lo mas numerable, diremos que X es una variable aleatoria discreta. Es decir, si se pueden anotar los valores

posibles de X como x1,x2, . . . ,xn, . . .. En el caso finito, la lista termina y en el caso infinito numerable, la lista continua

indefinidamente.

Las variables aleatorias definidas en los ejemplos anteriores, son claramente variables aleatorias discretas.

Definicion 3.3. Sea X una variable aleatoria discreta definida sobre el espacio de probabilidad (Ω,P). La funcion de

probabilidad de densidad (abreviada fpd) de X, se define como la funcion PX (x) tal que para cualquier numero real

x ∈ℜ,

PX (x) = PX (X = x) = P(w ∈Ω|X(w) = x)

La funcion de probabilidad de densidad PX (x) para una variable aleatoria discreta X se representa por una formula,

una tabla o una grafica que indique las probabilidades PX (x) correspondientes a cada uno de los valores de x ∈ℜ.

Ejemplo 3.3. Hallar la funcion de probabilidad de densidad para la variable aleatoria del ejemplo 1. En este caso,

PX (0) = PX (X = 0) = P(ss) = 14

PX (1) = PX (X = 1) = P(sc,cs) = 12

PX (2) = PX (X = 2) = P(cc) = 14



Observese que PX (0) = 14 es la probabilidad de que en un lanzamiento de dos monedas no salga ninguna cara. La

funcion de distribucion de probabilidad de la anterior variable aleatoria X se puede representar de las siguientes

maneras:

1. Mediante una tablaX = x 0 1 2

PX (x) 14

12

14

2. Mediante una formula

PX (x) =

(

2x

)(0.5)2 si x = 0,1,2

0 en otra parte.

3. Mediante una grafica

−1 0 1 2x

14

12

f (x)

Definicion 3.4. Sea X una variable aleatoria definida sobre el espacio de probabilidad (Ω,P). Para cualquier numero

real x ∈ℜ, la funcion de distribucion acumulada de X (abreviada fda), la cual se notara por F(x), se define por:

F(x) = P(w ∈Ω | X(w)≤ x

Observese que F(x) es la probabilidad del conjunto de todos los puntos del espacio muestrales Ω cuya imagen a traves

de la variable aleatoria X son menores o iguales a x ∈ℜ.

Ejemplo 3.4. Hallar la funcion de distribucion acumulada de la variable aleatoria X del ejemplo 1.

En este caso, como F(x) esta definida en todo el conjunto de los reales es claro que

F(x) = P(w ∈Ω | X(w)≤−0.0001= P(Φ) = 0



Es decir, para todo numero real menor que cero es cero. La probabilidad que no salga una cara es

F(0) = P(w ∈Ω | X(w)≤ 0= P(ss) = 14

La probabilidad que salga a lo mas una cara en dos lanzamiento de una moneda es

F(1) = P(w ∈Ω | X(w)≤ 1= P(ss,sc,cs) = 34

La probabilidad que salga a lo mas dos cara en dos lanzamiento de una moneda es

F(2) = P(w ∈Ω | X(w)≤ 2= P(ss,sc,cs,cc) = 44= 1

Es facil comprobar que la anterior funcion de distribucion F(x) es constante en los intervalos (−∞,0), [0,1), [1,2),

[2,+∞).

Tambien se puede representar a F(x) mediante:

1.

F(x) =

0, si x < 0

14 , si 0≤ x < 1

34 , si 1≤ x < 2

1, si x≥ 2

2. Una tabla como sigue

X ≤ x (−∞,0) [0,1) [1,2) [2,+∞)

F(x) 0 14

34 1

3. Una grafica


3.2. VARIABLES ALEATORIAS CONTINUAS Universidad Popular del Cesar

0 1 2x

14

34

1

f (x)

3.2. VARIABLES ALEATORIAS CONTINUAS

Definicion 3.5. Una variable aleatoria X se dice que es continua si F(x) es continua y la derivada F ′(x) existe excepto

a lo mas en un numero contable de valores. La funcion de densidad de probabilidad f (x), se define por

f (x) =dF(x)

dx= F ′(x)

De esta definicion se deduce que si X es una variable aleatoria continua se tiene que la probabilidad en un punto es

cero. Tambien se tiene, por Teorema Fundamental del Calculo, que se puede escribir como

F(x) =∫ x

−∞

f (t)dt

Teorema 3.1. Sea F(x) la funcion de distribucion acumulada de una variable aleatoria X continua. Entonces

1. f (x)≥ 0 para todo x ∈ℜ

2. P(a≤ X ≤ b) = F(b)−F(a)

3.∫

∞

−∞f (x)dx = 1

Demostracion 8. Para demostrar a (a) es suficiente observar que F(x) es una funcion no decreciente, por lo tanto la

primera derivada de F(x) es mayor o igual a cero. Es decir, F ′(x) = f (x)≥ 0.

Para probar que una funcion f (x) es una funcion de probabilidad o de densidad de una variable aleatoria X continua

es suficiente demostrar que satisface las condiciones (a) y (c) del teorema anterior.

Teorema 3.2. Sea F(x) la funcion de distribucion acumulada de una variable aleatoria discreta o continua X. En-

tonces

1. Si x1 < x2 entonces F(x1)≤ F(x2)



2. lımx→−∞ F(x) = F(−∞) = 0 y lımx→∞ F(x) = F(∞) = 1

3. F(x) es continua a la derecha para todo numero real. Es decir, F(x+) = lımh→0 F(x+h) = F(x) = 0, h > 0

Ejemplo 3.5. Sea una variable aleatoria X con funcion de distribucion acumulada F definida por,

F(x) =

0, si x≤ 1

ln(x), si 1 < x≤ e

1, si e < x

1. Encontrar f (x)

2. Demuestre que f (x) satisface las propiedades de una funcion de probabilidad

3. Graficar f (x) y F(x). Calcular las siguientes probabilidades:

4. PX (X < 2)

5. PX (2 < X < 2 12 )

6. PX (2 < X ≤ 2 12 )

Solucion 20.

1. Derivando F(x) se tiene que

f (x) = F ′(x) =

0, si x < 1

1x , si 1 < x < e

0, si e < x

Es decir,

f (x) = F ′(x) =

1x , si 1 < x < e

0, en otra parte

2. Demostremos que f (x) es una funcion de probabilidad (fdp). En efecto, f (x)> 0 si 1 < x < e y f (x) = 0 en otra

parte, por lo tanto f (x)≥ 0 para todo numero real x.

Calculemos las siguientes probabilidades

3.

PX (X < 2) =∫ 2

−∞

f (x)dx =∫ 1

−∞

0dx+∫ 2

1

1x

dx

=∫ 2

1

1x

dx = ln(x)∣∣∣∣21= ln(2)− ln(1) = ln(2)



4.

PX (2 < X < 212) = PX (2 < X <

52) =

∫ 2

−∞

f (x)dx

=∫ 5

2

2

1x

dx = ln(x)∣∣∣∣ 5

2

2= ln(5/2)− ln(2)

= ln(5)− ln(2)− ln(2) = ln(5)−2ln(2)

5. Como f es una funcion continua entonces es claro que el area bajo los intervalos (1,2 12 ) y (1,2 1

2 ] es la misma.

Ejemplo 3.6. Sea X una variable aleatoria con funcion de densidad dada por

f (x) =

0.2 si −1 < x≤ 0

0.2+ cx si 0 < x≤ 1

0 en otro caso

1. Determine el valor de c para que f sea una funcion de densidad

2. Obtener F(x)

3. Graficar f (x) y F(x)

4. Utilizar F(x) de (b) para calcular F(−1), F(0) y F(1)

5. Calcular PX (0≤ x≤ 0.5) de dos maneras

6. Calcular PX (X > 0.5 | X > 0.1)

Solucion 21.

1. Para determine el valor de c para que f sea una funcion de densidad, calculemos la integral∫∞

−∞

f (x)dx = 1

Es decir, ∫∞

−∞

f (x)dx =∫ −1

−∞

0dx+∫ 0

−10.2dx+

∫ 1

00.2+ cxdx = 1

⇒ 0.2x∣∣∣∣0−1

+0.2x∣∣∣∣10+

cx2

2

∣∣∣∣10= 0.2+0.2+

c2

= 0.4+c2= 1

⇒ 0.8+ c = 2

⇒ c = 1.2



Por lo tanto

f (x) =

0.2 si −1 < x≤ 0

0.2+1.2x si 0 < x≤ 1

0 en otro caso

2. Para obtener F(x) se hace una particion de los numeros reales en los intervalos (−∞,−1], (−1,0], (0,1] y

(1,+∞) y se procede como sigue:

Si x ∈ (−∞,−1] entonces

∫ x

−∞

f (t)dt =∫ x

−∞

0dt = 0

Si x ∈ (−1,0] entonces

∫ x

−∞

f (t)dt =∫ x

−∞

0dt +∫ x

−10.2dt = 0+0.2t

∣∣∣∣x−1

= 0.2x+0.2

Si x ∈ (0,1] entonces

∫ x

−∞

f (t)dt =∫ x

−∞

0dt +∫ 0

−10.2dt +

∫ x

10.2+1.2xdt

= 0+0.2t∣∣∣∣0−1

+0.2t +1.2t2

2

∣∣∣∣x1

= 0.2+0.2x+1.2x2

2

=1.2x2

2+0.2x+0.2

Por lo tanto

F(x) =

0 si x≤−1

0.2x+0.2 si −1 < x≤ 0

1.2x2

2 +0.2x+0.2 si 0 < x≤ 1

1 si x > 1

3. Graficar f (x) y F(x)


3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA Universidad Popular del Cesar

4. Calculemos F(−1), F(0) y F(1) utilizando F(x) de (b), como F(x) = 0.2x+0.2 si 0 < x≤ 1 entonces F(0) =

0.2∗0+0.2 = 0.2. De igual manera F(0) = 0 y F(1) = 1

5. Para calcular PX (0≤ x≤ 0.5) de dos maneras, primero se utiliza la funcion de densidad e integremos, es decir,

∫ 0.5

00.2+1.2xdt = 0.2x+1.2

12

x2∣∣∣∣0.50

= 0.2∗0.5+0.6(0.5)2 = 0.25

Segundo, utilizando la funcion de distribucion acumulada F(x), esto es,F(x) = 1.2x2

2 + 0.2x+ 0.2 si 0 < x≤ 1

entonces

PX (0≤ x≤ 0.5) = F(0.5)−F(0) =1.2(0.5)2

2+0.2(0.5)+0.2−0.2 = 0.25

6. Por otra parte se tiene

PX (X > 0.5 | X > 0.1) =PX (X > 0.5∩X > 0.1)

PX (X > 0.1)

=PX (X > 0.5)PX (X > 0.1)

=1−F(0.5)1−F(0.1)

=1−0.2501−0.226

=0.7500.774

= 0.969

3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATO-

RIA

Se ha observado que la funcion de probabilidad para una variable aleatoria es un modelo teorico para la frecuencia

relativa de datos asociados a una poblacion real. Si el modelo es una representacion exacta de la realidad, la funcion

de probabilidad y las frecuencias relativas son equivalentes. Por lo tanto es natural, como en estadıstica descriptiva,

que se intente definir la media y la varianza de una variable aleatoria y ası de esa manera obtener medidas descriptivas

para una funcion de probabilidad o de densidad.

Definicion 3.6. Sea X una variable aleatoria con funcion de distribucion de probabilidad PX (x) o funcion de densidad

f (x). El valor esperado de X el cual se denotara por E(X) o µ y es definido por:

1. µ = E(X) =∞

∑i=1

xiPX (xi) si X es discreta, o

2. µ = E(X) =∞∫−∞

x f (x)dx si X es continua.



En la anterior definicion se asume que la suma como la integral es absolutamente convergente, es decir,

∞

∑i=1|xi|PX (xi)< ∞ y

∞∫−∞

|x| f (x)< ∞

si esto no es ası se dice que no tiene valor esperado.

Ejemplo 3.7. Sea una variable aleatoria X que representa el numero de clientes que llegan una bomba de gasolina

en Valledupar en un intervalo de tiempo de una hora (por ejemplo, entre las 5:00 PM y 6:00 PM). En la siguiente

tabla se muestra la funcion de probabilidad de la variable aleatoria X

X = x 0 1 2 3 4 5 6 7 8

PX (x) 0.05 0.10 0.10 0.10 0.20 0.25 0.10 0.05 0.05

Encontrar el valor esperado de la variable aleatoria X.

Solucion 22. Con base en la definicion de valor esperado y la tabla anterior, tenemos:

X = x 0 1 2 3 4 5 6 7 8

PX (x) 0.05 0.10 0.10 0.10 0.20 0.25 0.10 0.05 0.05

xPX (x) 0 0.10 0.20 0.30 0.80 1.50 0.60 0.35 0.40

Ası, µ = E(X) =∞

∑i=1

xiPX (xi) =9∑

i=0xiPX (xi) = 4.25.

Ejemplo 3.8. Sea X una variable aleatoria con funcion de densidad de probabilidad dada por

f (x) =

0, si x < 1

1x , si 1 < x < e

0, si e < x

Encontrar el valor esperado de X.

Solucion 23. Por definicion de valor esperado se tiene:

E(X) =

∞∫−∞

x f (x)dx =1∫

−∞

x∗0dx+e∫

1

dx+∞∫

e

x∗0dx = e−1

Teorema 3.3. Sea X una variable aleatoria con funcion de distribucion de probabilidad PX (x) o funcion de densidad

f (x). Si g(x) es una funcion de valor real. Entonces

1. µ = E(g(X)) =∞

∑i=1

g(xi)PX (xi) si X es discreta, o

2. µ = E(g(X)) =∞∫−∞

g(x) f (x)dx si X y g(x) son continuas.



Definicion 3.7. Sea X una variable aleatoria. La varianza de X se define y notaremos por:

σ2 =V (X) = E((X−µ)2)

Donde µ = E(X)

A la raız cuadrada de la varianza, se llama desviacion estandar, la cual notaremos σ .

Teorema 3.4. Sean X y Y variables aleatorias y a, b numeros real tal que Y = aX +b. Entonces

1. E(Y ) = aE(X)+b

2. V (Y ) = a2V (X)

Demostracion 9.

1. Dado que Y = aX +b entonces se tiene

E(Y ) = E(aX +b)

=∫

∞

−∞

(ax+b) f (x)dx

= a∫

∞

−∞

x f (x)dx+b∫

∞

−∞

f (x)dx

E(Y ) = aE(X)+b

E(Y ) = aµ +b

2. De la misma manera

V (Y ) = E([(aX +b)− (aµ +b)]2)

= E((aX−aµ)2)

= E(a2(X−µ)2)

= a2E((X−µ)2)

V (Y ) = a2V (X)

Teorema 3.5. Sea X una variable aleatoria. Entonces

V (X) = E(X2)−µ2



Demostracion 10. La prueba es una simple aplicacion de la linealidad del valor esperado, esto es:

V (X) = E((X−µ)2)

= E((X2−2Xµ +µ2))

= E(X2)−2µE(X)+E(µ2)

= E(X2)−2µ2 +µ

2

V (X) = E(X2)−µ2

Ejemplo 3.9. El tiempo que esta detenida en un turno de 12 horas, una maquina por mantenimiento preventivo o

reparacion es una variable aleatoria X, con funcion de densidad de probabilidad dada por

f (x) =

2(1− x), si 0≤ x≤ 1

0, en otra parte

El costo de la perdida (en miles de pesos) debido mantenimiento preventivo o reparacion, esta dada por

C = 10+20X +4X2

Encuentre la perdida esperada y varianza debido al mantenimiento preventivo o reparacion.

Solucion 24. Por definicion se tiene,

E(C) = E(10+20X +4X2) = E(10)+20E(X)+4E(X2)

= 10∫ 1

0f (x)dx+20

∫ 1

0x f (x)dx+4

∫ 1

0x2 f (x)dx

= 20∫ 1

0(1− x)dx+40

∫ 1

0x(1− x)dx+8

∫ 1

0x2(1− x)dx

= 20/2+40/6+8/12 = 52/3.

Por otra parte tenemos que la varianza de la variable aleatoria C esta dada por,

V (C) = E(C2)− (E(C))2



E(C2) = E((10+20X +4X2)2)

= E(100)+400E(X)+480E(X2)+460E(X3)+16E(X4)

= 100∫ 1

0f (x)dx+400

∫ 1

0x f (x)dx+480

∫ 1

0x2 f (x)dx

+460∫ 1

0x3 f (x)dx+16

∫ 1

0x4 f (x)dx

= 200∫ 1

0(1− x)dx+800

∫ 1

0x(1− x)dx+960

∫ 1

0x2(1− x)dx

+320∫ 1

0x3(1− x)dx+32

∫ 1

0x4(1− x)dx

= 200/2+800/6+960/12+320/20+32/30 = 1652/5.

Entonces

V (C) = E(C2)− (E(C))2 = 1652/5− (52/3)2 = 29.96.

Definicion 3.8. Sea X variable aleatoria definimos el r-esimo momento alrededor de c como E((X − c)r). Notese

que:

1. E((X− c)r) =∞

∑i=1

(xi− c)rPX (xi) si X es discreta, o

2. E((X− c)r) =∞∫−∞

(x− c)r f (x)dx si X es continua.

Si c = 0 se dice el r-esimo momento alrededor de cero y si c = µ se dice el r-esimo momento alrededor de la

media.

Cuando conocemos la distribucion de una variable aleatoria X podemos calcular E(X) y V (X), sin embargo el

conocimiento de estas dos cantidades no nos permite calcular probabilidades del tipo P(|X −C| > ε). Afortunada-

mente existe una desigualdad muy conocida, debida al matematico ruso Tchebychev, que nos ofrece una cota superior

para tales probabilidades. Dicha desigualdad relaciona la probabilidad del tamano de la desviacion de una variable

aleatoria de su valor medio, con la varianza.

Teorema 3.6 (Desigualdad de Tchebychev). Sea X una variable aleatoria con media µ y varianza σ2. Para todo

numero real ε > 0,

PX (|X−µ|< ε)> 1− V (X)

ε2

O en forma equivalente

PX (|X−µ| ≥ ε)≤ V (X)

ε2



Demostracion 11. Demostremos la Desigualdad de Tchebychev en el caso continuo y supongamos. Sea ε > 0 en-

tonces

V (X) =∫

∞

−∞

(x−µ)2 f (x)dx

=∫

µ−ε

−∞

(x−µ)2 f (x)dx+∫

µ+ε

µ−ε

(x−µ)2 f (x)dx+∫

∞

µ+ε

(x−µ)2 f (x)dx

Omitiendo la segunda integral no negativa de la suma anterior se tiene la siguiente desigualdad:

V (X)≥∫

µ−ε

−∞

(x−µ)2 f (x)dx+∫

∞

µ+ε

(x−µ)2 f (x)dx

≥∫|µ+ε|≥ε

(x−µ)2 f (x)dx

≥∫|µ+ε|≥ε

ε2 f (x)dx

= ε2P(|X−µ| ≥ ε)

Por lo tanto,

V (X)≥ ε2P(|X−µ| ≥ ε)

Ası,

P(|X−µ| ≥ ε)≤ V (X)

ε2

Ejemplo 3.10. Un fabricante de llantas quiere promover un intervalo de recorrido expresados en kilometros que

excluya no mas del 10% de los recorridos de las llantas que vende. Solamente se sabe que, para un gran numero

de llantas probadas, el recorrido medio fue de 60000 kilometros con una desviacion estandar de 12000 kilometros.

¿Que intervalo sugerirıa?

Solucion 25. Aplicacion del teorema de Tchebychev,

PX (|X−µ|< ε)> 1− V (X)

ε2

tenemos


3.4. FUNCIONES GENERADORAS DE MOMENTOS Universidad Popular del Cesar

PX (|X−60000|< ε)> 1− 144000000ε2 = 0.90

⇒ ε2−144000000 = 0.90ε

⇒ 0.1ε2 = 144000000

⇒ ε2 = 144000000/0.1

⇒ ε = 37947

En consecuencias el intervalo que excluye el 10% esta dado por

|X−60000|< 37947

Es decir,

22053≤ X ≤ 97947.

3.4. FUNCIONES GENERADORAS DE MOMENTOS

Definicion 3.9. Sea X una variable aleatoria. la funcion generadora de momento (fgm) de la variable aleatoria X,

denota por MX (t), se define por

MX (t) = E(etX )

Para todo valor de X para el cual el valor esperado existe.

Ejemplo 3.11. Sea X una variable aleatoria binomial con funcion de densidad de probabilidad

PX (X = x) =(

nx

)pxqn−x; x = 0,1,2, · · ·n y q = 1− p

Hallar la funcion generatriz de momento de X.

Solucion 26. Por definicion se tiene

MX (t) = E(etX )

=n

∑x=0

etx(

nx

)pxqn−x

=n

∑x=0

(nx

)(pet)xqn−x

= (pet +q)n



En este caso,MX (t) es definida para todo valor de t.

Ejemplo 3.12. Sea X una variable aleatoria exponencial con funcion de densidad de probabilidad

f (x) =

λe−λx, si x > 0

0, si x≤ 0

Hallar la funcion generatriz de momento de X.

Solucion 27. Por definicion se tiene

MX (t) = E(etX )

=∫

∞

0etx

λe−λxdx

=∫

∞

0λe(t−λ )xdx

=λ

t−λe(t−λ )x

∣∣∣∣∞0

=λ

t−λ[ lımx→∞

e(t−λ )x−1]

Note que este limite existe, y es igual a 0, solo si t−λ )< 0. Entonces para t < λ ,

MX (t) =λ

t−λ.

Teorema 3.7. Sea X una variable aleatoria con funcion generadora de momento dada por MX (t). Entonces

M(r)X (0) = E(X r)

Demostracion 12. Verifiquemos el teorema para una variable aleatoria continua X y para los casos cuando r = 1 y

r = 2. Para el caso de una variable aleatoria discreta y para un r arbitrario la demostracion es sencilla.

r = 1,

M(1)X (0) =

ddt

∫∞

−∞

etx f (x)dx∣∣∣∣t=0

=∫

∞

−∞

ddt


=∫

∞

−∞

xetx f (x)dx∣∣∣∣t=0

=∫

∞

−∞

xe0.x f (x)dx

=∫

∞

−∞

x f (x)dx = E(X)



r = 2,

M(2)X (0) =

d2

dt2

∫∞

−∞


=∫

∞

−∞

d2

dt2 etx f (x)dx∣∣∣∣t=0

=∫

∞

−∞

x2etx f (x)dx∣∣∣∣t=0

=∫

∞

−∞

x2e0.x f (x)dx

=∫

∞

−∞

x2 f (x)dx = E(X2)

Ejemplo 3.13. Sea X una variable aleatoria binomial definida sobre n ensayos. Usando la funcion generatriz de

momento encontrar :

1. E(X)

2. E(X2)

3. V (X)

Solucion 28. La funcion generatriz de momento de una variable aleatoria binomial con parametros n y p esta dada

por,

MX (t) = (pet +q)n

1. Derivando esta funcion y por el teorema anterior, tenemos

M′X (t) = npet(pet +q)n−1

⇒M′X (0) = E(X) = npe0(pe0 +q)n−1

⇒M′X (0) = E(X) = np(p+q)n−1

⇒M′X (0) = E(X) = np

2. Por otro lado tenemos,

M′′X (t) = np[et(pet +q)n−1 +(n−1)pet(pet +q)n−2]

⇒M′′X (0) = E(X2) = np[(p+q)n−1 +(n−1)p(p+q)n−2]

⇒M′′X (0) = E(X2) = np[1+(n−1)p]

⇒M′′X (0) = E(X2) = np+n(n−1)p2



3. Pero,

V (X) = E(X2)− (E(X))2

⇒V (X) = np+n(n−1)p2− (np)2

⇒V (X) = np+n2 p2−np2−n2 p2

⇒V (X) = np−np2 = npq

Ejemplo 3.14. Sea X una variable aleatoria exponencial. Usando la funcion generatriz de momento encontrar :

1. E(X)

2. E(X2)

3. V (X)

Solucion 29. La funcion generatriz de momento de una variable aleatoria exponencial parametro λ esta dada por,

MX (t) =λ

λ − t; t < λ

1. Derivando esta funcion y por el teorema anterior, tenemos

M′X (t) = λ (λ − t)−2

⇒M′X (0) = E(X) = λλ−2 = λ

−1

2. Por otro lado tenemos,

M′′X (t) = 2λ (λ − t)−3

⇒M′′X (0) = E(X) = 2λλ−3 = 2λ

−2

3. Pero,

V (X) = E(X2)− (E(X))2

⇒V (X) = 2λ−2− (λ−1)2 = 2λ

−2−λ−2 = λ

−2



Si la expansion de la serie de Taylor de la funcion generatriz Mx(t) de una variable aleatoria es conocida, entonces

E(X r) es simplemente el coeficiente de tr/r!. Es decir si el desarrollo en serie de Taylor alrededor de cero es,

MX (t) =∞

∑r=0

M(r)X (0)tr

r!

Entonces M(r)X (0) = E(X r).

Ejemplo 3.15. Sea X una variable aleatoria exponencial con funcion generatriz de momento dada por,

MX (t) =λ

λ − t; t < λ

Encontrar M(r)X (0) = E(X r)

Solucion 30. Puesto que

MX (t) =λ

λ − t=

11− t/λ

; 0 < t/λ < 1

Como MX (t) es la suma de la serie geometrica,

MX (t) =∞

∑r=0

(t/λ )r =1

1− t/λ

MX (t) =∞

∑r=0

1λ r tr =

∞

∑r=0

r!λ r

tr

r!

Por lo tanto,

M(r)X (0) = E(X r) =

r!λ r

Teorema 3.8. Sea X una variable aleatoria con funcion generadora de momento dada por MX (t) y Y = aX + b.

Entonces

MY (t) = ebtMX (at)

Teorema 3.9. Sean X y Y variables aleatorias para las cuales MX (t) = MY (t) para algun intervalo que contiene a

cero. Entonces

fX = fY .

Este es un resultado muy importante en la teorıa de la probabilidad y la estadıstica, pero la demostracion esta fuera

del alcance y los propositos de este curso.



3.5. EJERCICIOS

1. Una urna contiene 4 bolas numeradas del 1 al 4 respectivamente. Para cada uno de los siguientes casos de-

termınese la funcion de probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor

esperado y varianza de las siguientes variables aleatorias:

a) Sea X el numero que ocurre si se saca de manera aleatoria una bola de la urna.

b) Sea X la suma que ocurre si se saca de manera aleatoria dos bola de la urna, sin reemplazo.

c) Sea X la suma que ocurre si se saca de manera aleatoria dos bola de la urna, con reemplazo.

d) Sea X la suma de los cuadrados que ocurre si se saca de manera aleatoria dos bola de la urna, con reem-

plazo.

2. En un salon de clase hay 10 estudiantes de ingenierıa, entre los cuales 3 tienen 19 anos, 4 tienen 20 anos, 1

tiene 21, 1 tiene 24, y 1 tiene 26 anos. De esta clase se seleccionan dos estudiantes sin reemplazo. Determınese

la funcion de probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor esperado y

varianza de la siguiente variable aleatoria: X la edad promedio de los dos estudiantes seleccionados.

3. Un borracho tiene cuatro llaves en su bolsillo. Llega a su casa a la una de la madrugada, como esta oscuro no

puede ver la llave de su puerta, por lo que prueba una por una, hasta encontrar la correcta. Determınese la funcion

de probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor esperado y varianza de la

siguiente variable aleatoria: X numero llaves que prueba (incluyendo la correcta) hasta abrir la puerta.

4. Sea una poblacion de tamano N = 5, la cual se compone de las edades de cinco ninos que son pacientes extremos

de una clınica de salud mental. Las edades son las siguientes: 6, 8, 10, 12, y 14. Determınese la funcion de

probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor esperado y varianza de la

siguiente variable aleatoria: X edad promedio de dos ninos seleccionados aleatoriamente cuando el muestreo se

realiza:

a) Con reemplazo.

b) Sin reemplazo.

c) Determines relaciones entre la media de la poblacion y el valor esperado de X .

5. En el municipio de Astrea se han detectado en los pozos de agua dos tipos de impurezas, se encontro que el 30%

de los pozos no revelan impureza alguna, el 45% tienen la impureza A y el 55% la impureza B. Naturalmente,

algunos tiene ambas impurezas. Si se escoge un pozo aleatoriamente del municipio de Astrea, determınese

la funcion de probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor esperado y

varianza de la siguiente variable aleatoria: X numero de impurezas encontradas en el pozo.



6. Se sabe que un grupo de cuatro componentes contiene dos defectuosos. Un inspector prueba los componentes

uno por uno hasta encontrar los dos defectuosos. Una vez encontrado el segundo defectuoso, se concluye la

prueba, pero se prueba el segundo defectuoso como comprobacion. Sea X el numero de pruebas necesarias

hasta encontrar el segundo defectuoso. Encuentre la distribucion de probabilidad para X .

7. Considere una sistema de agua que fluye a traves de unas valvulas A a B (vease el diagrama). Las valvulas 1, 2

y 3 funcionan independientemente y cada una se abre correctamente mediante una senal con una probabilidad

de 0.8. encuentre la distribucion de probabilidad para X , el numero de vıas abiertas de A a B despues de haber

enviado la senal. (observe que X puede tomar los valores 0, 1 y 2 ).

8. En un problema de una prueba aplicada a ninos pequenos, se les pide que hagan corresponder cada uno de los

tres dibujos de animales con la palabra que identifica a ese animal. Si un nino asigna aleatoriamente las tres

palabras a los tres dibujos, determınese la funcion de probabilidad, funcion de distribucion acumulada, graficas

para las fdp y fda, valor esperado y varianza de la siguiente variable aleatoria: X , el numero de correspondencia

correctas.

9. Cinco pelotas numeradas, 1, 2, 3, 4 y 5 se encuentran en una urna. Se sacan dos pelotas de manera aleatoria de

las cinco, y se anotan sus numero. Determınese la funcion de probabilidad, funcion de distribucion acumulada,

graficas para las fdp y fda, valor esperado y varianza de las siguiente variables aleatorias:

a) El mayor de los numeros seleccionados.

b) La suma de los dos numeros seleccionados.

10. Una agencia de alquiler que arrienda equipo pesado por dıa se da cuenta que un equipo costoso es arrendado, en

promedio, solamente un dıa de cinco. Si el alquiler en un dıa es independiente del alquiler de cualquier otro dıa,

determınese la funcion de probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor

esperado y varianza de la siguiente variable aleatoria: X el numero de dıas entre dos alquileres.

11. Sea X una variable aleatoria con funcion de densidad dada por

f (x) =

0.2 si −1 < x≤ 0

0.2+ cx si 0 < x≤ 1

0 en otro caso

a) Determine el valor de c

b) Obtener F(x)

c) Graficar f (x) y F(x)

d) Utilizar F(x) de (b) para calcular F(−1), F(0) y F(1)

e) Calcular p(0≤ x≤ 0.5)



f ) Calcular p(X > 0.5 | X > 0.1)

g) Calcular E(X), V (X) y σ .


f (x) =

c

26 x si 1 < x≤ 3

0 en otro caso

a) Determine el valor de c

b) Obtener F(x)


d) Utilizar F(x) de (b) para calcular F(−1), F(2) y F(2.5)


f ) Calcular p(X > 2.8 | X > 2.1)



f (x) =

cx si 0≤ x≤ 1

0 en otro caso

a) Determine el valor de c.

b) Obtener F(x)


d) Utilizar F(x) de (b) para calcular F(0), F(1) y F(2)


f ) Calcular p(X > 0.5 | X > 0.1)


14. El periodo de funcionamiento hasta su primera falla (en ciento de horas) para cierto transistor, es una variable

aleatoria X con funcion de distribucion acumulada dada por

F(x) =

0 si x < 0

1− e−x2x≥ 0

F(x) =

0, si x < 0;

1− e−x2, x≥ 0.



a) Demostrar que F(x) cumple las propiedades de una funcion de distribucion acumulada.

b) Obtener f (x)

c) Calcular la probabilidad de que el transistor trabaje por lo menos durante 200 horas hasta tener su primera

falla.

d) Encontrar valor esperado y varianza para la variable aleatoria X .

15. Un vendedor de gasolina tiene un tanque de 150 galones que se llena al principio de cada semana. Su demanda

semanal tiene una frecuencia relativa que crece constantemente de cero hasta 100 galones y permanece constante

entre 100 y 150 galones. Si X denota la demanda semanal en ciento de galones, la frecuencia relativa se puede

representar por

f (x) =

x si 0≤ x≤ 1

1 1 < x≤ 1.5

0 en otra parte

a) Obtener F(x)

b) Graficar f (x) y F(x).

c) Calcular P(0≤ x≤ 0.5)

d) Calcular P(0.5≤ x < 1.2) .

e) Encontrar valor esperado y varianza para la variable aleatoria X .

16. El tiempo por semana que un estudiante de la UPC usa internet, es una variable aleatoria X , tiene como funcion

de densidad de probabilidad (medida en horas)

f (x) =

364 x2(4− x) si 0≤ x≤ 4

0, en otra parte

a) Hallar E(X) y V (X)

b) El costo que paga la UPC por hora para cada estudiante por usar internet es de $500. Calcular el valor

esperado y la varianza del costo semanal por estudiante.

c) ¿Rebasarıa con mucha frecuencia el valor del tiempo semanal los $2000? ¿Por que?

17. Se X una variable aleatoria que modela el movimiento de un gas uniforme en equilibrio, entonces

f (x) = ax2e−bx2, donde x > 0

Aquı, b = m/(2kT ), donde k es la constante Bolzmann, T es la temperatura absoluta y m denota la masa de la

molecula. Encontrar a, para que f sea una funcion de densidad de probabilidad de la variable aleatoria X .



18. Supongamos que cierto paıs de la Comunidad Andina de Naciones la distribucion de los ingresos por familia se

puede modelar por una variable aleatoria X , con funcion de densidad de probabilidad dada por:

f (x) = xe−x, donde x > 0

donde x es dada en miles de dolares. Encontrar: el primer, segundo y tercer cuartil de la distribucion de los

ingresos de la variable aleatoria X . Esto es, encontrar los valores de x para los cuales F(x) = 0.25, F(x) = 0.50,

y F(x) = 0.75. De una interpretacion de estos resultados.

19. Demuestre que si X es una variable aleatoria y X ≥ 0. Entonces E(X)≥ 0.

20. Demuestre que |E(X)| ≤ E(|X |) para cualquiera variable aleatoria X .

21. Sea X una variable aleatoria tal que X ≥ 0. Demuestre que si E(X) = 0, entonces P(X = x) = 1.

22. Demuestre el teorema 5.1.

23. Demuestre que la funcion de distribucion acumulada de una variable aleatoria X distribuida uniformente esta

dada por la expresion 5.1.

24. Supongase que la variable aleatoria X esta distribuida uniforme en el intervalo (0,1).

a) Encontrar y graficar F(x)

b) Demuestre que P(a≤ x≤ a+b para a≥ 0, a+b≤ 1, depende solamente del valor de b.

25. Si un paracaidista cae en un sitio aleatorio demarcado por el segmento de lınea A y B. Encontrar la probabilidad

de que:

a) este mas cerca de A que de B

b) la distancia con respecto a A sea mas tres veces la distancia con respecto a B.

26. La variacion del nivel del agua del balneario Hurtado de un dıa al otro, medida en (cm) en un sitio especifico, es

una variable aleatoria X con la siguiente funcion de distribucion acumulada:

F(x) =

0, x < 0;

2x− x2, 0 < x < 1.

1, x > 1.

a) Obtener la funcion de distribucion acumulativa para la variable aleatoria X .

b) Obtener P(x > 1/2) y P(X > 3/4)

c) Hallar el valor esperado y la varianza de la variable aleatoria X :



27. Sea X una variable aleatoria con funcion de probabilidad dada por

p(X = k) =λ ke−λ

k!

donde k=1, 2, 3 . . . . Demuestre que E(X)=λ y V (X)=λ .

28. Sea X una variable aleatoria geometrica con la probabilidad de tener exito igual a p.

a) Demuestre que para un entero positivo a,

P(X > a) = qa

b) Demuestre que para los enteros positivos a y b,

P(X > a+b|X > a) = qb = P(X > b)

29. Sea X una variable aleatoria con funcion de probabilidad dada por

p(X = k) =λ ke−λ

k!

donde k=1, 2, 3 . . . . Demuestre que E(X)=λ y V (X)=λ .


f (x) =

cx si 0≤ x≤ 1

0 en otro caso

a) Determine el valor de c.

b) Obtener F(x)


d) Utilizar F(x) de (b) para calcular F(0), F(1) y F(2)


f ) Calcular p(X > 0.5 | X > 0.1)


31. El periodo de funcionamiento hasta su primera falla (en ciento de horas) para cierto transistor, es una variable

aleatoria X con funcion de distribucion acumulada dada por

F(x) =

0 si 0 < x

1− e−x2en otro caso

a) Demostrar que F(x) cumple las propiedades de una funcion de distribucion acumulada.



b) Obtener f (x)

c) Calcular la probabilidad de que el transistor trabaje por lo menos durante 200 horas hasta tener su primera

falla.

d) Encontrar valor esperado y varianza para la variable aleatoria X .

32. Un vendedor de gasolina tiene un tanque de 150 galones que se llena al principio de cada semana. Su demanda

semanal tiene una frecuencia relativa que crece constantemente de cero hasta 100 galones y permanece constante

entre 100 y 150 galones. Si X denota la demanda semanal en ciento de galones, la frecuencia relativa se puede

representar por

f (x) =

x si 0≤ x≤

1 1 < x≤ 1.5

0 en otra parte

a) Obtener F(x)

b) Graficar f (x) y F(x).

c) Calcular P(0≤ x≤ 0.5)

d) Calcular P(0.5≤ x < 1.2) .

e) Encontrar valor esperado y varianza para la variable aleatoria X .

33. El tiempo por semana que un estudiante de la UPC usa internet, es una variable aleatoria X , tiene como funcion

de densidad de probabilidad (medida en horas)

f (x) =

364 x2(4− x) si 0≤ x≤ 4

0, en otra parte

a) Hallar E(X) y V (X)

b) El costo que paga la UPC por hora para cada estudiante por usar internet es de $500. Calcular el valor

esperado y la varianza del costo semanal por estudiante.

c) ¿Rebasarıa con mucha frecuencia el valor del tiempo semanal los $2000? ¿Por que?

34. Sea X una variable aleatoria definida en el intervalo [0,2] y funcion de densidad de probabilidad fX . Encontrar

la funcion generatriz de momento para X si:

a) fX (x) = 1/2

b) fX (x) = (1/2)x

c) fX (x) = 1− (1/2)x



d) fX (x) = |1− x|

e) fX (x) = (3/8)x2

35. Para cada uno de las funciones de densidades del problema anterior calcular el primer y segundo momento

directamente de la definicion y verifique que M(0) = 1, M′(0) = E(X) y M′′(0) = E(X2).

36. Sea X una variable aleatoria definida en el intervalo [0,∞) y funcion de densidad de probabilidad fX . Encontrar

la funcion generatriz de momento para X si:

a) f X(x) = 2e−2x

b) fX (x) = e−2x +(1/2)e−x

c) fX (x) = 4xe−2x

d) fX (x) = λ (λx)n−1e−λx/(n−1)!

37. Para cada uno de las funciones de densidades del problema anterior calcular el primer y segundo momento

directamente de la definicion y verifique que M(0) = 1, M′(0) = E(X) y M′′(0) = E(X2).

38. Sea X una variable aleatoria distribuida uniformemente en el intervalo [0,1]. Encontrar en terminos de la funcion

generatriz de momento de X la funcion generatriz de momento de las siguientes variables aleatorias:

a) −X

b) 1+X

c) 3X

d) aX +b

39. Encuentre las distribuciones de probabilidades de la variable aleatoria X para cada una de las funciones gener-

adoras de momentos

a) M(t) =[

et+23

]5

b) M(t) = et

2−et

c) M(t) = e2(et−1)

40. Sea M(t) = et+2e2t+3e3t

6 . Encuentre lo siguiente:

a) E(X)

b) E(X2)

c) V (X)

d) La funcion de probabilidad de X .

41. Sea C(t) = lnM(t). Demuestre que C′(0) = µ. y C′′(0) = σ2



42. Se X una variable aleatoria que modela el movimiento de un gas uniforme en equilibrio, entonces

f (x) = ax2e−bx2, donde x > 0

Aquı, b = m/(2kT ), donde k es la constante Bolzmann, T es la temperatura absoluta y m denota la masa de la

molecula. Encontrar a, para que f sea una funcion de densidad de probabilidad de la variable aleatoria X .

43. Supongamos que cierto paıs de la Comunidad Andina de Naciones la distribucion de los ingresos por familia se

puede modelar por una variable aleatoria X , con funcion de densidad de probabilidad dada por:

f (x) = xe−x, donde x > 0

donde x es dada en miles de dolares. Encontrar: el primer, segundo y tercer cuartil de la distribucion de los

ingresos de la variable aleatoria X . Esto es, encontrar los valores de x para los cuales F(x) = 0.25, F(x) = 0.50,

y F(x) = 0.75. De una interpretacion de estos resultados.

44. Demuestre que si X es una variable aleatoria y X ≥ 0. Entonces E(X)≥ 0.

45. Demuestre que |E(X)| ≤ E(|X |) para cualquiera variable aleatoria X .

46. Sea X una variable aleatoria tal que X ≥ 0. Demuestre que si E(X) = 0, entonces P(X = x) = 1.

47. Sea X una variable aleatoria con x1,x2, . . . ,xn valores diferentes: Demostrar que para cualquiera funcion g :

ℜ−→ℜ,

E(g(X)) =n

∑i=1

g(xi)Pg(xi)

donde Pg(x) = PX (X = x) es la funcion de probabilidad de la variable aleatoria g(X).

48. Una variable aleatoria X una funcion de densidad dada por:

f (x) =

2xa2 , si 0≤ x≤ a

0, en otra parte

Otra variable aleatoria Y toma el valor y, y = 0,1,2, . . . ,9 con probabilidad PY (Y = y) = PX (0.1ay < X <

0.1a(y+1)). Encontrar

a) PY (Y = y). Es decir, la funcion de probabilidad de X

b) E(Y )

c) E(Y 2)

d) V (Y )



e) La cota de Tchebychev para la probabilidad PX (|X−E(X)| ≥ a/3) y compare con el valor exacto de PX .

f ) PY (Y = 8|Y > 7).

g) E(etx|X < a/2) y con esto demostrar que E(X |X < a/2) = a/3.

49. El voltaje a traves de un circuito electrico es una variable aleatoria X con funcion de densidad

f (x) =

e−(x−k), si x > k > 0

0, en otra parte

La resistencia del circuito esta fija en un valor conocido de Ω (ohms). Suponiendo que se cumple la ley de Ohm,

la cual afirma que la

corriente =volta je

resistencia

Encontrar la media y la varianza de la corriente a traves del circuito.


CAPITULO 4

DISTRIBUCIONES DISCRETAS

Algunos modelos de funciones de probabilidad ocurren con muchas frecuencias en el contexto de la estadısti-

ca teorica como aplicada, esto nos motiva al estudio en detalle de algunos modelos de probabilidad, los cuales han

demostrados ser util en el campo de las aplicaciones. A pesar de ello tales funciones de probabilidad presentan un

caracter teorico en el sentido en que son modelos que se deducen matematicamente con base en ciertos supuestos que

se suponen ciertos para los fenomenos aleatorios. La eleccion de un modelo de distribucion de probabilidad para rep-

resentar un fenomeno de interes practico debe estar motivada tanto por la compresion de la naturaleza del fenomeno en

sı, como por la posible verificacion de la distribucion seleccionada a traves de la evidencia empırica. En todo momento

antes de aplicar un modelo de funcion de frecuencia de probabilidad debe realizarse un analisis crıtico del problema

de investigacion.

En este capitulo, examinaremos con cierto rigor matematico algunos modelos de frecuencia de probabilidad disc-

retas, destacando ciertas aplicaciones de ellas.

4.1. Distribucion Binomial

Definicion 4.1. Sea X una variable aleatoria que representa el numero de exitos en n ensayos independiente, donde

la probabilidad de un exito es p y de un fracaso es q = 1− p, cada vez que el experimento se lleva acabo. Se dice

entonces que X tiene distribucion Binomial con funcion de probabilidad dada por:

PX (X = x) =

(

nx

)pxqn−x, donde x = 0,1,2, · · ·n y q = 1− p

0, en otro caso

Si una variable aleatoria X que tiene una distribucion binomial con parametros n y p, notaremos X ∼ B[n, p].

La probabilidad que una variable aleatoria X sea menor o igual a un valor determinado x0, se especifica por la funcion

de distribucion acumulada,

127

4.1. DISTRIBUCION BINOMIAL Universidad Popular del Cesar

F(x0) = PX (X ≤ x0) =x0

∑x=0

(nx

)pxqn−x

Ejemplo 4.1. Supongase que el 20% de los artıculos producidos por una fabrica son defectuosos. Si se selecciona

una muestra aleatoria simple con reemplazo de tamano 10.

1. Determine la funcion de probabilidad y la funcion de distribucion acumulada de la variable aleatoria, numero

de artıculos defectuosos en la muestra.

2. ¿Cual es la probabilidad de que exactamente tres artıculos son defectuosos entre los 10 seleccionados?

3. ¿Cual es la probabilidad de que 4 o mas artıculos son defectuosos entre los 10 seleccionados?

4. ¿Cual es la probabilidad de rechazar el lote de 10 artıculos si se tienen tres o mas artıculos son defectuosos?

Solucion

Sea X la variable aleatoria que representa el numero de artıculos defectuosos en la muestra seleccionada.

1. Para n = 10 y p = 0.2, entonces la funcion de probabilidad de esta dada por:

PX (X = x) =(

10x

)0.2x0.810−x,donde x = 0,1,2, · · ·n y q = 1− p

y la funcion de distribucion acumulada

F(x0) = PX (X ≤ x0) =10

∑x=0

(10x

)0.2x0.810−x

Las cuales tambien se puede representar mediante la siguiente tabla.

X = x PX (X = x) F(x0)

0 0.1074 0.1074

1 0.2684 0.3758

2 0.3020 0.6778

3 0.2013 0.8791

4 0.0881 0.9672

5 0.0264 0.9936

6 0.0055 0.9998

7 0.0008 0.9999

8 0.0001 1

9 0.0000 1



2. La probabilidad de que exactamente tres artıculos son defectuosos entre los 10 seleccionados es:

PX (X = 4) = 0.2013.

3. La probabilidad de que 4 o mas artıculos son defectuosos entre los 10 seleccionados es:

PX (X ≥ 4) = 1−F(3)

= 1−0.8791 = 0.1209.

4. La probabilidad de rechazar el lote de 10 artıculos si se tienen tres o mas artıculos son defectuosos es

PX (X ≥ 3) = 1−PX (X ≤ 2)

= 1−0.6778 = 0.3222.

Teorema 4.1. Sea una variable aleatoria X que tiene una distribucion binomial con parametros n y p. Entonces

1. ∑nx=0(n

x

)pxqn−x = 1

2. E(X) = np

3. V (X) = npq

4. MX (t) = (pet +q)n

Demostracion 13.

1. Debemos demostrar que∞

∑x=0

PX (x) = 1

Por definicion y el teorema del Binomio de Netown, entonces

∞

∑x=0

PX (x) =n

∑x=0

(nx

)pxqn−x

= (p+q)n = 1



2. Por la definicion de valor esperado para una variable aleatoria discreta,

E(X) =∞

∑x=0

xPX (x)

=n

∑x=0

x(

nx

)pxqn−x

=n

∑x=0

xn!(n− x)!x!

pxqn−x

=n

∑x=1

xn!(n− x)!(x−1)!

pxqn−x

=n−1

∑y=0

n(n−1)!(n− (y+1))!y!

py+1qn−(y+1)

=n−1

∑y=0

n(n−1)!(n−1)− y)!y!

py+1q(n−1)−y

= npn−1

∑y=0

(n−1)!(n−1)− y)!y!

pyq(n−1)−y

= np(p+q)n−1 = np

3. Para calcular la varianza de la variable aleatoria X, hallemos el segundo momento, es decir:

E(X2) =∞

∑x=0

x2PX (x)

=n

∑x=0

x2(

nx

)pxqn−x

=n

∑x=0

x2n!(n− x)!x!

pxqn−x

=n

∑x=1

xn!(n− x)!(x−1)!

pxqn−x

=n−1

∑y=0

n(n−1)(y+1)!(n− (y+1))!y!

py+1qn−(y+1)

= npn−1

∑y=0

(n−1)!(y+1)(n−1)− y)!y!

pyq(n−1)−y

= np[n−1

∑y=0

y(n−1)!(n−1)− y)!y!

pyq(n−1)−y

+n−1

∑y=0

(n−1)!(n−1)− y)!y!

pyq(n−1)−y]

Por lo tanto

E(X2) = np[np+q] = n2 p2 +npq


4.2. DISTRIBUCION POISSON Universidad Popular del Cesar

Puesto que V (X) = E(X2)− [E(X)]2), se tiene que

V (X) = E(X2)− [E(X)]2) = n2 p2 +npq−n2 p2 = npq

4. En el capitulo anterior se encontro la funcion generatriz de una variable aleatoria binomial.

En el ejemplo anterior, el numero de artıculos defectuosos que esperamos esten en el lote de 10 es:

E(X) = np = 10(0.20) = 2.

4.2. Distribucion Poisson

Definicion 4.2. Sea X una variable aleatoria que representa el numero de eventos independientes sobre el tiempo o

el espacio. Se dice entonces que tiene distribucion Poisson con funcion de probabilidad dada por:

PX (X = x) =

λ xe−λ

x! donde x = 0,1,2, · · ·

0, en otro caso

Donde λ es el numero promedio de resultados posibles por unidad de tiempo o espacio y e = 2.71828 . . ..

Si una variable aleatoria X que tiene una distribucion Poisson con parametro λ , notaremos X ∼ P[λ ].

La probabilidad que una variable aleatoria sea menor o igual a un valor determinado x0, se especifica por la funcion


F(x0) = PX (X ≤ x0) =x0

∑x=0

λ xe−λ

x!

Ejemplo 4.2. El numero de componentes que fallan antes de cumplir 100 horas de operacion es un variable aleatoria

de Poisson. Si el numero promedio de esta es ocho:

1. Hallar la funcion de probabilidad y distribucion acumulada para los primeros 6 valores de la variable aleatoria

X que falle un componentes en 25 horas.

2. Cual es la probabilidad de que falle un componentes en 25 horas?

3. Cual es la probabilidad de que fallen no mas de dos componentes en 50 horas?

4. Cual es la probabilidad de que fallen por lo menos diez componentes en 125 horas?



Solucion

Sea X la variable aleatoria que representa el numero componentes que fallan antes de cumplir 100 horas en la muestra

seleccionada. Si el numero promedio en la 100 horas es λ = 8. Entonces

1. Para 25 horas esperamos λ = 2, entonces la funcion de probabilidad de X esta dada por:

PX (X = x) =2xe−2

x!; donde x = 0,1,2, · · ·

Por lo tanto en la siguiente tabla se muestra la funcion de probabilidad y distribucion acumulada para los primero

6 valores de la variable aleatoria X

X = x PX (X = x) F(x)

0 0.1353 0.1353

1 0.2707 0.4060

2 0.2707 0.6767

3 0.1804 0.8571

4 0.0902 0.9473

5 0.0361 0.9834

2. La probabilidad de que falle un componentes en 25 horas es:

PX (X = 1) =2xe−2

x!= 0.2707


PX (X = x) =4xe−4

x!; donde x = 0,1,2, · · ·

En consecuencias, la probabilidad de que fallen no mas de dos componentes en 50 horas es:

PX (X ≤ 2) = 0.0183+0.0733+0.1465

= 0.2381.


PX (X = x) =10xe−10

x!; donde x = 0,1,2, · · ·

Por lo tanto en la siguiente tabla se muestra la funcion de probabilidad y la funcion de distribucion acumulada

para los primeros 10 valores de X



X = x PX (X = x) F(x)

0 0 0.0000

1 0.0005 0.0005

2 0.0023 0.0028

3 0.0076 0.0103

4 0.0189 0.0293

5 0.0378 0.0671

6 0.0631 0.1301

7 0.0901 0.2202

8 0.1126 0.3328

9 0.1251 0.4579

En consecuencias, la probabilidad de que fallen por lo menos 10 componentes en 125 horas es:

PX (X ≥ 10) = 1−PX (X ≤ 9) = F(10)

= 1−0.4579 = 0.5421.

Teorema 4.2. Sea una variable aleatoria X que tiene una distribucion Poisson con parametro λ . Entonces

1. ∑∞x=0

λ xe−λ

x! = 1

2. E(X) = λ

3. V (X) = λ

4. MX (t) = eλ (et−1)

Demostracion 14. Para demostrar el teorema es suficiente considerar el desarrollo en serie de Taylor de eλ , es decir,

eλ =∞

∑x=0

λ x

x!

Los detalles debe elaborarlo el estudiante como un ejercicio.

La distribucion de Poisson tambien es una forma limite de la distribucion Binomial. Este resultado se demuestra en el

siguiente teorema.



Teorema 4.3. Sea una variable aleatoria que tiene una distribucion Binomial, con parametros n y p. Entonces

lımn→∞

(nx

)pxqn−x =

λ xe−λ

x!

Donde λ = np.

Demostracion 15. Comencemos escribiendo la funcion de densidad de la probabilidad binomial en terminos de λ :

lımn→∞

(nx

)pxqn−x = lım

n→∞

(nx

)(λ

n

)x(1− λ

n

)n−x

= lımn→∞

n!(n− x)!x!

λx(

1nx

)(1− λ

n

)−x(1− λ

n

)n

(4.1)

Pero sabemos que

lımn→∞

(1− λ

n

)n

= e−λ (4.2)

Por otro lado notese,

n!(n− x)(n−λ )x =

n(n−1)(n−2) · · ·(n− x+1)(n−λ )(n−λ )(n−λ ) · · ·(n−λ )

Ası, dividiendo por n y tomado limite a la anterior expresion,

lımn→∞

n!(n− x)(n−λ )x = lım

n→∞

1(1−λ/n)

lımn→∞

1−1/n(1−λ/n)

lımn→∞

(1−2/n)(1−λ/n)

· · · lımn→∞

(1− (x−1)/n)(1−λ/n)

= 1 (4.3)

Reemplazando 4.3 y 4.2 en 4.1 se obtiene lo que se desea demostrar.

En la tabla siguiente se comparan las probabilidades binomial y de Poisson


4.3. DISTRIBUCION GEOMETRICA Universidad Popular del Cesar

X = x(100

x

)(0.01)x(0.99)100−x 1xe−1

x!

0 0.366032 0.367879

1 0.369730 0.367879

2 0.184865 0.183940

3 0.060999 0.061313

4 0.014941 0.015328

5 0.002897 0.003065

6 0.000463 0.000510

7 0.000062 0.000072

8 0.000007 0.000009

9 0.000000 0.000001

10 0.000000 0.000000

4.3. Distribucion Geometrica

Definicion 4.3. Sea X una variable aleatoria que representa el numero de pruebas necesarias hasta obtener el primer

exito, donde cada prueba es independiente y la probabilidad de un exito es p y de un fracaso es 1− p, cada vez que el

experimento se lleva acabo. Se dice entonces que X tiene distribucion Geometrica con funcion de probabilidad dada

por:

PX (X = x) =

pqx−1, donde x = 1,2,3, · · · y q = 1− p

0, en otro caso

Si una variable aleatoria X que tiene una distribucion geometrica con parametro p, notaremos X ∼ G[p].



F(x0) = PX (X ≤ x0) =x0

∑x=1

pqx−1

Teorema 4.4. Sea una variable aleatoria X que tiene una distribucion Poisson con parametro p. Entonces

1. ∑∞x=1 pqx−1 = 1

2. E(X) = 1p

3. V (X) = 1−pp2

4. MX (t) =pet

1−(1−p)et



Demostracion 16. Las pruebas de (a), (b) y (d) las dejaremos como ejercicios. Demostremos (c) teniendo en cuenta

la siguiente igualdad:

E(X2) = E(X(X−1))+E(X)

Por definicion,

E(X(X−1)) =∞

∑x=1

x(x−1)PX (x)

Ası que

E(X(X−1)) =∞

∑x=1

x(x−1)pqx−1 = pq∞

∑x=2

x(x−1)pqx−2

si y = x−1, entonces

E(X(X−1)) =pq∞

∑y=1

(y+1)yqy

=pq∞

∑y=1

(y+1)yqy−1 = pqd2

dq2

(∞

∑y=1

qy+1)

=pqd2

dq2

(q2

∞

∑y=1

qy−1)

pero la serie

∞

∑y=0

qy =1

1−q

esto conduce a la ecuacion

E(X(X−1)) = pqd2

dq2

(q2

1−q

)

derivando dos veces a E(X(X−1)) con respecto a q, tenemos

E(X(X−1)) =2qp2

Puesto que E(X2) = E(X(X−1))+E(X) entonces

E(X2) =2qp2 +

1p=

2q+ pp2



Ası,

V (X) =2q+ p

p2 − 1p2 =

1− pp2

Ejemplo 4.3. Supongase que el 10% de los motores fabricados en determinada lınea de montaje son defectuosos. Si

se seleccionan aleatoriamente los motores, uno a la vez, para su prueba. Calcular las siguientes probabilidades:

1. El primer motor defectuoso se encuentre en el segundo intento.

2. El primer motor defectuoso se encuentre en el quinto intento.

3. El primer motor defectuoso se encuentre en o antes del quinto intento.

4. Calcular el promedio y la varianza del numero de la inspeccion en la cual se encuentre en el primer motor

defectuoso.

Solucion

Sea X la variable aleatoria numero intentos hasta tener el primer motor defectuoso, es claro que esta es una variable

aleatoria con distribucion Geometrica con parametro p = 0.10. Por lo tanto, la funcion de probabilidad es

PX (X = x) = (0.1)(0.9)x−1, donde x = 1,2,3, · · · y q = 1− p

En la siguiente tabla se muestra la funcion de probabilidad y funcion de distribucion acumulada para los primeros 10

valores de la variable aleatoria X

X = x PX (X = x) F(x)

1 0.0900 0.1900

2 0.0810 0.2710

3 0.0729 0.3439

4 0.0656 0.4095

5 0.0590 0.4686

6 0.0531 0.5217

7 0.0478 0.5695

8 0.0430 0.6126

9 0.0387 0.6513

10 0.0349 0.6862

Por lo tanto

1. La probabilidad que el primer motor no defectuoso se encuentre en el segundo intento,

PX (X = 2) = (0.1)(0.9)2−1 = 0.0810


4.4. DISTRIBUCION BINOMIAL NEGATIVA Universidad Popular del Cesar

2. La probabilidad que el primer motor no defectuoso se encuentre en el quinto intento,

PX (X = 5) = (0.1)(0.9)5−1 = 0.0590

3. La probabilidad que el primer motor no defectuoso se encuentre en o antes del quinto intento,

F(5) = PX (X ≤ 5) =5

∑x=1

(0.1)(0.9)x−1 = 0.4686

4. El promedio y la varianza del numero de la inspeccion en la cual se encuentre en el primer motor no defectuoso

son:

E(X) =1p=

10.1

= 10

y

V (X) =1− p

p2 =0.9

(0.1)2 = 90

respectivamente.

4.4. Distribucion Binomial Negativa

Definicion 4.4. Sea X una variable aleatoria Binomial con probabilidad de exito p y donde X, es el numero de pruebas

necesarias hasta obtener exactamente r exitos. En este caso, se dice que la variable aleatoria X tiene distribucion

Binomial Negativa con funcion de probabilidad dada por:

PX (X = x) =

(x−1r−1

)prqx, donde

x = r,r+1,r+2, · · ·

r = 1,2,3, · · ·

0≤ p≤ 1 y q = 1− p

0, en otro caso

Si una variable aleatoria X que tiene una distribucion binomial negativa con parametros r y p, en donde r no se

requiere que sea un entero positivo, notaremos X ∼ BN[r, p].



F(x0) = PX (X ≤ x0) =x0

∑x=0

(x−1r−1

)prqx


4.4. DISTRIBUCION BINOMIAL NEGATIVA Universidad Popular del Cesar

Teorema 4.5. Sea una variable aleatoria X que tiene una distribucion binomial negativa con parametros r y p.

Entonces

1. ∑∞x=0(x−1

r−1

)prqx = 1

2. E(X) = rp

3. V (X) = r(1−p)p2

4. MX (t) =[

pet

1−qet

]r

Teorema 4.6. Sea X una variable aleatoria que tiene una distribucion Binomial Negativa con parametros r y p.

Entonces

FBN(x) = PX (X ≤ x) = 1−FB(y) = PY (Y ≥ y)

en donde Y es una variable aleatoria Binomial con parametros n = r+ x y p.

Ejemplo 4.4. Una empresa de reclutamiento encuentra que el 30% de los aspirantes para determinado puesto en la

industria tiene conocimiento avanzado de programacion. Supongase que se tienen tres puestos en los que se necesitan

conocimientos avanzados de programacion.

1. Encontrar la funcion de probabilidad de la variable aleatoria, numero de aspirantes hasta obtener tres que

tengan conocimiento avanzado en programacion.

2. Se entrevistan uno a uno los solicitantes, calcular la probabilidad de encontrar un aspirante en la quinta entre-

vista.

Solucion

Supongase que las entrevistas son independientes, y que la probabilidad de encontrar un candidato con conocimiento

avanzado de programacion es 0.3, la cual permanece constante de prueba en prueba. Sea X , numero de aspirantes

hasta obtener tres que tengan conocimiento avanzado en programacion. Entonces se puede inferir que X , numero de

aspirantes hasta obtener tres que tengan conocimiento avanzado en programacion.

1. Entonces se puede concluir que X tiene una distribucion Binomial Negativa, ası que la funcion de probabilidad

es:

PX (X = x) =(

x−12

)(0.3)3(0.7)x−1, r = 3,4,5, · · · ,12

En la siguiente tabla se muestra la funcion de probabilidad y funcion de distribucion acumulada para los primeros

10 valores de la variable aleatoria X


4.5. DISTRIBUCION HIPERGEOMETRICA Universidad Popular del Cesar

X = x PX (X = x) F(x)

3 0.0920 0.0920

4 0.0970 0.1890

5 0.0950 0.2840

6 0.0890 0.3730

7 0.0800 0.4530

8 0.0700 0.5820

9 0.0590 0.6320

10 0.0500 0.6820

11 0.0410 0.7230

12 0.0340 0.7570

2. De la tabla anterior observamos que

PX (X = 5) =(

42

)(0.3)3(0.7)4 = 0.0950

4.5. DISTRIBUCION HIPERGEOMETRICA

Definicion 4.5. Sea N el numero total de objetos en una poblacion finita, de manera tal que R de estos son de tipo

A y N −R - de tipo B. Si se selecciona una muestra aleatoria simple sin reemplazo n objetos de la poblacion. La

probabilidad que exactamente X sean de tipo A, esta dado por la funcion de probabilidad Hipergeometrica.

PX (X = x) =

(R

x)(N−Rn−x )

(Nn)

, si x = 0,1,2, · · · ,n.

0, en otro caso

y donde x≤ R yn− x≤ N−R.

Los parametros de la distribucion Hipergeometrica son N, n y R.

La probabilidad que una variable aleatoria Hipergeometrica X sea menor o igual a un valor determinado x0 ,se especi-

fica por la funcion de distribucion acumulada,

F(x0) = PX (X ≤ x0) =x0

∑x=0

(Rx

)(N−Rn−x

)(Nn

)Teorema 4.7. Sea una variable aleatoria X que tiene una distribucion Hipergeometrica con parametros N, n y R.

Entonces

1. ∑nx=0

(Rx)(

N−Rn−x )

(Nn)

= 1



2. E(X) = n RN

3. V (X) = n RN (1−

RN )(

N−nN−1 )

4. MX (t) = (pet +q)n

Ejemplo 4.5. Supongase que se tienen 50 representantes de cierta region del paıs, a una convencion polıtica nacional,

de los cuales 20 apoyan al candidato A y 30 al candidato B. Si se seleccionan aleatoriamente 10 representantes. Cual

es la probabilidad que entre estos 10:

1. Exactamente 5 apoyen al candidato A

2. Por lo menos apoyen al candidato A

3. Entre dos y cinco inclusive apoyen al candidato A

4. Cuantos representantes esperamos apoyen al candidato A

5. Con que variabilidad se espera que los representantes apoyen al candidato A.

Solucion

Sea X una variable aleatoria que representa el numero de representantes que apoyen al candidato A; con parametros

N = 50, n = 10 y R = 20. Entonces la funcion de probabilidad para la variable aleatoria X es

PX (X = x) =

(30x

)( 2010−x

)(Nn

) , si x = 0,1,2, · · · ,10.

Por lo tanto en la siguiente tabla se muestra la funcion de probabilidad y distribucion acumulada para valores de la

variable aleatoria X

X = x PX (X = x) F(x)

0 0.0029 0.0029

1 0.0279 0.0308

2 0.1083 0.1390

3 0.2259 0.3650

4 0.2801 0.6450

5 0.2151 0.8601

6 0.1034 0.9635

7 0.0306 0.9942

8 0.0053 0.9995

9 0.0005 1.0000

10 0.0000 1.0000



Las respuestas para las preguntas:

1. Exactamente 5 apoyen al candidato A:

PX (X = 5) = 0.2801

2. Por lo menos dos apoyen al candidato A:

PX (X ≥ 2) = 1−F(1) = 1−0.0308 = 0.9692

3. Entre dos y cinco inclusive apoyen al candidato A:

PX (2≤ X ≤ 5) = (0.1083+0.2259+0.2259+0.2801) = 0.8402

4. Cuantos representantes esperamos apoyen al candidato A:

E(X) = 10(30/50) = 6

5. Con que variabilidad se espera que los representantes apoyen al candidato A:

V (X) = 102050

(1− 20

50

)(50−1050−1

)= 1.6271

.

La distribucion de Binomial tambien es una forma limite de la distribucion Hipergeometrica. Este resultado se de-

muestra en el siguiente teorema.

Teorema 4.8. Sea X una variable aleatoria que tiene una distribucion Hipergeometrica con parametros N , n y R .

Entonces

lımN→∞

(Rx

)(N−Rn−x

)(Nn

) =

(nx

)pxqn−x

Donde p = R/N.

Demostracion 17. La prueba se deja como un ejercicio.

La funcion de distribucion Binomial aproxima de manera adecuada a la funcion de probabilidad Hipergeometrica si

n < 0.1N.

En la siguiente tabla se comparan los valores de probabilidad de una Binomial como limite de una funcion de proba-

bilidad Hipergeometrica, con N = 1000, n = 10 y R = 50.



X = x Hipergeometrica Binomial

0 0.0009 0.0010

1 0.0095 0.0098

2 0.0434 0.0439

3 0.1168 0.1172

4 0.2057 0.2051

5 0.2473 0.2461

6 0.2057 0.2051

7 0.1168 0.1172

8 0.0434 0.0439

9 0.0095 0.0098

10 0.0009 0.0010

4.6. EJERCICIOS

1. Demuestre las siguientes igualdades:

a)(

n+ r−1r−1

)=

(n+ r−1

n

)b)(

n+ r−1n

)= (−1)n

(−rn

)2. En la Universidad Popular del Cesar se ha observado que el 60% de los estudiantes que se matriculan lo hacen

en una carrera de Ciencias, mientras que el otro 40% lo hacen en carreras de Humanidades. Si un determinado

dıa se realizan 20 matrıculas, calcular la probabilidad de que:

a) haya igual numero de matrıculas en Ciencias y en Humanidades;

b) el numero de matrıculas en Ciencias sea menor que en Humanidades;

c) haya al menos 8 matrıculas en Ciencias

d) no haya mas de 12 matrıculas en Ciencias.

e) Si las cinco primeras matrıculas son de Humanidades, calcular la probabilidad de que:

1) total haya igual numero de matrıculas en Ciencias y en Humanidades

2) en total haya al menos 6 en Ciencias mas que en Humanidades.

3. Para un experimento medico se requieren cinco mujeres que hayan tenido seis o mas partos. La proporcion de

mujeres adultas con esa caracterıstica es 0.25. Suponga que se toma una muestra de mujeres adultas y sea N el

numero de mujeres adultas que es necesario entrevistar para encontrar las cinco buscadas.

a) ¿Cual es el modelo apropiado para la distribucion de N?



b) ¿Cual es la probabilidad de que en diez o menos intentos se encuentren las cinco mujeres?

4. Un complejo sistema electronico esta construido con cierto numero de componentes de apoyo en sus subsis-

temas. Un subsistemas contiene cuatro componentes identicas, cada uno con probabilidad de 0.2, de fallar en

menos de 1.000 horas. El subsistemas funciona si dos componentes cualesquiera de los cuatro trabajan en forma

adecuada. Se supone que los componentes operan independientemente.

a) Encuentre la probabilidad de que exactamente dos de cuatro componentes resistan mas de 1.000 horas.

b) Encuentre la probabilidad de que de que el subsistema funcione por mas de 1.000 horas.

5. La probabilidad de que un enfermo se recupere de un padecimiento gastrico es 0.8. Supongase que 20 personas

han contraıdo tal afeccion.

a. ¿Cual es la probabilidad de que sobrevivan exactamente 14?

b. ¿Cual es la probabilidad de que al menos 10 sobrevivan?

c. ¿Cual es la probabilidad de que al menos 14, pero no mas de 18 sobrevivan?

d. ¿Cual es la probabilidad de que al lo mas 16 sobrevivan?

e. Si 100 personas han contraigo la afeccion gastrica. ¿Cuantos esperamos que sobrevivan?

6. Un examen de seleccion multiple esta compuesto de 15 preguntas, con cinco respuestas posibles cada una, de

las cuales una es correcta. Supongase que uno de los estudiantes que realiza el examen responde las preguntas

al azar. ¿Cual es la probabilidad de que conteste correctamente al menos 10 preguntas?

7. Un sistema de proteccion contra cohetes esta construido con n unidades de radar que funcionan independien-

temente, cada una con probabilidad de 0.9 de detectar un cohete que ingrese en la zona que cubren todas las

unidades.

a) Si n= 5 y un cohete entra en la zona. ¿Cual es la probabilidad de que exactamente cuatro unidades detecten

el cohete?

b) Si n = 5 y un cohete entra en la zona. ¿Cual es la probabilidad de que al menos una unidades detecten el

cohete?

c) ¿Cual debe ser el valor de n para que la probabilidad de detectar el cohete al entrar a la zona, sea de 0.999?

8. Un fabricante de cera para pisos desarrolla dos productos nuevos, A y B, que desea someter a la evolucion de

amas de casa para determinar cual es la mejor. Las dos ceras, A y B, se aplica en los pisos de 15 casas. Se supone

que en realidad no hay diferencia en calidad entre las dos marcas.

a) ¿Cual es la probabilidad de que 10 o mas amas de casa vayan a preferir la marca A?

b) ¿Cual es la probabilidad de que 10 o mas amas de casa vayan a preferir la marca A o B?



9. De cada 2.000 tornillos fabricados por una determinada maquina hay 2 defectuosos. Para realizar el control de

calidad se observan 150 tornillos y se rechaza el lote si el numero de defectuosos es mayor que 1. Calcular la

probabilidad de que el lote sea rechazado.

10. En pruebas realizadas a un amortiguador para automovil se encontro que el 20% presentaban fuga de aceite. Si

se instalan 20 de estos amortiguadores, hallar la probabilidad de que:

a) 4 salgan defectuosos,

b) mas de 5 tengan fuga de aceite.

c) de 3 a 6 amortiguadores salgan defectuosos.

d) Determine el promedio y la desviacion estandar de amortiguadores con defectos.

11. Un ingeniero que labora en el departamento de control de calidad de una empresa electrica, inspecciona una

muestra al azar de 10 alternadores de un lotes. Si el 15% de los alternadores del lote estan defectuosos. Cual es

la probabilidad de que en la muestra,

a) ninguno este defectuoso,

b) uno salga defectuoso,

c) al menos dos salgan defectuosos

d) mas de tres esten con defectos

12. En un almacen en particular los clientes llegan al mostrador de caja, conforme una distribucion de Poisson con

un promedio de siete por hora. En una hora dada.

a) ¿Cual es la probabilidad de que no lleguen mas de tres clientes?

b) ¿Cual es la probabilidad de que lleguen al menos dos clientes?

c) ¿Cual es la probabilidad de que lleguen exactamente cinco clientes?

13. El numero de componentes que fallan antes de cumplir 100 horas de operacion es una variable aleatoria de

Poisson. Si el numero promedio de estas es ocho:

a) ¿Cual es la probabilidad de que falle una componente en 25 horas?

b) ¿Cual es la probabilidad de que fallen no mas de dos componentes en 50 horas?

c) ¿Cual es la probabilidad de que falle por lo menos diez componentes en 125 horas?

14. Mediante estudios reciente se ha determinado que la probabilidad de morir por causa de cierta vacuna para la

gripe es de 0.00002. Si se administra la vacuna a 100.000 personas y si suponemos que esta constituyen un

conjunto de ensayos independientes:

a) ¿Cual es la probabilidad de que mueran no mas de dos personas a causa de la vacuna?



b) ¿Cual es la probabilidad de que mueran exactamente cinco de las personas a causa de la vacuna?

c) ¿Cual es la probabilidad de que mueran ninguna de las personas a causa de la vacuna?

d) ¿Cuantas personas esperamos se mueran, de las 100.000, a causa de la vacuna?

15. Sea X una variable aleatoria binomial. Para n = 20, calcular las probabilidades puntuales binomiales y com-

pararlas con las correspondientes probabilidades de Poisson para p =0.5, 0.3, 0.1 y 0.01. (Sugerencia: haga

λ = np)

16. Las lıneas telefonicas que entran a una oficina de reservaciones de aerolıneas estan ocupadas un 60% del tiempo.

a) Si usted habla en esa oficina, ¿cual es la probabilidad que le respondan en la primera llamada? ¿En la

segunda? ¿En la tercera?

b) Si usted y un amigo deben hacer llamadas separadas a esta oficina, ¿cual es la probabilidad de que deban

hacer un total de cuatro intentos para lograr las dos llamadas?

17. Un electrodomestico se vende en dos colores, blanco y cafe, y tiene igual demanda. Un vendedor tiene tres

electrodomesticos de cada color en existencia, aunque esto no lo saben los clientes. Dichos clientes llegan y

piden en forma independiente estos electrodomesticos. Calcular la probabilidad d que

a) el quinto cliente pida el tercer blanco

b) el quinto cliente se lleve el tercer cafe

c) se piden todos los blancos antes del primer cafe

d) se pidan todos los blancos antes que se agoten los cafe.

18. Se definen los requisitos peor de los casos como objetivos de diseno de una marca de terminales de computadora.

Una prueba preliminar rapida indica que 4 de 10 terminales no pasan la prueba del peor de los casos. Se

seleccionan 5 de los 10, en forma aleatoria, para pruebas posteriores. Sea X la variable aleatoria el numero,

entre las 5 terminales, que no pasan la prueba preliminar. Calcular:

a) la funcion de probabilidad y de distribucion acumulada e interprete

b) el valor esperado y la desviacion estandar e interprete.

19. Los procedimientos de muestreo para aceptar lotes en una empresa manufaturera electronica requiere el muestreo

de n artıculos de un lote de N artıculos, y aceptar el lote si X ≤ c, donde X es el numero de artıculos defectuosos

en la muestra. Para un lote de 20 cubiertas de impresoras, se debe mostrar 5. Calcular de aceptar el lote si c = 1,

y si el numero real de cubiertas defectuosas en el lote es:

a) X = 0, 1, 2, 3, 4

b) Responder la anterior pregunta se c = 2.



20. Se forma una empresa de explotacion petrolera con suficiente capital para financiar 10 exploraciones. La proba-

bilidad de que una exploracion en particular se exitosa es de 0.1. Supongase que las exploraciones son indepen-

dientes.

a) Encuentre la media y la varianza del numero de exploraciones exitosas.

b) Supongase que la empresa tiene uno costos fijos de $20.000 dolares para preparar el equipo antes de la

primera exploracion. Si cada exploracion exitosa cuesta $30.000 dolares y cada exploracion fallida $15.00,

encuentre el costo total esperado de la empresa para las 10 exploraciones.

21. Una venta en particular involucra cuatro artıculos seleccionados aleatoriamente de un gran lote que contiene

10% defectuosos. Sea X el numero de defectos entre los cuatro artıculos vendidos. El comprador de los artıculos

regresara los defectuosos para ser reparados, y el costo de reparacion esta dado por C = 3X2 +X +2.

a) Encontrar el costo de reparacion.

b) De una interpretacion de la funcion C.

22. Un contador publico titulado (cpt) ha encontrado que nueve de diez auditorıas de companıas contienen errores

importantes. Si cpt revisa la contabilidad de una serie de companıa. ¿Cual es la probabilidad de que:

a) La primera contabilidad con errores sustanciales sea la tercera contabilidad revisada?

b) La primera contabilidad con errores importantes fuera encontrada despues de revisar la tercera contabili-

dad?

23. Un lote de televisores esta formado por 5 TV a color (3 de la marca A y 2 de la marca B) y 6 TV blanco y negro

(4 de la marca A y 2 de la marca B). Si se seleccionan sin reemplazo un grupo de 3 TV. Hallar la probabilidad

de:

a) Seleccionar 2 TV de la marca B.

b) Seleccionar 2 TV de la marca A o 2 TV a color.

24. La probabilidad de un lanzamiento exitoso es igual a 0.8. Supongamos que se hacen ensayos de lanzamientos

hasta que han ocurrido 3 lanzamientos exitosos.

a) ¿Cual es la probabilidad de que sean necesarios 6 ensayos?

b) Suponga que se hacen los ensayos de lanzamientos hasta que ocurren 3 lanzamientos exitosos consecu-

tivos. Responda la pregunta (a) en este caso.

c) Suponga que cada uno de los ensayos de lanzamiento cuesta $5000. Ademas, un lanzamientos que fracase

produce un costo adicional de $500. Calcule el costo esperado para obtener los 3 lanzamientos exitosos.



25. El 20% de los peces de un lago son de la especie A y el resto de otras especies. Un investigador decide realizar el

siguiente experimento: Extraer peces del lago hasta obtener 3 de la especie A (asuma que el metodo de captura

utilizado por el investigador es igualmente efectivo para con todas las especies).

a. ¿Cual es la probabilidad de que el investigador realice solamente 10 extracciones?

b. Para la v.a. definida en la parte (a), calcule el valor esperado e interpretarlo.

c. Suponga que en el lago solo hay 50 peces, 10 de los cuales son de la especie A.

d. ¿Cual es la probabilidad de que en 10 extracciones se obtengan 3 de la especie A?

e. Bajo los supuestos de la pregunta (c), ¿cual es la probabilidad de que sean necesarias 10 extracciones para

obtener 3 de la especie A?

26. Supongase que el numero de accidentes en una fabrica se puede representar por un proceso de Poisson con un

promedio de 2 accidentes por semana.

a) Encuentre la distribucion de probabilidades de la variable aleatoria tiempo hasta que ocurra un nuevo

accidente.

b) ¿Cual es la probabilidad de que el tiempo entre un accidente y el siguiente sea mayor de 3 dıas?

c) Cual es la probabilidad de que el tiempo hasta que ocurran cinco accidentes sea mayor a 2 semanas?

d) Si ocurrio un accidente en el tiempo 0, y un dıa despues aun no ocurre otro, ¿cual es la probabilidad de

que pasen dos dıas mas y aun no halla ocurrido el siguiente accidente?

27. Los empleados de una empresa que fabrican aisladores son examinados para detectar la presencia de asbesto en

sus pulmones. La empresa debe enviar tres empleados con pruebas positivas de asbesto a un centro medico para

realizarles mas examenes. Si el 40% de los empleados tienen pruebas positivas de asbesto en sus pulmones.

a) Encuentre la probabilidad de que se tenga que examinar 10 empalados hasta encontrar el tres con asbestos

en sus pulmones.

b) Si cada prueba cuesta $20 (dolares), encuentre el valor esperado y la varianza del costo total de las pruebas

necesarias hasta encontrar tres empleados con resultados positivos. ¿Piense que es muy probable que el

costo de realizar estas pruebas exceda $350?

28. Se sabe que el 5% de una poblacion tiene el padecimiento A, que se puede detectar por medio de un analisis de

sangre. Esto se puede hacer de dos maneras: (1) examinando cada persona por separado: (2) mezclar las muestras

sanguıneas de las k personas y despues analizar la mezcla. (Suponga que N = nk, con n numero entero). Si la

prueba resulta negativa, todas las personas son sanas (es decir, se necesita un sola prueba). Si la prueba resulta

positiva, se tienen que examinar cada una de las k personas por separado ( es decir, se necesitan k+ 1 pruebas

en total).



a) Para un valor fijo de k, ¿cual es el valor esperado de de numero de pruebas necesarias en el caso (2).

b) Encontrar el valor de k que minimiza el valor esperado del numero de pruebas en el caso (2).

c) ¿cuantas pruebas se ahorran comparando el caso (b) con el caso (1).

29. Un deposito contiene 10000 partıculas y la probabilidad de que una de esas partıculas salga del deposito es igual

a 0.0004. Asuma que cada partıcula es independiente de las otras. ¿Cual es la probabilidad de que ocurran mas

de 3 salidas?

30. El muestreo para encontrar los artıculos de un gran lote de produccion revela cierto numero de artıculos defectu-

osos X , que tiene una distribucion de probabilidad binomial. Un proyecto de muestreo consistente en especificar

el numero de artıculos que deben incluirse en la muestra n, y el numero de aceptacion, a. Se acepta el lote

cuando X ≥ a y se rechaza el lote si X < a. Sea p la proporcion de artıculo defectuosos en el lote. Para n = 5 y

a = 0 calcule la probabilidad de que el lote se aceptado si.

a) p = 0.0

b) p = 0.1

c) p = 0.3

d) p = 0.5

e) p = 1.0

La curva que muestra la probabilidad de aceptar un lote se llama curva caracterıstica de operacion para el

proyecto de muestreo. Construya la curva caracterıstica de operacion para el proyecto de muestreo n = 5, a = 0.

Observese que un proyecto de muestreo es un ejemplo de la inferencia estadıstica. La aceptacion o el rechazo

de un lote basado en la informacion contenida en una muestra es equivalente a la conclusion de que el lote es

bueno o malo respectivamente. Bueno implica una fraccion pequena de artıculos defectuosos y que el lote es

apropiado para ser enviado.

31. Construya la curva caracterıstica de operacion del problema anterior para los proyectos muestrales siguientes:

a) n = 10,a = 0

b) n = 10,a = 1

c) n = 10,a = 2

En cada caso, calcular la probabilidad para p = 0,0.05,0.1,0.3,1.0. se incluye que es mucho menos probable

que el proyecto de muestreo (a.) acepte un lote malo que los proyectos (b.) y (c.). Una comparacion visual las

curvas caracterısticas de operacion confirman estas conclusiones intuitivas.


libroestadistica.pdf

Documents

distribucion binomial1274

distribucion poisson

distribucion geometrica

distribucion hipergeometrica

distribucion uniforme1075

distribucion gamma

distribucion multinomial

distribucion binomial