libroestadistica.pdf
TRANSCRIPT
UNIVERSIDAD POPULAR DEL CESARFACULTAD DE CIENCIAS BASICAS Y EDUCACIONDEPARTAMENTO DE MATEMATICAS Y ESTADISTICA
INTRODUCCION A LA PROBABILIDAD Y A LAESTADISTICA CON APLICACIONES
A B C D E
05
1015
2025
3035
HUMBERTO BARRIOS ESCOBAR
Indice general
1. ESTADISTICA DESCRIPTIVA 41
1.1. INTRODUCCION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES . . . . . . . . . . . . . . . . . . . . . . 43
1.2.1. DISTRIBUCIONES DE FRECUENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.2.2. METODO GRAFICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.3.1. MEDIDAS DE TENDENCIA CENTRAL . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.3.2. MEDIDAS DE DISPERSION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
1.3.3. OTRAS MEDIDAS DESCRIPTIVAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
1.4. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2. PROBABILIDAD 67
2.1. INTRODUCCION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.2. PROPIEDADES BASICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.3. DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES . . . . . . . . . . . . . . . . . . . . 73
2.4. PROBABILIDAD CONDICIONAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.5. EVENTOS INDEPENDIENTES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.6. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3. VARIABLES ALEATORIAS 98
3.1. VARIABLES ALEATORIAS DISCRETAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.2. VARIABLES ALEATORIAS CONTINUAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA . . . . . . . . . . . . . . 106
3.4. FUNCIONES GENERADORAS DE MOMENTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
3.5. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
II
INDICE GENERAL Universidad Popular del Cesar
4. DISTRIBUCIONES DISCRETAS 127
4.1. Distribucion Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.2. Distribucion Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.3. Distribucion Geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
4.4. Distribucion Binomial Negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.5. DISTRIBUCION HIPERGEOMETRICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
4.6. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
5. ALGUNAS DISTRIBUCIONES CONTINUAS 107
5.1. Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.2. Distribucion Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.3. Distribucion Gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
5.4. Distribucion Chi Cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.5. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
6. VECTORES ALEATORIOS Y DENSIDADES CONJUNTAS 123
6.1. INTRODUCCION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.2. Distribuciones de probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
6.3. Variables aleatorias independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
6.4. Variables aleatorias independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
6.5. Valor esperado y momentos para distribuciones conjuntas . . . . . . . . . . . . . . . . . . . . . . . . 135
6.6. La distribucion multinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
6.7. Distribucion normal bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
6.8. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
III Humberto Barrios. mail: [email protected]
CAPITULO 1
ESTADISTICA DESCRIPTIVA
1.1. INTRODUCCION
Estamos en una epoca en la que nos agobian acontecimientos y numeros, las llamadas, estadısticas, acerca de
cualquier tema comprensible. Se escuchan o se leen indagaciones de los medios de comunicaciones del numero de
personas desplazadas por la violencia a las que ayuda el gobierno, el numero de hectareas sembradas de coca radicadas
diariamente por el actual gobierno y cronicas deportivas sobre el numero promedios de goles en los partidos de futbol
en una semana determinada. En este sentido para mucha gente, el termino estadıstica significa descripcion numerica.
En un sentido mas amplio, se puede establecer que el objetivo de la estadıstica es hacer inferencias con respecto a una
poblacion a partir de la informacion contenida en una muestra y proporcionar una medida (probabilidad) correspondi-
ente para la bondad de la inferencia. Es decir, la estadıstica trata del diseno de experimento o encuestas (investigacion)
mediante muestras para obtener una cantidad determinada de informacion a un costo mınimo y del uso optimo de esta
informacion para sacar conclusiones (inferencias inductivas) con respecto a una poblacion.
En estadıstica la inferencia es inductiva porque se proyecta de lo especifico (la muestra) hacia lo general (poblacion).
En un procedimiento de esta naturaleza siempre existe la posibilidad de error. Nunca se tendrıa el cien por ciento de
seguridad sobre una proporcion en la que se basa la inferencia estadıstica. Sin embargo, lo que hace de la estadıstica
una ciencia (separandola del arte de adivinar la suerte) es que, unida cualquiera proposicion o afirmacion, existe una
medida de la confiabilidad de esta. En estadıstica se mide la confiabilidad en terminos de probabilidad (un tema que
se estudiara mas adelante). En otras palabras, para cada inferencia estadıstica se identifica la probabilidad de que la
inferencia sea correcta. Los problemas estadısticos se caracterizan por los siguientes cuatro elementos:
1. La poblacion de interes y el procedimiento cientıfico que se emplea para seleccionar la muestra.
2. La muestra y el analisis matematico de la informacion.
3. Las inferencias estadısticas que resulten del analisis de la muestra.
4. La probabilidad o confiabilidad de que las inferencias sean correctas.
41
1.1. INTRODUCCION Universidad Popular del Cesar
Para comprender la naturaleza de la estadıstica inferencial, es necesario precisar algunos conceptos.
Definicion 1.1. Una poblacion es el conjunto de todas las mediciones de interes para determinado problema. En
estadıstica, poblacion es un concepto mucho mas general del que tiene el concepto comun de esta palabra.
En este sentido, una poblacion es cualquier coleccion ya sea de un numero finito de mediciones o una coleccion grande,
virtualmente infinita, de datos acerca de algo de interes.
Definicion 1.2. Una muestra es un subconjunto de la poblacion que contiene las mediciones obtenidas mediante un
experimento. De esta forma, una buena muestra es aquella que refleja las caracterısticas esenciales de la poblacion
de la cual se obtuvo.
En estadıstica, el objetivo de las tecnicas de muestreo es asegurar que cada observacion en la poblacion tiene una
oportunidad igual e independiente de ser incluida en la muestra. Tales procesos de muestreo conducen a una muestra
aleatoria. Las observaciones de la muestra aleatoria se usan para calcular ciertas caracterısticas de la muestra llamadas
estadısticas. Las estadısticas se usan como base para hacer inferencias de ciertas caracterısticas de la poblacion, que
reciben el nombre de parametros.
En cada uno de los siguientes casos se describe la poblacion correspondiente, el objetivo inferencial y que es lo que se
harıa para obtener una buena muestra.
Ejemplo 1.1. La Facultad de Ciencias de la Salud de la UPC quiere hacer un estudio acerca de los niveles de
resistencia fısica de estudiantes varones que recientemente ingresaron a la universidad.
Poblacion: Son todos los estudiantes varones de primer semestre de la UPC.
Objetivo inferencial: Estimar la distribucion de frecuencias, por edades, la resistencia fısica de estudiantes varones
que recientemente ingresaron a la universidad.
Muestra: Seleccionar una muestras de estudiantes varones que ingresaron a la UPC, en el primer semestre.
Ejemplo 1.2. Un ingeniero desea estimar el consumo semanal promedio de agua por familias en Valledupar.
Poblacion: Todas las familias que viven en Valledupar.
Objetivo inferencial: Estimar el consumo semanal promedio de agua por familias.
Muestra: Tomar un subconjunto de todas las familias de Valledupar, de tal manera que estas familias sean “represen-
tativas”.
42 Humberto Barrios. mail: [email protected]
1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES Universidad Popular del Cesar
Ejemplo 1.3. Un ingeniero electronico desea determinar si la duracion promedio de cierto tipo de transistores supera
las 500 horas.
Poblacion: En este caso, la poblacion puede estar constituida por todos los transistores producidos por una fabrica
durante una semana o tambien se puede considerar los que se pueden fabricar en el futuro. En este caso, la poblacion
es virtualmente infinita.
Objetivo inferencial: Estimar si la duracion promedio de cierto tipo de transistores supera las 500 horas.
Muestra: Seleccionar una muestra aleatoria de la produccion de un lote de varios dıas.
1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES
1.2.1. DISTRIBUCIONES DE FRECUENCIAS
En el sentido mas amplio, hacer inferencias implica la descripcion parcial o total de un fenomeno u objeto fısico.
Por consiguiente, un preludio necesario a la explicacion de como hacer inferencias, es la elaboracion de un metodo
para describir un conjunto de numeros. La descripcion debe ser tal, que el conocimiento de las medidas descriptivas
nos permita tener una apreciacion clara del conjunto de datos. Ademas es de esperarse que la descripcion posea un
sentido pragmatica, para que el conocimiento de las medidas descriptivas de una poblacion nos ayude a resolver un
problema practico no estadıstico, por ejemplo, en la toma de decisiones.
Ejemplo 1.4. Si se seleccionaron aleatoriamente en un proceso de fabricacion de una semana, 100 baterıas para
hallar algun tipo de regularidad en el proceso de fabricacion. En el cuadro 1.1 se dan los datos que representan el
tiempo de duracion en dıas de las 100 baterıas:
Cuadro 1.1: Tiempo de duracion de 100 baterıas
178 221 157 153 107 188 220 157 184 173
221 153 177 173 182 185 111 151 178 167
164 234 151 169 174 229 192 109 118 135
205 181 155 176 146 187 168 188 222 156
200 134 174 200 191 165 187 175 169 162
206 139 176 160 226 188 155 185 187 184
199 174 165 168 124 149 203 159 164 166
226 191 195 182 160 193 140 167 218 183
122 224 187 104 173 194 181 151 198 172
218 236 176 150 158 199 144 202 208 178
43 Humberto Barrios. mail: [email protected]
1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES Universidad Popular del Cesar
Si quisieramos buscar algun tipo de regularidad en este conjunto de datos serıa imposible encontrarla a simple vista.
Una manera sencilla para organizar datos es preparar un arreglo ordenado. Un arreglo ordenado es una lista de valores
de una poblacion o muestra en orden de magnitud de menor a mayor valor. Un arreglo ordenado permite determinar con
rapidez los valores de las mediciones mas pequenos, de los mas grandes. A continuacion se muestra la construccion
de un arreglo ordenado con los datos que se muestran en el cuadro 1.1.
Cuadro 1.2: Tiempo de duracion de 100 baterıas ordenadas de menor a mayor
104 107 109 111 118 122 124 134 135 139
140 144 146 149 150 151 151 151 153 153
155 155 156 157 157 158 159 160 160 162
164 164 165 165 166 167 167 168 168 169
169 172 173 173 173 174 174 174 175 176
176 176 177 178 178 178 181 181 182 182
183 184 184 185 185 187 187 187 187 188
188 188 191 191 192 193 194 195 198 199
199 200 200 202 203 205 206 208 218 218
220 221 221 222 224 226 226 229 234 236
Facilmente es posible identificar rapidamente la baterıa que duro menos dıas (104) y la que duro mas dıas (236).
Pero para identificar los patrones en un conjunto de datos es necesario agrupar las observaciones en un numero rel-
ativamente pequeno de clases que no se intercepten entre sı, de tal manera que no exista ninguna ambiguedad con
respecto a la clase que pertenece una observacion en particular. El numero de observaciones que caen en una clase
recibe el nombre de frecuencia de clase ( fi), mientras que el cociente de una frecuencia de clase con respecto al
numero de observaciones (n) en la muestra se conoce como frecuencia relativa ( fi/n) de la clase. Los lımites de las
clases se denominan fronteras de clases, y el promedio aritmetico entre los lımites superior (Li) e inferior (Ls) recibe
el nombre de marca de clase o punto medio de clase (xi).
El numero de clase que se emplean para clasificar a un conjunto de datos depende del numero total de observaciones.
Si el numero de observaciones es relativamente pequeno, el numero a emplear serıa cinco o mas. Si existe un numero
sustancial de datos, el numero de clases debe ser de quince clases o menos. Es decir, el numero de clases que se deben
tomar no debe ser mayor a quince ni menor de cinco. Un numero muy pequeno de clases puede ocultar la distribucion
real del conjunto de datos, mientras que una muy numerosa puede dejar sin observaciones a algunas clases, limitando
de esta forma su uso.
Para determinar el numero aproximado de clases, tambien se puede hacer uso de la Regla de Sturges:
k = 1+3.3logn
44 Humberto Barrios. mail: [email protected]
1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES Universidad Popular del Cesar
donde
K es el numero de clases
n es el numero total de observaciones de la muestra
log es el logaritmo comun base 10.
Se debe dejar en claro que la Regla de Sturges es una aproximacion del numero de clases, siempre es posible tomar
una mas o una menos de lo que la formula nos da.
Una buena practica es la creacion de clases que tengan longitudes iguales. Esto puede lograrse tomando la diferencia
entre los valores extremos del conjunto de los datos, lo que se conoce como rango (R), y dividiendolo sobre el numero
de clases, el resultado sera aproximadamente la longitud para cada clase. Sin embargo, existen casos donde esta regla
no se puede aplicar o no debe aplicarse. Como ilustracion, tomemos los datos de la tabla 1, para establecer un esquema
de agrupamiento para este conjunto de datos y determinar las frecuencias de clases, frecuencias relativas de clases,
marcas de clases y fronteras de clases. Agrupar los datos en clases de igual longitud.
El rango = valor mayor - valor menor = 236−104 = 132
Por ejemplo, si aplicamos la Regla de Sturges el numero de clases que deberıamos serıa de 8.
Pero supongamos que decidimos tomar diez clases: clases = 10
Por lo tanto, la Longitud de clase = 13.1' 13.
Para establecer las fronteras de cada clase, es necesario considerar la unidad mas cercana con respecto a la cual se
mide las observaciones. Ası, las diez clases a considerar son:
104-117, 118-131, 132-145, 146-159, 160-173
174-187, 188-201, 202-215, 216-229, 230-243
Por lo tanto, una manera de representar a un conjunto de datos es como se muestra en el siguiente cuadro, distribucion
de frecuencias correspondiente a la duracion de 100 baterıas, seleccionadas de manera aleatoria, de la produccion de
una fabrica en una semana.
45 Humberto Barrios. mail: [email protected]
1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES Universidad Popular del Cesar
Cuadro 1.3: Distribucion de frecuencias del tiempo de duracion de 100 baterıas
Li Ls LI LS xi fi fi % Fi Fi %
104 117 103.5 117.5 110.5 4 4% 4 4%
118 131 117.5 131.5 124.5 3 3% 7 7%
132 145 131.5 145.5 138.5 5 5% 12 12%
146 159 145.5 159.5 152.5 15 15% 27 27%
160 173 159.5 173.5 166.5 18 18% 45 45%
174 187 173.5 187.5 180.5 24 24% 69 69%
188 201 187.5 201.5 194.5 14 14% 83 83%
202 215 201.5 215.5 208.5 5 5% 88 88%
216 229 215.5 229.5 222.5 10 10% 98 98%
230 243 229.5 243.5 236.5 2 2% 100 100%
Donde
Li limite inferior de la clase i-esima.
Ls limite superior de la clase i-esima.
xi marca de clase de la clase i-esima.
LI limite inferior real de la clase i-esima.
LS limite superior real de la clase i-esima.
fi frecuencia absoluta de la clase i-esima.
fi % frecuencia porcentual de la clase i-esima.
Fi frecuencia acumulada absoluta de la clase i-esima.
Fi % frecuencia acumulada porcentual de la clase i-esima.
El cuadro 1.3 de frecuencias proporciona mucha mas informacion a simple vista que los datos originales, cuadro
1.1. En un estudio de la vida de las baterıas, hay muchas preguntas que pueden ahora responderse. ¿Que fraccion o
porcentaje de las baterıas puede esperarse de la poblacion en estudio tengan una duracion entre 174 a 187 dıas?
Es claro, que si la muestra es el reflejo de la poblacion, o como dicen mis companeros de la UPC es “representativa”,
entonces la respuesta es 0.25, es decir, el 25%. Muchas preguntas mas se pueden responder con la tabla anterior,
como por ejemplo, ¿Cuantas baterıas fallarıan antes de 187 horas? La respuesta a esta pregunta serıa sumar todas las
frecuencias que ocurren antes de 187, esto es, sumar las frecuencias: 4%, 3%, 5%, 15%, 16%, y 25% lo que suma
46 Humberto Barrios. mail: [email protected]
1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES Universidad Popular del Cesar
68%. La suma de las frecuencias ( fi ) de las observaciones cuyos valores son menores o iguales al lımite superior de
una clase dada se denomina frecuencia acumulada (Fi). De la misma manera se definen la frecuencia acumulada
relativa (Fi/n).
1.2.2. METODO GRAFICO
Otra manera util de representar los datos de una muestra es a traves de graficos. El principal objetivo de la rep-
resentacion grafica de las frecuencias de clases como las frecuencias acumuladas es mostrar el perfil de distribucion
de los datos. El conocimiento de este perfil es util en varias formas, para los analisis apropiados para las inferencias
estadısticas o con el fin de comparar los perfiles de dos o mas conjunto de datos.
Histograma de frecuencias. Un histograma es una representacion grafica de los datos que muestra la frecuencias de
los casos (valores de los datos) en categorıas. Las frecuencias se representan para examinar la forma de la distribucion
de las respuestas. El histograma de frecuencias se construye levantando rectangulos con centros en las marca de
clases, con base de longitud igual a la longitud real del intervalo de clase (L = LS−LI) y altura igual a la frecuencia
de la respectiva clase, en un eje de coordenadas. Para la distribucion de frecuencias del cuadro 1.3, el histograma de
frecuencias es:
Frecuencias del tiempo de duración de 100 baterías
Duración en días
Fre
cuen
cias
100 120 140 160 180 200 220 240
05
1015
2025
Polıgono de frecuencias. Los polıgonos de frecuencias son otra forma de representar graficamente distribuciones de
clases (o distribuciones relativas de clases). Para construir un polıgono de frecuencias senalamos en el eje horizon-
tal las marcas de clases, en el eje vertical las frecuencias correspondientes y en los extremos se anaden dos clases
con frecuencia cero, en un sistema de coordenadas, y conectamos con segmentos los puntos sobre el plano. Para la
distribucion de frecuencias del cuadro 1.3, el polıgono de frecuencias es:
47 Humberto Barrios. mail: [email protected]
1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES Universidad Popular del Cesar
100 150 200 250
05
1015
2025
Frecuencias del tiempo de duración de 100 baterías
Duración en días
Fre
cuen
cias
Los histogramas y los polıgonos de frecuencias son parecidos. Como se puede observar en los graficos anteriores. Pero
se pueden senalar las ventajas de los histogramas, las que se pueden resumir ası: los rectangulos muestran cada clase
de la distribucion por separado y el area de cada rectangulo, en relacion con el resto, muestra la proporcion del numero
total de observaciones que se encuentra en cada clase.
Los polıgonos, sin embargo, tambien poseen ciertas ventajas, de las cuales se pueden resaltar: el polıgono de frecuen-
cias es mas sencillo que el histograma, traza con mas claridad el perfil de patron de los datos y por ultimo, el polıgono
se vuelve mas liso y parecido a una curva conforme aumenta el numero de clases y el numero de observaciones. Un
polıgono como el que acabamos de describir, alisado mediante el aumento de clases y de puntos de datos, se conoce
como curva de frecuencias.
Diagrama de tallo y hojas. Una variante del histograma es el diagrama de tallo y hoja que tiene la misma similitud y
proposito pero que tambien proporciona una enumeracion completa de los valores de los datos reales. Para construirlo
basta separar en cada dato el ultimo dıgito de la derecha (que constituye la hoja) del bloque de cifras restantes (que
formara el tallo). El siguiente ejemplo ilustra la construccion del diagrama de tallo y hojas.
Ejemplo 1.5. Utilice los datos de los tiempo de duracion del cuadro 1.1 para construir diagrama de tallo y hojas.
Solucion 4. Puesto que todas las mediciones son numeros de tres dıgitos, se tiene tallos de dos dıgitos y hojas de un
solo dıgito. Por ejemplo, la medicion 175 tiene un tallo 17 y una hoja de 5. La siguiente figura muestra el diagrama
de tallo y hojas para los datos.
48 Humberto Barrios. mail: [email protected]
1.2. DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES Universidad Popular del Cesar
Cuadro 1.4: Diagrama de tallo y hojas para la
duracion de 100 baterıas
10 47918
12 24459
14 04690111335567789
16 00244556778899233344456667888
18 1122344557777888112345899
20 002356888
22 0112466946
Ojiva. Para graficar la distribucion de frecuencias acumulada (o relativa acumulada), sobre un eje de coordenadas, se
ubican los limites reales de las clases sobre el eje horizontal contra las frecuencias acumuladas (o relativas acumuladas)
en el eje vertical y se unen todos los puntos consecutivos. Para la distribucion de frecuencias acumulada del cuadro
1.3 , la ojiva de las frecuencias acumuladas (o relativas acumuladas) es:
100 150 200 250
020
4060
8010
0
Ojiva de la duración de 100 baterías
Duración en días
Fre
cuen
cias
acu
mul
adas
En este contexto el principal uso de la distribucion acumulada (o acumulada relativa) es lo que comunmente se denom-
ina como cantiles. Con respecto a una distribucion relativa acumulada, se define un cuantil como el valor bajo el cual
se encuentra una determinada proporcion de los valores de la distribucion. En la proxima seccion se dara una formula
para calcular los cantiles correspondiente a una distribucion de frecuencia acumulada.
49 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS
Las descripciones graficas de los datos presentadas en la seccion anterior proporcionan una informacion util re-
specto al conjunto de mediciones, pero no es adecuado para hacer inferencias, sobre todo porque ninguna de las
representaciones (tablas y graficas) no estan bien definidas. Por ejemplo, se podrıan elaborar muchos histogramas sim-
ilares a partir del mismo conjunto de mediciones. Para poder hacer inferencias con respecto a una poblacion, basada
en la informacion contenida en una muestra y medir la confiabilidad de la inferencia, en terminos de probabilidades, se
requieren cantidades obtenidas de expresiones rigurosamente definidas para analizar la informacion de la muestra. Es
posible obtener, mediante las matematicas, ciertas propiedades de esas cantidades muestrales y establecer conclusiones
probabilısticas con respecto a la validez de las inferencias.
Las cantidades que se pretenden definir son medidas numericas descriptivas de un conjunto de datos. Se buscan
numeros que describan la distribucion de frecuencias para cualquier conjunto de mediciones.
Existen dos medidas de interes para cualquier conjunto de datos: la localizacion de su centro y su variabilidad.
1.3.1. MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central de un conjunto de datos es la disposicion de estos para agruparse ya sea alrededor
del centro o de ciertos valores numericos. Existen principalmente tres medidas de tendencia central: la media, la
mediana y la moda.
Definicion 1.3. Sean x1, x2, x3, . . ., xk marcas de clases con frecuencias de clases f1, f2, f3, . . . fk, respectivamente,
en una distribucion de frecuencias. Entonces la media es
x =1n
k
∑i=1
xi fi (1.1)
Donde n= f1+ f2+ f3+ . . .+ fk. En el caso, f1 = f2 = f3 = . . .= fk = 1 entonces los datos se dicen no agrupados.
Ası, la formula para la media se convierte en
x =1n
n
∑i=1
xi (1.2)
La media es una medida apropiada de tendencia central para muchos conjuntos de datos. Sin embargo, dado que todas
las mediciones se emplean para su calculo, el valor de la media puede afectarse por la existencia de algunos valores
extremos.
50 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
Definicion 1.4. La mediana en un conjunto de datos no agrupados, ordenados de menor a mayor, es el valor medio
si el numero de datos es impar o el promedio de los dos valores centrales cuando el numero de datos es par. Se notara
la mediana por x.
Para el caso de datos agrupados o para una distribucion de frecuencias, se procede como sigue:
a. Se identifica la clase mediana, la cual sera la que contiene el elemento para el cual la mitad de todas las observa-
ciones es menor y la otra mitad es mayor.
b. Lm = limite real inferior de la clase mediana
c. fm = frecuencia de la clase mediana
d. Fm−1 = frecuencia acumulada anterior a la clase mediana
e. c = ancho real de la clase mediana
f. n = numero de observaciones en la muestra o tamano de muestra.
Por consiguiente, la ecuacion para la mediana con datos agrupados serıa:
x = Lm +n2 −Fm−1
fmc (1.3)
Puesto que la mediana es un valor que se basa en la secuencia ordenada de las n mediciones, es necesario saber que la
existencia de valores extremos y agregado muy alto de observaciones, no afecta su valor, en este sentido la mediana es
mejor que la media. Generalmente los conjuntos de datos que describen informacion de ingresos caen en esta categorıa.
Definicion 1.5. La moda para un conjunto de datos no agrupados es el valor de las observaciones que ocurre con
mayor frecuencia. La cual notaremos por: Mo.
Cuando los datos se encuentran agrupados en una distribucion de frecuencias, se puede suponer que la moda esta lo-
calizada en la clase de mayor frecuencia. Para determinar un solo valor para la moda a partir de esta clase modal,
identifica:
a. LMo = limite real inferior de la clase modal
b. ∆1 = frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por encima de ella
c. ∆2 = frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por debajo de ella
d. c = ancho real de la clase modal
51 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
Entonces se utiliza la siguiente ecuacion:
Mo = LMo +
(∆1
∆1 +∆2
)c (1.4)
En muchas ocasiones en una serie de datos, puede ocurrir mas de una observacion con la misma frecuencia. En este
caso, se dice que la distribucion de frecuencias es multimodal. Como en todos los aspectos de la vida, el azar puede
desempenar un papel importante en la organizacion en un conjunto de mediciones. En ocasiones, el azar hace que un
solo elemento no representativo se repita lo suficiente para ser el valor mas frecuente del conjunto de mediciones. Es
por esta razon que rara vez se utilice la moda de un conjunto de datos no agrupados como medida de tendencia central.
Se explicaran el calculo de la media, mediana y moda con los ejemplos siguientes:
Ejemplo 1.6. (Para datos no agrupados). El tiempo de reparacion, medido en horas, de un instrumento electronico
tiene un comportamiento aleatorio. Los tiempos de reparacion de 16 de tales instrumentos, elegidos a traves de un
mecanismo aleatorio, son los siguientes:
5 6 3 6 11 7 9 10 2 4 10 6 2 8 1 5
Calcular la media, mediana y moda de este conjunto de datos.
Para calcular la media se utiliza la formula (1.2), es decir,
x =1n
n
∑i=1
xi =116
(5+6+3+6+11+7+9+10+2+4+10+6+2+8+1+5) = 5.94
Para el caso de la mediana se ordenan los datos de menor a mayor, como en este caso el numero de elementos es par,
la mediana sera el promedio de los dos valores centrales.
1 2 2 3 4 5 5 6 6 6 7 8 9 10 10 11
Es decir,
x =6+6
2= 6
La moda en una serie de datos es el valor con mayor frecuencia, en este caso el valor con mayor frecuencia es el 6.
Entonces
52 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
Mo = 6
Ejemplo 1.7. (Para datos agrupados). Con la distribucion de frecuencias del cuadro 1.5. Calcular la media, mediana
y moda.
Solucion 5. De la distribucion de frecuencias correspondiente a la duracion de 100 baterıas, para calcular la media
multiplicamos las marcas de clases por las respectivas frecuencias de clase y dividimos por las suma de las frecuen-
cias. Es decir,
x =1n
L
∑i=1
xi fi
=1
100[110.50(4)+124.50(3)+138.50(5)+152.50(15)+166.50(18)
+180.50(24)+194.50(14)+208.50(5)+222.50(10)+236.50(2)] = 175.88
Otra manera para calcular la media es utilizando la tabla 2, en este caso multiplicamos las marcas de clases por sus
respectivas frecuencias. Ası:
Cuadro 1.5: Calculo de la media en una distribucion de frecuenciasxi Li Ls fi xi fi
110.5 103.5 117.5 4 442.0
124.5 117.5 131.5 3 373.5
138.5 131.5 145.5 5 692.5
152.5 145.5 159.5 15 2287.5
166.5 159.5 173.5 18 2997.5
180.5 173.5 187.5 24 4332.0
194.5 187.5 201.5 14 2723.0
208.5 201.5 215.5 5 1042.5
222.5 215.5 229.5 10 2225.0
236.5 229.5 243.5 2 473.0
Total 100 17588.0
53 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
x =1n
L
∑i=1
xi fi =1
100(17588) = 175.88
Para calcular la mediana de la distribucion de frecuencias de la Tabla 3.
1. Se identifica la clase mediana, la cual sera la que contiene el elemento para el cual la mitad de todas las
observaciones es menor y la otra mitad es mayor. Por lo tanto la clase mediana es: 173.5-187.5.
2. Lm = limite real inferior de la clase mediana = 173.5
3. fm = frecuencia de la clase mediana = 24
4. Fm−1 = frecuencia acumulada anterior a la clase mediana = 45
5. c = ancho real de la clase mediana = 14
6. n = numero de observaciones en la muestra o tamano de muestra = 100.
Por consiguiente, la ecuacion para la mediana con datos agrupados serıa:
x = Lm +
( n2 −Fm−1
fm
)c = 173.5+
(50−45
24
)(14) = 176.42
Para determinar el valor para la moda, identificamos la clase modal es: 173.5-187.5.
a. LMo = lımite real inferior de la clase modal= 173.5
b. ∆1 = frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por encima de ella =
24-18 = 6
c. ∆2 = frecuencia de la clase modal menos la frecuencia que se encuentra inmediatamente por debajo de ella = 24
-14 = 10
d. c = ancho real de la clase modal = 14
Entonces se utiliza la siguiente ecuacion:
Mo = LMo +
(∆1
∆1 +∆2
)c = 173.5+
(6
6+10
)(14) = 178.75
54 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
Cuando se trabaja un problema en estadıstica, se debe decidir cual de las medidas de tendencia central se va ha utilizar.
Por ejemplo, si la distribucion es simetrica, es claro que en este caso solo tienen una moda. Por lo tanto el mismo valor
para la media, la mediana y la moda. En tales casos, no es necesario escoger la medida de tendencia central, pues ya
esta hecha la seleccion, cualquiera de ellas es una buena opcion.
En una distribucion sesgada positiva. Es decir, sesgada hacia la derecha, la moda se encuentra en el punto mas alto de
la distribucion, la mediana esta a la derecha de la moda y la media se encuentra todavıa mas a la derecha de la moda y
la mediana. Es decir, se tiene la siguiente relacion:
Mo < x < x
En una distribucion sesgada negativa. Es decir, sesgada hacia la izquierda, la moda se encuentra en el punto mas alto
de la distribucion, la mediana esta hacia la izquierda de la moda y la media se encuentra todavıa mas a la izquierda de
la moda y la mediana. Es decir, se tiene la siguiente relacion:
Mo > x > x
Cuando la poblacion esta sesgada negativamente o positivamente, con frecuencia la mediana resulta ser la mejor
medida de posicion, debido a que siempre esta entre la moda y la media. La mediana no se ve influida por la frecuencia
de aparicion de un solo valor como es el caso de la moda, ni se distorsion con la presencia de valores extremos como
la media.
En cualquier otro caso, no existen reglas universales para la aplicacion de la media, la mediana o la moda como
medidas de tendencia central para diferentes poblaciones. Cada caso debera considerarse de manera independiente, de
acuerdo con las lıneas generales que se ha analizado.
1.3.2. MEDIDAS DE DISPERSION
Las medidas de tendencia central de un conjunto de mediciones solamente localizan el centro de la distribucion de
los datos. Por si mismo, no ofrecen una descripcion adecuada de los datos. Por ejemplo, dos conjuntos de mediciones
podrıan tener sus distribuciones de frecuencias muy diferentes pero con la misma media. La diferencias entre dos
distribuciones, puede estar en variacion o dispersion a ambos lados de la media. Una descripcion adecuada de los
datos requiere de la definicion de una medida de variabilidad de los datos. La medida mas comun de variabilidad
usada en la estadıstica es la varianza, que es una funcion de las desviaciones (o distancia) de las mediciones con
respecto a su media.
55 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
Definicion 1.6. Sean x1, x2, x3, . . ., xk marcas de clases con frecuencias de clases f1, f2, f3, . . . fk, respectivamente,
en una distribucion de frecuencias. Entonces la varianza es
s2 =1
n−1
k
∑i=1
(xi− x)2 fi (1.5)
Donde n = f1 + f2 + f3 + . . .+ fk. En el caso, f1 = f2 = f3 = . . .= fk = 1 entonces los datos se dicen no agrupados.
Ası, la formula para la varianza se convierte en
s2 =1
n−1
n
∑i=1
(xi− x)2 (1.6)
La varianza es util en la comparacion de la variacion relativa de dos conjuntos de mediciones, pero solo aporta infor-
macion con respecto a la variacion en un solo conjunto cuando se interpreta en terminos de la desviacion estandar. La
desviacion estandar de un conjunto de medidas es la raız cuadrada positiva de la varianza, es decir,
s =√
s2 (1.7)
La varianza y la desviacion estandar no son medidas de variabilidad distintas, debido a que la ultima no puede deter-
minarse a menos que se conozca la primera. A menudo se prefiere la desviacion estandar en relacion con la varianza,
porque se expresa en las mismas unidades fısicas de las observaciones.
Otra medida util de la variabilidad tiene base en el valor absoluto de las diferencias entres el conjunto de mediciones
y la media o la mediana, dependiendo de cual de las dos se emplee como medida de tendencia central.
Definicion 1.7. Sean x1, x2, x3, . . ., xk marcas de clases con frecuencias de clases f1, f2, f3, . . . fk, respectivamente,
en una distribucion de frecuencias. Entonces la desviacion media esta dada por
DM =1n
k
∑i=1|xi− x| fi (1.8)
Donde n = f1 + f2 + f3 + . . .+ fk. En el caso, f1 = f2 = f3 = . . .= fk = 1 entonces los datos se dicen no agrupados.
Ası, la formula para la desviacion media esta se convierte en
DM =1n
n
∑i=1|xi− x| (1.9)
56 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
Cuando se sustituye la media por la mediana en (1.8) y (1.9) se obtiene la desviacion mediana, la que se notara por
DMd.
La desviacion media es una medida de la variacion de un conjunto de mediciones, especialmente en el contexto de la
evidencia empırica, debido a que en muchas ocasiones el interes se centra en las desviaciones y no en los signos de
estas. Sin embargo, desde un punto de vista teorico, el empleo de desviacion media como medida de dispersion esta en
desventaja dado que, matematicamente, es difıcil de obtener. De cualquiera manera, la desviacion media es menos
sensible a los efectos inducidos por las observaciones extremas del conjunto de datos que la varianza o la desviacion
estandar. Sin importar la presencia de pocos valores extremos, la desviacion media puede proporcionar una medida de
dispersion mucho mas real que la obtenida por la desviacion estandar.
Cuando la mediana se utiliza como medida de tendencia central con el proposito de amortiguar los efectos de la
existencia de algunos valores extremos en el conjunto de mediciones, debe preferirse a la desviacion mediana como
una medida de dispersion por la misma razon, es decir, con la intencion amortiguar los efectos de la existencia de
valores extremos en el conjunto de mediciones.
A continuacion se ilustran los pasos que se deben seguir para los calculos de la varianza, desviacion estandar, desviacion
media y desviacion mediana, para los datos no agrupados del ejemplo 1 y para los datos agrupados de la tabla 2.
Ejemplo 1.8. El tiempo de reparacion, medio en horas, de un instrumento electronico tiene un comportamiento
aleatorio. Los tiempos de reparacion de 16 de tales instrumentos, elegidos a traves de un mecanismo aleatorio, son
los siguientes:
5 6 3 6 11 7 9 10 2 4 10 6 2 8 1 5
Calcular la varianza, desviacion estandar, desviacion media y desviacion mediana de este conjunto de datos.
Solucion 6. Para la varianza se tiene
57 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
s2 =1
n−1
n
∑i=1
(xi− x)2
=1
16−1[(5−5.94)2 +(6−5.94)2
+(3−5.94)2 +(6−5.94)2 +(2−5.94)2
+(4−5.94)2 +(11−5.94)2 +(7−5.94)2
+(9−5.94)2 +(10−5.94)2 +(10−5.94)2
+(6−5.94)2 +(2−5.94)2 +(8−5.94)2
+(1−5.94)2 +(5−5.94)2]
= 9.53
La desviacion estandar es
s =√
9.5333 = 3.0876
Para la desviacion media se tiene
DM =1n
n
∑i=1|xi− x|
=116
[|5−5.94|+ |6−5.94|+ |3−5.94|+ |6−5.94|
+ |2−5.94|+ |4−5.94|+ |11−5.94|+ |7−5.94|
+ |9−5.94|+ |10−5.94|+ |10−5.94|+ |6−5.94|
+ |2−5.94|+ |8−5.94|+ |1−5.94|+ |5−5.94|
= 2.445
Para la desviacion mediana se tiene
58 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
DMd =1n
n
∑i=1|xi− x|
=1
16[|5−6|+ |6−6|+ |3−6|+ |6−6|
+ |2−6|+ |4−6|+ |11−6|+ |7−6|+ |9−6|
+ |10−5.94|+ |10−6|+ |6−6|+ |2−6|
+ |8−6|+ |1−6|+ |5−6|
= 2.4375
Ejemplo 1.9. Con la distribucion de frecuencias de la tabla 2. Calcular la varianza, desviacion estandar, desviacion
media y desviacion mediana.
Solucion 7. Utilicemos el cuadro 1.5, para la varianza, desviacion estandar, desviacion media y desviacion mediana.
Cuadro 1.6: Calculo de las medidas de dispersion en una distribucion de frecuencias
xi fi (xi− x)2 fi |xi− x| fi |xi− x| fi
110.5 4 17098.18 261.52 263.68
124.5 3 7919.71 154.14 155.76
138.5 5 6986.32 186.90 189.60
152.5 15 8199.37 350.70 358.80
166.5 18 1583.72 168.84 178.56
180.5 24 512.27 110.88 97.92
194.5 14 4853.86 260.68 253.12
208.5 5 5320.32 163.10 160.40
222.5 10 21734.24 466.20 460.80
236.5 2 7349.57 121.24 120.16
total 100 81557.56 2244.20 2238.8
Por lo tanto la
varianza es: s2 = 823.81
Desviacion estandar es: s = 28.70
Desviacion media es: D.M.= 22.44
Desviacion mediana es: D.Md.= 22.39
59 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
1.3.3. OTRAS MEDIDAS DESCRIPTIVAS
El principal uso de la distribucion acumulada es lo que comunmente se conoce como cuantiles. Con respecto a
una distribucion de frecuencias relativa acumulada, se define un cuantil como el valor bajo el cual se encuentra una
determinada proporcion de los valores de la distribucion. Para identifica la clase cuantil, la cual sera la que contiene el
elemento para el cual la proporcion 100q% de todas las observaciones es menor y la otra proporcion 100(1−q)% es
mayor en una distribucion de frecuencias.
Definicion 1.8. Para calcular el cuantil q se utiliza la siguiente formula
xq = Lq +nq−Fq−1
fqc (1.10)
a. Se identifica la clase cuantil, la cual sera la que contiene el elemento para el cual la q% de todas las observaciones
es menor y la otra (100−q)% es mayor.
b. Lq = limite real inferior de la clase cuantil
c. fq = frecuencia de la clase cuantil
d. Fq−1 = frecuencia acumulada anterior a la clase cuantil
e. c = ancho real de la clase cuantil
f. n = numero de observaciones en la muestra o tamano de muestra.
Definicion 1.9. Una medida que compara la dispersion relativa de dos distribuciones de frecuencias es el coeficiente
de variacion, que esta definido por:
cv =sx
100% (1.11)
Los cantiles comunmente mas utilizados son los percentiles, deciles y cuartiles. Los percentiles son los puntos que
dividen a la distribucion de frecuencias en 100 pares iguales, cada uno con una frecuencia relativa q = 0.01; los deciles
y cuartiles son los puntos que dividen a la distribucion de frecuencias en 10 y 4 partes iguales, cada uno con frecuencia
relativa q = 0.1 y q = 0.01, respectivamente. Notese que la mediana es el cincuentavo percentil, el quinto decil y el
segundo cuartil.
Definicion 1.10. La diferencia entre los percentiles 90 avo y 10 avo recibe el nombre de recorrido interdecil.
Definicion 1.11. La diferencia entre los percentiles 75avo y 25avo recibe el nombre de recorrido intercuartil.
60 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
En este contexto el recorrido interdecil es una medida de la dispersion del 80% de la distribucion de frecuencia,
en tanto que el recorrido intercuartil refleja la variacion del 50% de la distribucion de frecuencia. En ambos casos,
al excluir los efectos de los valores extremos de la distribucion de frecuencia, se tiene la capacidad de medir la
variabilidad del conjunto de mediciones de la mitad de una distribucion de frecuencia.
Los recorridos interdecil e intercuartil, son dos medidas de dispersion que se emplean en disciplinas como educacion,
economıa, finazas e ingenierıa. El recorrido interdecil se emplea muchas veces en pruebas educacionales para medir la
variabilidad en el desempeno sin importar los valores por arriba o por debajo de un 10% de un valor predeterminado.
El recorrido intercuartil se emplea en muchas ocasiones, en economıa y finanzas, para medir la variabilidad de un
conjunto de mediciones de una proporcion de su distribucion de frecuencia.
El coeficiente de variacion expresa la magnitud de la dispersion de un conjunto de mediciones con respecto a la
media, es una medida estandarizada de la variacion con respecto a la media, especialmente util para comparar dos
distribuciones de frecuencias cuando la escala de medicion difiere de manera apreciable entre estas. Es decir, como
el coeficiente de variaciones la razon de dos promedios, es independiente de las unidades de medidas usadas, por
ejemplo, da igual que se usen libras o gramos para medir el peso.
Ejemplo 1.10. . Para la distribucion de frecuencia de la Tabla 2. Calcular los recorrido interdecil, recorrido inter-
cuartil y el coeficiente de variacion.
Solucion 8. Las clases percentiles 10ava y 90ava son respectivamente (132-145) y (216-229), entonces para calcular
a x0.1 se tiene:
(a) Se identifica la clase cuantil, la cual sera la que contiene el elemento para el cual la q% de todas las observaciones
es menor y la otra (100−q)% es mayor.
(b) Lq = limite real inferior de la clase 10ava = 131.5
(c) fq = frecuencia de la clase 10ava = 5
(d) Fq−1 = frecuencia acumulada anterior a la clase cuantil =7
(e) c = ancho real de la clase cuantil =14
(f) n = numero de observaciones en la muestra o tamano de muestra =100.
Se utiliza la siguiente formula:
xq = Lq +nq−Fq−1
fqc = 131.5+
0.1(100)−75
(14) = 139.5
De la misma manera se calcula x0.9,
61 Humberto Barrios. mail: [email protected]
1.3. MEDIDAS NUMERICAS DESCRIPTIVAS Universidad Popular del Cesar
xq = Lq +nq−Fq−1
fqc = 215.5+
0.9(100)−8810
(14) = 217.8
Ası, el recorrido interdecil es = 217.80-139.50 = 78.3.
De igual forma se realizan los calculos para el recorrido intercuartil.
El coeficiente de variacion es:
cv =sx
100 =28.70
175.88(100) = 0.16 = 16%
En la siguiente tabla se resumen las medidas numericas descriptivas para la distribucion de frecuencia de la Tabla 2.
Medidas descriptivas
Media 175.88
Mediana 176.42
Moda 178.75
Varianza 823.81
Desviacion estandar 28.70
Desviacion media 22.44
Desviacion mediana 22.39
Recorrido 140.00
Recorrido intercuartil 34.89
Recorrido interdecil 78.3
Observese (tabla 5) que los valores de las medidas de tendencias central se encuentran muy cerca entre si, tambien se
puede afirmar lo mismo de las desviaciones estandar, media y mediana. Sin embargo, no es de esperar que todas las
distribuciones de frecuencia tengan este comportamiento.
Estas comparaciones aclaran lo que las medidas numericas y las distribuciones de frecuencia pueden hacer para de-
scubrir la naturaleza inherente de un conjunto de mediciones. En consecuencias, el usuario debe tener cuidado tanto
en la eleccion como en la interpretacion de estas medidas. A pesar que la media y la desviacion estandar se han em-
pleado de manera extensa como medidas de tendencia central y dispersion respectivamente, aunque tiene propiedades
matematicas muy interesantes existen problemas para los cuales no puede ser las medidas mas deseables. Para con-
juntos de mediciones fısicas como lecturas de instrumentos, especificaciones de partes, pesos, etc., la media y la
desviacion estandar o desviacion media, son medidas anheladas. Para conjunto de mediciones afines con ingresos y
otras informaciones de tipo economico y financieros, la mejor eleccion para la medida de tendencia central y dispersion
son la media y la desviacion de la mediana respectivamente.
62 Humberto Barrios. mail: [email protected]
1.4. EJERCICIOS Universidad Popular del Cesar
En muchas investigaciones de tipo economico y social proporcionan informacion en tablas de frecuencia que no solo
contienen clases de diferentes amplitudes sino tambien clases abiertas como mayores que o menor que con el proposito
de tener mayor cobertura de los datos. Estas clases se presentan en los extremos de la distribucion de frecuencia y no
se especifica los lımites de las clases. Como resultado, no se encuentra definido el punto medio de la clase abierta y
en consecuencias no se puede calcular la media, varianza, desviacion estandar y desviacion media, a menos que se
conozca un valor particular de la clase o que sea conocido su promedio aritmetico.
1.4. EJERCICIOS
1. Los siguientes datos son los tiempos, en minutos, correspondiente a una muestra aleatoria de 50 personas que
estuvieron cobrando un cheque, un fin de mes en un banco de la cuidad
17 16 39 30 23 38 32 20 43 32
44 41 23 17 29 26 21 34 44 24
21 27 36 21 17 28 29 34 24 28
25 29 45 23 16 34 20 30 23 35
35 27 19 31 45 40 14 29 23 19
a) Construir una distribucion de frecuencias, de clases, relativa, acumulada y relativa acumulada.
b) Construir histograma, polıgono y ojiva con los resultados obtenidos en a.
c) Con los datos agrupados calcula: la media, mediana, moda, desviacion estandar, desviacion media, desviacion
mediana, y los recorridos intercuartil e interdecil.
2. Con los siguiente tres conjuntos de datos:
1 2 3 4 5 6
1 1 1 6 6 6
−13 2 3 4 5 20
Calcular la media y la varianza para cada conjunto de datos. ¿Que se puede concluir?
3. Con los datos del ejercicio 1, sea xi el tiempo que gasta el i-esimo cliente en cobrar un cheque para i =
1,2, . . . ,50. Transformar los datos por medio de la relacion
zi = (xi−28.2)/8.928
63 Humberto Barrios. mail: [email protected]
1.4. EJERCICIOS Universidad Popular del Cesar
Con los datos transformados
a) Construir una distribucion de frecuencias, de clases, relativa, acumulada y relativa acumulada.
b) Construir histograma, polıgono y ojiva con los resultados obtenidos en a.
c) Con los datos agrupados calcula: la media, mediana, moda, desviacion estandar, desviacion media, desviacion
mediana, y los recorridos intercuartil e interdecil.
d) ¿Ha ocurrido algun cambio en la naturaleza de la distribucion de frecuencia cuando esta se compara con
los del ejercicio 1?
4. Los datos que tienen una distribucion acampanada tienen caracterısticas bien definidas con respecto a la variacion,
que se puede expresar en el siguiente enunciado:
Regla empırica. Para una distribucion de mediciones que es aproximadamente acampanada (forma normal), el
intervalo
(µ−σ ,µ +σ) Contiene aproximadamente el 68% de las mediciones
(µ−2σ ,µ +2σ) Contiene aproximadamente el 95% de las mediciones
(µ−3σ ,µ +3σ) Contiene casi todas las mediciones
Donde µ y σ son la media poblacional y desviacion estandar poblacional respectivamente.
Calcular el intervalo (x− kσ , x+ kσ) para k =1, 2, y 3, del ejercicio 1, cuenta el numero de mediciones que se
ubican dentro de cada intervalo y compara estos resultados con el numero que podrıa esperarse de acuerdo a la
regla empırica.
5. Los siguientes datos agrupados representan las ventas ($1000) de 50 tiendas, seleccionadas aleatoriamente del
municipio de Valledupar, de un dıa cualquiera de la semana.
Clases Frecuencias
110-186 4
187-263 14
264-340 11
341-417 9
418-494 7
495-571 1
572-648 2
649-727 2
a) Construir una distribucion de frecuencia acumulada y relativa acumulada.
64 Humberto Barrios. mail: [email protected]
1.4. EJERCICIOS Universidad Popular del Cesar
b) Construir histograma, polıgono y ojiva con los resultados obtenidos en a.
c) Calcular la media, mediana, moda, desviacion estandar, desviacion media, desviacion mediana, y los recor-
ridos intercuartil e interdecil.
La regla empırica senala que se puede aproximar la desviacion estandar de un conjunto de mediciones por una
cuarta parte del rango. Calcule esta aproximacion para la desviacion estandar en los conjunto de datos de la tabla
1 y del ejercicio 1.
6. Las siguiente tres propiedades son importante cuando se emplea el sımbolo de la sumatoria.
a)n∑
i=1c = nc
b)n∑
i=1cxi = c
n∑
i=1xi
c)n∑
i=1(xi + yi) =
n∑
i=1xi +
n∑
i=1yi
1. Demostrar las siguientes identidades algebraicas:
a)n∑
i=1(xi− x) = 0
b) s2 = 1n−1
[k∑
i=1x2
i fi−nx2]
2. Demuestre que la funcion
h(y) =n
∑i=1
(xi− y)2
Tiene un mınimo en x . Utilice sus conocimientos de Calculo Diferencial.
7. Sea k≥ 1. Demuestre que para cualquier conjunto de n mediciones, la fraccion que queda incluida en el intervalo
(x− ks, x+ ks) es por lo menos (1− 1k2 ). Este resultado se conoce con el nombre de teorema de Tchbysheff.
8. Supongamos que tenemos las siguientes medias: x1 = 37, x2 = 41 y x3 = 28, basadas en 50, 20 y 10 observa-
ciones respectivamente. Si hay que escoger una sola media, ¿Cual serıa su eleccion? ¿Por que? ¿Cuales son los
totales de las muestras originales? ¿Como se usarıa estos totales para hallar la media de las 80 observaciones?
9. Sea x1,x2, . . . ,xn una muestra aleatoria de una poblacion. Demuestre que
max1≤i≤n
|xi− x|< (n−1)s√n
a menos que todas las n observaciones sean iguales o exactamente n−1 de las xi son iguales.
65 Humberto Barrios. mail: [email protected]
1.4. EJERCICIOS Universidad Popular del Cesar
10. Sean x1,x2, . . . ,xk marcas de clases diferentes con frecuencias f1, f2, . . . , fk respectivamente. Si yi = axi +c, son
las marcas de clases de una nueva variable aleatoria yi. Demuestre que:
a) y = ax+ c
b) s2y = a2s2.
11. Los siguientes datos corresponden a una muestra aleatoria simple de tamano n = 100 seleccionadas de los
N = 365 dıas de las ventas (en millones) de un supermercado de la ciudad, los datos se muestra en la tabla
siguiente:
Cuadro 1.7: Datos78 113 94 101 87 88 75 87 110 92
100 116 102 105 89 104 111 93 114 95
107 117 109 117 100 104 127 112 120 117
108 121 126 127 124 106 127 120 121 118
108 124 128 135 131 114 128 122 129 119
126 131 129 138 139 121 129 128 129 126
129 136 130 140 140 124 130 141 130 135
137 143 132 141 143 133 137 143 138 140
139 144 146 153 146 135 142 151 142 147
142 146 149 175 155 135 167 151 147 152
a) Encuentre las clases para el conjunto de datos anteriores, si se sabe que la primera clase tiene como limite
inferior 75 y la longitud de cada clase es c = 10.
b) Hallar las frecuencias absolutas y acumuladas para cada clase.
c) Que interpretacion se le da a las frecuencias absolutas y acumuladas en cada clase.
d) Hallar los limites reales para cada clase y sus marcas de clases e interprete.
e) Que porcentajes de dıas al ano tienen ventas superiores a $140.000.000 (ciento cuarenta millones de pesos).
f ) Que porcentajes dıas tiene ventas superiores o iguales a $173.000.000 y superiores o iguales $108.000.000.
g) Construir el histograma de frecuencias, polıgono de frecuencias y ojiva e indicar cual debe ser el perfil de
la poblacion.
h) Calcular la media, mediana y moda e interprete su significados en terminos poblacionales.
i) Calcular el rango, varianza, desviacion estandar, desviacion media y desviacion mediana e interprete su
significados.
j) Calcular todos los deciles y cuartiles de la distribucion de frecuencias.
k) Calcular el recorrido interdecil y el recorrido intercuartil e interprete.
66 Humberto Barrios. mail: [email protected]
CAPITULO 2
PROBABILIDAD
2.1. INTRODUCCION
La teorıa de probabilidad comenzo en siglo XVII con dos grandes matematicos franceses, Blaise Pascal (1961-
1668) y Pierre de Fermat (1623-1662), aunque algunos matematicos anteriores, como Gerolamo Cardano (1501-1576)
en el siglo XVI, habıan hecho importantes contribuciones a su desarrollo. La probabilidad, como una rama de la
matematica, comenzo como un intento de responder a varias preguntas que surgıan en los juegos de azar, convir-
tiendose en una herramienta poderosa en las mas variadas ramas del conocimiento. Es ası, que encuentra aplicaciones
en cada una de las area de la actividad humana desde la musica a la fısica, y en experiencia diarias como es la de
pronosticar el tiempo a la prediccion de los riesgos de nuevos tratamientos medicos.
El objetivo principal de este capıtulo es proporcionar al estudiante una formacion solida y sistematica en los
principios, metodos, resultados y aplicaciones de la teorıa de la probabilidad, ası como la habilidad de razonar bajo
estos modelos. El primer paso de esta capıtulo es describir la estructura generica del concepto de probabilidad a traves
de un conjunto de axiomas, y sus propiedades basicas. Para esto, se empezara con una revision corta de la teorıa de
conjuntos.
2.2. PROPIEDADES BASICAS
La teorıa de la probabilidad fue establecida sobre una base axiomatica idonea por el matematico ruso Andrei
Nikolayevich Kolmogorov (1903-1987) en la decada de los anos treinta. Por supuesto, los axiomas y teoremas de
Kolmogorov son mas rigurosos que la version simplificada que presentaremos a continuacion, para ilustrar el enfoque
axiomatico comenzaremos con la siguiente definicion.
Definicion 2.1. Un experimento aleatorio es el proceso por medio del cual se obtiene una observacion.
Por ejemplo, el lanzamiento de un dado, el numero de carros que llegan a la universidad en una hora determinada, se
les puede considerar un experimento. En el contexto de las ciencias sociales, la mayor parte de los procedimientos de
67
2.2. PROPIEDADES BASICAS Universidad Popular del Cesar
recogida de datos se pueden considerar como experimentos aleatorios. Cuando se efectua un experimento se pueden
tener uno o mas resultados posibles, los cuales se denominan eventos.
Definicion 2.2. Un espacio muestral Ω asociado a un experimento es el conjunto de todo los resultados posibles de
un experimento.
Por ejemplo, para el lanzamiento del dado el espacio muestral puede ser
Ω = 1, 2, 3, 4, 5, 6
o tambien
Ω = pares, impares.
Para el numero de carros que llegan a la universidad en una hora determinada, el espacio muestral es
Ω = x| x un numero entero mayor o igual a cero.
Donde x es el numero de carros que llegan en una hora determinada.
Si w es un elemento de Ω lo notaremos w ∈ Ω, y diremos que w pertenece a Ω. La definicion de un espacio muestral
Ω en un problema concreto depende de cuales son los aspectos que se desean analizar.
Definicion 2.3. Un evento es cualquier subconjunto A del espacio muestral Ω, y lo notaremos A⊆Ω.
Para el espacio muestral asociado con el lanzamiento de un dado, se tiene que cualquier subconjunto de
Ω = 1, 2, 3, 4, 5, 6
es un evento de Ω.
Al conjunto formado por todos los subconjuntos de Ω, el cual notaremos P(Ω), lo denominaremos el conjunto de
partes Ω. Por ejemplo, si Ω = a, b, c conjunto de partes de Ω es:
P(Ω) = /0, a, b, c, a, b, a, c, b, c, Ω.
Definicion 2.4. Sean A y B eventos cualesquiera del espacio muestral Ω. Entonces
1. La interseccion de los eventos A y B es otro evento, lo cual escribimos A∩B, cuyo elementos son los elementos
comunes a A y B.
x ∈ A∩B si y solo si x ∈ A y x ∈ B
68 Humberto Barrios. mail: [email protected]
2.2. PROPIEDADES BASICAS Universidad Popular del Cesar
2. La union de los eventos A y B es otro evento, lo cual escribimos A∪B, cuyos elementos son todos los elementos
de A o B.
x ∈ A∩B si y solo si x ∈ A y x ∈ B
3. Los eventos A y B se dicen disjuntos o mutuamente excluyentes si su interseccion es el conjunto vacıo:
A∩B = /0
4. El complemento de A es otro evento, lo escribimos Ac, cuyos elementos son todos los del espacio muestral
Omega excepto los que estan en A:
x ∈ Ac si y solo si x no esta en A
En lo sucesivo, cualquier evento de un espacio muestral se puede representar mediante los diagramas de Veen. Por
ejemplo, la interseccion, la union, la disyuncion y el complemento entre conjuntos se representan como se muestran
en las figuras siguientes respectivamente
A∩B
ΩA∩B
A B
ΩA∪B
A B
ΩA∩B = /0 Ω
A
Ac
69 Humberto Barrios. mail: [email protected]
2.2. PROPIEDADES BASICAS Universidad Popular del Cesar
Ejemplo 2.1. Sea Ω = 1, 2, 3, 4, 5, 6 el espacio muestral asociado al experimento el lanzamiento de un dado, y
sean los eventos A = 2, 4, 6 y B = 3, 6. Entonces
A∩B = 6
A∪B = 2, 3, 4, 6
Ac = 2, 3, 4, 6
Definicion 2.5. Sea Ω un espacio muestral asociado a un experimento. Una probabilidad es una funcion P de valor
real que asigna a cada evento A de Ω un numero real de tal manera que sean validos los siguientes axiomas:
P1. Para todo evento A de P(A) ≥ 0. Es decir, la probabilidad de cualquier evento A de Ω es un numero real no
negativo.
P2. P(Ω) = 1
P3. Si A1,A2,A3, . . . es una sucesion de eventos de Ω mutuamente excluyentes, es decir, Ai∩A j = Φ para todo i 6= j ,
entonces
P(∞⋃
n=1
An) =∞
∑n=1
P(An).
La pareja (Ω,P) se llama un espacio de probabilidad. Un espacio de probabilidad es una descripcion del experimento
que informa de cual es el conjunto de posibles resultados del experimento, Ω de los sucesos cuya realizacion interesa,
los eventos A de Ω, los cuales permiten cuantificar la incertidumbre de que produzcan los sucesos que interesan.
Teorema 2.1. P(Φ) = 0.
Demostracion 1. Sea A1 = Ω y Ai = Φ para i = 2,3, . . . , es claro que Ai∩A j = Φ para todo i 6= j.
Por el axioma (P3) de la definicion (2.5) tenemos que
P(∞⋃
n=1
An) =∞
∑n=1
P(An) (2.1)
como
Ω =∞⋃
n=1
An (2.2)
De (2.1) y (2.2) se infiere que
P(Ω) = P(Ω)+∞
∑n=2
P(An)
y puesto que P(Ai)≥ 0 para todo i = 1,2,3, . . .. Entonces P(Ai)≥ 0 para todo i = 2,3, . . .. En consecuencia
P(Φ) = 0.
70 Humberto Barrios. mail: [email protected]
2.2. PROPIEDADES BASICAS Universidad Popular del Cesar
Teorema 2.2. Sean A y B eventos de Ω si A∩B = Φ. Entonces
P(A∪B) = P(A)+P(B).
Demostracion 2. Considerese A1 = A, A2 = B, Ai = Φ, aplicando el axioma ?? se deduce
P(∞⋃
n=1
An) =∞
∑n=1
= P(A1)+P(A2)+∞
∑n=3
P(An)
puesto que P(Φ) = 0 se concluye
P(∞⋃
n=1
An) =∞
∑n=1
P(An) = P(A1)+P(A2) (2.3)
pero
A∪B =∞⋃
n=1
An (2.4)
De (2.3) y (2.4) se obtiene
P(A∪B) = P(A)+P(B).
Teorema 2.3. Sea A evento de Ω. Entonces
P(Ac) = 1−P(A).
Demostracion 3. Como se puede ver en la figura 2.1, Ω = A∪Ac y A∩Ac = Φ.
Figura 2.1: Ac
Ω
A
Ac
Aplicando el axioma P2 y el teorema 2, se tiene
P(Ω) = P(A∪Ac) = P(A)+P(Ac) = 1
En consecuencia
P(Ac) = 1−P(A).
71 Humberto Barrios. mail: [email protected]
2.2. PROPIEDADES BASICAS Universidad Popular del Cesar
Teorema 2.4. Sean A y B eventos de Ω, tales que A⊆ B. Entonces
P(A)≤ P(B).
Demostracion 4. Notese que el evento B se puede escribir como
B = A∪ (Ac∩B)
Figura 2.2: A⊆ BΩ
A
Ac∩B
B
donde los eventos A y (Ac∩B) son mutuamente excluyentes. En consecuencia, por teorema 2 se tiene
P(B) = P(A)+P(Ac∩B)
como
P(Ac∩B)≥ 0
se sigue
P(A)≤ P(B).
Teorema 2.5. Sean A y B eventos de Ω. Entonces
P(A∪B) = P(A)+P(B)−P(A∩B)
Demostracion 5. Es facil comprobar, mediante la figura 2.3, que
Figura 2.3: A∪B
A BA∩B
ΩA∪B
72 Humberto Barrios. mail: [email protected]
2.3. DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES Universidad Popular del Cesar
A∪B = A∪ (Ac∩B) y A∩ (Ac∩B) = Φ (2.5)
tambien
B = (A∩B)∪ (Ac∩B) y A∩B)∩ (Ac∩B) = Φ (2.6)
de (2.5) y teorema 2, se infiere
P(A∪B) = P(A)+P(Ac∩B) (2.7)
por (2.6) y teorema 2, se obtiene
P(B) = P(A∩B)+P(Ac∩B) (2.8)
De (2.7) y (2.8) se establece
P(A∪B) = P(A)+P(B)−P(A∩B).
Observemos que la definicion de probabilidad solamente expresa cuales son las propiedades que tiene una funcion de
probabilidad, pero no expresa como asignar las probabilidades especıficas de los eventos.
2.3. DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES
En un experimento aleatorio no es posible determinar con absoluta precision cual sera el resultado. Sin embargo,
unos resultados suelen ser mas verosımiles que otros. Intuitivamente, la probabilidad indica el grado de confianza en
que ocurra cada suceso. Existen diferentes interpretaciones del concepto de probabilidad que pretenden dar sentido a
esta idea. Algunas de ellas son las siguientes:
Definicion 2.6 (Probabilidad clasica). Se define la probabilidad como el cociente entre el numero de casos favorables
y el numero total de casos posibles, siempre que no exista razon alguna para creer que un resultado ocurra mas que
otro. Es decir, si A es un evento del espacio muestral Ω entonces la probabilidad del evento A es:
P(A) =numero de casos favorables de A
numero de casos posibles=
#(A)#(Ω)
Por ejemplo, si se lanza un dado, la probabilidad de cada cara es 16 . Esta definicion no implica que se realice verdader-
amente el experimento. La probabilidad se define independientemente de que el experimento se lleve a cabo o no, y
depende unicamente de la geometrıa o las propiedades fısicas del objeto en cuestion.
73 Humberto Barrios. mail: [email protected]
2.3. DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES Universidad Popular del Cesar
Definicion 2.7 (Probabilidad frecuentista). Supongamos que se lanza un dado N veces en las mismas condiciones
y sale la cara un numero n de veces. La definicion frecuentista de la probabilidad de obtener n veces caras en el
resultado es:
P(c) = lımn→∞
nN
Al igual que en el caso anterior, esta definicion es una forma conceptual de entender lo que es un experimento aleatorio
(por ejemplo, lanzar un dado), y no significa que en la practica haya que repetirlo un numero ilimitado de veces para
calcular la probabilidad. Esto se debe a dos razones: en la practica es imposible repetir un mismo experimento en
identicas condiciones; el dado se deteriorara cuantas mas veces se lance, la velocidad del aire cambiara, etc. Ademas,
si se pudiera repetir el fenomeno en identicas condiciones el resultado serıa el mismo en todos los lanzamientos, por
lo que el concepto de probabilidad perdera su sentido.
Ejemplo 2.2. Considerese el experimento de lanzamiento de un dado.
1. Hallar el espacio muestral
2. Asigne probabilidades a cada resultado posible
3. Hallar la probabilidad de obtener un numero par.
Solucion 9. El espacio muestral asociado al experimento, del lanzamiento de un dado,
1. es
Ω = 1,2,3,4,5,6.
2. El axioma P2 dice que la suma de todas las probabilidades de los elementos de Ω debe ser igual a uno. Por lo
tanto una forma de asignar probabilidades es suponer a priori que el dado es perfecto, y en consecuencia cada
una de las caras tiene la misma posibilidad de salir, en este caso,
P(i) = 16
; i=1, 2, 3, 4, 5, 6.
Esta forma de asignar probabilidad se denomina clasica.
3. El evento obtener un numero par es el subconjunto
A = 2,4,6
P(A) =numero de casos favorables
numero de caso posibles=
36=
12.
74 Humberto Barrios. mail: [email protected]
2.3. DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES Universidad Popular del Cesar
Ejemplo 2.3. Un fabricante tiene cinco terminales de computador aparentemente identicos listos para ser enviados
a su destino. El no sabe que dos son defectuosos. Recibe un pedido especial de dos terminales y lo surte seleccionado
al azar dos de los cinco disponibles.
1. Encuentren el espacio muestral para este experimento
2. Sea A el evento en que el pedido se surte con dos terminales no defectuosos. Liste los puntos muestrales de A
3. Asigne probabilidades a cada resultado posible
4. Calcular la probabilidad del evento A.
Solucion 10. Sean d1,d2 los dos terminales defectuoso y b1,b2,b3 los terminales buenos.
1. Los eventos simples pueden representarse como sigue:
e1 = d1,d2 e6 = d2,b2
e2 = d1,b1 e7 = d2,b3
e3 = d1,b2 e8 = b1,b2
e4 = d1,b3 e9 = b2,b3
e5 = d2,b1 e10 = b3,b3.
Por lo tanto el espacio muestral es:
Ω = e1,e2,e3,e4,e5,e6,e7,e8,e9,e10.
2. El evento A = e8,e9,e10
3. Como las terminales son identicos se puede asumir que tiene la misma posibilidad de ser seleccionado cualquiera
de los elementos del espacio muestral, luego
P(ei=1
10; i=1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
4. Puesto que el evento A = e8,e9,e10= e8∪e9∪e10 , aplicando el teorema 2, se obtiene
P(A) = P(e8)+P(e9)+P(e10) =3
10.
Ejemplo 2.4. Una empresa dedicada a la busqueda de petroleo o gas natural encuentra en 10% de sus perforaciones.
Si la companıa perfora dos pozos, los cuatro eventos simples posibles y tres de sus probabilidades asociadas son:
75 Humberto Barrios. mail: [email protected]
2.3. DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES Universidad Popular del Cesar
RESULTADOS
EVENTOS 1 perforacion 2 perforacion Probabilidad
e1 Exito Exito 0.01
e2 Exito Fracaso
e3 Fracaso Exito 0.09
e4 Fracaso fracaso 0.81
1. Obtenga la probabilidad de que la companıa encuentre petroleo o gas en la primera perforacion y falle en la
segunda
2. Obtenga la probabilidad de que la companıa encuentre petroleo o gas en al menos una de las dos perforaciones.
Solucion 11. El experimento consiste en la perforacion de pozos en busca de petroleo o gas. El espacio muestral es:
Ω = e1,e2,e3,e4
donde, por ejemplo, e3 significa fracaso en la primera perforacion y exito en la segunda.
1. El evento de encontrar petroleo o gas en la primera perforacion y fracaso en la segunda perforacion es:
A = e2.
Por otro lado, se tiene por axioma P2, que
P(Ω) = P(e1)+P(e2)+P(e3)+P(e4) = 1
entonces
P(e2) = 1− (P(e1)+P(e3)+P(e4)) = 1− (0.01+0.09+0.81) = 0.09.
2. El evento de que encuentre petroleo o gas en al menos en una de las dos perforaciones es
B = e1,e2,e3
por lo tanto
P(B) = P(e1)+P(e2)+P(e3) = 0.01+0.09+0.09 = 0.19
Otra forma de calcular la probabilidad de P(B) es:
P(B) = 1−P(e4) = 1−0.81 = 0.19.
76 Humberto Barrios. mail: [email protected]
2.3. DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES Universidad Popular del Cesar
Ejemplo 2.5. Una agencia comercial compra papelerıa a uno de los tres vendedores v1, v2 y v3. Se ordena el pedido
en dos dıas consecutivos, un pedido por dıa, tal que (v1,v2) significa que el vendedor v1 recibe el pedido el primer dıa
y el vendedor v2 lo recibe el segundo dıa.
1. Determine los puntos muestrales de este experimento
2. Supongamos que se seleccionan los vendedores al azar cada dıa, asigne una probabilidad a cada punto muestral
3. Sean A el evento de que el mismo vendedor recibe los dos pedidos y el evento B de que el vendedor v2 consigue
por lo menos un pedido. Calcular: P(A), P(B), P(A∩B) y P(A∪B).
Solucion 12. El experimento consiste en la solicitud de papelerıa que hace una agencia comercial en dos
dıas consecutivos. Como (vi,v j) representa que el vendedor i recibio el primer pedido y j el segundo pedido.
Entonces
1. el espacio muestral es:
Ω = (v1,v1),(v1,v2),(v1,v3),(v2,v1),(v2,v2),(v2,v3),(v3,v1),(v3,v2),(v3,v3)
2. Como la seleccion se hace de manera aleatoria cada dıa, es natural suponer que todos los vendedores tienen la
misma posibilidad de ser seleccionados por lo tanto
P((vi,v j)) =19
; i,j=1, 2, 3.
3. Los eventos
A = (v1,v1),(v2,v2),(v3,v3)
B = (v1,v2),(v2,v1),(v2,v2),(v2,v3),(v3,v2)
A∩B = (v2,v2)
se tiene
P(A) = P((v1,v1),(v2,v2),(v3,v3)) =13
P(B) = P((v1,v2),(v2,v1),(v2,v2),(v2,v3),(v3,v2)) =59
P(A∩B) = P((v2,v2)) =19.
Por lo tanto
P(A∪B) = P(A)+P(B)−P(A∩B) =13+
59
19=
77.
77 Humberto Barrios. mail: [email protected]
2.4. PROBABILIDAD CONDICIONAL Universidad Popular del Cesar
2.4. PROBABILIDAD CONDICIONAL
La probabilidad condicional nos permite ajustar un evento si se sabe que ha ocurrido un evento relacionado con el
primero.
Definicion 2.8. . Sea B un evento del espacio muestral Ω tal que P(B)> 0. Entonces la probabilidad condicional del
evento A, dado que el evento B ocurrio, se define como la razon
P(A|B) = P(A∩BP(B)
.
De la misma manera se define
P(B|A) = P(A∩BP(A)
.
Tambien de la definicion de probabilidad condicional se obtiene lo que se conoce como teorema de multiplicacion
P(A∩B) = P(A|B)P(B) = P(B|A)P(A).
Ejemplo 2.6. Supongamos que en una oficina hay 100 maquinas calculadoras. Algunas de esas maquinas son electric-
as (E), mientras otras son manuales (M). Ademas, algunas son nuevas (N), mientras otras son usadas (U). La siguiente
tabla da el numero de maquinas de cada categorıa.
E M Total
N 40 30 70
U 20 10 30
Total 60 40 100
Una persona entra a la oficina, escoge una maquina al azar y descubre que es nueva. ¿Cual es la probabilidad de que
sea electrica?
Solucion 13. Se sabe que la persona escogio una maquina nueva de la 70 y se tienen 40, por lo tanto
P(E|N) =47.
Otra forma es calcular la probabilidad que se nueva y electrica,
P(E|N) = 0.40 y P(N) = 0.70.
Entonces
P(E|N) =P(E ∩N
P(N)=
0.400.70
=47.
78 Humberto Barrios. mail: [email protected]
2.4. PROBABILIDAD CONDICIONAL Universidad Popular del Cesar
Ejemplo 2.7. Considerese las familias que tienen dos hijos y supongamos que varones y mujeres son igualmente
probables. Si se escoge una familia al azar y en la familia hay un hijo varon ¿cual es la probabilidad de que el otro
sea varon?
Solucion 14. En este caso el espacio muestral es
Ω = (v,v),(v,m),(m,v),(m,m).
Donde v es varon, m es mujer y el orden del par es el orden de los nacimientos. Cada uno de los puntos tiene la
probabilidad 14 . Sean los eventos A: uno de los hijos es varon y B: ambos son varones, entonces
A = (v,v),(v,m),(m,v)
y
A = (v,v)
como B⊆ A entonces B = A∩B. Por lo tanto
P(A|B) = P(A∩B)P(B)
=13.
Definicion 2.9. Se dice que los eventos B1,B2,B3,B4, . . .Bn representa una particion del espacio muestral Ω si:
1. Bi∩B j = Φ para todo i 6= j.
2.n⋃
i=1Bi = Ω
3. P(Bi)> 0 para todo i = 1,2,3, . . . ,n.
Teorema 2.6 (Teorema de la Probabilidad Total). Sea B1,B2,B3, . . . ,Bn una particion del espacio muestral Ω y A un
evento de Ω. Entonces
P(A) =n
∑i=1
P(A|Bi)P(Bi).
Demostracion 6. Es facil observar en la figura 2.4 que A es la union disjunta de elementos de Ω, como se muestra en
la siguiente grafica.
Esto es:
A = (A∩B1)∪ (A∩B2)∪ (A∩B3)∪ . . .∪ (A∩Bn)
donde
(A∩B1)∩ (A∩B2 = Φ; para todo i 6= j
79 Humberto Barrios. mail: [email protected]
2.4. PROBABILIDAD CONDICIONAL Universidad Popular del Cesar
Figura 2.4: Particion de Ω
B1
B2
B3
Bn
A
entonces
P(A) =n
∑i=1
P(A∩Bi) (2.9)
pero tenemos que para i = 1,2, . . . ,n
P(A∩Bi) = P(A|Bi)P(Bi) (2.10)
sustituyendo (2.10) en (2.9), se obtiene
P(A) =n
∑i=1
P(A|Bi)P(Bi).
Ejemplo 2.8. Cierto artıculo se hace en una de tres fabricas, digamos 1,2 y 3. Se sabe que la primera produce
el doble de artıculos que la segunda. Tambien se sabe que la segunda y la tercera producen el mismo numero de
artıculo(durante un periodo de produccion especıfico). Se conoce tambien que el 2% de los artıculos producidos por
cada una de las dos primeras son defectuosos; mientras que 4% de los manufacturados por la tercera son defectuosos.
Todos los artıculos se colocan en una fila y se escoge uno al azar.
1. ¿Cual es la probabilidad de que este artıculo sea defectuoso?
2. Si las tres fabricas producen 10000 artıculos ¿Cual es el numero de artıculos defectuosos que produce cada
fabrica?
3. Si se sabe que el artıculo es defectuoso ¿Cual es la probabilidad de que este articulo proceda de la fabrica dos?
Solucion 15. Definamos
1. los siguientes eventos:
80 Humberto Barrios. mail: [email protected]
2.4. PROBABILIDAD CONDICIONAL Universidad Popular del Cesar
A = el artıculo es defectuoso
B1 = el artıculo proviene de la fabrica 1
B2 = el artıculo proviene de la fabrica 2
B3 = el artıculo proviene de la fabrica 3.
Entonces para i = 1,2,3
(A∩B1) = el articulo es defectuoso y proviene de la fabrica i
Luego
A = (A∩B1)∪ (A∩B2)∪ (A∩B3)
por otra parte se tiene que
P(A|B1) = 0.02
P(A|B2) = 0.02
P(A|B3) = 0.04
P(B1) = 0.5
P(B2) = 0.25
P(B3) = 0.25.
Reemplazando los valores anteriores en
P(A) = P(A|B1)P(B1)+P(A|B2)P(B2)+P(A|B3)(B3)
se obtiene
P(A) = (0.02)(0.5)+(0.02)(0.25)+(0.04)(0.25) = 0.025.
Por lo tanto la probabilidad que un artıculo sea defectuoso es 0.025.
Los puntos 2. y 3. se dejan al lector.
81 Humberto Barrios. mail: [email protected]
2.4. PROBABILIDAD CONDICIONAL Universidad Popular del Cesar
Ejemplo 2.9. Supongase que tenemos una urna con cuatro monedas de oro y tres de bronce, y una segunda urna
contiene tres de oro y cinco de bronce. Las monedas en las dos urnas son todas identicas. Se selecciona una moneda
de la primera urna y se coloca sin verla en la segunda urna. ¿Cual es la probabilidad de que ahora se seleccione una
moneda de bronce de la segunda?
Solucion 16. Sean B1 y B2, la seleccion de una moneda de bronce de la urna 1 y una moneda de bronce de la segunda
urna respectivamente, y O1 una moneda de oro de la urna 1. Debemos calcular la probabilidad de la union de los
eventos B1 ∩B2 y O1 ∩B2. Las diferentes posibilidades que se pueden dar se muestran el diagrama de arbol, figura
2.5. Entonces
Figura 2.5:
P(B 1)
=3
7
P(B2|B1)=
69 P(B1∩B2) = P(B2|B1)P(B1) =
1863
P(O2 |B1 ) = 39
P(B1∩O2) = P(O2|B1)P(B1) =963
P(O1 ) =
47
P(B2 |O1 ) = 59
P(O2|O1)=
49 P(O1∩O2) = P(O2|O1)P(O1) =
1663
P(B2∩O1) = P(B2|O1)P(O1) =2063
Por lo tanto, la probabilidad se seleccionar una moneda de bronce de la segunda urna es:
P((B1∩B2)∪ (O1∩B2)) = P(B1∩B2)+P(O1∩B2)
= P(B2|B1)P(B1)+P(B2|O1)P(O1)
=1863
+2063
=3863
.
Teorema 2.7 (Teorema de Bayes). Sea B1,B2,B3, . . . ,Bn una particion del espacio muestral Ω. Para cualquier evento
A de Ω, done P(A)> 0 y cualquier j, 1≤ j ≤ n. Entonces
P(B j|A) =P(A|B j)P(B j)n∑
i=1P(A|Bi)P(Bi)
.
Demostracion 7. Por la definicion de probabilidad condicional se tiene
82 Humberto Barrios. mail: [email protected]
2.4. PROBABILIDAD CONDICIONAL Universidad Popular del Cesar
P(B j|A) =P(A∩B j)
P(A)(2.11)
Por otra parte se tiene que
P(B j ∩A) = P(A | B j)P(B j) (2.12)
por teorema de la probabilidad total
P(A) =n
∑i=1
P(A | Bi)P(Bi) (2.13)
reemplazando (2.12) y (2.13) en (2.11) se obtiene
P(B j|A) =P(A | B j)P(B j)n∑
i=1P(A|Bi)P(Bi)
.
Ejemplo 2.10. Supongamos que varias cajas son de dos tipos B1 y B2 . El tipo B1 contiene 70% de caramelos dulces
y 30% de caramelos acidos, mientras que el tipo B2 dicho porcentaje esta invertido. Supongamos ademas que el 60%
de todas las cajas son del tipo B1 , mientras que el resto son del tipo B2. Si se escoge un caramelo dulce al azar de
una caja desconocida. Decidir de que tipo proviene.
Solucion 17. Se tienen dos tipos de cajas B1 y B2 con probabilidades de seleccion
P(B1) = 0.60
y
P(B2) = 0.40.
Sea los eventos
D = conjunto de caramelos dulces
A = conjunto de caramelos acidos
por otra parte se tiene que
83 Humberto Barrios. mail: [email protected]
2.5. EVENTOS INDEPENDIENTES Universidad Popular del Cesar
P(D|B1) = 0.70
P(D|B2) = 0.30
P(A|B1) = 0.30
P(A|B2) = 0.70.
Ası
P(B1|D) =P(D|B1)P(B1)
P(D|B1)P(B1)+P(D|B2)P(B2)=
(0.7)(0.6)(0.7)(0.6)+(0.3)(0.4)
=79
y
P(B2|D) =P(D|B2)P(B2)
P(D|B1)P(B1)+P(D|B2)P(B2)=
(0.3)(0.4)(0.7)(0.6)+(0.3)(0.4)
=29
Por lo tanto se decide a favor de los caramelos que provienen de las cajas B1.
2.5. EVENTOS INDEPENDIENTES
Definicion 2.10. Los eventos A1,A2,A3, . . . ,An de Ω se dicen independientes si para todo conjunto de ındices i1, i2, i3, . . . , ik
entre 1 y n se tiene que
P(Ai1 ∩Ai2 ∩Ai3 ∩ . . .∩Aik) = P(Ai1)P(Ai2)P(Ai3) . . .P(Aik).
En particular, los eventos A y B son eventos independientes en Ω, si
P(A∩B) = P(A)P(B).
Es facil verificar que los eventos Φ y Ω son independientes.
Ejemplo 2.11. Un lote de diez objetos contiene cuatro defectuosas y seis en buen estado. Se extraen dos objetos
sucesivamente y sin reemplazo. Sea
D1 = el primer objeto es defectuoso
D2 = el segundo objeto es defectuoso
84 Humberto Barrios. mail: [email protected]
2.5. EVENTOS INDEPENDIENTES Universidad Popular del Cesar
1. ¿Son independientes estos eventos?
2. ¿Que sucede si los objetos se extraen con reemplazo?
Solucion 18. Si D1, el primer objeto es defectuoso, entonces
P(D1) =25
y la probabilidad del evento D2 el segundo objeto es defectuoso, es
P(D2) = P(D2|D1)P(D1)+P(D2|Dc1)P(D
c1) =
13
25+
49
35=
25.
Por otra parte, la probabilidad de D2 dado que ocurrio D1 es:
P(D2|D1) =39
de lo cual se tiene que
P(D2|D1) 6= P(D2)
En el segundo caso se tiene
P(D1) = P(D2) =25
y
P(D1∩D2) = P(D1)P(D2) =4
25.
Por lo tanto, si la seleccion se realiza con reemplazo los eventos son independientes.
Si A1,A2,A3, . . . ,An son eventos tales que Ai1 ,Ai2 ,Ai3 , . . . ,Aik son independientes para todos los indices distintos
i1, i2, . . . , ik, k = 1,2, . . . ,n−1, de esto no se sigue que
A1,A2,A3, . . . ,An
son independientes. Por ejemplo, se el lanzamiento de una moneda dos veces, y signemos una probabilidad de 1/4
a cada resultado de Ω = cc,cs,sc,ss. Sean los eventos
A = cc,cs
B = cc,sc
C = cc,ss
Entonces se tiene
85 Humberto Barrios. mail: [email protected]
2.5. EVENTOS INDEPENDIENTES Universidad Popular del Cesar
P(A∩B) = P(cc) = 14 = P(A)P(B) = 1
212
P(A∩C) = P(cc) = 14 = P(A)P(C) = 1
212
P(B∩C) = P(cc) = 14 = P(B)P(C) = 1
212
pero
P(A∩B∩C) = P(cc) = 146= 1
8= P(A)P(B)P(C) =
12
12
12.
Entonces A y B, A y C, B y C son independientes pero A, B y C no lo son.
Inversamente, si P(A1∩A2∩ . . .∩An) = P(A1)P(A2) . . .P(An), esto no implica que
P(Ai1 ∩Ai2 ∩ . . .∩Aik) = P(Ai1)P(Ai2) . . .P(Ain)
cuando k < n. Por ejemplo, supongamos el lanzamiento de dos dados. Es claro, que el espacio muestral Ω es conjunto
formado por todas las parejas (i, j), i, j = 1,2,3,4,5,6 con probabilidad 1/36. Sean los siguientes eventos
A = el segundo dado muestra 1, 2, o 5
B = el segundo dado muestra 4, 5 , o 6
B = la suma de las dos caras sea nueve
En este caso, es facil ver que
P(A∩B) 6= P(A)P(B)
P(A∩C) 6= P(A)P(C)
P(B∩C) 6= P(B)P(C)
pero
P(A∩B∩C) = P(A)P(B)PC).
Por lo tanto los eventos A, B y C no son independientes.
86 Humberto Barrios. mail: [email protected]
2.5. EVENTOS INDEPENDIENTES Universidad Popular del Cesar
Ejemplo 2.12. El siguiente circuito (figura 2.6) funciona si y solo si hay un camino en el cual todos los dispositivos
funcionan de izquierda a derecha. Suponga que los dispositivos funcionen de forma independiente y que la probabili-
dad de que funcione un dispositivo es como se muestra en la grafica.
1. ¿Cual es la probabilidad de que el circuito funcione?
2. ¿Cual es la probabilidad de que el no circuito funcione?
Figura 2.6:
0.90 0.90
0.97
0.98
0.98
0.99
A1 A2
A3
A4
A5
A6
Solucion 19. Para solucionar este problema procedemos como sigue:
1. La trayectoria de A1 a A2 funciona si y solo si los dispositivos A1 y A2 funcionan simultaneamente. Por lo tanto,
la probabilidad de que funciona, dado que los dispositivos funcionan de manera independiente, es:
P(A1∩A2) = P(A1)P(∩A2) = (0.90)(0.90) = 0.81
Ası, se tiene el siguiente circuito equivalente al dado en la figura 2.6
Figura 2.7:
0.81
0.97
0.98
0.98
0.99
A1
A3
A4
A5
A6
Por otra parte, la trayectoria del rectangulo en el circuito de la 2.7 funciona si los dispositivos A1 o A3 funciones,
es decir, no funciona si y solo si los dispositivos A1 y A3 no funcionan simultaneamente. En consecuencia, la
probabilidad que no funcione es:
87 Humberto Barrios. mail: [email protected]
2.6. EJERCICIOS Universidad Popular del Cesar
P(Ac1∩Ac
3) = P(Ac1)P(A
c3) = (1−P(Ac
1))(1−P(Ac3)) = (1−0.81)(1−0.97) = 0.0057
Luego la probabilidad que funcione la trayectoria del rectangulo es:
P(A1∪A3) = 1−P((A1∪A3)c) = 1−P(Ac
1∩Ac3) = 1−0.0057 = 0.9943
De manera similar se resuelve para el caso de la trayectoria compuesta por el cuadrado
P(A4∪A5) = 1− (1−P(Ac4))(1−P(Ac
5)) = 0.9996
Resumiendo lo anterior se llega al circuito
Figura 2.8:
0.994 0.999 0.990
A1 A2 A3
Para que el circuito de la figura 2.8 funcione es necesario que los tres dispositivos funciones simultaneamente,
y por ser independientes, la probabilidad que funcione el circuito es:
P(A1∩A2∩A3) = P(A1)P(A2)P(A3) = 0.983.
2. La probabilidad que no funcione el circuito de la figura 2.6 es: 0.017.
2.6. EJERCICIOS
1. F Supongamos que se lanzan tres monedas perfectas y se observa el resultado de las caras que quedan hacia
arriba.
a) Establezca los puntos muestrales de este experimento.
b) Asigne una probabilidad razonable a cada punto.
c) Sea A el evento de observar exactamente una cara y B el evento de observar al menos una cara. Obtenga
los puntos muestrales de los eventos A y B.
d) De la respuesta de (c), calcular P(A), P(B), P(A∩B), P(A∪B) y P(Ac∩B).
2. F Cuatro administradores de empresa solicitan dos puestos en una companıa. Uno y solamente uno de los
aspirantes es miembro de una etnica de la Sierra Nevada de Santa Marta. Los puestos se otorgan seleccionado
aleatoriamente dos de los aspirantes.
88 Humberto Barrios. mail: [email protected]
2.6. EJERCICIOS Universidad Popular del Cesar
a) Establezca los puntos muestrales de este experimento.
b) Asigne las probabilidades a los resultados del espacio muestral.
c) Encuentre la probabilidad de que el aspirante de la etnica de la Sierra Nevada de Santa Marta se selec-
cionado para un puesto.
3. F Un equipo de comunicacion contiene seis sistemas electronicos complejos. Se seleccionan aleatoriamente
dos de los seis para someterlos a pruebas rigurosas y clasificarlos como defectuosos y no defectuosos.
a) Si dos de los seis sistemas son realmente defectuosos, encuentre la probabilidad que al menos uno de los
dos sistemas probados sean defectuosos. Encuentre la probabilidad que los dos sean defectuosos.
b) Encuentre la probabilidad indicada en (a) para el caso en que cuatro de los seis sistemas sean realmente
defectuosos.
4. F Un supermercado vende solamente dos tipos de lamparas electricas y la experiencia muestra que tienen
igual demanda. Cuatro clientes entran uno tras otro para comprar una lampara. El vendedor se interesa por la
preferencia de sus clientes.
a) Establezca los puntos muestrales de este experimento.
b) Asigne las probabilidades a los resultados del espacio muestral.
c) Sea A el evento de que los cuatro clientes prefieren el mismo tipo de lampara. Calcular P(A).
5. F Dos equipos de futbol, I Y II, tienen la misma capacidad y juegan uno contra el otro una serie de cuatro
juegos. Se registra el resultado de cada juego.
a) Establezca los puntos del espacio muestral de este experimento.
b) Asigne las probabilidades a los resultados del espacio muestral.
c) Sea A el evento de que el equipo I gana exactamente tres veces. Calcular P(A).
6. F Los enfermos no hospitalizados que acuden a una clınico pueden elegir una de tres secciones para ser aten-
didos. Suponga que los medicos son asignados aleatoriamente a tales secciones y que por esto los pacientes no
presentan preferencia alguna con respecto a una seccion. Tres pacientes acuden a la clınico y se observan la
seccion que eligen.
a) Establezca los puntos del espacio muestral de este experimento.
b) Asigne las probabilidades a los resultados del espacio muestral.
c) Sea A el evento de que cada seccion recibe un paciente. Establezca los puntos muestrales de A. Calcular
P(A).
89 Humberto Barrios. mail: [email protected]
2.6. EJERCICIOS Universidad Popular del Cesar
7. Se tienen 3 libros: uno de aritmetica (A), uno de biologıa (B) y otro de calculo(C). ¿De cuantas maneras se
pueden ordenar en un estante?
8. Se tienen 7 libros y solo 3 espacios en una biblioteca, suponiendo que no existan razones para preferir alguno.
¿De cuantas maneras se pueden colocar 3 libros elegidos; entre los siete dados?
9. ¿Cuantas permutaciones pueden formarse con las letras de la palabra BONDAD?
10. Cuantos grupos de 5 alumnos pueden formarse con los treinta alumnos de una clase. (Un grupo es distinto de
otro si se diferencia de otro por lo menos en un alumno).
11. Una aerolınea tiene seis vuelos diarios Barranquilla a Medellın y siete vuelos de Medellın a Cali. Si los vuelos
se hacen en dıas separados. ¿Cuantos arreglos diferentes de vuelos puede ofrecer la aerolınea de Barranquilla a
Cali?
12. Una operacion de montaje en una fabrica manufacturara requiere tres pasos que pueden realizarse en cualquier
orden. ¿De cuantas maneras se puede hacer el montaje?
13. Cierta marca de automovil tiene cinco modelos diferentes, con cuatro tipo de motores, con dos tipos de trans-
mision, y en ocho colores.
a) ¿Cuantos automoviles tendrıa que adquirir un distribuidor si quiere incluir un carro por combinacion
modelo-motor-trasmision?
b) ¿Cuantos automoviles tendrıa que tener en existencia un centro de distribucion si almacenara los carros de
todos los colores disponibles para cada combinacion en (a.)?
14. Un investigador quiere determinar el efecto de tres variables, presion, temperatura y el tipo de catalizador, en
el proceso de refinacion. Si el investigador tiene la intencion de utilizar tres temperaturas, tres presiones y dos
tipos de catalizador. ¿ Cuantos experimentos habrıa que hacer si quiere incluir todas las posibles combinaciones
de temperaturas, de presiones y tipos de catalizador?
15. F Cinco empresas F1,F2,F3,F4 y F5, hacen propuestas con respecto a tres contratos separados, C1,C2 y C3.
Una empresa solo puede obtener a lo mas un contrato. Los contratos son bastante diferentes, de tal manera que
la asignacion de C1 a F1 se debe diferenciar de la asignacion de C2 a F2.
a) ¿Cuantos puntos muestrales tiene este experimento que trata de la asignacion de los contratos a las empre-
sas?
b) Encuentre la probabilidad de que se conceda un contrato a la empresa F3, bajo el supuesto de que los
puntos muestrales son equiprobable.
16. F Dado los siguientes eventos A y B, tales que P(A) = 0.5, P(B) = 0.3, y P(A∩B) = 0.1, encontrar lo siguiente:
90 Humberto Barrios. mail: [email protected]
2.6. EJERCICIOS Universidad Popular del Cesar
a) P(A|B)
b) P(B|A)
c) P(A|A∩B)
d) P(A|A∪B)
e) P(A∪B|A∩B)
17. F Un armador de ventiladores electricos usa motores de dos proveedores. La companıa A le suministra el 70%
y la companıa B el otro 30% de los motores. Supongamos que sabe que el 5% de los motores que suministra la
companıa A son defectuosos que el 3% de los que suministra B tambien lo son. Se selecciona un ventilador ya
armado.
a) ¿Cual es la probabilidad que tenga un motor defectuoso?
b) ¿Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido suministrado por la companıa
A?
c) ¿Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido suministrado por la companıa
B?
18. F Los empleados de un supermercado se encuentra clasificado en tres categorıas: administradores, supervisores
y vendedores. La siguiente tabla indica el numero de empleados en cada division clasificados por sexo:
Mujeres (M) Hombres (H) Total
Administradores (A) 20 30 50
Supervisores (S) 50 20 70
Vendedores (V) 100 80 180
Total 170 130 300
a) Si elige aleatoriamente un empleado:
1) ¿Cual es la probabilidad que sea mujer?
2) ¿Cual es la probabilidad que sea un vendedor?
3) ¿Cual es la probabilidad que sea mujer y trabaje en la seccion de administracion?
4) ¿Cual es la probabilidad que sea mujer si trabaja en la division de supervision?
b) ¿Son los eventos V y H estadısticamente independientes?
c) ¿Son los eventos A y M estadısticamente independientes?
d) Determine las siguientes probabilidades:
1) P(A∪M)
2) P(A∪Mc)
91 Humberto Barrios. mail: [email protected]
2.6. EJERCICIOS Universidad Popular del Cesar
3) P(S∩M)
4) P(M|A)
19. Sean A y B dos eventos cualesquiera de un espacio muestral Ω. Si A y B son mutuamente excluyentes, muestrese
que no pueden ser independientes. Deduzcase que dos eventos independientes son, tambien, mutuamente.
20. Se lanza una moneda diez veces y en todos los lanzamientos el resultado es cara.
a) ¿Cual es la probabilidad de este evento?
b) ¿Cual es la probabilidad de que en el decimoprimero lanzamiento el resultado sea cara?
21. Una agencia de automoviles recibe un embarque de 20 automoviles nuevos. Entre estos, dos tienen defectos. La
agencia decide seleccionar, aleatoriamente, dos automoviles entre los 20 y aceptar el embarque si ninguno de
los dos vehıculos seleccionados tienen defectos. ¿Cual es la probabilidad de aceptar el embarque?
22. F Se lanza una moneda con una probabilidad de 23 que el resultado sea cara. Si aparece una cara, se extrae una
pelota, aleatoriamente, de una urna que contiene dos pelotas rojas y tres verdes. Si el resultado es sello se extrae
una pelota, de otra urna, que contiene dos rojas y dos verdes. ¿Cual es la probabilidad de extraer una pelota roja?
23. De entre 20 tanques de combustible fabricados para el trasbordador espacial, tres se encuentran defectuosos. Si
se seleccionan aleatoriamente cuatro tanques:
a) ¿Cual es la probabilidad que ninguno de los tanques se encuentre defectuoso?
b) ¿Cual es la probabilidad de que uno de los tanques tenga defectos?
24. F La probabilidad de que cierto componente electrico funcione es de 0.9. un aparato contiene dos de estos
componentes. El aparato funciona mientras lo haga, por lo menos, uno de los componentes.
a) Sin importar cual de los dos componente funcione o no. ¿Cuales son los posibles resultados y sus respec-
tivas probabilidades?. Suponga independencia en la operacion entre los componentes.
b) ¿Cual es la probabilidad que el aparato funcione?
25. F Con base en varios estudios una companıa ha clasificado, de acuerdo con la posibilidad de descubrir petroleo,
las formaciones geologicas en tres tipos. La companıa pretende perforar un pozo en determinado sitio, al que
le asigna las probabilidades 0.35, 0.40 y 0.25 para los tres tipos de formaciones respectivas. De acuerdo con la
experiencia, se sabe que el petroleo se encuentra en un 40% de formaciones de tipo I, en un 20% de formaciones
de tipo II y en un 30% de formaciones de tipo III. Si la companıa no descubre petroleo en ese lugar, determınese
la probabilidad de que exista una formacion de tipo II.
26. F Se debe examinar un grupo grande de personas respecto a dos sıntomas comunes de cierta enfermedad. Se
considera que el 20% de las personas presentan solamente el sıntoma A, el 30% tienen solamente el sıntoma B,
92 Humberto Barrios. mail: [email protected]
2.6. EJERCICIOS Universidad Popular del Cesar
10% tienen ambos sıntomas, y el resto no tiene sıntoma alguno. Para una persona escogida aleatoriamente de
este grupo, encuentre las probabilidades de los eventos siguientes:
a) ¿Que la persona presente al menos un sıntoma?
b) ¿Que la persona no presente sıntoma alguno?
c) ¿Que la persona presente ambos sıntoma, dado que presenta el sıntoma B?
27. F Una planta ensambladora recibe circuitos proveniente de tres fabricas distintas B1, B2 y B3. El 50% del total
se compran a B1 mientras que a B2 y B3 se les compra un 25% a cada una. El porcentaje de circuitos defectuosos
para B1, B2 y B3 es 5, 10 y 12% respectivamente. Si los circuitos se almacenan en la planta sin importar quien
fue el proveedor:
a) Determinar la probabilidad de que una unidad armada en la planta contenga un circuito defectuoso
b) Si un circuito no es defectuoso. ¿Cual es la probabilidad de que haya sido vendido por el proveedor B2?
28. Supongamos que hay nueve lugares disponibles en un estacionamiento, uno junto al otro. Un acomodador tiene
que estacionar nueve carros. Tres son carros deportivos, tres son carros grandes nacionales, y tres son carros com-
pactos importados. ¿Cual es la probabilidad de que los tres carros deportivos se encuentren juntos, suponiendo
que el acomodador estaciona los carros de manera aleatoria?
29. Se clasifican ocho marcas de llantas de 1 a 8 (de la mejor a la peor) segun el kilometraje que aguanten. Si
un comprador escoge cuatro llantas aleatoriamente, encuentre la probabilidad de que la mejor llanta entre las
seleccionadas por el comprador se encuentre realmente en el tercer lugar entre las ocho llantas originales.
30. Una maquinaria para producir un nuevo tubo electronico experimental genera tubos defectuosos de vez en cuan-
do, de una manera aleatoria. El ingeniero supervisor de una maquina en particular, ha notado que los tubos defec-
tuosos parecen agruparse (y, por tanto, aparecen de manera no aleatoria) y esto sugiere el mal funcionamiento
de alguna de la maquina. Una prueba para detectar la no aleatoriedad de un evento, se basa en el numero de
corridas de artıculos defectuosos y buenos (una corrida es una sucesion no interrumpida de artıculos defectu-
osos o buenos). Mientras mas pequena sea el numero de corridas, mas grande es la evidencia que indica la no
aleatoriedad. De 12 tubos producidos por la maquina, los 10 primeros eran buenos y los dos ultimos defectuosos
(BBBBBBBBBBDD). Suponga la aleatoriedad.
a) ¿Cual es la probabilidad de observar la secuencia antes mencionada (resultante de dos corridas) dado que
los 10 tubos de 12 son buenos?
b) ¿Cual es la probabilidad de observar dos corridas?
c) ¿Cual es la probabilidad de que el numero de corridas R sea R=3?
31. F Suponga que la probabilidad de exposicion a la gripe durante una epidemia es 0.6. La experiencia ha mostrado
que una vacuna tiene 80% de efectividad en proteger a una persona sobre la gripe, si esta expuesta a la epidemia.
93 Humberto Barrios. mail: [email protected]
2.6. EJERCICIOS Universidad Popular del Cesar
Una persona tiene una probabilidad de 0.90 de ser afectada por la gripe al ser expuesta. Dos personas, una
vacunada y la otra no, realizan una tarea altamente especializada en un negocio. Suponga que no se ubican en la
misma localizacion, que no entra en contacto con la misma persona, y no se expone la una a la otra. ¿Cual es la
probabilidad de que al menos una sea afectada por la gripe?
32. F Si A y B son eventos tales que A⊆ B. Demuestrese que P(A)≤ P(B).
33. F Sean A, B y C eventos mutuamente excluyentes. Entonces
P(A∪B∪C) = P(A)+P(B)+P(C)
34. F Sean A y B eventos cualesquiera. Entonces
P(A∩B)≥ P(A)+P(B)−1
35. F Sean A, B y C eventos cualesquiera. Entonces
P(A∪B∪C) = P(A)+P(B)+P(C)−P(A∩B)−P(A∩C)−P(B∩C)+P(A∩B∩C)
36. F Sea (Ω,P) un espacio de probabilidad. Dada la funcion PH :℘(Ω) 7→ℜ, definida por
PH(A) =P(A∩H)
P(H)
donde A y H son subconjuntos de Ω y P(H)> 0.
Demuestrese que
a) PH es un funcion de probabilidad
b) PH(Φ) = 0
c) PH(A∪B) = PH(A)+PH(B), si A∩B = Φ
d) PH(Ac) = 1−P(A)
e) PH(A∪B) = PH(A)+PH(B)−PH(A∩B), para A y B eventos cualesquiera.
37. F Sean A1,A2, . . . ,An eventos definidos en el espacio muestral Ω y Ai∩A j = Φ, i 6= j. Demostrar que
P(n⋃
i=1
Ai) =n
∑i=1
P(Ai)
38. Sea A evento tal que A⊆Ω. Demuestrese que P(A)≤ 1.
39. F Sea A1,A2, . . . ,An una particion del espacio muestral Ω y B un evento de Ω. Entonces
P(B) =n
∑i=1
P(Ai∩B)
94 Humberto Barrios. mail: [email protected]
2.6. EJERCICIOS Universidad Popular del Cesar
40. F Sean A1,A2, . . . ,An eventos del espacio muestral Ω. Entonces
P(n⋃
i=1
Ai)≤n
∑i=1
P(Ai)
41. F Sean A1,A2, . . . ,An eventos del espacio muestral Ω. Entonces
P(n⋃
i=1
Ai) =n
∑i=1
P(Ai)−n
∑i< j
P(Ai∩A j)+n
∑i< j<k
P(Ai∩A j ∩Ak)− . . .+(−1)n+1P(A1∩A2∩ . . .∩An
42. F Sean A y B eventos cualesquiera del espacio muestral Ω, tales que P(A) = 0.2, P(B) = 0.3 y P(A∪B) = 0.4.
Calcular:
a) P(A∩B)
b) P(Ac∪B)
c) P(Ac∩Bc)
d) P(Ac∪Bc)
43. F Sean A y B eventos independientes del espacio muestral Ω tales que P(A) = 0.5 y P(B) = 0.4. Calcular:
a) P(A∩B)
b) P(Ac∪B)
c) P(Ac∩Bc)
d) P(Ac∪Bc)
44. F Sean A y B eventos cualesquiera del espacio muestral Ω. Demuestrese:
a) Si A∩B = Φ =⇒ P(A|B) = 0
b) Si A⊆ B =⇒ P(B|A) = 1
45. Se lanzan dos dados hasta que la suma de los dos puntos sea 7 u 8. si sale 7, gana el jugador A, y si sale 8 gana
el jugador B. ¿Cual es la probabilidad que gane B?
46. F En el control preventivo de una poblacion donde la proporcion de enfermos es, se usa el examen radiologi-
co para detectar posibles enfermos. Se sabe que la probabilidad de que, aplicando el examen a un enfermo,
la muestra como tal, es 0.90; y que la probabilidad de que el examen aplicado a una persona sana la senale
como enfermo es 0.01. calcular la probabilidad de que una persona dada este realmente enferma, si el examen
radiologico lo mostro como tal. Considerese el experimento de elegir una persona de la poblacion de manera
aleatoria.
47. F Supongamos que tenemos tres escritorios identicos, A, B y C, cada uno con dos cajones. En A, cada cajon
contiene una moneda de oro; en B, un cajon contiene una moneda de oro y el otro una de plata, y en C, cada
cajon contiene una de plata. Se elige un escritorio al azar, se abre uno de los cajones y encontramos una moneda
de oro. ¿Cual es la probabilidad de que el escritorio elegido sea el B?
95 Humberto Barrios. mail: [email protected]
2.6. EJERCICIOS Universidad Popular del Cesar
48. F Sean A y B dos eventos independientes tales que con probabilidad 16 ocurren simultaneamente, y con proba-
bilidad 13 ninguno ocurre. Halle P(A) y P(B). ¿Estan determinadas en forma unica estas probabilidades?
49. F Sean A y B dos eventos independientes tales que con probabilidad 16 ocurren simultaneamente, y con proba-
bilidad 13 ocurre A y B no ocurre. Halle P(A) y P(B). ¿Estan determinadas en forma unica estas probabilidades?
50. F ¿Cual es el menor valor de n para el cual la probabilidad de obtener al menos un 6 en una serie de n lanza-
mientos de un dado es mayor que 34 ?
51. Los A1,A2, . . . son independientes y P(Ai) = p, i = 1,2, . . . . Hallar el menor n para el cual P(n⋃
i=1Ai)≥ p0, donde
p0 es un numero fijo.
52. F Sean A y B dos eventos cualesquiera. ¿Cual de las siguientes afirmaciones es falsa?
a) P(A|B)+P(Ac|Bc) = 1
b) P(A|B)+P(A|Bc) = 1
c) P(A|B)+P(Ac|B) = 1
53. Sean A y B dos eventos cualesquiera tales que P(A|B) = P(B|A), P(A∪B) = 1 y P(A | B) > 0. Demostrar que
P(A)> 1/2.
54. Sean A1,A2, . . . ,An eventos independientes en el espacio muestral Ω si 0 < P(A j) < 1 para todo j. Demostrar
que Ω tiene por lo 2n puntos.
55. Demuestre que si P(A|C)≥ P(B|C) y P(A|Cc)≥ P(B|Cc), entonces P(A)≥ P(B).
Sean A y B dos eventos cualesquiera del espacio muestral Ω. Diremos que el evento A atrae al evento B si
P(B|A)> P(B) y rechaza a B si P(B|A)< P(B).
56. Probar que A atrae a B si y solo si B atrae a A. Luego diremos que A y B son mutuamente atractivos si A atrae B.
57. Probar que A no atrae ni rechaza a B si y solo si A y son B independientes.
58. Probar que A y B son mutuamente atractivos si y solo si P(B|A)> P(B|Ac).
59. Probar que A atrae a B, entonces A rechaza a Bc.
60. Probar que si A atrae B y C, y A rechaza a B∩C, entonces A atrae B∪C. Hallar un ejemplo en el cual A atrae a
B y C y rechace a B∪C?
61. Probar que si B1,B2, . . . ,Bn es una coleccion mutuamente disjunta y si A atrae algun Bi, entonces A rechaza
algun B j.
62. Muestre que para A y B eventos en un espacio de probabilidad:
96 Humberto Barrios. mail: [email protected]
2.6. EJERCICIOS Universidad Popular del Cesar
a) P((A∩Bc)∪ (B∩Ac)) = P(A)+P(B)−2P(A∩B)
b) P(A∩B)≤ P(A)≤ P(A∪B)≤ P(A)+P(B)
c) Si P(A) = α y P(B) = β entonces P(A∩B)≥ α +β −1.
63. Un suero de la verdad tiene la propiedad de que el 90% de los sospechosos culpables se juzgan de forma
adecuada; mientras que, por supuesto, 10% de lo sospechosos erroneamente se consideran inocentes. Por otro
lado, a los sospechosos inocentes se les juzga de manera erronea 1% de las veces. Si el sospechoso se selecciona
de un grupo de sospechosos, de los cuales solo el 5% alguna vez han cometido un delito, y el suero indica que
es culpable, ¿cual es la probabilidad de que sea inocente?
97 Humberto Barrios. mail: [email protected]
CAPITULO 3
VARIABLES ALEATORIAS
En el capıtulo anterior se estudio los conceptos basicos de probabilidad con respecto a los resultados posibles
de un experimento aleatorio. Se considero al espacio muestral Ω, como el conjunto de todos los resultados posibles
de un experimento aleatorio. Estos resultados pueden ser cualitativos o cuantitativos. Por ejemplo, en un proceso
de fabricacion se puede estar interesado en el hecho si el producto es defectuoso o no defectuoso o una persona
puede estar interesada en el consumo de agua diarias de una familia en Valledupar. Con frecuencia puede ser util la
cuantificacion de los resultados de un espacio muestral y, mediante la asignacion de un numero real a cada elemento
de Ω, estudiar su comportamiento aleatorio. El concepto de variable aleatoria facilita un medio para relacionar un
resultado de un espacio muestral con un numero real. Es decir, utilizaremos el concepto de variable aleatoria para
referirnos a experimentos donde cada resultado posible queda caracterizado por un valor numerico.
3.1. VARIABLES ALEATORIAS DISCRETAS
Hasta ahora, estamos familiarizados con una funcion cuyo dominio y recorrido son subconjuntos de los numeros
reales. Una funcion que tiene como dominio un espacio muestral y su recorrido es un subconjunto de los numeros
reales la llamaremos variable aleatoria.
Definicion 3.1. Sea (Ω,P) un espacio de probabilidad. Una funcion
X : Ω→ℜ
se llama una variable aleatoria real.
Es decir, una funcion X que asigna a cada uno de los elementos w ∈ Ω, un numero real X(w), se llama una variable
aleatoria.
Ejemplo 3.1. Considerese el experimento del lanzamiento de dos monedas una sola vez. El espacio muestral es:
Ω = cc,cs,sc,ss
98
3.1. VARIABLES ALEATORIAS DISCRETAS Universidad Popular del Cesar
Sea la variable aleatoria X =“numero de sellos en el lanzamiento de las dos monedas”, entonces los posibles valores
de esta variable aleatoria son: X(cc) = 0, X(cs) = 1, X(sc) = 1 y X(ss) = 2.
Ejemplo 3.2. Supongase que se lanza un dado corriente dos veces consecutivas. Entonces en este caso el espacio
muestral es:
Ω =
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
y definamos la variable aleatoria X =“suma de las dos caras”, entonces los posibles valores de esta variable aleatoria
son: X = 2,3,4,5,6,7,8,9,10,11,12.
En un espacio muestral, se puede definir mas de una variable aleatoria. Ası, por ejemplo, X(x,y) = max(x,y) es otra
variable aleatoria definida en el anterior espacio muestral, cuyo valores son: X = 1,2,3,4,5,6.
Definicion 3.2. Sea X una variable aleatoria definida sobre el espacio muestral Ω. Si el numero de valores posibles
de X es a lo mas numerable, diremos que X es una variable aleatoria discreta. Es decir, si se pueden anotar los valores
posibles de X como x1,x2, . . . ,xn, . . .. En el caso finito, la lista termina y en el caso infinito numerable, la lista continua
indefinidamente.
Las variables aleatorias definidas en los ejemplos anteriores, son claramente variables aleatorias discretas.
Definicion 3.3. Sea X una variable aleatoria discreta definida sobre el espacio de probabilidad (Ω,P). La funcion de
probabilidad de densidad (abreviada fpd) de X, se define como la funcion PX (x) tal que para cualquier numero real
x ∈ℜ,
PX (x) = PX (X = x) = P(w ∈Ω|X(w) = x)
La funcion de probabilidad de densidad PX (x) para una variable aleatoria discreta X se representa por una formula,
una tabla o una grafica que indique las probabilidades PX (x) correspondientes a cada uno de los valores de x ∈ℜ.
Ejemplo 3.3. Hallar la funcion de probabilidad de densidad para la variable aleatoria del ejemplo 1. En este caso,
PX (0) = PX (X = 0) = P(ss) = 14
PX (1) = PX (X = 1) = P(sc,cs) = 12
PX (2) = PX (X = 2) = P(cc) = 14
99 Humberto Barrios. mail: [email protected]
3.1. VARIABLES ALEATORIAS DISCRETAS Universidad Popular del Cesar
Observese que PX (0) = 14 es la probabilidad de que en un lanzamiento de dos monedas no salga ninguna cara. La
funcion de distribucion de probabilidad de la anterior variable aleatoria X se puede representar de las siguientes
maneras:
1. Mediante una tablaX = x 0 1 2
PX (x) 14
12
14
2. Mediante una formula
PX (x) =
(
2x
)(0.5)2 si x = 0,1,2
0 en otra parte.
3. Mediante una grafica
−1 0 1 2x
14
12
f (x)
Definicion 3.4. Sea X una variable aleatoria definida sobre el espacio de probabilidad (Ω,P). Para cualquier numero
real x ∈ℜ, la funcion de distribucion acumulada de X (abreviada fda), la cual se notara por F(x), se define por:
F(x) = P(w ∈Ω | X(w)≤ x
Observese que F(x) es la probabilidad del conjunto de todos los puntos del espacio muestrales Ω cuya imagen a traves
de la variable aleatoria X son menores o iguales a x ∈ℜ.
Ejemplo 3.4. Hallar la funcion de distribucion acumulada de la variable aleatoria X del ejemplo 1.
En este caso, como F(x) esta definida en todo el conjunto de los reales es claro que
F(x) = P(w ∈Ω | X(w)≤−0.0001= P(Φ) = 0
100 Humberto Barrios. mail: [email protected]
3.1. VARIABLES ALEATORIAS DISCRETAS Universidad Popular del Cesar
Es decir, para todo numero real menor que cero es cero. La probabilidad que no salga una cara es
F(0) = P(w ∈Ω | X(w)≤ 0= P(ss) = 14
La probabilidad que salga a lo mas una cara en dos lanzamiento de una moneda es
F(1) = P(w ∈Ω | X(w)≤ 1= P(ss,sc,cs) = 34
La probabilidad que salga a lo mas dos cara en dos lanzamiento de una moneda es
F(2) = P(w ∈Ω | X(w)≤ 2= P(ss,sc,cs,cc) = 44= 1
Es facil comprobar que la anterior funcion de distribucion F(x) es constante en los intervalos (−∞,0), [0,1), [1,2),
[2,+∞).
Tambien se puede representar a F(x) mediante:
1.
F(x) =
0, si x < 0
14 , si 0≤ x < 1
34 , si 1≤ x < 2
1, si x≥ 2
2. Una tabla como sigue
X ≤ x (−∞,0) [0,1) [1,2) [2,+∞)
F(x) 0 14
34 1
3. Una grafica
101 Humberto Barrios. mail: [email protected]
3.2. VARIABLES ALEATORIAS CONTINUAS Universidad Popular del Cesar
0 1 2x
14
34
1
f (x)
3.2. VARIABLES ALEATORIAS CONTINUAS
Definicion 3.5. Una variable aleatoria X se dice que es continua si F(x) es continua y la derivada F ′(x) existe excepto
a lo mas en un numero contable de valores. La funcion de densidad de probabilidad f (x), se define por
f (x) =dF(x)
dx= F ′(x)
De esta definicion se deduce que si X es una variable aleatoria continua se tiene que la probabilidad en un punto es
cero. Tambien se tiene, por Teorema Fundamental del Calculo, que se puede escribir como
F(x) =∫ x
−∞
f (t)dt
Teorema 3.1. Sea F(x) la funcion de distribucion acumulada de una variable aleatoria X continua. Entonces
1. f (x)≥ 0 para todo x ∈ℜ
2. P(a≤ X ≤ b) = F(b)−F(a)
3.∫
∞
−∞f (x)dx = 1
Demostracion 8. Para demostrar a (a) es suficiente observar que F(x) es una funcion no decreciente, por lo tanto la
primera derivada de F(x) es mayor o igual a cero. Es decir, F ′(x) = f (x)≥ 0.
Para probar que una funcion f (x) es una funcion de probabilidad o de densidad de una variable aleatoria X continua
es suficiente demostrar que satisface las condiciones (a) y (c) del teorema anterior.
Teorema 3.2. Sea F(x) la funcion de distribucion acumulada de una variable aleatoria discreta o continua X. En-
tonces
1. Si x1 < x2 entonces F(x1)≤ F(x2)
102 Humberto Barrios. mail: [email protected]
3.2. VARIABLES ALEATORIAS CONTINUAS Universidad Popular del Cesar
2. lımx→−∞ F(x) = F(−∞) = 0 y lımx→∞ F(x) = F(∞) = 1
3. F(x) es continua a la derecha para todo numero real. Es decir, F(x+) = lımh→0 F(x+h) = F(x) = 0, h > 0
Ejemplo 3.5. Sea una variable aleatoria X con funcion de distribucion acumulada F definida por,
F(x) =
0, si x≤ 1
ln(x), si 1 < x≤ e
1, si e < x
1. Encontrar f (x)
2. Demuestre que f (x) satisface las propiedades de una funcion de probabilidad
3. Graficar f (x) y F(x). Calcular las siguientes probabilidades:
4. PX (X < 2)
5. PX (2 < X < 2 12 )
6. PX (2 < X ≤ 2 12 )
Solucion 20.
1. Derivando F(x) se tiene que
f (x) = F ′(x) =
0, si x < 1
1x , si 1 < x < e
0, si e < x
Es decir,
f (x) = F ′(x) =
1x , si 1 < x < e
0, en otra parte
2. Demostremos que f (x) es una funcion de probabilidad (fdp). En efecto, f (x)> 0 si 1 < x < e y f (x) = 0 en otra
parte, por lo tanto f (x)≥ 0 para todo numero real x.
Calculemos las siguientes probabilidades
3.
PX (X < 2) =∫ 2
−∞
f (x)dx =∫ 1
−∞
0dx+∫ 2
1
1x
dx
=∫ 2
1
1x
dx = ln(x)∣∣∣∣21= ln(2)− ln(1) = ln(2)
103 Humberto Barrios. mail: [email protected]
3.2. VARIABLES ALEATORIAS CONTINUAS Universidad Popular del Cesar
4.
PX (2 < X < 212) = PX (2 < X <
52) =
∫ 2
−∞
f (x)dx
=∫ 5
2
2
1x
dx = ln(x)∣∣∣∣ 5
2
2= ln(5/2)− ln(2)
= ln(5)− ln(2)− ln(2) = ln(5)−2ln(2)
5. Como f es una funcion continua entonces es claro que el area bajo los intervalos (1,2 12 ) y (1,2 1
2 ] es la misma.
Ejemplo 3.6. Sea X una variable aleatoria con funcion de densidad dada por
f (x) =
0.2 si −1 < x≤ 0
0.2+ cx si 0 < x≤ 1
0 en otro caso
1. Determine el valor de c para que f sea una funcion de densidad
2. Obtener F(x)
3. Graficar f (x) y F(x)
4. Utilizar F(x) de (b) para calcular F(−1), F(0) y F(1)
5. Calcular PX (0≤ x≤ 0.5) de dos maneras
6. Calcular PX (X > 0.5 | X > 0.1)
Solucion 21.
1. Para determine el valor de c para que f sea una funcion de densidad, calculemos la integral∫∞
−∞
f (x)dx = 1
Es decir, ∫∞
−∞
f (x)dx =∫ −1
−∞
0dx+∫ 0
−10.2dx+
∫ 1
00.2+ cxdx = 1
⇒ 0.2x∣∣∣∣0−1
+0.2x∣∣∣∣10+
cx2
2
∣∣∣∣10= 0.2+0.2+
c2
= 0.4+c2= 1
⇒ 0.8+ c = 2
⇒ c = 1.2
104 Humberto Barrios. mail: [email protected]
3.2. VARIABLES ALEATORIAS CONTINUAS Universidad Popular del Cesar
Por lo tanto
f (x) =
0.2 si −1 < x≤ 0
0.2+1.2x si 0 < x≤ 1
0 en otro caso
2. Para obtener F(x) se hace una particion de los numeros reales en los intervalos (−∞,−1], (−1,0], (0,1] y
(1,+∞) y se procede como sigue:
Si x ∈ (−∞,−1] entonces
∫ x
−∞
f (t)dt =∫ x
−∞
0dt = 0
Si x ∈ (−1,0] entonces
∫ x
−∞
f (t)dt =∫ x
−∞
0dt +∫ x
−10.2dt = 0+0.2t
∣∣∣∣x−1
= 0.2x+0.2
Si x ∈ (0,1] entonces
∫ x
−∞
f (t)dt =∫ x
−∞
0dt +∫ 0
−10.2dt +
∫ x
10.2+1.2xdt
= 0+0.2t∣∣∣∣0−1
+0.2t +1.2t2
2
∣∣∣∣x1
= 0.2+0.2x+1.2x2
2
=1.2x2
2+0.2x+0.2
Por lo tanto
F(x) =
0 si x≤−1
0.2x+0.2 si −1 < x≤ 0
1.2x2
2 +0.2x+0.2 si 0 < x≤ 1
1 si x > 1
3. Graficar f (x) y F(x)
105 Humberto Barrios. mail: [email protected]
3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA Universidad Popular del Cesar
4. Calculemos F(−1), F(0) y F(1) utilizando F(x) de (b), como F(x) = 0.2x+0.2 si 0 < x≤ 1 entonces F(0) =
0.2∗0+0.2 = 0.2. De igual manera F(0) = 0 y F(1) = 1
5. Para calcular PX (0≤ x≤ 0.5) de dos maneras, primero se utiliza la funcion de densidad e integremos, es decir,
∫ 0.5
00.2+1.2xdt = 0.2x+1.2
12
x2∣∣∣∣0.50
= 0.2∗0.5+0.6(0.5)2 = 0.25
Segundo, utilizando la funcion de distribucion acumulada F(x), esto es,F(x) = 1.2x2
2 + 0.2x+ 0.2 si 0 < x≤ 1
entonces
PX (0≤ x≤ 0.5) = F(0.5)−F(0) =1.2(0.5)2
2+0.2(0.5)+0.2−0.2 = 0.25
6. Por otra parte se tiene
PX (X > 0.5 | X > 0.1) =PX (X > 0.5∩X > 0.1)
PX (X > 0.1)
=PX (X > 0.5)PX (X > 0.1)
=1−F(0.5)1−F(0.1)
=1−0.2501−0.226
=0.7500.774
= 0.969
3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATO-
RIA
Se ha observado que la funcion de probabilidad para una variable aleatoria es un modelo teorico para la frecuencia
relativa de datos asociados a una poblacion real. Si el modelo es una representacion exacta de la realidad, la funcion
de probabilidad y las frecuencias relativas son equivalentes. Por lo tanto es natural, como en estadıstica descriptiva,
que se intente definir la media y la varianza de una variable aleatoria y ası de esa manera obtener medidas descriptivas
para una funcion de probabilidad o de densidad.
Definicion 3.6. Sea X una variable aleatoria con funcion de distribucion de probabilidad PX (x) o funcion de densidad
f (x). El valor esperado de X el cual se denotara por E(X) o µ y es definido por:
1. µ = E(X) =∞
∑i=1
xiPX (xi) si X es discreta, o
2. µ = E(X) =∞∫−∞
x f (x)dx si X es continua.
106 Humberto Barrios. mail: [email protected]
3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA Universidad Popular del Cesar
En la anterior definicion se asume que la suma como la integral es absolutamente convergente, es decir,
∞
∑i=1|xi|PX (xi)< ∞ y
∞∫−∞
|x| f (x)< ∞
si esto no es ası se dice que no tiene valor esperado.
Ejemplo 3.7. Sea una variable aleatoria X que representa el numero de clientes que llegan una bomba de gasolina
en Valledupar en un intervalo de tiempo de una hora (por ejemplo, entre las 5:00 PM y 6:00 PM). En la siguiente
tabla se muestra la funcion de probabilidad de la variable aleatoria X
X = x 0 1 2 3 4 5 6 7 8
PX (x) 0.05 0.10 0.10 0.10 0.20 0.25 0.10 0.05 0.05
Encontrar el valor esperado de la variable aleatoria X.
Solucion 22. Con base en la definicion de valor esperado y la tabla anterior, tenemos:
X = x 0 1 2 3 4 5 6 7 8
PX (x) 0.05 0.10 0.10 0.10 0.20 0.25 0.10 0.05 0.05
xPX (x) 0 0.10 0.20 0.30 0.80 1.50 0.60 0.35 0.40
Ası, µ = E(X) =∞
∑i=1
xiPX (xi) =9∑
i=0xiPX (xi) = 4.25.
Ejemplo 3.8. Sea X una variable aleatoria con funcion de densidad de probabilidad dada por
f (x) =
0, si x < 1
1x , si 1 < x < e
0, si e < x
Encontrar el valor esperado de X.
Solucion 23. Por definicion de valor esperado se tiene:
E(X) =
∞∫−∞
x f (x)dx =1∫
−∞
x∗0dx+e∫
1
dx+∞∫
e
x∗0dx = e−1
Teorema 3.3. Sea X una variable aleatoria con funcion de distribucion de probabilidad PX (x) o funcion de densidad
f (x). Si g(x) es una funcion de valor real. Entonces
1. µ = E(g(X)) =∞
∑i=1
g(xi)PX (xi) si X es discreta, o
2. µ = E(g(X)) =∞∫−∞
g(x) f (x)dx si X y g(x) son continuas.
107 Humberto Barrios. mail: [email protected]
3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA Universidad Popular del Cesar
Definicion 3.7. Sea X una variable aleatoria. La varianza de X se define y notaremos por:
σ2 =V (X) = E((X−µ)2)
Donde µ = E(X)
A la raız cuadrada de la varianza, se llama desviacion estandar, la cual notaremos σ .
Teorema 3.4. Sean X y Y variables aleatorias y a, b numeros real tal que Y = aX +b. Entonces
1. E(Y ) = aE(X)+b
2. V (Y ) = a2V (X)
Demostracion 9.
1. Dado que Y = aX +b entonces se tiene
E(Y ) = E(aX +b)
=∫
∞
−∞
(ax+b) f (x)dx
= a∫
∞
−∞
x f (x)dx+b∫
∞
−∞
f (x)dx
E(Y ) = aE(X)+b
E(Y ) = aµ +b
2. De la misma manera
V (Y ) = E([(aX +b)− (aµ +b)]2)
= E((aX−aµ)2)
= E(a2(X−µ)2)
= a2E((X−µ)2)
V (Y ) = a2V (X)
Teorema 3.5. Sea X una variable aleatoria. Entonces
V (X) = E(X2)−µ2
108 Humberto Barrios. mail: [email protected]
3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA Universidad Popular del Cesar
Demostracion 10. La prueba es una simple aplicacion de la linealidad del valor esperado, esto es:
V (X) = E((X−µ)2)
= E((X2−2Xµ +µ2))
= E(X2)−2µE(X)+E(µ2)
= E(X2)−2µ2 +µ
2
V (X) = E(X2)−µ2
Ejemplo 3.9. El tiempo que esta detenida en un turno de 12 horas, una maquina por mantenimiento preventivo o
reparacion es una variable aleatoria X, con funcion de densidad de probabilidad dada por
f (x) =
2(1− x), si 0≤ x≤ 1
0, en otra parte
El costo de la perdida (en miles de pesos) debido mantenimiento preventivo o reparacion, esta dada por
C = 10+20X +4X2
Encuentre la perdida esperada y varianza debido al mantenimiento preventivo o reparacion.
Solucion 24. Por definicion se tiene,
E(C) = E(10+20X +4X2) = E(10)+20E(X)+4E(X2)
= 10∫ 1
0f (x)dx+20
∫ 1
0x f (x)dx+4
∫ 1
0x2 f (x)dx
= 20∫ 1
0(1− x)dx+40
∫ 1
0x(1− x)dx+8
∫ 1
0x2(1− x)dx
= 20/2+40/6+8/12 = 52/3.
Por otra parte tenemos que la varianza de la variable aleatoria C esta dada por,
V (C) = E(C2)− (E(C))2
109 Humberto Barrios. mail: [email protected]
3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA Universidad Popular del Cesar
E(C2) = E((10+20X +4X2)2)
= E(100)+400E(X)+480E(X2)+460E(X3)+16E(X4)
= 100∫ 1
0f (x)dx+400
∫ 1
0x f (x)dx+480
∫ 1
0x2 f (x)dx
+460∫ 1
0x3 f (x)dx+16
∫ 1
0x4 f (x)dx
= 200∫ 1
0(1− x)dx+800
∫ 1
0x(1− x)dx+960
∫ 1
0x2(1− x)dx
+320∫ 1
0x3(1− x)dx+32
∫ 1
0x4(1− x)dx
= 200/2+800/6+960/12+320/20+32/30 = 1652/5.
Entonces
V (C) = E(C2)− (E(C))2 = 1652/5− (52/3)2 = 29.96.
Definicion 3.8. Sea X variable aleatoria definimos el r-esimo momento alrededor de c como E((X − c)r). Notese
que:
1. E((X− c)r) =∞
∑i=1
(xi− c)rPX (xi) si X es discreta, o
2. E((X− c)r) =∞∫−∞
(x− c)r f (x)dx si X es continua.
Si c = 0 se dice el r-esimo momento alrededor de cero y si c = µ se dice el r-esimo momento alrededor de la
media.
Cuando conocemos la distribucion de una variable aleatoria X podemos calcular E(X) y V (X), sin embargo el
conocimiento de estas dos cantidades no nos permite calcular probabilidades del tipo P(|X −C| > ε). Afortunada-
mente existe una desigualdad muy conocida, debida al matematico ruso Tchebychev, que nos ofrece una cota superior
para tales probabilidades. Dicha desigualdad relaciona la probabilidad del tamano de la desviacion de una variable
aleatoria de su valor medio, con la varianza.
Teorema 3.6 (Desigualdad de Tchebychev). Sea X una variable aleatoria con media µ y varianza σ2. Para todo
numero real ε > 0,
PX (|X−µ|< ε)> 1− V (X)
ε2
O en forma equivalente
PX (|X−µ| ≥ ε)≤ V (X)
ε2
110 Humberto Barrios. mail: [email protected]
3.3. VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA Universidad Popular del Cesar
Demostracion 11. Demostremos la Desigualdad de Tchebychev en el caso continuo y supongamos. Sea ε > 0 en-
tonces
V (X) =∫
∞
−∞
(x−µ)2 f (x)dx
=∫
µ−ε
−∞
(x−µ)2 f (x)dx+∫
µ+ε
µ−ε
(x−µ)2 f (x)dx+∫
∞
µ+ε
(x−µ)2 f (x)dx
Omitiendo la segunda integral no negativa de la suma anterior se tiene la siguiente desigualdad:
V (X)≥∫
µ−ε
−∞
(x−µ)2 f (x)dx+∫
∞
µ+ε
(x−µ)2 f (x)dx
≥∫|µ+ε|≥ε
(x−µ)2 f (x)dx
≥∫|µ+ε|≥ε
ε2 f (x)dx
= ε2P(|X−µ| ≥ ε)
Por lo tanto,
V (X)≥ ε2P(|X−µ| ≥ ε)
Ası,
P(|X−µ| ≥ ε)≤ V (X)
ε2
Ejemplo 3.10. Un fabricante de llantas quiere promover un intervalo de recorrido expresados en kilometros que
excluya no mas del 10% de los recorridos de las llantas que vende. Solamente se sabe que, para un gran numero
de llantas probadas, el recorrido medio fue de 60000 kilometros con una desviacion estandar de 12000 kilometros.
¿Que intervalo sugerirıa?
Solucion 25. Aplicacion del teorema de Tchebychev,
PX (|X−µ|< ε)> 1− V (X)
ε2
tenemos
111 Humberto Barrios. mail: [email protected]
3.4. FUNCIONES GENERADORAS DE MOMENTOS Universidad Popular del Cesar
PX (|X−60000|< ε)> 1− 144000000ε2 = 0.90
⇒ ε2−144000000 = 0.90ε
⇒ 0.1ε2 = 144000000
⇒ ε2 = 144000000/0.1
⇒ ε = 37947
En consecuencias el intervalo que excluye el 10% esta dado por
|X−60000|< 37947
Es decir,
22053≤ X ≤ 97947.
3.4. FUNCIONES GENERADORAS DE MOMENTOS
Definicion 3.9. Sea X una variable aleatoria. la funcion generadora de momento (fgm) de la variable aleatoria X,
denota por MX (t), se define por
MX (t) = E(etX )
Para todo valor de X para el cual el valor esperado existe.
Ejemplo 3.11. Sea X una variable aleatoria binomial con funcion de densidad de probabilidad
PX (X = x) =(
nx
)pxqn−x; x = 0,1,2, · · ·n y q = 1− p
Hallar la funcion generatriz de momento de X.
Solucion 26. Por definicion se tiene
MX (t) = E(etX )
=n
∑x=0
etx(
nx
)pxqn−x
=n
∑x=0
(nx
)(pet)xqn−x
= (pet +q)n
112 Humberto Barrios. mail: [email protected]
3.4. FUNCIONES GENERADORAS DE MOMENTOS Universidad Popular del Cesar
En este caso,MX (t) es definida para todo valor de t.
Ejemplo 3.12. Sea X una variable aleatoria exponencial con funcion de densidad de probabilidad
f (x) =
λe−λx, si x > 0
0, si x≤ 0
Hallar la funcion generatriz de momento de X.
Solucion 27. Por definicion se tiene
MX (t) = E(etX )
=∫
∞
0etx
λe−λxdx
=∫
∞
0λe(t−λ )xdx
=λ
t−λe(t−λ )x
∣∣∣∣∞0
=λ
t−λ[ lımx→∞
e(t−λ )x−1]
Note que este limite existe, y es igual a 0, solo si t−λ )< 0. Entonces para t < λ ,
MX (t) =λ
t−λ.
Teorema 3.7. Sea X una variable aleatoria con funcion generadora de momento dada por MX (t). Entonces
M(r)X (0) = E(X r)
Demostracion 12. Verifiquemos el teorema para una variable aleatoria continua X y para los casos cuando r = 1 y
r = 2. Para el caso de una variable aleatoria discreta y para un r arbitrario la demostracion es sencilla.
r = 1,
M(1)X (0) =
ddt
∫∞
−∞
etx f (x)dx∣∣∣∣t=0
=∫
∞
−∞
ddt
etx f (x)dx∣∣∣∣t=0
=∫
∞
−∞
xetx f (x)dx∣∣∣∣t=0
=∫
∞
−∞
xe0.x f (x)dx
=∫
∞
−∞
x f (x)dx = E(X)
113 Humberto Barrios. mail: [email protected]
3.4. FUNCIONES GENERADORAS DE MOMENTOS Universidad Popular del Cesar
r = 2,
M(2)X (0) =
d2
dt2
∫∞
−∞
etx f (x)dx∣∣∣∣t=0
=∫
∞
−∞
d2
dt2 etx f (x)dx∣∣∣∣t=0
=∫
∞
−∞
x2etx f (x)dx∣∣∣∣t=0
=∫
∞
−∞
x2e0.x f (x)dx
=∫
∞
−∞
x2 f (x)dx = E(X2)
Ejemplo 3.13. Sea X una variable aleatoria binomial definida sobre n ensayos. Usando la funcion generatriz de
momento encontrar :
1. E(X)
2. E(X2)
3. V (X)
Solucion 28. La funcion generatriz de momento de una variable aleatoria binomial con parametros n y p esta dada
por,
MX (t) = (pet +q)n
1. Derivando esta funcion y por el teorema anterior, tenemos
M′X (t) = npet(pet +q)n−1
⇒M′X (0) = E(X) = npe0(pe0 +q)n−1
⇒M′X (0) = E(X) = np(p+q)n−1
⇒M′X (0) = E(X) = np
2. Por otro lado tenemos,
M′′X (t) = np[et(pet +q)n−1 +(n−1)pet(pet +q)n−2]
⇒M′′X (0) = E(X2) = np[(p+q)n−1 +(n−1)p(p+q)n−2]
⇒M′′X (0) = E(X2) = np[1+(n−1)p]
⇒M′′X (0) = E(X2) = np+n(n−1)p2
114 Humberto Barrios. mail: [email protected]
3.4. FUNCIONES GENERADORAS DE MOMENTOS Universidad Popular del Cesar
3. Pero,
V (X) = E(X2)− (E(X))2
⇒V (X) = np+n(n−1)p2− (np)2
⇒V (X) = np+n2 p2−np2−n2 p2
⇒V (X) = np−np2 = npq
Ejemplo 3.14. Sea X una variable aleatoria exponencial. Usando la funcion generatriz de momento encontrar :
1. E(X)
2. E(X2)
3. V (X)
Solucion 29. La funcion generatriz de momento de una variable aleatoria exponencial parametro λ esta dada por,
MX (t) =λ
λ − t; t < λ
1. Derivando esta funcion y por el teorema anterior, tenemos
M′X (t) = λ (λ − t)−2
⇒M′X (0) = E(X) = λλ−2 = λ
−1
2. Por otro lado tenemos,
M′′X (t) = 2λ (λ − t)−3
⇒M′′X (0) = E(X) = 2λλ−3 = 2λ
−2
3. Pero,
V (X) = E(X2)− (E(X))2
⇒V (X) = 2λ−2− (λ−1)2 = 2λ
−2−λ−2 = λ
−2
115 Humberto Barrios. mail: [email protected]
3.4. FUNCIONES GENERADORAS DE MOMENTOS Universidad Popular del Cesar
Si la expansion de la serie de Taylor de la funcion generatriz Mx(t) de una variable aleatoria es conocida, entonces
E(X r) es simplemente el coeficiente de tr/r!. Es decir si el desarrollo en serie de Taylor alrededor de cero es,
MX (t) =∞
∑r=0
M(r)X (0)tr
r!
Entonces M(r)X (0) = E(X r).
Ejemplo 3.15. Sea X una variable aleatoria exponencial con funcion generatriz de momento dada por,
MX (t) =λ
λ − t; t < λ
Encontrar M(r)X (0) = E(X r)
Solucion 30. Puesto que
MX (t) =λ
λ − t=
11− t/λ
; 0 < t/λ < 1
Como MX (t) es la suma de la serie geometrica,
MX (t) =∞
∑r=0
(t/λ )r =1
1− t/λ
MX (t) =∞
∑r=0
1λ r tr =
∞
∑r=0
r!λ r
tr
r!
Por lo tanto,
M(r)X (0) = E(X r) =
r!λ r
Teorema 3.8. Sea X una variable aleatoria con funcion generadora de momento dada por MX (t) y Y = aX + b.
Entonces
MY (t) = ebtMX (at)
Teorema 3.9. Sean X y Y variables aleatorias para las cuales MX (t) = MY (t) para algun intervalo que contiene a
cero. Entonces
fX = fY .
Este es un resultado muy importante en la teorıa de la probabilidad y la estadıstica, pero la demostracion esta fuera
del alcance y los propositos de este curso.
116 Humberto Barrios. mail: [email protected]
3.5. EJERCICIOS Universidad Popular del Cesar
3.5. EJERCICIOS
1. Una urna contiene 4 bolas numeradas del 1 al 4 respectivamente. Para cada uno de los siguientes casos de-
termınese la funcion de probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor
esperado y varianza de las siguientes variables aleatorias:
a) Sea X el numero que ocurre si se saca de manera aleatoria una bola de la urna.
b) Sea X la suma que ocurre si se saca de manera aleatoria dos bola de la urna, sin reemplazo.
c) Sea X la suma que ocurre si se saca de manera aleatoria dos bola de la urna, con reemplazo.
d) Sea X la suma de los cuadrados que ocurre si se saca de manera aleatoria dos bola de la urna, con reem-
plazo.
2. En un salon de clase hay 10 estudiantes de ingenierıa, entre los cuales 3 tienen 19 anos, 4 tienen 20 anos, 1
tiene 21, 1 tiene 24, y 1 tiene 26 anos. De esta clase se seleccionan dos estudiantes sin reemplazo. Determınese
la funcion de probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor esperado y
varianza de la siguiente variable aleatoria: X la edad promedio de los dos estudiantes seleccionados.
3. Un borracho tiene cuatro llaves en su bolsillo. Llega a su casa a la una de la madrugada, como esta oscuro no
puede ver la llave de su puerta, por lo que prueba una por una, hasta encontrar la correcta. Determınese la funcion
de probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor esperado y varianza de la
siguiente variable aleatoria: X numero llaves que prueba (incluyendo la correcta) hasta abrir la puerta.
4. Sea una poblacion de tamano N = 5, la cual se compone de las edades de cinco ninos que son pacientes extremos
de una clınica de salud mental. Las edades son las siguientes: 6, 8, 10, 12, y 14. Determınese la funcion de
probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor esperado y varianza de la
siguiente variable aleatoria: X edad promedio de dos ninos seleccionados aleatoriamente cuando el muestreo se
realiza:
a) Con reemplazo.
b) Sin reemplazo.
c) Determines relaciones entre la media de la poblacion y el valor esperado de X .
5. En el municipio de Astrea se han detectado en los pozos de agua dos tipos de impurezas, se encontro que el 30%
de los pozos no revelan impureza alguna, el 45% tienen la impureza A y el 55% la impureza B. Naturalmente,
algunos tiene ambas impurezas. Si se escoge un pozo aleatoriamente del municipio de Astrea, determınese
la funcion de probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor esperado y
varianza de la siguiente variable aleatoria: X numero de impurezas encontradas en el pozo.
117 Humberto Barrios. mail: [email protected]
3.5. EJERCICIOS Universidad Popular del Cesar
6. Se sabe que un grupo de cuatro componentes contiene dos defectuosos. Un inspector prueba los componentes
uno por uno hasta encontrar los dos defectuosos. Una vez encontrado el segundo defectuoso, se concluye la
prueba, pero se prueba el segundo defectuoso como comprobacion. Sea X el numero de pruebas necesarias
hasta encontrar el segundo defectuoso. Encuentre la distribucion de probabilidad para X .
7. Considere una sistema de agua que fluye a traves de unas valvulas A a B (vease el diagrama). Las valvulas 1, 2
y 3 funcionan independientemente y cada una se abre correctamente mediante una senal con una probabilidad
de 0.8. encuentre la distribucion de probabilidad para X , el numero de vıas abiertas de A a B despues de haber
enviado la senal. (observe que X puede tomar los valores 0, 1 y 2 ).
8. En un problema de una prueba aplicada a ninos pequenos, se les pide que hagan corresponder cada uno de los
tres dibujos de animales con la palabra que identifica a ese animal. Si un nino asigna aleatoriamente las tres
palabras a los tres dibujos, determınese la funcion de probabilidad, funcion de distribucion acumulada, graficas
para las fdp y fda, valor esperado y varianza de la siguiente variable aleatoria: X , el numero de correspondencia
correctas.
9. Cinco pelotas numeradas, 1, 2, 3, 4 y 5 se encuentran en una urna. Se sacan dos pelotas de manera aleatoria de
las cinco, y se anotan sus numero. Determınese la funcion de probabilidad, funcion de distribucion acumulada,
graficas para las fdp y fda, valor esperado y varianza de las siguiente variables aleatorias:
a) El mayor de los numeros seleccionados.
b) La suma de los dos numeros seleccionados.
10. Una agencia de alquiler que arrienda equipo pesado por dıa se da cuenta que un equipo costoso es arrendado, en
promedio, solamente un dıa de cinco. Si el alquiler en un dıa es independiente del alquiler de cualquier otro dıa,
determınese la funcion de probabilidad, funcion de distribucion acumulada, graficas para las fdp y fda, valor
esperado y varianza de la siguiente variable aleatoria: X el numero de dıas entre dos alquileres.
11. Sea X una variable aleatoria con funcion de densidad dada por
f (x) =
0.2 si −1 < x≤ 0
0.2+ cx si 0 < x≤ 1
0 en otro caso
a) Determine el valor de c
b) Obtener F(x)
c) Graficar f (x) y F(x)
d) Utilizar F(x) de (b) para calcular F(−1), F(0) y F(1)
e) Calcular p(0≤ x≤ 0.5)
118 Humberto Barrios. mail: [email protected]
3.5. EJERCICIOS Universidad Popular del Cesar
f ) Calcular p(X > 0.5 | X > 0.1)
g) Calcular E(X), V (X) y σ .
12. Sea X una variable aleatoria con funcion de densidad dada por
f (x) =
c
26 x si 1 < x≤ 3
0 en otro caso
a) Determine el valor de c
b) Obtener F(x)
c) Graficar f (x) y F(x)
d) Utilizar F(x) de (b) para calcular F(−1), F(2) y F(2.5)
e) Calcular p(0≤ x≤ 1.5)
f ) Calcular p(X > 2.8 | X > 2.1)
g) Calcular E(X), V (X) y σ .
13. Sea X una variable aleatoria con funcion de densidad dada por
f (x) =
cx si 0≤ x≤ 1
0 en otro caso
a) Determine el valor de c.
b) Obtener F(x)
c) Graficar f (x) y F(x)
d) Utilizar F(x) de (b) para calcular F(0), F(1) y F(2)
e) Calcular p(0≤ x≤ 0.5)
f ) Calcular p(X > 0.5 | X > 0.1)
g) Calcular E(X), V (X) y σ .
14. El periodo de funcionamiento hasta su primera falla (en ciento de horas) para cierto transistor, es una variable
aleatoria X con funcion de distribucion acumulada dada por
F(x) =
0 si x < 0
1− e−x2x≥ 0
F(x) =
0, si x < 0;
1− e−x2, x≥ 0.
119 Humberto Barrios. mail: [email protected]
3.5. EJERCICIOS Universidad Popular del Cesar
a) Demostrar que F(x) cumple las propiedades de una funcion de distribucion acumulada.
b) Obtener f (x)
c) Calcular la probabilidad de que el transistor trabaje por lo menos durante 200 horas hasta tener su primera
falla.
d) Encontrar valor esperado y varianza para la variable aleatoria X .
15. Un vendedor de gasolina tiene un tanque de 150 galones que se llena al principio de cada semana. Su demanda
semanal tiene una frecuencia relativa que crece constantemente de cero hasta 100 galones y permanece constante
entre 100 y 150 galones. Si X denota la demanda semanal en ciento de galones, la frecuencia relativa se puede
representar por
f (x) =
x si 0≤ x≤ 1
1 1 < x≤ 1.5
0 en otra parte
a) Obtener F(x)
b) Graficar f (x) y F(x).
c) Calcular P(0≤ x≤ 0.5)
d) Calcular P(0.5≤ x < 1.2) .
e) Encontrar valor esperado y varianza para la variable aleatoria X .
16. El tiempo por semana que un estudiante de la UPC usa internet, es una variable aleatoria X , tiene como funcion
de densidad de probabilidad (medida en horas)
f (x) =
364 x2(4− x) si 0≤ x≤ 4
0, en otra parte
a) Hallar E(X) y V (X)
b) El costo que paga la UPC por hora para cada estudiante por usar internet es de $500. Calcular el valor
esperado y la varianza del costo semanal por estudiante.
c) ¿Rebasarıa con mucha frecuencia el valor del tiempo semanal los $2000? ¿Por que?
17. Se X una variable aleatoria que modela el movimiento de un gas uniforme en equilibrio, entonces
f (x) = ax2e−bx2, donde x > 0
Aquı, b = m/(2kT ), donde k es la constante Bolzmann, T es la temperatura absoluta y m denota la masa de la
molecula. Encontrar a, para que f sea una funcion de densidad de probabilidad de la variable aleatoria X .
120 Humberto Barrios. mail: [email protected]
3.5. EJERCICIOS Universidad Popular del Cesar
18. Supongamos que cierto paıs de la Comunidad Andina de Naciones la distribucion de los ingresos por familia se
puede modelar por una variable aleatoria X , con funcion de densidad de probabilidad dada por:
f (x) = xe−x, donde x > 0
donde x es dada en miles de dolares. Encontrar: el primer, segundo y tercer cuartil de la distribucion de los
ingresos de la variable aleatoria X . Esto es, encontrar los valores de x para los cuales F(x) = 0.25, F(x) = 0.50,
y F(x) = 0.75. De una interpretacion de estos resultados.
19. Demuestre que si X es una variable aleatoria y X ≥ 0. Entonces E(X)≥ 0.
20. Demuestre que |E(X)| ≤ E(|X |) para cualquiera variable aleatoria X .
21. Sea X una variable aleatoria tal que X ≥ 0. Demuestre que si E(X) = 0, entonces P(X = x) = 1.
22. Demuestre el teorema 5.1.
23. Demuestre que la funcion de distribucion acumulada de una variable aleatoria X distribuida uniformente esta
dada por la expresion 5.1.
24. Supongase que la variable aleatoria X esta distribuida uniforme en el intervalo (0,1).
a) Encontrar y graficar F(x)
b) Demuestre que P(a≤ x≤ a+b para a≥ 0, a+b≤ 1, depende solamente del valor de b.
25. Si un paracaidista cae en un sitio aleatorio demarcado por el segmento de lınea A y B. Encontrar la probabilidad
de que:
a) este mas cerca de A que de B
b) la distancia con respecto a A sea mas tres veces la distancia con respecto a B.
26. La variacion del nivel del agua del balneario Hurtado de un dıa al otro, medida en (cm) en un sitio especifico, es
una variable aleatoria X con la siguiente funcion de distribucion acumulada:
F(x) =
0, x < 0;
2x− x2, 0 < x < 1.
1, x > 1.
a) Obtener la funcion de distribucion acumulativa para la variable aleatoria X .
b) Obtener P(x > 1/2) y P(X > 3/4)
c) Hallar el valor esperado y la varianza de la variable aleatoria X :
121 Humberto Barrios. mail: [email protected]
3.5. EJERCICIOS Universidad Popular del Cesar
27. Sea X una variable aleatoria con funcion de probabilidad dada por
p(X = k) =λ ke−λ
k!
donde k=1, 2, 3 . . . . Demuestre que E(X)=λ y V (X)=λ .
28. Sea X una variable aleatoria geometrica con la probabilidad de tener exito igual a p.
a) Demuestre que para un entero positivo a,
P(X > a) = qa
b) Demuestre que para los enteros positivos a y b,
P(X > a+b|X > a) = qb = P(X > b)
29. Sea X una variable aleatoria con funcion de probabilidad dada por
p(X = k) =λ ke−λ
k!
donde k=1, 2, 3 . . . . Demuestre que E(X)=λ y V (X)=λ .
30. Sea X una variable aleatoria con funcion de densidad dada por
f (x) =
cx si 0≤ x≤ 1
0 en otro caso
a) Determine el valor de c.
b) Obtener F(x)
c) Graficar f (x) y F(x)
d) Utilizar F(x) de (b) para calcular F(0), F(1) y F(2)
e) Calcular p(0≤ x≤ 0.5)
f ) Calcular p(X > 0.5 | X > 0.1)
g) Calcular E(X), V (X) y σ .
31. El periodo de funcionamiento hasta su primera falla (en ciento de horas) para cierto transistor, es una variable
aleatoria X con funcion de distribucion acumulada dada por
F(x) =
0 si 0 < x
1− e−x2en otro caso
a) Demostrar que F(x) cumple las propiedades de una funcion de distribucion acumulada.
122 Humberto Barrios. mail: [email protected]
3.5. EJERCICIOS Universidad Popular del Cesar
b) Obtener f (x)
c) Calcular la probabilidad de que el transistor trabaje por lo menos durante 200 horas hasta tener su primera
falla.
d) Encontrar valor esperado y varianza para la variable aleatoria X .
32. Un vendedor de gasolina tiene un tanque de 150 galones que se llena al principio de cada semana. Su demanda
semanal tiene una frecuencia relativa que crece constantemente de cero hasta 100 galones y permanece constante
entre 100 y 150 galones. Si X denota la demanda semanal en ciento de galones, la frecuencia relativa se puede
representar por
f (x) =
x si 0≤ x≤
1 1 < x≤ 1.5
0 en otra parte
a) Obtener F(x)
b) Graficar f (x) y F(x).
c) Calcular P(0≤ x≤ 0.5)
d) Calcular P(0.5≤ x < 1.2) .
e) Encontrar valor esperado y varianza para la variable aleatoria X .
33. El tiempo por semana que un estudiante de la UPC usa internet, es una variable aleatoria X , tiene como funcion
de densidad de probabilidad (medida en horas)
f (x) =
364 x2(4− x) si 0≤ x≤ 4
0, en otra parte
a) Hallar E(X) y V (X)
b) El costo que paga la UPC por hora para cada estudiante por usar internet es de $500. Calcular el valor
esperado y la varianza del costo semanal por estudiante.
c) ¿Rebasarıa con mucha frecuencia el valor del tiempo semanal los $2000? ¿Por que?
34. Sea X una variable aleatoria definida en el intervalo [0,2] y funcion de densidad de probabilidad fX . Encontrar
la funcion generatriz de momento para X si:
a) fX (x) = 1/2
b) fX (x) = (1/2)x
c) fX (x) = 1− (1/2)x
123 Humberto Barrios. mail: [email protected]
3.5. EJERCICIOS Universidad Popular del Cesar
d) fX (x) = |1− x|
e) fX (x) = (3/8)x2
35. Para cada uno de las funciones de densidades del problema anterior calcular el primer y segundo momento
directamente de la definicion y verifique que M(0) = 1, M′(0) = E(X) y M′′(0) = E(X2).
36. Sea X una variable aleatoria definida en el intervalo [0,∞) y funcion de densidad de probabilidad fX . Encontrar
la funcion generatriz de momento para X si:
a) f X(x) = 2e−2x
b) fX (x) = e−2x +(1/2)e−x
c) fX (x) = 4xe−2x
d) fX (x) = λ (λx)n−1e−λx/(n−1)!
37. Para cada uno de las funciones de densidades del problema anterior calcular el primer y segundo momento
directamente de la definicion y verifique que M(0) = 1, M′(0) = E(X) y M′′(0) = E(X2).
38. Sea X una variable aleatoria distribuida uniformemente en el intervalo [0,1]. Encontrar en terminos de la funcion
generatriz de momento de X la funcion generatriz de momento de las siguientes variables aleatorias:
a) −X
b) 1+X
c) 3X
d) aX +b
39. Encuentre las distribuciones de probabilidades de la variable aleatoria X para cada una de las funciones gener-
adoras de momentos
a) M(t) =[
et+23
]5
b) M(t) = et
2−et
c) M(t) = e2(et−1)
40. Sea M(t) = et+2e2t+3e3t
6 . Encuentre lo siguiente:
a) E(X)
b) E(X2)
c) V (X)
d) La funcion de probabilidad de X .
41. Sea C(t) = lnM(t). Demuestre que C′(0) = µ. y C′′(0) = σ2
124 Humberto Barrios. mail: [email protected]
3.5. EJERCICIOS Universidad Popular del Cesar
42. Se X una variable aleatoria que modela el movimiento de un gas uniforme en equilibrio, entonces
f (x) = ax2e−bx2, donde x > 0
Aquı, b = m/(2kT ), donde k es la constante Bolzmann, T es la temperatura absoluta y m denota la masa de la
molecula. Encontrar a, para que f sea una funcion de densidad de probabilidad de la variable aleatoria X .
43. Supongamos que cierto paıs de la Comunidad Andina de Naciones la distribucion de los ingresos por familia se
puede modelar por una variable aleatoria X , con funcion de densidad de probabilidad dada por:
f (x) = xe−x, donde x > 0
donde x es dada en miles de dolares. Encontrar: el primer, segundo y tercer cuartil de la distribucion de los
ingresos de la variable aleatoria X . Esto es, encontrar los valores de x para los cuales F(x) = 0.25, F(x) = 0.50,
y F(x) = 0.75. De una interpretacion de estos resultados.
44. Demuestre que si X es una variable aleatoria y X ≥ 0. Entonces E(X)≥ 0.
45. Demuestre que |E(X)| ≤ E(|X |) para cualquiera variable aleatoria X .
46. Sea X una variable aleatoria tal que X ≥ 0. Demuestre que si E(X) = 0, entonces P(X = x) = 1.
47. Sea X una variable aleatoria con x1,x2, . . . ,xn valores diferentes: Demostrar que para cualquiera funcion g :
ℜ−→ℜ,
E(g(X)) =n
∑i=1
g(xi)Pg(xi)
donde Pg(x) = PX (X = x) es la funcion de probabilidad de la variable aleatoria g(X).
48. Una variable aleatoria X una funcion de densidad dada por:
f (x) =
2xa2 , si 0≤ x≤ a
0, en otra parte
Otra variable aleatoria Y toma el valor y, y = 0,1,2, . . . ,9 con probabilidad PY (Y = y) = PX (0.1ay < X <
0.1a(y+1)). Encontrar
a) PY (Y = y). Es decir, la funcion de probabilidad de X
b) E(Y )
c) E(Y 2)
d) V (Y )
125 Humberto Barrios. mail: [email protected]
3.5. EJERCICIOS Universidad Popular del Cesar
e) La cota de Tchebychev para la probabilidad PX (|X−E(X)| ≥ a/3) y compare con el valor exacto de PX .
f ) PY (Y = 8|Y > 7).
g) E(etx|X < a/2) y con esto demostrar que E(X |X < a/2) = a/3.
49. El voltaje a traves de un circuito electrico es una variable aleatoria X con funcion de densidad
f (x) =
e−(x−k), si x > k > 0
0, en otra parte
La resistencia del circuito esta fija en un valor conocido de Ω (ohms). Suponiendo que se cumple la ley de Ohm,
la cual afirma que la
corriente =volta je
resistencia
Encontrar la media y la varianza de la corriente a traves del circuito.
126 Humberto Barrios. mail: [email protected]
CAPITULO 4
DISTRIBUCIONES DISCRETAS
Algunos modelos de funciones de probabilidad ocurren con muchas frecuencias en el contexto de la estadısti-
ca teorica como aplicada, esto nos motiva al estudio en detalle de algunos modelos de probabilidad, los cuales han
demostrados ser util en el campo de las aplicaciones. A pesar de ello tales funciones de probabilidad presentan un
caracter teorico en el sentido en que son modelos que se deducen matematicamente con base en ciertos supuestos que
se suponen ciertos para los fenomenos aleatorios. La eleccion de un modelo de distribucion de probabilidad para rep-
resentar un fenomeno de interes practico debe estar motivada tanto por la compresion de la naturaleza del fenomeno en
sı, como por la posible verificacion de la distribucion seleccionada a traves de la evidencia empırica. En todo momento
antes de aplicar un modelo de funcion de frecuencia de probabilidad debe realizarse un analisis crıtico del problema
de investigacion.
En este capitulo, examinaremos con cierto rigor matematico algunos modelos de frecuencia de probabilidad disc-
retas, destacando ciertas aplicaciones de ellas.
4.1. Distribucion Binomial
Definicion 4.1. Sea X una variable aleatoria que representa el numero de exitos en n ensayos independiente, donde
la probabilidad de un exito es p y de un fracaso es q = 1− p, cada vez que el experimento se lleva acabo. Se dice
entonces que X tiene distribucion Binomial con funcion de probabilidad dada por:
PX (X = x) =
(
nx
)pxqn−x, donde x = 0,1,2, · · ·n y q = 1− p
0, en otro caso
Si una variable aleatoria X que tiene una distribucion binomial con parametros n y p, notaremos X ∼ B[n, p].
La probabilidad que una variable aleatoria X sea menor o igual a un valor determinado x0, se especifica por la funcion
de distribucion acumulada,
127
4.1. DISTRIBUCION BINOMIAL Universidad Popular del Cesar
F(x0) = PX (X ≤ x0) =x0
∑x=0
(nx
)pxqn−x
Ejemplo 4.1. Supongase que el 20% de los artıculos producidos por una fabrica son defectuosos. Si se selecciona
una muestra aleatoria simple con reemplazo de tamano 10.
1. Determine la funcion de probabilidad y la funcion de distribucion acumulada de la variable aleatoria, numero
de artıculos defectuosos en la muestra.
2. ¿Cual es la probabilidad de que exactamente tres artıculos son defectuosos entre los 10 seleccionados?
3. ¿Cual es la probabilidad de que 4 o mas artıculos son defectuosos entre los 10 seleccionados?
4. ¿Cual es la probabilidad de rechazar el lote de 10 artıculos si se tienen tres o mas artıculos son defectuosos?
Solucion
Sea X la variable aleatoria que representa el numero de artıculos defectuosos en la muestra seleccionada.
1. Para n = 10 y p = 0.2, entonces la funcion de probabilidad de esta dada por:
PX (X = x) =(
10x
)0.2x0.810−x,donde x = 0,1,2, · · ·n y q = 1− p
y la funcion de distribucion acumulada
F(x0) = PX (X ≤ x0) =10
∑x=0
(10x
)0.2x0.810−x
Las cuales tambien se puede representar mediante la siguiente tabla.
X = x PX (X = x) F(x0)
0 0.1074 0.1074
1 0.2684 0.3758
2 0.3020 0.6778
3 0.2013 0.8791
4 0.0881 0.9672
5 0.0264 0.9936
6 0.0055 0.9998
7 0.0008 0.9999
8 0.0001 1
9 0.0000 1
128 Humberto Barrios. mail: [email protected]
4.1. DISTRIBUCION BINOMIAL Universidad Popular del Cesar
2. La probabilidad de que exactamente tres artıculos son defectuosos entre los 10 seleccionados es:
PX (X = 4) = 0.2013.
3. La probabilidad de que 4 o mas artıculos son defectuosos entre los 10 seleccionados es:
PX (X ≥ 4) = 1−F(3)
= 1−0.8791 = 0.1209.
4. La probabilidad de rechazar el lote de 10 artıculos si se tienen tres o mas artıculos son defectuosos es
PX (X ≥ 3) = 1−PX (X ≤ 2)
= 1−0.6778 = 0.3222.
Teorema 4.1. Sea una variable aleatoria X que tiene una distribucion binomial con parametros n y p. Entonces
1. ∑nx=0(n
x
)pxqn−x = 1
2. E(X) = np
3. V (X) = npq
4. MX (t) = (pet +q)n
Demostracion 13.
1. Debemos demostrar que∞
∑x=0
PX (x) = 1
Por definicion y el teorema del Binomio de Netown, entonces
∞
∑x=0
PX (x) =n
∑x=0
(nx
)pxqn−x
= (p+q)n = 1
129 Humberto Barrios. mail: [email protected]
4.1. DISTRIBUCION BINOMIAL Universidad Popular del Cesar
2. Por la definicion de valor esperado para una variable aleatoria discreta,
E(X) =∞
∑x=0
xPX (x)
=n
∑x=0
x(
nx
)pxqn−x
=n
∑x=0
xn!(n− x)!x!
pxqn−x
=n
∑x=1
xn!(n− x)!(x−1)!
pxqn−x
=n−1
∑y=0
n(n−1)!(n− (y+1))!y!
py+1qn−(y+1)
=n−1
∑y=0
n(n−1)!(n−1)− y)!y!
py+1q(n−1)−y
= npn−1
∑y=0
(n−1)!(n−1)− y)!y!
pyq(n−1)−y
= np(p+q)n−1 = np
3. Para calcular la varianza de la variable aleatoria X, hallemos el segundo momento, es decir:
E(X2) =∞
∑x=0
x2PX (x)
=n
∑x=0
x2(
nx
)pxqn−x
=n
∑x=0
x2n!(n− x)!x!
pxqn−x
=n
∑x=1
xn!(n− x)!(x−1)!
pxqn−x
=n−1
∑y=0
n(n−1)(y+1)!(n− (y+1))!y!
py+1qn−(y+1)
= npn−1
∑y=0
(n−1)!(y+1)(n−1)− y)!y!
pyq(n−1)−y
= np[n−1
∑y=0
y(n−1)!(n−1)− y)!y!
pyq(n−1)−y
+n−1
∑y=0
(n−1)!(n−1)− y)!y!
pyq(n−1)−y]
Por lo tanto
E(X2) = np[np+q] = n2 p2 +npq
130 Humberto Barrios. mail: [email protected]
4.2. DISTRIBUCION POISSON Universidad Popular del Cesar
Puesto que V (X) = E(X2)− [E(X)]2), se tiene que
V (X) = E(X2)− [E(X)]2) = n2 p2 +npq−n2 p2 = npq
4. En el capitulo anterior se encontro la funcion generatriz de una variable aleatoria binomial.
En el ejemplo anterior, el numero de artıculos defectuosos que esperamos esten en el lote de 10 es:
E(X) = np = 10(0.20) = 2.
4.2. Distribucion Poisson
Definicion 4.2. Sea X una variable aleatoria que representa el numero de eventos independientes sobre el tiempo o
el espacio. Se dice entonces que tiene distribucion Poisson con funcion de probabilidad dada por:
PX (X = x) =
λ xe−λ
x! donde x = 0,1,2, · · ·
0, en otro caso
Donde λ es el numero promedio de resultados posibles por unidad de tiempo o espacio y e = 2.71828 . . ..
Si una variable aleatoria X que tiene una distribucion Poisson con parametro λ , notaremos X ∼ P[λ ].
La probabilidad que una variable aleatoria sea menor o igual a un valor determinado x0, se especifica por la funcion
de distribucion acumulada,
F(x0) = PX (X ≤ x0) =x0
∑x=0
λ xe−λ
x!
Ejemplo 4.2. El numero de componentes que fallan antes de cumplir 100 horas de operacion es un variable aleatoria
de Poisson. Si el numero promedio de esta es ocho:
1. Hallar la funcion de probabilidad y distribucion acumulada para los primeros 6 valores de la variable aleatoria
X que falle un componentes en 25 horas.
2. Cual es la probabilidad de que falle un componentes en 25 horas?
3. Cual es la probabilidad de que fallen no mas de dos componentes en 50 horas?
4. Cual es la probabilidad de que fallen por lo menos diez componentes en 125 horas?
131 Humberto Barrios. mail: [email protected]
4.2. DISTRIBUCION POISSON Universidad Popular del Cesar
Solucion
Sea X la variable aleatoria que representa el numero componentes que fallan antes de cumplir 100 horas en la muestra
seleccionada. Si el numero promedio en la 100 horas es λ = 8. Entonces
1. Para 25 horas esperamos λ = 2, entonces la funcion de probabilidad de X esta dada por:
PX (X = x) =2xe−2
x!; donde x = 0,1,2, · · ·
Por lo tanto en la siguiente tabla se muestra la funcion de probabilidad y distribucion acumulada para los primero
6 valores de la variable aleatoria X
X = x PX (X = x) F(x)
0 0.1353 0.1353
1 0.2707 0.4060
2 0.2707 0.6767
3 0.1804 0.8571
4 0.0902 0.9473
5 0.0361 0.9834
2. La probabilidad de que falle un componentes en 25 horas es:
PX (X = 1) =2xe−2
x!= 0.2707
3. Para 50 horas esperamos λ = 4, entonces la funcion de probabilidad de X esta dada por:
PX (X = x) =4xe−4
x!; donde x = 0,1,2, · · ·
En consecuencias, la probabilidad de que fallen no mas de dos componentes en 50 horas es:
PX (X ≤ 2) = 0.0183+0.0733+0.1465
= 0.2381.
4. Para 125 horas esperamos λ = 10, entonces la funcion de probabilidad de X esta dada por:
PX (X = x) =10xe−10
x!; donde x = 0,1,2, · · ·
Por lo tanto en la siguiente tabla se muestra la funcion de probabilidad y la funcion de distribucion acumulada
para los primeros 10 valores de X
132 Humberto Barrios. mail: [email protected]
4.2. DISTRIBUCION POISSON Universidad Popular del Cesar
X = x PX (X = x) F(x)
0 0 0.0000
1 0.0005 0.0005
2 0.0023 0.0028
3 0.0076 0.0103
4 0.0189 0.0293
5 0.0378 0.0671
6 0.0631 0.1301
7 0.0901 0.2202
8 0.1126 0.3328
9 0.1251 0.4579
En consecuencias, la probabilidad de que fallen por lo menos 10 componentes en 125 horas es:
PX (X ≥ 10) = 1−PX (X ≤ 9) = F(10)
= 1−0.4579 = 0.5421.
Teorema 4.2. Sea una variable aleatoria X que tiene una distribucion Poisson con parametro λ . Entonces
1. ∑∞x=0
λ xe−λ
x! = 1
2. E(X) = λ
3. V (X) = λ
4. MX (t) = eλ (et−1)
Demostracion 14. Para demostrar el teorema es suficiente considerar el desarrollo en serie de Taylor de eλ , es decir,
eλ =∞
∑x=0
λ x
x!
Los detalles debe elaborarlo el estudiante como un ejercicio.
La distribucion de Poisson tambien es una forma limite de la distribucion Binomial. Este resultado se demuestra en el
siguiente teorema.
133 Humberto Barrios. mail: [email protected]
4.2. DISTRIBUCION POISSON Universidad Popular del Cesar
Teorema 4.3. Sea una variable aleatoria que tiene una distribucion Binomial, con parametros n y p. Entonces
lımn→∞
(nx
)pxqn−x =
λ xe−λ
x!
Donde λ = np.
Demostracion 15. Comencemos escribiendo la funcion de densidad de la probabilidad binomial en terminos de λ :
lımn→∞
(nx
)pxqn−x = lım
n→∞
(nx
)(λ
n
)x(1− λ
n
)n−x
= lımn→∞
n!(n− x)!x!
λx(
1nx
)(1− λ
n
)−x(1− λ
n
)n
(4.1)
Pero sabemos que
lımn→∞
(1− λ
n
)n
= e−λ (4.2)
Por otro lado notese,
n!(n− x)(n−λ )x =
n(n−1)(n−2) · · ·(n− x+1)(n−λ )(n−λ )(n−λ ) · · ·(n−λ )
Ası, dividiendo por n y tomado limite a la anterior expresion,
lımn→∞
n!(n− x)(n−λ )x = lım
n→∞
1(1−λ/n)
lımn→∞
1−1/n(1−λ/n)
lımn→∞
(1−2/n)(1−λ/n)
· · · lımn→∞
(1− (x−1)/n)(1−λ/n)
= 1 (4.3)
Reemplazando 4.3 y 4.2 en 4.1 se obtiene lo que se desea demostrar.
En la tabla siguiente se comparan las probabilidades binomial y de Poisson
134 Humberto Barrios. mail: [email protected]
4.3. DISTRIBUCION GEOMETRICA Universidad Popular del Cesar
X = x(100
x
)(0.01)x(0.99)100−x 1xe−1
x!
0 0.366032 0.367879
1 0.369730 0.367879
2 0.184865 0.183940
3 0.060999 0.061313
4 0.014941 0.015328
5 0.002897 0.003065
6 0.000463 0.000510
7 0.000062 0.000072
8 0.000007 0.000009
9 0.000000 0.000001
10 0.000000 0.000000
4.3. Distribucion Geometrica
Definicion 4.3. Sea X una variable aleatoria que representa el numero de pruebas necesarias hasta obtener el primer
exito, donde cada prueba es independiente y la probabilidad de un exito es p y de un fracaso es 1− p, cada vez que el
experimento se lleva acabo. Se dice entonces que X tiene distribucion Geometrica con funcion de probabilidad dada
por:
PX (X = x) =
pqx−1, donde x = 1,2,3, · · · y q = 1− p
0, en otro caso
Si una variable aleatoria X que tiene una distribucion geometrica con parametro p, notaremos X ∼ G[p].
La probabilidad que una variable aleatoria X sea menor o igual a un valor determinado x0, se especifica por la funcion
de distribucion acumulada,
F(x0) = PX (X ≤ x0) =x0
∑x=1
pqx−1
Teorema 4.4. Sea una variable aleatoria X que tiene una distribucion Poisson con parametro p. Entonces
1. ∑∞x=1 pqx−1 = 1
2. E(X) = 1p
3. V (X) = 1−pp2
4. MX (t) =pet
1−(1−p)et
135 Humberto Barrios. mail: [email protected]
4.3. DISTRIBUCION GEOMETRICA Universidad Popular del Cesar
Demostracion 16. Las pruebas de (a), (b) y (d) las dejaremos como ejercicios. Demostremos (c) teniendo en cuenta
la siguiente igualdad:
E(X2) = E(X(X−1))+E(X)
Por definicion,
E(X(X−1)) =∞
∑x=1
x(x−1)PX (x)
Ası que
E(X(X−1)) =∞
∑x=1
x(x−1)pqx−1 = pq∞
∑x=2
x(x−1)pqx−2
si y = x−1, entonces
E(X(X−1)) =pq∞
∑y=1
(y+1)yqy
=pq∞
∑y=1
(y+1)yqy−1 = pqd2
dq2
(∞
∑y=1
qy+1)
=pqd2
dq2
(q2
∞
∑y=1
qy−1)
pero la serie
∞
∑y=0
qy =1
1−q
esto conduce a la ecuacion
E(X(X−1)) = pqd2
dq2
(q2
1−q
)
derivando dos veces a E(X(X−1)) con respecto a q, tenemos
E(X(X−1)) =2qp2
Puesto que E(X2) = E(X(X−1))+E(X) entonces
E(X2) =2qp2 +
1p=
2q+ pp2
136 Humberto Barrios. mail: [email protected]
4.3. DISTRIBUCION GEOMETRICA Universidad Popular del Cesar
Ası,
V (X) =2q+ p
p2 − 1p2 =
1− pp2
Ejemplo 4.3. Supongase que el 10% de los motores fabricados en determinada lınea de montaje son defectuosos. Si
se seleccionan aleatoriamente los motores, uno a la vez, para su prueba. Calcular las siguientes probabilidades:
1. El primer motor defectuoso se encuentre en el segundo intento.
2. El primer motor defectuoso se encuentre en el quinto intento.
3. El primer motor defectuoso se encuentre en o antes del quinto intento.
4. Calcular el promedio y la varianza del numero de la inspeccion en la cual se encuentre en el primer motor
defectuoso.
Solucion
Sea X la variable aleatoria numero intentos hasta tener el primer motor defectuoso, es claro que esta es una variable
aleatoria con distribucion Geometrica con parametro p = 0.10. Por lo tanto, la funcion de probabilidad es
PX (X = x) = (0.1)(0.9)x−1, donde x = 1,2,3, · · · y q = 1− p
En la siguiente tabla se muestra la funcion de probabilidad y funcion de distribucion acumulada para los primeros 10
valores de la variable aleatoria X
X = x PX (X = x) F(x)
1 0.0900 0.1900
2 0.0810 0.2710
3 0.0729 0.3439
4 0.0656 0.4095
5 0.0590 0.4686
6 0.0531 0.5217
7 0.0478 0.5695
8 0.0430 0.6126
9 0.0387 0.6513
10 0.0349 0.6862
Por lo tanto
1. La probabilidad que el primer motor no defectuoso se encuentre en el segundo intento,
PX (X = 2) = (0.1)(0.9)2−1 = 0.0810
137 Humberto Barrios. mail: [email protected]
4.4. DISTRIBUCION BINOMIAL NEGATIVA Universidad Popular del Cesar
2. La probabilidad que el primer motor no defectuoso se encuentre en el quinto intento,
PX (X = 5) = (0.1)(0.9)5−1 = 0.0590
3. La probabilidad que el primer motor no defectuoso se encuentre en o antes del quinto intento,
F(5) = PX (X ≤ 5) =5
∑x=1
(0.1)(0.9)x−1 = 0.4686
4. El promedio y la varianza del numero de la inspeccion en la cual se encuentre en el primer motor no defectuoso
son:
E(X) =1p=
10.1
= 10
y
V (X) =1− p
p2 =0.9
(0.1)2 = 90
respectivamente.
4.4. Distribucion Binomial Negativa
Definicion 4.4. Sea X una variable aleatoria Binomial con probabilidad de exito p y donde X, es el numero de pruebas
necesarias hasta obtener exactamente r exitos. En este caso, se dice que la variable aleatoria X tiene distribucion
Binomial Negativa con funcion de probabilidad dada por:
PX (X = x) =
(x−1r−1
)prqx, donde
x = r,r+1,r+2, · · ·
r = 1,2,3, · · ·
0≤ p≤ 1 y q = 1− p
0, en otro caso
Si una variable aleatoria X que tiene una distribucion binomial negativa con parametros r y p, en donde r no se
requiere que sea un entero positivo, notaremos X ∼ BN[r, p].
La probabilidad que una variable aleatoria X sea menor o igual a un valor determinado x0, se especifica por la funcion
de distribucion acumulada,
F(x0) = PX (X ≤ x0) =x0
∑x=0
(x−1r−1
)prqx
138 Humberto Barrios. mail: [email protected]
4.4. DISTRIBUCION BINOMIAL NEGATIVA Universidad Popular del Cesar
Teorema 4.5. Sea una variable aleatoria X que tiene una distribucion binomial negativa con parametros r y p.
Entonces
1. ∑∞x=0(x−1
r−1
)prqx = 1
2. E(X) = rp
3. V (X) = r(1−p)p2
4. MX (t) =[
pet
1−qet
]r
Teorema 4.6. Sea X una variable aleatoria que tiene una distribucion Binomial Negativa con parametros r y p.
Entonces
FBN(x) = PX (X ≤ x) = 1−FB(y) = PY (Y ≥ y)
en donde Y es una variable aleatoria Binomial con parametros n = r+ x y p.
Ejemplo 4.4. Una empresa de reclutamiento encuentra que el 30% de los aspirantes para determinado puesto en la
industria tiene conocimiento avanzado de programacion. Supongase que se tienen tres puestos en los que se necesitan
conocimientos avanzados de programacion.
1. Encontrar la funcion de probabilidad de la variable aleatoria, numero de aspirantes hasta obtener tres que
tengan conocimiento avanzado en programacion.
2. Se entrevistan uno a uno los solicitantes, calcular la probabilidad de encontrar un aspirante en la quinta entre-
vista.
Solucion
Supongase que las entrevistas son independientes, y que la probabilidad de encontrar un candidato con conocimiento
avanzado de programacion es 0.3, la cual permanece constante de prueba en prueba. Sea X , numero de aspirantes
hasta obtener tres que tengan conocimiento avanzado en programacion. Entonces se puede inferir que X , numero de
aspirantes hasta obtener tres que tengan conocimiento avanzado en programacion.
1. Entonces se puede concluir que X tiene una distribucion Binomial Negativa, ası que la funcion de probabilidad
es:
PX (X = x) =(
x−12
)(0.3)3(0.7)x−1, r = 3,4,5, · · · ,12
En la siguiente tabla se muestra la funcion de probabilidad y funcion de distribucion acumulada para los primeros
10 valores de la variable aleatoria X
139 Humberto Barrios. mail: [email protected]
4.5. DISTRIBUCION HIPERGEOMETRICA Universidad Popular del Cesar
X = x PX (X = x) F(x)
3 0.0920 0.0920
4 0.0970 0.1890
5 0.0950 0.2840
6 0.0890 0.3730
7 0.0800 0.4530
8 0.0700 0.5820
9 0.0590 0.6320
10 0.0500 0.6820
11 0.0410 0.7230
12 0.0340 0.7570
2. De la tabla anterior observamos que
PX (X = 5) =(
42
)(0.3)3(0.7)4 = 0.0950
4.5. DISTRIBUCION HIPERGEOMETRICA
Definicion 4.5. Sea N el numero total de objetos en una poblacion finita, de manera tal que R de estos son de tipo
A y N −R - de tipo B. Si se selecciona una muestra aleatoria simple sin reemplazo n objetos de la poblacion. La
probabilidad que exactamente X sean de tipo A, esta dado por la funcion de probabilidad Hipergeometrica.
PX (X = x) =
(R
x)(N−Rn−x )
(Nn)
, si x = 0,1,2, · · · ,n.
0, en otro caso
y donde x≤ R yn− x≤ N−R.
Los parametros de la distribucion Hipergeometrica son N, n y R.
La probabilidad que una variable aleatoria Hipergeometrica X sea menor o igual a un valor determinado x0 ,se especi-
fica por la funcion de distribucion acumulada,
F(x0) = PX (X ≤ x0) =x0
∑x=0
(Rx
)(N−Rn−x
)(Nn
)Teorema 4.7. Sea una variable aleatoria X que tiene una distribucion Hipergeometrica con parametros N, n y R.
Entonces
1. ∑nx=0
(Rx)(
N−Rn−x )
(Nn)
= 1
140 Humberto Barrios. mail: [email protected]
4.5. DISTRIBUCION HIPERGEOMETRICA Universidad Popular del Cesar
2. E(X) = n RN
3. V (X) = n RN (1−
RN )(
N−nN−1 )
4. MX (t) = (pet +q)n
Ejemplo 4.5. Supongase que se tienen 50 representantes de cierta region del paıs, a una convencion polıtica nacional,
de los cuales 20 apoyan al candidato A y 30 al candidato B. Si se seleccionan aleatoriamente 10 representantes. Cual
es la probabilidad que entre estos 10:
1. Exactamente 5 apoyen al candidato A
2. Por lo menos apoyen al candidato A
3. Entre dos y cinco inclusive apoyen al candidato A
4. Cuantos representantes esperamos apoyen al candidato A
5. Con que variabilidad se espera que los representantes apoyen al candidato A.
Solucion
Sea X una variable aleatoria que representa el numero de representantes que apoyen al candidato A; con parametros
N = 50, n = 10 y R = 20. Entonces la funcion de probabilidad para la variable aleatoria X es
PX (X = x) =
(30x
)( 2010−x
)(Nn
) , si x = 0,1,2, · · · ,10.
Por lo tanto en la siguiente tabla se muestra la funcion de probabilidad y distribucion acumulada para valores de la
variable aleatoria X
X = x PX (X = x) F(x)
0 0.0029 0.0029
1 0.0279 0.0308
2 0.1083 0.1390
3 0.2259 0.3650
4 0.2801 0.6450
5 0.2151 0.8601
6 0.1034 0.9635
7 0.0306 0.9942
8 0.0053 0.9995
9 0.0005 1.0000
10 0.0000 1.0000
141 Humberto Barrios. mail: [email protected]
4.5. DISTRIBUCION HIPERGEOMETRICA Universidad Popular del Cesar
Las respuestas para las preguntas:
1. Exactamente 5 apoyen al candidato A:
PX (X = 5) = 0.2801
2. Por lo menos dos apoyen al candidato A:
PX (X ≥ 2) = 1−F(1) = 1−0.0308 = 0.9692
3. Entre dos y cinco inclusive apoyen al candidato A:
PX (2≤ X ≤ 5) = (0.1083+0.2259+0.2259+0.2801) = 0.8402
4. Cuantos representantes esperamos apoyen al candidato A:
E(X) = 10(30/50) = 6
5. Con que variabilidad se espera que los representantes apoyen al candidato A:
V (X) = 102050
(1− 20
50
)(50−1050−1
)= 1.6271
.
La distribucion de Binomial tambien es una forma limite de la distribucion Hipergeometrica. Este resultado se de-
muestra en el siguiente teorema.
Teorema 4.8. Sea X una variable aleatoria que tiene una distribucion Hipergeometrica con parametros N , n y R .
Entonces
lımN→∞
(Rx
)(N−Rn−x
)(Nn
) =
(nx
)pxqn−x
Donde p = R/N.
Demostracion 17. La prueba se deja como un ejercicio.
La funcion de distribucion Binomial aproxima de manera adecuada a la funcion de probabilidad Hipergeometrica si
n < 0.1N.
En la siguiente tabla se comparan los valores de probabilidad de una Binomial como limite de una funcion de proba-
bilidad Hipergeometrica, con N = 1000, n = 10 y R = 50.
142 Humberto Barrios. mail: [email protected]
4.6. EJERCICIOS Universidad Popular del Cesar
X = x Hipergeometrica Binomial
0 0.0009 0.0010
1 0.0095 0.0098
2 0.0434 0.0439
3 0.1168 0.1172
4 0.2057 0.2051
5 0.2473 0.2461
6 0.2057 0.2051
7 0.1168 0.1172
8 0.0434 0.0439
9 0.0095 0.0098
10 0.0009 0.0010
4.6. EJERCICIOS
1. Demuestre las siguientes igualdades:
a)(
n+ r−1r−1
)=
(n+ r−1
n
)b)(
n+ r−1n
)= (−1)n
(−rn
)2. En la Universidad Popular del Cesar se ha observado que el 60% de los estudiantes que se matriculan lo hacen
en una carrera de Ciencias, mientras que el otro 40% lo hacen en carreras de Humanidades. Si un determinado
dıa se realizan 20 matrıculas, calcular la probabilidad de que:
a) haya igual numero de matrıculas en Ciencias y en Humanidades;
b) el numero de matrıculas en Ciencias sea menor que en Humanidades;
c) haya al menos 8 matrıculas en Ciencias
d) no haya mas de 12 matrıculas en Ciencias.
e) Si las cinco primeras matrıculas son de Humanidades, calcular la probabilidad de que:
1) total haya igual numero de matrıculas en Ciencias y en Humanidades
2) en total haya al menos 6 en Ciencias mas que en Humanidades.
3. Para un experimento medico se requieren cinco mujeres que hayan tenido seis o mas partos. La proporcion de
mujeres adultas con esa caracterıstica es 0.25. Suponga que se toma una muestra de mujeres adultas y sea N el
numero de mujeres adultas que es necesario entrevistar para encontrar las cinco buscadas.
a) ¿Cual es el modelo apropiado para la distribucion de N?
143 Humberto Barrios. mail: [email protected]
4.6. EJERCICIOS Universidad Popular del Cesar
b) ¿Cual es la probabilidad de que en diez o menos intentos se encuentren las cinco mujeres?
4. Un complejo sistema electronico esta construido con cierto numero de componentes de apoyo en sus subsis-
temas. Un subsistemas contiene cuatro componentes identicas, cada uno con probabilidad de 0.2, de fallar en
menos de 1.000 horas. El subsistemas funciona si dos componentes cualesquiera de los cuatro trabajan en forma
adecuada. Se supone que los componentes operan independientemente.
a) Encuentre la probabilidad de que exactamente dos de cuatro componentes resistan mas de 1.000 horas.
b) Encuentre la probabilidad de que de que el subsistema funcione por mas de 1.000 horas.
5. La probabilidad de que un enfermo se recupere de un padecimiento gastrico es 0.8. Supongase que 20 personas
han contraıdo tal afeccion.
a. ¿Cual es la probabilidad de que sobrevivan exactamente 14?
b. ¿Cual es la probabilidad de que al menos 10 sobrevivan?
c. ¿Cual es la probabilidad de que al menos 14, pero no mas de 18 sobrevivan?
d. ¿Cual es la probabilidad de que al lo mas 16 sobrevivan?
e. Si 100 personas han contraigo la afeccion gastrica. ¿Cuantos esperamos que sobrevivan?
6. Un examen de seleccion multiple esta compuesto de 15 preguntas, con cinco respuestas posibles cada una, de
las cuales una es correcta. Supongase que uno de los estudiantes que realiza el examen responde las preguntas
al azar. ¿Cual es la probabilidad de que conteste correctamente al menos 10 preguntas?
7. Un sistema de proteccion contra cohetes esta construido con n unidades de radar que funcionan independien-
temente, cada una con probabilidad de 0.9 de detectar un cohete que ingrese en la zona que cubren todas las
unidades.
a) Si n= 5 y un cohete entra en la zona. ¿Cual es la probabilidad de que exactamente cuatro unidades detecten
el cohete?
b) Si n = 5 y un cohete entra en la zona. ¿Cual es la probabilidad de que al menos una unidades detecten el
cohete?
c) ¿Cual debe ser el valor de n para que la probabilidad de detectar el cohete al entrar a la zona, sea de 0.999?
8. Un fabricante de cera para pisos desarrolla dos productos nuevos, A y B, que desea someter a la evolucion de
amas de casa para determinar cual es la mejor. Las dos ceras, A y B, se aplica en los pisos de 15 casas. Se supone
que en realidad no hay diferencia en calidad entre las dos marcas.
a) ¿Cual es la probabilidad de que 10 o mas amas de casa vayan a preferir la marca A?
b) ¿Cual es la probabilidad de que 10 o mas amas de casa vayan a preferir la marca A o B?
144 Humberto Barrios. mail: [email protected]
4.6. EJERCICIOS Universidad Popular del Cesar
9. De cada 2.000 tornillos fabricados por una determinada maquina hay 2 defectuosos. Para realizar el control de
calidad se observan 150 tornillos y se rechaza el lote si el numero de defectuosos es mayor que 1. Calcular la
probabilidad de que el lote sea rechazado.
10. En pruebas realizadas a un amortiguador para automovil se encontro que el 20% presentaban fuga de aceite. Si
se instalan 20 de estos amortiguadores, hallar la probabilidad de que:
a) 4 salgan defectuosos,
b) mas de 5 tengan fuga de aceite.
c) de 3 a 6 amortiguadores salgan defectuosos.
d) Determine el promedio y la desviacion estandar de amortiguadores con defectos.
11. Un ingeniero que labora en el departamento de control de calidad de una empresa electrica, inspecciona una
muestra al azar de 10 alternadores de un lotes. Si el 15% de los alternadores del lote estan defectuosos. Cual es
la probabilidad de que en la muestra,
a) ninguno este defectuoso,
b) uno salga defectuoso,
c) al menos dos salgan defectuosos
d) mas de tres esten con defectos
12. En un almacen en particular los clientes llegan al mostrador de caja, conforme una distribucion de Poisson con
un promedio de siete por hora. En una hora dada.
a) ¿Cual es la probabilidad de que no lleguen mas de tres clientes?
b) ¿Cual es la probabilidad de que lleguen al menos dos clientes?
c) ¿Cual es la probabilidad de que lleguen exactamente cinco clientes?
13. El numero de componentes que fallan antes de cumplir 100 horas de operacion es una variable aleatoria de
Poisson. Si el numero promedio de estas es ocho:
a) ¿Cual es la probabilidad de que falle una componente en 25 horas?
b) ¿Cual es la probabilidad de que fallen no mas de dos componentes en 50 horas?
c) ¿Cual es la probabilidad de que falle por lo menos diez componentes en 125 horas?
14. Mediante estudios reciente se ha determinado que la probabilidad de morir por causa de cierta vacuna para la
gripe es de 0.00002. Si se administra la vacuna a 100.000 personas y si suponemos que esta constituyen un
conjunto de ensayos independientes:
a) ¿Cual es la probabilidad de que mueran no mas de dos personas a causa de la vacuna?
145 Humberto Barrios. mail: [email protected]
4.6. EJERCICIOS Universidad Popular del Cesar
b) ¿Cual es la probabilidad de que mueran exactamente cinco de las personas a causa de la vacuna?
c) ¿Cual es la probabilidad de que mueran ninguna de las personas a causa de la vacuna?
d) ¿Cuantas personas esperamos se mueran, de las 100.000, a causa de la vacuna?
15. Sea X una variable aleatoria binomial. Para n = 20, calcular las probabilidades puntuales binomiales y com-
pararlas con las correspondientes probabilidades de Poisson para p =0.5, 0.3, 0.1 y 0.01. (Sugerencia: haga
λ = np)
16. Las lıneas telefonicas que entran a una oficina de reservaciones de aerolıneas estan ocupadas un 60% del tiempo.
a) Si usted habla en esa oficina, ¿cual es la probabilidad que le respondan en la primera llamada? ¿En la
segunda? ¿En la tercera?
b) Si usted y un amigo deben hacer llamadas separadas a esta oficina, ¿cual es la probabilidad de que deban
hacer un total de cuatro intentos para lograr las dos llamadas?
17. Un electrodomestico se vende en dos colores, blanco y cafe, y tiene igual demanda. Un vendedor tiene tres
electrodomesticos de cada color en existencia, aunque esto no lo saben los clientes. Dichos clientes llegan y
piden en forma independiente estos electrodomesticos. Calcular la probabilidad d que
a) el quinto cliente pida el tercer blanco
b) el quinto cliente se lleve el tercer cafe
c) se piden todos los blancos antes del primer cafe
d) se pidan todos los blancos antes que se agoten los cafe.
18. Se definen los requisitos peor de los casos como objetivos de diseno de una marca de terminales de computadora.
Una prueba preliminar rapida indica que 4 de 10 terminales no pasan la prueba del peor de los casos. Se
seleccionan 5 de los 10, en forma aleatoria, para pruebas posteriores. Sea X la variable aleatoria el numero,
entre las 5 terminales, que no pasan la prueba preliminar. Calcular:
a) la funcion de probabilidad y de distribucion acumulada e interprete
b) el valor esperado y la desviacion estandar e interprete.
19. Los procedimientos de muestreo para aceptar lotes en una empresa manufaturera electronica requiere el muestreo
de n artıculos de un lote de N artıculos, y aceptar el lote si X ≤ c, donde X es el numero de artıculos defectuosos
en la muestra. Para un lote de 20 cubiertas de impresoras, se debe mostrar 5. Calcular de aceptar el lote si c = 1,
y si el numero real de cubiertas defectuosas en el lote es:
a) X = 0, 1, 2, 3, 4
b) Responder la anterior pregunta se c = 2.
146 Humberto Barrios. mail: [email protected]
4.6. EJERCICIOS Universidad Popular del Cesar
20. Se forma una empresa de explotacion petrolera con suficiente capital para financiar 10 exploraciones. La proba-
bilidad de que una exploracion en particular se exitosa es de 0.1. Supongase que las exploraciones son indepen-
dientes.
a) Encuentre la media y la varianza del numero de exploraciones exitosas.
b) Supongase que la empresa tiene uno costos fijos de $20.000 dolares para preparar el equipo antes de la
primera exploracion. Si cada exploracion exitosa cuesta $30.000 dolares y cada exploracion fallida $15.00,
encuentre el costo total esperado de la empresa para las 10 exploraciones.
21. Una venta en particular involucra cuatro artıculos seleccionados aleatoriamente de un gran lote que contiene
10% defectuosos. Sea X el numero de defectos entre los cuatro artıculos vendidos. El comprador de los artıculos
regresara los defectuosos para ser reparados, y el costo de reparacion esta dado por C = 3X2 +X +2.
a) Encontrar el costo de reparacion.
b) De una interpretacion de la funcion C.
22. Un contador publico titulado (cpt) ha encontrado que nueve de diez auditorıas de companıas contienen errores
importantes. Si cpt revisa la contabilidad de una serie de companıa. ¿Cual es la probabilidad de que:
a) La primera contabilidad con errores sustanciales sea la tercera contabilidad revisada?
b) La primera contabilidad con errores importantes fuera encontrada despues de revisar la tercera contabili-
dad?
23. Un lote de televisores esta formado por 5 TV a color (3 de la marca A y 2 de la marca B) y 6 TV blanco y negro
(4 de la marca A y 2 de la marca B). Si se seleccionan sin reemplazo un grupo de 3 TV. Hallar la probabilidad
de:
a) Seleccionar 2 TV de la marca B.
b) Seleccionar 2 TV de la marca A o 2 TV a color.
24. La probabilidad de un lanzamiento exitoso es igual a 0.8. Supongamos que se hacen ensayos de lanzamientos
hasta que han ocurrido 3 lanzamientos exitosos.
a) ¿Cual es la probabilidad de que sean necesarios 6 ensayos?
b) Suponga que se hacen los ensayos de lanzamientos hasta que ocurren 3 lanzamientos exitosos consecu-
tivos. Responda la pregunta (a) en este caso.
c) Suponga que cada uno de los ensayos de lanzamiento cuesta $5000. Ademas, un lanzamientos que fracase
produce un costo adicional de $500. Calcule el costo esperado para obtener los 3 lanzamientos exitosos.
147 Humberto Barrios. mail: [email protected]
4.6. EJERCICIOS Universidad Popular del Cesar
25. El 20% de los peces de un lago son de la especie A y el resto de otras especies. Un investigador decide realizar el
siguiente experimento: Extraer peces del lago hasta obtener 3 de la especie A (asuma que el metodo de captura
utilizado por el investigador es igualmente efectivo para con todas las especies).
a. ¿Cual es la probabilidad de que el investigador realice solamente 10 extracciones?
b. Para la v.a. definida en la parte (a), calcule el valor esperado e interpretarlo.
c. Suponga que en el lago solo hay 50 peces, 10 de los cuales son de la especie A.
d. ¿Cual es la probabilidad de que en 10 extracciones se obtengan 3 de la especie A?
e. Bajo los supuestos de la pregunta (c), ¿cual es la probabilidad de que sean necesarias 10 extracciones para
obtener 3 de la especie A?
26. Supongase que el numero de accidentes en una fabrica se puede representar por un proceso de Poisson con un
promedio de 2 accidentes por semana.
a) Encuentre la distribucion de probabilidades de la variable aleatoria tiempo hasta que ocurra un nuevo
accidente.
b) ¿Cual es la probabilidad de que el tiempo entre un accidente y el siguiente sea mayor de 3 dıas?
c) Cual es la probabilidad de que el tiempo hasta que ocurran cinco accidentes sea mayor a 2 semanas?
d) Si ocurrio un accidente en el tiempo 0, y un dıa despues aun no ocurre otro, ¿cual es la probabilidad de
que pasen dos dıas mas y aun no halla ocurrido el siguiente accidente?
27. Los empleados de una empresa que fabrican aisladores son examinados para detectar la presencia de asbesto en
sus pulmones. La empresa debe enviar tres empleados con pruebas positivas de asbesto a un centro medico para
realizarles mas examenes. Si el 40% de los empleados tienen pruebas positivas de asbesto en sus pulmones.
a) Encuentre la probabilidad de que se tenga que examinar 10 empalados hasta encontrar el tres con asbestos
en sus pulmones.
b) Si cada prueba cuesta $20 (dolares), encuentre el valor esperado y la varianza del costo total de las pruebas
necesarias hasta encontrar tres empleados con resultados positivos. ¿Piense que es muy probable que el
costo de realizar estas pruebas exceda $350?
28. Se sabe que el 5% de una poblacion tiene el padecimiento A, que se puede detectar por medio de un analisis de
sangre. Esto se puede hacer de dos maneras: (1) examinando cada persona por separado: (2) mezclar las muestras
sanguıneas de las k personas y despues analizar la mezcla. (Suponga que N = nk, con n numero entero). Si la
prueba resulta negativa, todas las personas son sanas (es decir, se necesita un sola prueba). Si la prueba resulta
positiva, se tienen que examinar cada una de las k personas por separado ( es decir, se necesitan k+ 1 pruebas
en total).
148 Humberto Barrios. mail: [email protected]
4.6. EJERCICIOS Universidad Popular del Cesar
a) Para un valor fijo de k, ¿cual es el valor esperado de de numero de pruebas necesarias en el caso (2).
b) Encontrar el valor de k que minimiza el valor esperado del numero de pruebas en el caso (2).
c) ¿cuantas pruebas se ahorran comparando el caso (b) con el caso (1).
29. Un deposito contiene 10000 partıculas y la probabilidad de que una de esas partıculas salga del deposito es igual
a 0.0004. Asuma que cada partıcula es independiente de las otras. ¿Cual es la probabilidad de que ocurran mas
de 3 salidas?
30. El muestreo para encontrar los artıculos de un gran lote de produccion revela cierto numero de artıculos defectu-
osos X , que tiene una distribucion de probabilidad binomial. Un proyecto de muestreo consistente en especificar
el numero de artıculos que deben incluirse en la muestra n, y el numero de aceptacion, a. Se acepta el lote
cuando X ≥ a y se rechaza el lote si X < a. Sea p la proporcion de artıculo defectuosos en el lote. Para n = 5 y
a = 0 calcule la probabilidad de que el lote se aceptado si.
a) p = 0.0
b) p = 0.1
c) p = 0.3
d) p = 0.5
e) p = 1.0
La curva que muestra la probabilidad de aceptar un lote se llama curva caracterıstica de operacion para el
proyecto de muestreo. Construya la curva caracterıstica de operacion para el proyecto de muestreo n = 5, a = 0.
Observese que un proyecto de muestreo es un ejemplo de la inferencia estadıstica. La aceptacion o el rechazo
de un lote basado en la informacion contenida en una muestra es equivalente a la conclusion de que el lote es
bueno o malo respectivamente. Bueno implica una fraccion pequena de artıculos defectuosos y que el lote es
apropiado para ser enviado.
31. Construya la curva caracterıstica de operacion del problema anterior para los proyectos muestrales siguientes:
a) n = 10,a = 0
b) n = 10,a = 1
c) n = 10,a = 2
En cada caso, calcular la probabilidad para p = 0,0.05,0.1,0.3,1.0. se incluye que es mucho menos probable
que el proyecto de muestreo (a.) acepte un lote malo que los proyectos (b.) y (c.). Una comparacion visual las
curvas caracterısticas de operacion confirman estas conclusiones intuitivas.
149 Humberto Barrios. mail: [email protected]