Download - MODELOS ESPECIALES DE PROBABILIDAD
1
MODELOS ESPECIALES DE PROBABILIDAD
Sumario: 1. Distribución Lognormal. 2. Las funciones Gamma y Beta. 2.1. Función
Gamma. 2.2. Función Beta. 3. Proceso de POISSON. 3.1. Distribución de POISSON. 3.2.
Cálculo aproximado de la distribución Binomial. 3.3. Distribución Exponencial. 3.4.
Distribución Gamma. 3.5. Distribución Gamma de parámetro r no entero. 4. Distribución
Beta. 5. Apéndices. 5.1. Demostración de la ley Exponencial de fallas. 5.2. Demostración
de la función de probabilidad de POISSON.
1. Distribución Lognormal
Se dice que una variable aleatoria tiene distribución Lognormal o Normal logarítmica
si su logaritmo, en cualquier base, tiene distribución Normal. Dicho de otro modo, si x es una
variable con distribución Lognormal, entonces y=Ln x tiene distribución Normal. Esta es la ley que
rige los ingresos de grandes grupos de individuos, donde las variaciones de la variable se observan
entre distintos individuos o unidades experimentales en un momento fijo del tiempo y no sobre un
individuo a través del tiempo. Así, decimos que se trata de una variable trasversal o de sección
trasversal cross section en terminología anglosajona. Aclaremos además, que llamamos variable
temporal a aquella cuyos valores se observan a través del tiempo, para la cual son válidos otros tipos
de modelos el Gaussiano entre otros .
La función de densidad de esta
distribución tiene la forma de la Fig. 8.1,
que representa los consumos de energía
eléctrica de Buenos Aires y Gran Buenos
Aires. En la Sección 1 del Capítulo 6
explicamos el motivo de su asimetría.
Veamos ahora una prueba sencilla de que su
logaritmo puede tener distribución Normal.
Supongamos que una persona comienza su
vida laboral en una empresa, ganando un
sueldo inicial de A$; tiempo después, por
algún motivo, recibe un aumento de sueldo,
digamos del 10%, con lo cual su ingreso pasa a ser A×1,1; luego, recibe un aumento del 5%, con lo
cual pasa a ganar A×1,1×1,05; así siguiendo, su salario se va modificando del siguiente modo, hasta
llegar a su salario actual x:
A×1,1×1,05×... = x
Este salario x queda formado como un producto de variables aleatorias, cuyo logaritmo
será entonces la suma de los logaritmos de los factores y por lo tanto, el logaritmo del salario resulta
ser una suma de variables aleatorias que, en virtud del Teorema Central del Límite (Capítulo 6), se
espera que tenga, al menos aproximadamente, distribución Normal. Véase en Klein (1966) un análisis
más completo sobre esta cuestión.
Así pues, el modelo Lognormal tiene un sustento teórico o analítico, pero también ha sido
verificado experimentalmente con adecuados procedimientos de ajuste, por lo tanto, siempre que
tengamos una variable económica o financiera de corte trasversal, deberemos considerar al Lognormal
como un posible candidato.
El tipo de prueba que hemos dado para el modelo Lognormal es bastante frecuente en
Estadística. Es decir, no se pretende un rigor matemático profundo, sino tan sólo un análisis que nos
permita considerarlo como un candidato plausible, pues pueden darse casos en los cuales deba
recurrirse a otro tipo de modelo; luego, en el Capítulo 10, trataremos brevemente la distribución
propuesta empíricamente por WILFREDO PARETO, para salarios de una empresa.
La función de densidad de probabilidad (Fig. 8.1) es
Fig. 8.1
0 200 400 600 800 1000
2
(8.1)
2
2
2
)(
π2
1)(
D
mxLnExp
xDxf
válida en el dominio x>0. Los parámetros m y D son la media y el desvío estándar del logaritmo de
la variable, es decir:
(8.2)
0)()(E mdxxfxLnxLn
(8.3) E[(Ln x m)²] =
0
22)()( DdxxfmxLn
que están relacionados con la media µ y el desvío estándar de la variable, pues
(8.4) µ = E(x) =
0 2)(
2D
mExpdxxxf
(8.5) 2 = E[(x µ)²] =
0)()(
2dxxfx = Exp(2m+D²)[Exp(D²) 1]
Si disponemos de un conjunto de observaciones de una variable, sobre la que tenemos una
razonable seguridad de que responde al modelo Lognormal, podemos estimar sus parámetros m y D.
Indicamos los dos procedimientos fundamentales para ello.
Sean las observaciones X1, X2, ..., Xn. Dado que m es la esperanza matemática del logaritmo
de la variable, es razonable estimarlo como:
(8.6)
n
iiXLn
nm
1
1ˆ
Análogamente, podemos poner:
(8.7)
n
imXLn
nD i
1
22)ˆ(
1
1ˆ
Las expresiones (8.6) y (8.7) son los estimadores por máxima verosimilitud de los
parámetros de la distribución Lognormal. En el capítulo sobre estimación de parámetros discutiremos
con cierto detalle ese método de estimación, atribuido a FISHER, pero cuyo origen es muy anterior,
dado que procede de GAUSS.
Otra forma de estimar los parámetros m y D es utilizar las relaciones (8.4) y (8.5),
resolviéndolas para m y D, en función de µ y , como sigue:
(8.8)
2
2
2
σ1;
)/σ(1
LnDLnm
Luego, se reemplazan en estas expresiones los parámetros µ y por sus estimaciones X
y S, para obtener las estimaciones de m y D. Este procedimiento para estimar los parámetros se
denomina Método de los Momentos, y se debe a KARL PEARSON (1857-1936), insigne estadístico
inglés, pionero de nuestra ciencia.
El Modo o Moda es el valor de la variable que maximiza la función de densidad. Dado que
en este caso la curva representativa de (8.1) es acampanada, es posible calcular dicho valor derivando
3
la función e igualando a cero dicha derivada, es decir, resolviendo la ecuación f '(x)=0; el valor de x
que se obtiene es el modo:
(8.9) Modo = Exp(m D²)
Digamos finalmente que el cálculo de la función de distribución F(x), o sea la probabilidad
de no superar un dado valor de x, se realiza con la tabla de la distribución Normal, mediante la
siguiente relación:
(8.10) F(x) =
x
D
mxLndxxf
0)(
Ejemplo 1. Los consumos telefónicos de las casas de familia de Buenos Aires, tienen una
media de 850 pulsos, con un desvío estándar de 625 pulsos, para el último bimestre del año. Calcular:
a) Los parámetros m y D. b) El modo y la mediana. c) El porcentaje de usuarios con consumos
superiores a la media.
Solución: a) Por supuesto que la distribución es Lognormal. Los parámetros m y D se
obtienen mediante las expresiones (8.8), de las que resulta:
2)/σ(1
Lnm = 6,5291
2
σ1
LnD = 0,6574
b) Calculamos el modo mediante (8.9), resultando igual a 444pulsos
La mediana es el valor de la variable tal que F(x)=0,5. Aplicando (8.10), tenemos
05,0
ZD
mMLn d
de donde Md = em = 685pulsos
c) El porcentaje de usuarios con consumos superiores a la media será
%1,37371,0629,01)329,0(1850
1)850()(
D
mLnxPxP
En general, las variables a las que se ajusta el modelo Lognormal tienen elevados
coeficientes de variación, esto es, su desvío estándar no es pequeño frente a la media, sino que es
comparable con ella y frecuentemente es mayor, algunas veces mucho mayor. Tenemos casos en que
el desvío es dos, tres y hasta seis veces la media.
2. Las funciones Gamma y Beta
4
Por su importancia y utilidad en diversas distribuciones (Gamma, Beta, de WEIBULL, de
GUMBEL, etc) que trataremos en estos capítulos sobre modelos especiales (este y el 10) haremos aquí
un breve estudio de las llamadas integrales eulerianas:
(8.11)
0
1)( dyey
yrr (Función Gamma)
(8.12) 1
0
11 )1(),( dyyy babaB (Función Beta)
2.1. Función Gamma
La integral paramétrica (8.11) que define la función Gamma, es convergente siempre que
sea r>0. Integrando por partes se obtiene la relación fundamental
(8.13) (r) = (r1)(r1)
Además, como (1)=1, para valores enteros de r es
(8.14) (r) = (r1)! (r entero 1)
Por lo tanto, la función Gamma es una generalización del factorial. Por lo mismo, al ser
(1)=1, resulta 0!=1, hecho que se da como impuesto cuando se define el factorial de un número.
Como la integral (8.11) está definida para r>0 real, con la relación (8.13), es posible
calcularla para cualquier r, si se dispone de una tabla para un intervalo unitario. La planilla EXCEL
suministra su logaritmo natural con la función =GAMMA.LN(r). Además, tenemos una expresión
sencilla para valores semienteros de r, que obtendremos a partir de la integral que calculamos en el
Capítulo 6 (Sección 2.4):
(8.15)
0
2/12
22
1)( b
bdxbxExpI
Pongamos en (8.11) r=1/2
0
2/1
2
1dyey y
Ponemos y=x2, dy=2xdx y queda
0 0
2
2
222
1dxexdx
x
e xx
La última integral se identifica con (8.15) para b=1, por lo tanto
(8.16) π2
1
Con (8.13) obtenemos sucesivamente
π2
1
2
3
5
π4
3π
2
1
2
3
2
5
(8.17) π
!2
12
)!1(
2 1
n
nn
n
(n impar 1)
Una fórmula apropiada para el cálculo numérico es
(8.18) ))...(1(1680
1
1260
1
360
1
12
1π2)1()(
753nrrrLn
yyyyyLnyLnyaLn
siendo y=r+n+1 con n entero tal que r+n>8.
En el Capítulo 10, en la discusión de las distribuciones de GUMBEL, tendremos que utilizar
la derivada de la función Gamma, o sea:
(8.19)
0
1)(')(
ydyLneyrdr
rd yr
Para r=1, se tiene el resultado notable
(8.20) CydyLne y
0
)1('
siendo C la denominada Constante de EULER, definida como
(8.21)
nLn
nLímCn
1...
3
1
2
11 0,577256649
un número que, al día de hoy, no se ha podido demostrar siquiera que es irracional, aunque, por
supuesto, se sospecha que es irracional trascendente, como y e. Este número notable aparecerá en la
expresión de la media de las distribuciones de GUMBEL, que tienen diversas aplicaciones en
Ingeniería.
2.2. Función Beta
En el estudio de la distribución Beta, que veremos en este capítulo, aparecerá la integral
paramétrica
(8.22) 1
0
11 )1(),( dyyy babaB
denominada función Beta, que está definida para a>0 y b>0.
Es importante su relación con la función Gamma
(8.23) )(
)()(),(
ba
babaB
cuya demostración puede verse, por ejemplo, en DeGroot (1988).
3. Proceso de POISSON
Un proceso de POISSON es una sucesión de fallas o acontecimientos puntuales, que ocupan,
individualmente, una porción despreciable en un medio continuo, de modo que la probabilidad de que
ocurra un número dado r de fallas en una extensión t de continuo es independiente de la posición de t
6
dentro del continuo y de la ocurrencia de fallas en otros tramos del continuo, esto es, que las fallas no
se producen en "trenes" y el proceso no tiene memoria. Así, son ejemplos de este tipo de proceso, los
siguientes:
* Cortes de luz en una ciudad
* Llamadas telefónicas a una línea
* Llegadas de personas a un comercio
* Fallas de aislación en un proceso de fabricación de cable plástico
* Fallas en los rollos de alfombra moqueta
* Goles en un partido de fútbol
* Accidentes de tránsito en una ciudad
Un proceso de POISSON está caracterizado por un parámetro fundamental, que
universalmente es designado con la letra (lambda), que es la tasa de fallas o promedio de fallas por
unidad de continuo1, es decir
(8.24) continuodeextensióndeUnidad
fallasdemedioNúmeroλ
Así, por ejemplo, podemos decir que en una tela se produce en promedio 0,8 fallas cada
100 metros o, lo que es lo mismo, 8 fallas cada 1000 metros; adviértase que la unidad en que se mide
el continuo es totalmente arbitraria.
3.1. Distribución de POISSON
Fijada la extensión t de continuo, el número r de fallas que pueden encontrarse en ella es
una variable aleatoria, denominada variable de POISSON, cuya media o esperanza matemática es
(8.25) E(r) = t
cantidad que designamos con la letra m. En el Apéndice 5.2 de este capítulo demostraremos que la
función de probabilidad de la variable r, esto es, la probabilidad de encontrar r fallas en la extensión t,
está dada por la siguiente expresión:
(8.26) !
)(r
merP
rm
(r 0)
Verifiquemos el cierre:
0
21
...!2!1
1!r
mrm
mme
r
me
La serie del último paréntesis es igual a em, con lo cual queda verificado el cierre.
1En el Capítulo 10 discutiremos con más detalle el concepto de tasa de fallas.
7
Probaremos ahora (8.25)
1
1
00 )!1(1 )!1(!)()(E
r
rm
r
rm
r
rm
rm
r
mem
r
me
r
merrrPr
Calcularemos ahora la varianza de r. Veamos primero la esperanza de r2:
1 )!1()11(
)!1(!)(E
11
2
r
rm
r
rm
r
rm
r
mer
r
mer
r
mer
2r
1
1
2
2
11
22
)!1()!2()!1()!1()1(
r
rm
r
rm
r
rm
r
rm
mmr
mem
r
mem
r
me
r
mer
Finalmente, la varianza es
(8.27) D2(r) = E(r
2) [E(r)]
2 = m
2 + m m
2 = m
Así, pues, la varianza de la variable de POISSON coincide numéricamente con su media.
Ejemplo 2. El proceso productivo de un tipo de tela produce fallas a una tasa
=1,2fallas/100metros=0,012 y se bobina en rollos de t=80metros, entonces m=t=0,012×80= 0,96.
Definamos como rollo de primera calidad aquel que tiene 1 o ninguna falla, como de segunda calidad
el que tiene 2 fallas y de rechazo el que tiene 3 o más fallas. Calcular los porcentajes de cada una de
estas calidades.
Solución: Calculemos las probabilidades correspondientes
3676,0!1
96,0.)1(;3829,0)0(
96,096,0
e
PeP
luego P(1ªcalidad)=P(0)+P(1)= 0,3829+0,3676=0,7504, lo que quiere decir que el 75,04% de los
rollos son de 1ª calidad. La fracción de rollos de 2ª calidad se calcula como
1764,0!2
96,0.)2(
296,0
e
P
así pues, el 17,64% de los rollos son de segunda. Calcule el lector el porcentaje de rollos de rechazo.
La distribución de POISSON está tabulada y se tiene también como función de biblioteca de
diversos programas, en particular de la popular planilla EXCEL. Llamando
P(r=r) = PPo (r \ m)
P(r r) = FPo (r \ m)
P(r r) = Gpo (r \ m)
la planilla EXCEL nos provee sus valores a través de la función =POISSON (r; m; alfanum) siendo
alfanum un parámetro alfanumérico que puede tomar el valor “verdadero”, en cuyo caso nos devuelve
la FPo (r \ m) o “falso” con el que tenemos PPo (r \ m).
También hay aproximaciones de la probabilidad acumulada. La más clásica es:
(8.28)
m
mrmrFpo
5,0)\(
válida para m 10.
Muy buena precisión ofrece la siguiente (WILSON-HILFERTY, 1931):
8
(8.29)
3/1
1)1(9
1113)\(
r
m
rrmrFpo
Ejemplo 3. El control de producción de un tipo de tela se efectúa revisando 10 rollos,
deteniendo el proceso si se encuentra más de 1 de 2ª calidad. La longitud de los rollos es 50 metros y
se consideran de 2ª calidad los que tienen 2 o más fallas. En condiciones normales de trabajo, el
proceso productivo genera fallas al azar a razón de 1 cada 200 metros en promedio. ¿Cuál es la
probabilidad de detener el proceso innecesariamente?
Solución: La detención se produce si se encuentran 2 o más rollos de segunda calidad, en
la muestra de 10, cuya probabilidad es P=Gb(2\10; p), siendo p la probabilidad de que un rollo tenga 2
o más fallas, o sea
p = Gpo[2\m=(1/200)50] = Gpo(2\m=0,25)= 1 Fpo(1\m=0,25)
= 0265,0!1
25,0
!0
25,01)25,0\1()25,0\0(1
1025,0
ePP popo
Será entonces:
P=Gb(2\10; 0,0265) = 0,0274.
Ejemplo 4. Un fabricante compró un nuevo equipo para producir cable plástico con el cual
ha conseguido disminuir el promedio de fallas, que con el viejo equipo era de 2 cada 1.000m a 1
cada 1.000 m. Le han informado que su competidor principal, que tiene un equipo igual al que él dejó
de usar, ha instalado un nuevo equipo similar al suyo; su confianza en la fuente de información es tal
que asigna una probabilidad del 60% a dicho evento. A fin de cerciorarse, decide comprar 2.000 m de
la competencia e inspeccionarlos, hallando 5 fallas. ¿Cuál es la probabilidad de que el competidor
haya instalado el nuevo equipo?
Solución: Si el competidor hubiera instalado el nuevo equipo, el número esperado de fallas
sería 2; al haber encontrado 5 fallas, la probabilidad de que lo haya instalado, debe ser menor que el
60%. Sean los sucesos:
N: El competidor instaló el nuevo equipo
V: El competidor continúa con el equipo viejo
F: En 2.000 metros se encontraron 5 fallas.
Se pide calcular
(8.30) )V\F()V()N\F()N(
)N\F()N()F\N(
PPPP
PPP
Tenemos: P(N)=0,6 y P(V)=0,4. Además
P(F\N) = Ppo[5\m=(1/1000)2000] = Ppo(5\m=2) = 0361,0!5
252
e
P(F\V) = Ppo[5\m=(2/1000)2000] = Ppo(5\m=4) = 1563,0!5
454
e
Reemplazando en (8.30), obtenemos P(N\F)=0,2573
Ejemplo 5. En un proceso de pintura se producen fallas con media 1 falla por unidad. Las
normas de control de calidad califican como defectuosa toda unidad con más de 2 fallas. De los tres
9
inspectores, A y B aplican correctamente la norma pero C, equivocadamente, clasifica como
defectuosas las que tienen 2 o más fallas. Si de un grupo de 15 unidades, que se saben inspeccionadas
todas por el mismo inspector, hay 3 clasificadas como defectuosas, ¿cuál será la probabilidad de que
hayan sido inspeccionadas por C?
Solución: Sean los sucesos
A: Las piezas fueron inspeccionadas por A
B: Ídem por B
C: Ídem por C
X: En 15 unidades hubo 3 clasificadas como defectuosas
Se pide:
(8.31) )C\X()C()B\X()B()A\X()A(
)C\X()C()X\C(
PPPPPP
PPP
En ausencia de otra información, las probabilidades a priori son iguales, o sea P(A)=
P(B)=P(C)=1/3. La probabilidad de que una unidad sea considerada defectuosa por A o por B es
pA = pB = Gpo(3\m=1) = 0,0803
La probabilidad de que una unidad sea considerada defectuosa por C es
pC = Gpo(2\m=1) = 0,2642
Si las 15 unidades fueron revisadas por A o por B, la probabilidad de que haya 3
defectuosas en ellas es
P(X\A) = P(X\B) = Pb(3\15; pA=pB) = 0,0863
Análogamente, si las 15 unidades fueron revisadas por C, es:
P(X\C) = Pb(3\15; pC) = 0,2113
Reemplazando en (8.31), obtenemos P(C\X)=0,5504
Ejemplo 6. Una empresa de instalaciones industriales adquirió en un remate un lote de
caños de PVC de 6 m de longitud. Para realizar una estimación del costo real de estos caños, se
averigua que este lote podría provenir de alguno de dos fabricantes: el A, cuyo proceso de fabricación
continuo se sabe presenta 1 falla cada 30 metros, o el B, que con un proceso más moderno, presenta 1
falla cada 60 m. En la primera instalación de 300 m de longitud en que se instalaron estos caños, al
realizar la prueba hidráulica tuvieron que cambiar 3 caños. ¿Cuál es la probabilidad de que el lote
provenga del proveedor A?
Solución: Sean los sucesos
A: El lote proviene del proveedor A
B: Ídem del proveedor B
X: En la instalación de 300 m se tuvieron que cambiar 3 caños
Se pide:
(8.32) )B\X()B()A\X()A(
)A\X()A()X\A(
PPPP
PPP
En ausencia de otra información, es P(A)=P(B)=0,5. Si un caño tiene una o más fallas hay
que cambiarlo; si es del proveedor A, la probabilidad es
pA=Gpo(1\mA=(1/30)6) = Gpo(1\mA=0,2) = 1 e0,2
= 0,1813
10
Si es del proveedor B, es
pB=Gpo(1\mB=(1/60)6) = Gpo(1\mB=0,1) = 1 e0,1
= 0,0952
En 300 metros hay 50 caños de 6 metros. Si son del proveedor A, la probabilidad de que
haya que cambiar 3 es
P(X\A) = Pb(3\50; pA) = 0,009657
y si son del proveedor B
P(X\B) = Pb(3\50; pB) = 0,153628
Reemplazando en (8.32) obtenemos P(A\X)=0,0591
3.2. Cálculo aproximado de la distribución Binomial
En el Capítulo 6 vimos la aproximación Normal clásica a la distribución Binomial, válida
para n grande:
(8.33)
)1(
5,0),\(
pnp
nprpnrFb
tomando como un criterio de aplicabilidad las condiciones np>10 y n(1 p)>10, lo cual implica que n
deberá ser más grande cuando más extremo sea el valor de p. Si p está muy cercano a 0 o a 1, la
aproximación Normal puede no ser válida, siendo en ese caso preferible utilizar la aproximación de
POISSON, dada por
(8.34) Fb (r \ n; p) FPo (r \ m=np) Si p 0,1
(8.34') Fb (r \ n; p) =Gb (n r \ n; 1p) GPo [n r \ m=n(1p)] Si p 0,9
Es importante destacar que la condición de n grande, indicada por muchos tratadistas, para
la validez de (8.34), no es necesaria; únicamente se requiere que p sea pequeño o grande. Para
ciertos valores de n y p, puede haber dudas sobre cuál aproximación usar, por ejemplo n=100 y p=0,1;
en este caso, si bien serían aplicables ambas, desearíamos saber cuál es la más conveniente. Para
situaciones como esta, recomendamos utilizar el criterio de uno de nosotros (O. L. M), demostrado en
su texto (1970), como sigue:
Si n n0 utilizar la aproximación Normal
Si n < n0 utilizar la aproximación de POISSON
siendo
(8.35) 3
2
0
)1(23,0
n donde =mín(p; 1p)
Así, por ejemplo, si fuera, n=100 y p=0,1, es n0=186 y al ser n<n0, deberá utilizarse la
aproximación de POISSON.
Otras buenas aproximaciones de la distribución Binomial son las debidas a M. WISE y a E.
PAULSON. Ambas tienen la misma expresión fundamental:
(8.36) Fb(r \ n, p) (z)
También, para ambas es a=nr, b=r+1
Aproximación de WISE (1960)
11
(8.37) 3/1
2
)3/1)(1()2(3)1(
63
9
113
rn
bbrnpLn
b
bbz si n 2r+1
3/1
1
)3/1)(1()1(3)(
63
9
113
rn
aarnpLn
a
aaz si n 2r+1
Aproximación de PAULSON (1942)
(8.38) 32
11
siendo1
3
13
3
13
pa
bA
b
A
a
abA
z
3.3. Distribución Exponencial
En el proceso de POISSON, la extensión de continuo entre fallas consecutivas es también una
variable aleatoria, denominada variable Exponencial, cuya función de distribución, que vimos en el
Capítulo 6, Ejemplo 1, y demostraremos en el Apéndice 5.1 de este capítulo, es la siguiente:
(8.39) F(x) = 1 e x/µ
En (8.39), la variable x es la extensión de continuo entre fallas consecutivas de un proceso de
POISSON, siendo µ la extensión media entre fallas. También se puede poner
(8.39’) F(x) = 1 e x
donde tiene la misma interpretación que en la distribución de POISSON, o sea es la tasa de fallas
Número medio de fallas por unidad de continuo y es igual al recíproco de la distancia media entre
fallas. En efecto, supongamos nuevamente el ejemplo anterior, en que era =1,2fallas/100metros,
entonces la distancia media entre fallas será 100/1,2=83,3metros. Otro ejemplo: Si nos dicen que
recibimos una llamada telefónica cada 2 minutos (µ=2minutos=tiempo medio entre llamadas),
entonces la tasa de llamadas es = 1 llamada / 2minutos = 0,5llamada/minuto. Así pues, la media de
esta distribución es:
(8.40) λ
1
La función de densidad se obtiene de (8.39’) como
(8.41) f(x) = F ’(x) = ex
En la Fig. 8.2 vemos la representación gráfica
La varianza, que puede calcularse por definición, está dada por:
(8.42) 2
2
λ
1σ
y, entonces, el desvío estándar es igual a 1/ o sea igual a la media de la distribución.
Como hemos indicado anteriormente, la relación /µ de una variable, esto es, su coeficiente
de variación, es una indicación del grado de dispersión o de aleatoriedad que ella tiene. Así, por
ex
Fig. 8.2
12
ejemplo, en el caso de las variables que provienen de procesos controlados, que responden, en general,
a la distribución Normal, dicha relación rara vez excede al 20%, en cambio para el caso de los
ingresos, regidos con por el modelo Lognormal, dicha relación toma valores superiores al 50% y,
frecuentemente, es mucho mayor (100% o más). En el caso de la distribución Exponencial, la relación
/µ es igual al 100%, lo cual indica que estamos frente a una variable con un alto grado de
dispersión.
Otra aplicación importante de este modelo es la siguiente: Las fallas de una pieza constituyen
un proceso de POISSON siempre que se produzcan por causas exclusivamente aleatorias, no por
desgaste ni fatiga. Son ejemplos de fallas aleatorias las de un fusible de luz o de un chip de memoria
RAM, que no disipa energía, a diferencia del procesador. En ese caso, si llamamos x a la duración de
esas piezas, será válida la expresión (8.39). Nótese que la probabilidad de que la pieza dure x o más
horas es G(x)=ex
y también es igual a la probabilidad de que en t horas tenga 0 fallas o sea
PPo(0\m=t). Nuevamente, este es un modelo analítico y esta expresión puede demostrarse a partir de
la definición del proceso de POISSON Véase la demostración en el Apéndice 5.2 de este capítulo. Se
corrobora la alta dispersión de esta variable; considérese el alto grado de incertidumbre que se tiene,
por ejemplo, frente al tiempo entre dos cortes de luz consecutivos.
Ejemplo 7. Un elemento falla “a la POISSON” con una vida media de 400 horas. a) Calcular
la duración garantizada con 90% de probabilidad. b) Si un elemento funcionó 400 horas sin fallar,
¿cuál es la probabilidad de que funcione 100 horas más?
Solución: a) La duración garantizada con 90% de probabilidad es el valor de la variable x=x0
tal que:
0,9 = P(x x0)
o sea
G(x0) = 0,9
0,9 = /0x
e
1054,09,00
Lnx
x0 = 42,1hs
b) Si un elemento ha funcionado durante 400 horas sin fallar, la probabilidad de que funcione
100 horas más es la probabilidad condicional:
/400
/500
)400(
)500(
)400(
)400()500()400\500(
e
e
xP
xP
xP
xxPxxP
= e100/400
= e 0,25
= 0,779
Observemos que esta probabilidad (e100/ µ
) es también la probabilidad incondicional de que
un elemento dure más de 100 horas. La interpretación de esto es que el elemento se mantiene siempre
nuevo, o sea, si ha funcionado x horas sin fallar, la probabilidad de que funcione otras horas es
siempre la misma, independiente de x, sólo función de y vale e /µ
. En el Apéndice 5.1 de este
capítulo se demuestra que la única distribución que tiene esta propiedad es la Exponencial, que rige la
vida de elementos que fallan por causas exclusivamente aleatorias. En cambio, para un elemento que
falla por desgaste o fatiga, la probabilidad de que falle en las próximas horas depende de las x
horas que ha estado funcionando. En el Capítulo 10 estudiaremos con detalle esta cuestión.
3.4. Distribución Gamma
13
Otro modelo importante que aparece en el proceso de POISSON es la distribución de la
extensión de continuo necesaria para que se produzcan r fallas, o la duración total de un stock de r
elementos cuya falla individual se produce por causas aleatorias; sería una suma de r variables
Exponenciales, todas con el mismo . Se
tiene así la denominada distribución
Gamma (o de ERLANG), cuya función de
densidad es:
(8.43)
/1
)!1(
1)( x
rx e
rxf
que hemos representado en la Fig. 8.3 para
distintos valores del parámetro r y =1. Es
decir, que la variable Gamma puede
considerarse como una suma de r variables
Exponenciales independientes, todas con el
mismo =1/ por lo tanto, si llamamos ti a dichas variables Exponenciales, la Gamma puede
expresarse como:
(8.44) x = t1 + t2 + ... + tr
Entonces, teniendo en cuenta que la media y la varianza son operadores lineales con
propiedades de aditividad, o sea, que la media de una suma es igual a la suma de las medias y
análogamente con la varianza, podemos escribir:
(8.45) x = r
(8.46) x2 = r 2
Al tratarse de una suma de variables aleatorias, para valores suficientemente grandes del
parámetro r, la distribución Gamma se ha de aproximar a la Normal, como puede apreciarse en la
Fig. 8.3. En la práctica, se acepta que la Gamma puede considerarse Normal si r30; para r=30 el
coeficiente de variación es 0,18.
El modo de la variable, esto es, el valor de más alta frecuencia, se calcula derivando la
función de densidad e igualando a cero la derivada, ya que, para r>1, la curva es acampanada;
resolviendo entonces la ecuación f’(x)=0 se obtiene:
(8.47) Modo = (r1)
Es posible calcular la función de distribución de la distribución Gamma, si se dispone de una
tabla para la distribución de POISSON, pues la probabilidad acumulada izquierda de la Gamma es igual
a la acumulada derecha de POISSON, o sea:
(8.48) Fg(x \ r, ) = GPo(r \ m=x/)
que expresa la equivalencia de los sucesos "r o más fallas en la extensión x" y "x o menos extensión
para obtener r fallas". Esta relación (8.48) fue publicada por E. MOLINA en 1915, razón por la cual
suele denominarse "Relación de MOLINA".
Con la planilla EXCEL podemos calcular la función de distribución, digitando
=DISTR.GAMMA(x;r;;verdadero) que devuelve Fg(x \ r; )
Si el parámetro alfanumérico tomara el valor falso, devolvería la función de densidad.
Fig. 8.3
0
0,1
0,2
0,3
0,4
0,5
0,6
0 2 4 6 8 10
r=1
r=3
r=5
14
Si el parámetro r es mayor o igual que 30, por lo dicho anteriormente, es posible aplicar la
aproximación Normal clásica, o sea
(8.49)
r
rxrxFg
);\(
Otras aproximaciones son:
(8.50)
142);\( r
xrxFg
(r 10) (FISHER)
(8.51)
1
9
13);\(
3/1
rr
xrrxFg
(sin restricciones) (WILSON-HILFERTY)
Análogamente, podemos calcular fractiles de la distribución Gamma, como sigue. Sea dado
tal que
(8.52) = Fg(x \ r; )
el valor de x que resuelve esta ecuación se obtiene, con la planilla EXCEL, como
=DISTR.GAMMA.INV(; r; )
Con la aproximación de WILSON-HILFERTY, el fractil x se obtiene con la expresión
(8.53)
3
ωω
39
11
r
z
rrx
Una propiedad importante de la distribución Gamma es que un cambio de escala no altera su
parámetro r, o sea, si x tiene distribución Gamma de parámetros rx y x, entonces la variable y=ax
tiene distribución Gamma de parámetros ry=rx y y=ax.
Ejemplo 8. Considere un stock de 10 elementos cuyas duraciones medias individuales son
iguales a =400horas. Vimos en el Ejemplo 7 que la duración garantizada para un elemento con 90%
de probabilidad es 42,1horas. Calcule la duración total para el stock, garantizada con 90% de
probabilidad.
Solución: Digitando en EXCEL
=DISTR.GAMMA.INV(0,1;10;400)
obtenemos el fractil x0,1=2.488,5 horas. Con la aproximación (8.53) se obtiene, reemplazando r=10,
=400 y z0,1=1,2816, el valor x0,1=2.489,6.
Quizás el lector considere este resultado como extraño: Si para un elemento se garantizan
42,1 horas, para 10 esperaríamos que se garanticen 421 horas. ¡Grave error!. El fractil 0,1 de una suma
de variables NO es igual a la suma de los fractiles 0,1 de los sumandos, así como el mínimo de una
suma no es igual a la suma de los mínimos. La explicación intuitiva es que no podemos tener tanta
mala suerte con los 10 elementos; una explicación un poco más formal es que la dispersión relativa de
la suma disminuye con el número de sumandos en proporción 1/r1/2
, y entonces los valores menos
probables de los extremos se acercan a la media al aumentar r, así como disminuye la
15
asimetría de la variable suma, lo que nuevamente está relacionado con el Teorema Central del Límite.
La distribución Gamma tiene, como la Normal, la propiedad de aditividad siguiente: Dadas n
variables aleatorias independientes x1, x2, ..., xn, con distribuciones Gamma de parámetros r1, r2, ..., rn,
no necesariamente iguales, y 1=2=...=n=, la variable
y = x1+ x2+ ...+ xn
tiene distribución Gamma de parámetros ry=r1+r2+...+rn y igual al de los sumandos. Esta propiedad
será demostrada en el Capítulo 9.
Ejemplo 9. El control de recepción de una tela cruda consiste en revisar 5 rollos de cada lote
(muy grande) y rechazar el lote en caso de encontrar algún rollo con longitud inferior a 50 metros. Se
sabe que estos rollos tienen una longitud que ha quedado determinada por la aparición de la 2da. falla
y que el proceso genera en promedio 1 falla cada 160metros. a) Calcular el porcentaje de lotes
rechazados. b) ¿Qué longitud puede garantizarse para un rollo cualquiera con 90% de probabilidad? c)
Idem b) para un lote de 5 rollos. d) Idem b) para un lote de 100 rollos.
Solución: a) El porcentaje de lotes rechazados es la probabilidad de encontrar 1 o más
rollos con longitud inferior a 50 metros, o sea Gb(1\5;p), siendo p la probabilidad de que 1 rollo tenga
longitud inferior a 50 metros; esta probabilidad es igual a
p = Fg(50\ r=2;=160) = Gpo(2\ m=50/160) = Gpo(2\ m=0,3125)= 0,0398
entonces, la probabilidad de rechazar un lote será
P(rechazar lote) = Gb(1\5;0,0398) =1 Pb(0\5;0,0398) =
= 1 0,96025 = 0,184 = 18,4%
b) La longitud que puede garantizarse para un rollo con 90% de probabilidad es el valor de x
tal que
0,1 = Fg(x\ r=2;=160)
Digitando en EXCEL =DISTR.GAMMA.INV(0,1;2;160) se obtiene x=85,1 metros. Con la
aproximación (8.51) se obtiene 84,8 metros.
c) Para un lote de 5 rollos, la longitud total también tiene distribución Gamma, pero de r=10,
debido a la propiedad de aditividad. Digitando entonces en EXCEL =DISTR. GAMMA. INV (0,1;10;160)
se obtiene 995,4 metros. Con la aproximación (8.53) el resultado es 995,8 metros.
d) Para un lote de 100 rollos es r=200 y con EXCEL se obtiene 29.137 metros, en tanto que
con (8.53) el resultado es 29.137 metros, o sea el valor exacto.
3.5. Distribución Gamma de parámetro r no entero
Tal como hemos definido la distribución Gamma, esto es, la extensión de continuo asociada a
la obtención de r fallas en un proceso de POISSON, el parámetro r es, necesariamente, un número
entero mayor o igual que la unidad. Ello no obstante, esta distribución se ha mostrado adecuada para
ajustarse a otras variables no poissonianas, tales como
mm de lluvia caída mensualmente en un lugar
Demanda diaria de un producto
Edad de las personas de un país o de una ciudad
En estos casos, la obtención de los parámetros r y podrá realizarse mediante las expresiones
de la media y la varianza, o sea
16
(8.45) = r
(8.46) 2 = r 2
Obtenida una cantidad de observaciones, X1, X2, ..., Xn, se calculará su media y su varianza y
luego, con la solución de (8.45) y (8.46), esto es
(8.54)
22
σ;
σ
r
calcularemos r y . Obviamente, en estos casos, el parámetro r no tendrá por qué ser un número
entero; será un número real positivo. La función de densidad se expresará ahora
(8.55)
/
1
)(
1)(
x
r
ex
rxf
Con respecto al cálculo de la probabilidad acumulada Fg(x\r;), la función del EXCEL
[=DISTR.GAMMA(x;r;;verdadero)] no requiere que r sea entero y arroja, por lo tanto, el resultado
exacto de la función, cuya expresión general es:
(8.56)
0
/
))...(2)(1()(),\(
n
nx
r
gnrrrr
x
r
ex
rxF
La relación de MOLINA (8.48) podrá utilizarse como una aproximación, pero en estos casos
será preferible la aproximación de WILSON-HILFERTY (8.51).
Ejemplo 10. La demanda diaria de nafta en una estación de servicio tiene distribución
Gamma con media 5.760 litros y desvío estándar 2.265 litros. Calcular: a) La probabilidad de que la
demanda de un día supere la media. b) La demanda superada con 90% de probabilidad.
Solución: a) Calculamos los parámetros r y con las expresiones (8.54)
467,6265.2
760.5
σ;664,890
760.5
265.2σ2222
r
La probabilidad pedida es:
P(x>\r; ) = 1 Fg(5.760\r=6,467; =890,664)
Con la planilla EXCEL, digitamos
=1DISTR.GAMMA(5.760;6,467;890,664;verdadero)
y obtenemos 0,448. Con la aproximación de WILSON-HILFERTY (8.51) tenemos
448,0552,01)13,0(119
131);\(1
3/1
rr
xrrxFg
o sea, en este caso, el valor exacto con 3 dígitos decimales.
b) Queremos calcular un valor x de la variable tal que
0,1 = Fg(x\ r; )
17
Con la planilla EXCEL, digitamos
=DISTR.GAMMA.INV(0,1; 6,467;890,664)
y obtenemos x=3.114 litros. Con la aproximación de WILSON-HILFERTY (8.53) obtenemos
116.339
11
31,0
1,0
r
z
rrx litros
4. Distribución Beta
La distribución Beta está definida por la siguiente función de densidad:
(8.57) ),(
)1()(
11
nmB
xxxf
nm 0< x<1 ; m>0 ; n>0
cuya representación gráfica puede verse en las Figs. 8.4a 8.4b y 8.4c.
Si bien el uso de esta distribución es poco frecuente, puede ser útil para describir variables
que, por su naturaleza, tienen un dominio acotado (generalmente entre 0 y 1), como índices o
porcentajes. No obstante, si uno o ambos límites del campo de variación real de la variable está (están)
suficientemente alejados de los teóricos, suele haber otros modelos que compiten con ventaja, sobre
todo si se atiende al principio de parsimonia que, en esencia, consiste en elegir aquel modelo que
tenga el menor número posible de parámetros, descartando otros más complicados
cuando la mejora obtenida no resulta
de importancia práctica. Así, es muy probable
que, para el rendimiento de un proceso
químico, que varía habitualmente de lote a lote
entre 75% y 80%, el modelo más apropiado
sea la Normal. Por otra parte, como la Beta
tiene dos parámetros de forma, (en lugar de uno
o ninguno, como los modelos vistos hasta
aquí), puede adoptar formas muy variadas que
le permiten adaptarse a situaciones muy
diversas (Figs 8.4). Vea en el capítulo
siguiente, Sección 8, qué son parámetros de
corrimiento, de escala y de forma. Como
dijimos antes, cuando uno o ambos límites del
dominio real de la variable están alejados de
los teóricos, puede haber otros modelos más
parsimoniosos que resulten apropiados, tal es el
caso si, por ejemplo, la media toma valores
suficientemente bajos y la variable, en los
hechos, no está acotada a su derecha, como
puede verse en la Fig. 8.4c. Puede demostrarse
que, en ese caso, la Beta se aproxima a una
Gamma, la que entonces resulta un modelo
alternativo natural. De la misma manera, si en
la práctica la distribución no está acotada, ni a
izquierda ni a derecha, la Normal puede
competir con ventaja (Fig. 8.4b con m=n=5).
0
0.5
1
1.5
2
2.5
3
0 0.2 0.4 0.6 0.8 1
f(x)
x
m =2
n =1
m =1
n =3
m =1
n =2
m =1,5
n =1
Fig. 8.4a
0
0.5
1
1.5
2
2.5
0 0.2 0.4 0.6 0.8 1
f(x)
x
Fig. 8.4b
(
= 0,5)
m =
1
n =
1
m =
0,5
n = 0,5
m =
5
n =
5
m =
2
n =
2
18
En nuestra experiencia con variables teóricamente acotadas, hemos encontrado que, casi
siempre, se dan las condiciones para adoptar modelos alternativos más parsimoniosos. No obstante,
pueden imaginarse casos, como por ejemplo el porcentaje (diario, semanal, etc.) de cielo cubierto por
nubes, en que la distribución puede tomar, según la época y el lugar,
formas muy variadas que incluyen, entre otras, la forma de U.
Un ejemplo, a nuestro juicio incorrecto, de uso de la Beta, es el
caso de los tiempos de operaciones en los diagramas de camino
crítico –P.E.R.T.–, ya que no existe demostración o análisis empírico
alguno que lo justifique, y pueden en cambio utilizarse otros
modelos, como la Normal o la Gamma. Cabe destacar que,
Kaufmann y Desbazeille (1965), aclaran que “Cuando se ignoran las
distribuciones de los tiempos operatorios se supone, en el método
P.E.R.T. y por razones de simple comodidad de cálculo, que dichos
tiempos operatorios se distribuyen según leyes Beta”.
La media y la varianza están dadas por las siguientes
expresiones
(8.58) 1
)1(σ;
2
nmnm
m
que nos permiten calcular (o estimar) m y n por momentos:
(8.59)
1
)1()1(;1
)1(
22
nm
El modo de esta variable, o sea el valor de más alta frecuencia, puede ser 0 si m<1 o 1 si n<1;
si son ambos, m y n, menores que 1, hay dos modos. Si m y n son ambos mayores que 1, el modo está
dado por la siguiente expresión:
(8.60) Modo=)1()1(
1
nm
m
El cálculo de la función de distribución se puede efectuar con los métodos para la Binomial,
mediante la siguiente relación
(8.61) FB( x\ m, n) = Gb(m\ m + n 1; p = x)
que es estrictamente válida para el caso en que m y n sean enteros positivos, pero que puede utilizarse
como una aproximación si no lo son. Una propiedad importante de la función de distribución es la
siguiente relación:
(8.62) FB( x\ m, n) = GB(1x\ n, m)
La función de distribución FB(x\m,n) se puede obtener en forma exacta con la función del
EXCEL
=DISTR.BETA(x;m;n)
cuya expresión es:
(8.63)
0
1
)1)...(2)(1(
))...(1)((1
),(
)1(),\(
i
inm
B ximmm
inmnmnm
nmmB
xxnmxF
0
1)1()1)...(2)(1(
))...(1)((1
).(
)1(1
i
inm
xinnn
inmnmnm
nmnB
xx
0
2
4
6
8
10
12
14
16
0 0.1 0.2 0.3 0.4
m =
0,5
n = 4,5
m =
10
n = 90
m =
2
n =
18
m =
1
n =
9
f(x)
x
Beta
Fig. 8.4c
= 0,1
19
También, con EXCEL, es posible calcular fractiles x. Dado el valor de la probabilidad
acumulada izquierda, el valor de la variable asociado a dicha probabilidad, esto es x se calcula
mediante
=DISTR.BETA.INV(;m;n)
Finalmente, disponemos de las aproximaciones de WISE y de PAULSON, equivalentes a (8.37)
y (8.38), que vimos en este capítulo para la Binomial. Para ambas, la expresión es
(8.64) FB(x\ m, n) (z)
Aproximación de WISE (1960)
3/1
12
)3/1)(1()12(3)(
63
9
113
nm
nnnmxLn
n
nnz si m n
(8.65)
3/1
12
)3/1)(1()12(3)1(
63
9
113
nm
mmnmxLn
m
mmz si m n
Aproximación de PAULSON (1942)
(8.66)
3/1
)1(;
1
3
13
3
13
2
xm
nxh
n
h
m
mnh
z
Ejemplo 11. La relación entre el área cosechada y el área sembrada de trigo pan en nuestro
país, tiene distribución Beta con media 0,958 y desvío estándar 0,0278. Calcular: a) La probabilidad
de que la relación sea superior a la media. b) La relación superada el 90% de las campañas.
Solución: a) Con las expresiones (8.59) calculamos m=48,918 y n=2,145. La probabilidad
pedida es GB(0,958\m=48,918; n=2,145)=FB(0,042\m’=2,145; n’=48,918)=0,585, obtenida con la
función =DISTR.BETA(0,042;2,145;48,918) del EXCEL. Con la aproximación de PAULSON (8.66) se
obtiene 0,584.
b) La relación superada el 90% de las campañas es el fractil 0,1, que vale x0,1=0,92, obtenida
con la función =DISTR.BETA.INV(0,1; 48,918; 2,145) del EXCEL.
Relación con la distribución Gamma
En el Capítulo.... demostraremos que si x e y tienen distribuciones Gamma, independientes
entre sí, con el mismo parámetro de escala , pudiendo tener distintos parámetros de forma (rx y ry), la
relación entre una de ellas, por ejemplo x, y la suma (x+y), o sea
20
(8.67) yx
xu
tiene distribución Beta de parámetros m=rx y n=ry.
Ejemplo 12. En un establecimiento agropecuario, distante de los centros poblados,
comenzará próximamente la cosecha de girasol, del que dispone de una importante extensión. Por
experiencia de años anteriores, el tiempo de duración de la cosecha es bastante variable, debido,
fundamentalmente, a las cambiantes condiciones climáticas de esta época del año. El análisis
estadístico de los tiempos de duración de años anteriores permite establecer que dicho tiempo tiene
distribución Gamma, con media 36 días y desvío estándar 9,8 días. Dentro de las contingencias de la
tarea, el inconveniente que se presenta con mayor frecuencia, es la rotura aleatoria de una de las
correas de trasmisión de las cosechadoras, que se produce en este establecimiento a razón de 0,2
correa/día=1 correa/5 días. Debido a la distancia del establecimiento a los centros poblados, se
desea calcular qué stock de correas habrá que prever para que la probabilidad de agotamiento del
mismo sea del 1%.
Solución: Sean las variables
x: Duración de r correas
y: Duración de la cosecha
Las variables x e y tienen, ambas, distribución Gamma. Debemos hallar el parámetro rx de la
variable x tal que
P(x<y) = 0,01
o
P(y<x) = 0,99
Sumemos en ambos miembros de la desigualdad (y<x) una variable ay de modo que esta
variable tenga el mismo parámetro de escala que x (x=5 días/correa). Deberá ser entonces x=ay o
sea a=x /y. Los parámetros de la variable y se calculan con las expresiones (8.54)
(8.54)
22
σ;
σ
r
de las que se obtiene y=2,668 y ry=13,494. Se tiene entonces a=x/y=5/2,668=1,874. Efectuando
ahora la transformación indicada:
P(y+ay<x+ay) = 0,99
99,01)1(
ayx
yaP
99,01
a
a
ayx
ayP
Como x y ay tienen el mismo parámetro de escala, la variable ay/(x+ay) tiene distribución
Beta de parámetros m=ry y n=rx. La variable x tiene parámetro de forma igual a rx, que es el stock de
correas, nuestra incógnita; la variable ay tiene parámetro de forma igual a ry=13,494. La última
expresión puede escribirse:
99,0;\1
xyB rnrm
a
aF
21
Como es a=1,874, ry=13,494, tenemos
FB(0,652\ m=13,494; n=rx) = 0,99
Con la función =DISTR.BETA(x; m; n) de la planilla EXCEL, obtenemos
FB(0,652 \ m=13,494; n=16) = 0,984
FB(0,652 \ m=13,494; n=17) = 0,991
Por lo tanto, deberá prepararse un stock de 17 correas.
5. Apéndices
5.1. Demostración de la ley Exponencial de fallas
Veremos ahora la demostración de la expresión (8.39)
(8.39) F(x) = 1 e x/µ
donde x es la duración de un elemento que falla por causas exclusivamente aleatorias, o sea de
acuerdo con el proceso de POISSON.
Si en un momento dado, sabemos que el elemento hace x horas que funciona, la probabilidad
de que dure, a partir de ese momento, otras t horas por lo menos, es decir que dure en total (t+x) o
más horas, sabiendo que hace x horas que funciona, es:
(8.68) P[(t>t+x)\(t>x)] =
)(
)(
)(
)()(
xP
xtP
xP
xxtP
t
t
t
tt
Esta expresión es general, cualquiera sea la causa de falla del elemento.
Si el elemento falla al azar, significa que siempre está como nuevo y (8.68) debe ser igual a
P(t>t), o sea independiente del tiempo x que hace que está funcionando el elemento, es decir:
(8.69) P[(t>t+x)\(t>x)] = )()(
)(tP
xP
xtP
t
t
t (Fallas aleatorias o “a la POISSON”)
o sea
(8.69’) P(t>t+x) = P(t>t)P(t>x)
o, con nuestra notación de probabilidades acumuladas:
(8.69”) G(t+x) = G(t) G(x)
Demostraremos que el modelo Exponencial es el único que cumple con (8.69").
La derivada parcial con respecto a t del primer miembro de la expresión es:
)(
)()(.
)(
)()(
xt
xtG
t
xt
xt
xtG
t
xtG
Igualándola con la derivada parcial con respecto a t del segundo miembro, tenemos:
(8.70) )()(')(
)(xGtG
xt
xtG
22
El mismo razonamiento sobre la variable x conduce a:
(8.70’) )(')()(
)(xGtG
xt
xtG
Las expresiones (8.70) y (8.70') tienen sus primeros miembros iguales, por lo tanto, los
segundos miembros también son iguales:
G’(t) G(x) = G(t) G’(x)
o sea
(8.71) )(
)('
)(
)('
xG
xG
tG
tG
Esta expresión (8.71) es válida para todo t y todo x, ambos reales positivos, por lo tanto, la
relación G’(t)/G(t) es una constante del proceso, negativa, porque la función G(t) es decreciente. La
llamamos . En el Capítulo 10 demostraremos que es la tasa de fallas. Tenemos entonces:
(8.72) λ)(
)('
tG
tG
Integramos ambos miembros y obtenemos
Ln G(t) = t + A
siendo A una constante de integración. Resulta finalmente:
G(t) = e t + A
La constante A es igual a cero porque G(0)=1. Esto completa la demostración.
5.2. Demostración de la función de probabilidad de POISSON
Deseamos calcular la expresión de la probabilidad de encontrar r fallas en la extensión t, o
sea la función de probabilidad de la variable r, que llamaremos P(r, t). Para ello, hacemos las
siguientes suposiciones:
Para t pequeño:
1) La probabilidad de encontrar una falla en t es proporcional a t y vale t.
2) La probabilidad de encontrar más de una falla en t es despreciable (es un infinitésimo de
orden superior).
Consideremos el tramo (t+t). La probabilidad de encontrar r fallas en (t+t), que
llamamos P(r, t+t), la podemos expresar como la probabilidad de encontrar r fallas en t y 0 fallas en
t más la probabilidad de encontrar (r1) fallas en t y 1 falla en t. Estos dos sucesos son mutuamente
excluyentes y, además, los tramos de continuo t y t son independientes o sea:
P(r, t+t) = P(r, t)P(0, t) + P(r1, t)P(1, t)
Para t pequeño (luego lo haremos tender a 0) tenemos:
P(1, t) = t ; P(0, t) = 1 t
23
entonces:
P(r,t+t) = P(r, t)(1t) + P(r1, t) t
Después de operar, llegamos a:
),(λ),1(λ),(),(
trPtrPt
trPttrP
El límite del primer miembro, cuando t0, es la derivada de P(r,t) respecto de t, entonces:
(8.73) ),(λ),1(λ),(
trPtrPdt
trdP
Esta es una ecuación diferencial cuya función incógnita es P(r,t) y las variables
independientes son t (variable continua) y r (variable discreta). Como hay una derivada con respecto a
t y la función incógnita aparece evaluada para (r1) y r, tenemos una ecuación diferencial en
diferencias. Es decir que tenemos una sucesión de ecuaciones diferenciales, esto es, una ecuación
diferencial para cada valor de r. Para obtener la solución, comenzamos dando a r el valor r = 0, con lo
cual:
),0(λ),1(λ),0(
tPtPdt
tdP
pero obviamente P(1, t) = 0, pues no puede haber 1 falla, entonces:
),0(λ),0(
tPdt
tdP
La integral general de esta ecuación es:
P(0, t) = Ce t
La constante de integración C se obtiene con la condición P(0,0)=1, pues si t=0, con
seguridad habrá 0 fallas; tenemos entonces C =1.
A continuación, en la expresión (8.73), ponemos r=1 y obtenemos
),1(λ),0(λ),1(
tPtPdt
tdP
pero P(0, t) = et
, entonces, la solución de esta ecuación es:
P(1, t) = t et
Así siguiendo, obtenemos la solución para P(r,t):
P(r,t) = !
)(λ
r
te rt
Esta es la función de probabilidad de POISSON.