capítulo 3 distribuciones de probabilidades 7aprehender.net/estadistica/ch3spss/ch3.pdf · •...

235
1 Capítulo 3 Distribuciones de Probabilidades ____________________________________ 7 Objetivos__________________________________________________________________________ 7 Introducción ___________________________________________________________________8 Variable aleatoria, v.a. _______________________________________________________________ 8 Distribución de probabilidades ________________________________________________________ 9 Ia Una variable_________________________________________________________________10 1 Métodos tabulares y gráficos _______________________________________________________ 10 a Variables cuantitativas discretas _____________________________________________________ 10 Tablas _________________________________________________________________________ 10 Diagramas ______________________________________________________________________ 10 PF ____________________________________________________________________________ 10 CDF ___________________________________________________________________________ 11 b. Variables cuantitativas de escala ____________________________________________________ 15 Diagramas ______________________________________________________________________ 15 PDF ___________________________________________________________________________ 15 Probabilidad de masas ____________________________________________________________ 16 CDF ___________________________________________________________________________ 16 2. Métodos numéricos ______________________________________________________________ 17 Medidas de posición________________________________________________________________ 17 Modo _________________________________________________________________________ 17 Mediana _______________________________________________________________________ 17 Valor esperado __________________________________________________________________ 17 Medidas de dispersión ______________________________________________________________ 18 Amplitudes _____________________________________________________________________ 18 Desviación Media ________________________________________________________________ 18 Varianza _______________________________________________________________________ 18 Desviación estándar ______________________________________________________________ 19 Propiedades ______________________________________________________________________ 19 Desigualdad de Tchebyscheff _________________________________________________________ 19 Problema resuelto 3.1 Selección de 3 esferas ________________________________________ 20 Problema resuelto 3.2 Dado 1 ____________________________________________________ 20 Problema resuelto 3.3 Dado 2 ____________________________________________________ 22 Problema resuelto 3.4 Clientes de un supermercado __________________________________ 22 Problema resuelto 3.5 Demanda de nafta ___________________________________________ 23 Suceso poco común: criterio con probabilidades _________________________________________ 23 Problema resuelto 3.6 Dados de distintos colores ____________________________________ 24 Ib Funciones de variables aleatorias (una variable) ___________________________________25 Eventos equivalentes _____________________________________________________________ 25 Métodos _________________________________________________________________________ 26 1 Caso discreto __________________________________________________________________ 26 Método de la PF _________________________________________________________________ 26 Problema resuelto 3.7 Transformación cuadrática ____________________________________ 26 2 Caso contínuo _________________________________________________________________ 26 Método de la CDF ________________________________________________________________ 26 Problema resuelto 3.8 Transformación cuadrática ____________________________________ 27 Método de la PDF ________________________________________________________________ 28 Problema resuelto 3.9 Transformación lineal ________________________________________ 29 Método de la MGF _______________________________________________________________ 30 Métodos numéricos ________________________________________________________________ 30 Valor esperado de Y ______________________________________________________________ 30 Ic Modelos teóricos de una variable _______________________________________________31 SPSS y EXCEL ____________________________________________________________________ 31

Upload: lydang

Post on 03-Feb-2018

251 views

Category:

Documents


11 download

TRANSCRIPT

Page 1: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

1

Capítulo 3 Distribuciones de Probabilidades  ____________________________________ 7 Objetivos __________________________________________________________________________ 7 

Introducción  ___________________________________________________________________ 8 Variable aleatoria, v.a. _______________________________________________________________ 8 Distribución de probabilidades  ________________________________________________________ 9 

Ia Una variable _________________________________________________________________ 10 1 Métodos tabulares y gráficos  _______________________________________________________ 10 a Variables cuantitativas discretas _____________________________________________________ 10 Tablas _________________________________________________________________________ 10 Diagramas ______________________________________________________________________ 10 PF  ____________________________________________________________________________ 10 CDF ___________________________________________________________________________ 11 

b. Variables cuantitativas de escala ____________________________________________________ 15 Diagramas ______________________________________________________________________ 15 PDF ___________________________________________________________________________ 15 Probabilidad de masas ____________________________________________________________ 16 CDF ___________________________________________________________________________ 16 

2. Métodos numéricos ______________________________________________________________ 17 Medidas de posición ________________________________________________________________ 17 Modo  _________________________________________________________________________ 17 Mediana _______________________________________________________________________ 17 Valor esperado __________________________________________________________________ 17 

Medidas de dispersión ______________________________________________________________ 18 Amplitudes _____________________________________________________________________ 18 Desviación Media ________________________________________________________________ 18 Varianza  _______________________________________________________________________ 18 Desviación estándar ______________________________________________________________ 19 

Propiedades ______________________________________________________________________ 19 Desigualdad de Tchebyscheff _________________________________________________________ 19 

Problema resuelto 3.1 Selección de 3 esferas ________________________________________ 20 Problema resuelto 3.2 Dado 1 ____________________________________________________ 20 Problema resuelto 3.3 Dado 2 ____________________________________________________ 22 Problema resuelto 3.4 Clientes de un supermercado __________________________________ 22 Problema resuelto 3.5 Demanda de nafta ___________________________________________ 23 

Suceso poco común: criterio con probabilidades  _________________________________________ 23 Problema resuelto 3.6 Dados de distintos colores  ____________________________________ 24 

Ib Funciones de variables aleatorias (una variable) ___________________________________ 25 Eventos equivalentes _____________________________________________________________ 25 

Métodos _________________________________________________________________________ 26 1 Caso discreto __________________________________________________________________ 26 Método de la PF _________________________________________________________________ 26 Problema resuelto 3.7 Transformación cuadrática ____________________________________ 26 

2 Caso contínuo  _________________________________________________________________ 26 Método de la CDF ________________________________________________________________ 26 Problema resuelto 3.8 Transformación cuadrática ____________________________________ 27 

Método de la PDF ________________________________________________________________ 28 Problema resuelto 3.9 Transformación lineal ________________________________________ 29 

Método de la MGF _______________________________________________________________ 30 Métodos numéricos ________________________________________________________________ 30 Valor esperado de Y ______________________________________________________________ 30 

Ic Modelos teóricos de una variable  _______________________________________________ 31 SPSS y EXCEL ____________________________________________________________________ 31 

Page 2: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

2

1. Modelos discretos  _______________________________________________________________ 32 Distribución de Bernoulli, b(y,1,p) _____________________________________________________ 32 Supuestos ______________________________________________________________________ 32 Caracterización __________________________________________________________________ 33 

Distribución Binomial, b(y,n,p) ________________________________________________________ 33 Supuestos ______________________________________________________________________ 33 Problema resuelto 3.10 Fiesta numerosa  ___________________________________________ 35 

Expresiones generales  ____________________________________________________________ 37 Caracterización __________________________________________________________________ 37 Proporción muestral ______________________________________________________________ 39 Uso de tablas  ___________________________________________________________________ 39 Problema resuelto 3.11 Paquetes de una distribuidora  ________________________________ 39 

Distribución Hipergeométrica, h(y,N,n,k)  _______________________________________________ 40 Supuestos ______________________________________________________________________ 40 Problema resuelto 3.12 Fiesta no numerosa _________________________________________ 41 

Expresiones generales  ____________________________________________________________ 42 Caracterización __________________________________________________________________ 43 Aproximación de una hipergeométrica _______________________________________________ 44 

Distribución geométrica, g(y,p) _______________________________________________________ 44 Supuestos ______________________________________________________________________ 44 Expresiones generales  ____________________________________________________________ 45 Caracterización __________________________________________________________________ 45 Pérdida de la memoria ____________________________________________________________ 46 Problema resuelto 3.13 Auditorías con errores _______________________________________ 47 

Distribución binomial negativa o de Pascal, bn(y,r,p) ______________________________________ 48 Supuestos ______________________________________________________________________ 48 Expresiones generales  ____________________________________________________________ 49 Caracterización __________________________________________________________________ 49 Relaciones entre las CDF Binomial y Pascal ____________________________________________ 50 Pascal y Binomial  ________________________________________________________________ 50 Geométrica y Binomial ____________________________________________________________ 51 Problema resuelto 3.14 Gripe H1N1  _______________________________________________ 51 Problema resuelto 3.15 Falla de un motor  __________________________________________ 52 

Distribuciones multinomial y multihipergeométrica _______________________________________ 53 Distribución de Poisson, p(y,λ) ________________________________________________________ 53 Supuestos ______________________________________________________________________ 53 Caracterización __________________________________________________________________ 56 Problema resuelto 3.16 Preguntas a un consultor _____________________________________ 57 

Aproximación de una binomial  _____________________________________________________ 59 Uso de tablas  ___________________________________________________________________ 59 Problema resuelto 3.17 Errores en un libro __________________________________________ 60 

Diseños con tabla de contingencias ____________________________________________________ 60 2. Modelos contínuos _______________________________________________________________ 63 Distribución Uniforme, r(x,a,b) ________________________________________________________ 63 Caracterización __________________________________________________________________ 64 Problema resuelto 3.18 Distribución uniforme _______________________________________ 65 Problema resuelto 3.19 Espera del ómnibus _________________________________________ 65 

Distribución Exponencial, e(t,ω) _______________________________________________________ 66 Caracterización __________________________________________________________________ 67 Pérdida de la memoria ____________________________________________________________ 68 

Distribución Gamma ________________________________________________________________ 68 Función Gamma _________________________________________________________________ 68 Problema resuelto 3.20 Γ(1/2) ____________________________________________________ 69 

Distribución Gamma(x,r,α) _________________________________________________________ 69 Caracterización __________________________________________________________________ 70 

Page 3: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Introducción – Objetivos

3

Exponencial _____________________________________________________________________ 70 Relaciones entre las CDF de Gamma y Poisson _________________________________________ 71 Gamma y Poisson ________________________________________________________________ 71 Exponencial y Poisson _____________________________________________________________ 72 Problema resuelto 3.21 Distribución exponencial _____________________________________ 73 Problema resuelto 3.22 Reparación de aviones  ______________________________________ 75 

Distribución Normal, n(z,0,1) _________________________________________________________ 76 Supuestos ______________________________________________________________________ 76 PDF ___________________________________________________________________________ 77 CDF ___________________________________________________________________________ 80 Caracterización __________________________________________________________________ 80 Propiedades ____________________________________________________________________ 82 Uso de tablas  ___________________________________________________________________ 82 Problema resuelto 3.23 Distribución normal _________________________________________ 82 Problema resuelto 3.24 Método de Sympson ________________________________________ 83 Problema resuelto 3.25 Coeficiente de inteligencia  ___________________________________ 83 

Regla empírica  __________________________________________________________________ 85 Aproximación de una binomial y de una Poisson  _______________________________________ 86 Problema resuelto 3.26 Estudiantes promocionados __________________________________ 87 

Distribución t de Student, f(t,ν) _______________________________________________________ 88 Caracterización __________________________________________________________________ 89 Propiedades ____________________________________________________________________ 90 Uso de tablas  ___________________________________________________________________ 90 Problema resuelto 3.27 Distribución t de Student  ____________________________________ 90 

Distribución chi cuadrado, f(χ2, ν) _____________________________________________________ 91 Caracterización __________________________________________________________________ 93 Propiedades ____________________________________________________________________ 93 Uso de tablas  ___________________________________________________________________ 95 Problema resuelto 3.28 Distribución χ2   ____________________________________________ 96 

Distribución F, f(F,ν1, ν2)_____________________________________________________________ 96 Caracterización __________________________________________________________________ 98 Propiedades ____________________________________________________________________ 98 Uso de tablas  __________________________________________________________________ 100 Problema resuelto 3.29 Distribución F _____________________________________________ 100 Problema resuelto 3.30 Propiedad reciproca  _______________________________________ 101 

Estimador de Densidad Kernel, Kernel Density Estimate, KDE. ____________________________ 101 Distribuciones truncadas ___________________________________________________________ 101 

Problema resuelto 3.31 Normal truncada a la izquierda _______________________________ 102 Momentos de orden n _____________________________________________________________ 103 Función generadora de momentos, MGF m(t)  __________________________________________ 103 

Problema resuelto 3.32 Obtención de MX(t) ________________________________________ 105 Propiedades de la MGF  __________________________________________________________ 107 

IIa Dos variables  ______________________________________________________________ 109 1. Métodos tabulares y gráficos ______________________________________________________ 109 a Variables discretas _______________________________________________________________ 109 PF  ___________________________________________________________________________ 109 CDF __________________________________________________________________________ 109 PF marginales __________________________________________________________________ 110 PF condicionales ________________________________________________________________ 110 Independencia  _________________________________________________________________ 110 

b Variables contínuas ______________________________________________________________ 110 CDF __________________________________________________________________________ 110 PDF __________________________________________________________________________ 110 PDF marginales _________________________________________________________________ 111 PDF condicionales _______________________________________________________________ 111 

Page 4: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

4

Independencia  _________________________________________________________________ 111 2. Métodos numéricos _____________________________________________________________ 111 Medidas de posición _______________________________________________________________ 112 Vector esperanza _______________________________________________________________ 112 Esperanza conjunta  _____________________________________________________________ 112 Esperanza condicional  ___________________________________________________________ 112 

Medidas de dispersión _____________________________________________________________ 112 Vector varianza _________________________________________________________________ 112 Varianza conjunta _______________________________________________________________ 113 Varianza condicional _____________________________________________________________ 113 

Medidas de asociación _____________________________________________________________ 113 Covarianza  ____________________________________________________________________ 113 Correlación lineal _______________________________________________________________ 113 Matriz Covarianzas, P ____________________________________________________________ 113 Matriz de correlaciones, R ________________________________________________________ 114 Problema resuelto 3.33. Género de los hijos ________________________________________ 114 Problema resuelto 3.34. Demanda diaria  __________________________________________ 115 Problema resuelto 3.35. Tiempo de vida de 2 dispositivos electrónicos  __________________ 116 

IIb Funciones de variables aleatorias (dos variables) _________________________________ 118 Métodos ________________________________________________________________________ 118 1 Caso discreto _________________________________________________________________ 118 Método de la PF ________________________________________________________________ 118 Problema resuelto 3.36 Defectuosos en 2 líneas de producción  ________________________ 118 

2 Caso contínuo  ________________________________________________________________ 119 Método de la CDF _______________________________________________________________ 119 Problema resuelto 3.37 Transformación suma ______________________________________ 120 

Método de la PDF _______________________________________________________________ 121 Funciones  1 2( , )Y H X X= importantes ____________________________________________ 122 Problema resuelto 3.38 Transformación suma ______________________________________ 123 

Métodos numéricos _______________________________________________________________ 124 Valor esperado de Y _____________________________________________________________ 125 H lineal  _______________________________________________________________________ 125 Problema resuelto 3.39 Distribución hipergeométrica ________________________________ 126 

IIc Modelos teóricos de dos variables _____________________________________________ 129 1 Modelos discretos _______________________________________________________________ 129 Multinomial, m(yA,yB,yC,n,pA,pB,pC)  ___________________________________________________ 129 Supuestos _____________________________________________________________________ 129 Expresiones generales  ___________________________________________________________ 129 PDF conjunta ___________________________________________________________________ 130 Relación con la binomial __________________________________________________________ 130 Caracterización _________________________________________________________________ 130 Problema resuelto 3.40 Examen de selección múltiple ________________________________ 131 

Distribución Multihipergeométrica ___________________________________________________ 131 PDF conjunta ___________________________________________________________________ 131 Relación con la hipergeométrica ___________________________________________________ 132 Caracterización _________________________________________________________________ 132 Esperanza _____________________________________________________________________ 132 

2 Modelos contínuos  ______________________________________________________________ 133 Distribución uniforme ______________________________________________________________ 133 PDF conjunta ___________________________________________________________________ 133 Problema resuelto 3.41 Encuentro  _______________________________________________ 133 

Distribución binormal ______________________________________________________________ 133 nXY(μx, μy, σx, σy, ρ) ______________________________________________________________ 134 PDF conjunta ___________________________________________________________________ 134 

Page 5: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Introducción – Objetivos

5

PDF marginales _________________________________________________________________ 134 Caracterización _________________________________________________________________ 134 

III Confiabilidad, R(t) ___________________________________________________________ 136 Distribución exponencial  _________________________________________________________ 139 Distribución Gamma, (t,r,α) _______________________________________________________ 141 Distribución de Weibull, (x,ω,β) ____________________________________________________ 141 Distribución normal _____________________________________________________________ 144 Sistemas ______________________________________________________________________ 146 Problema resuelto 3.42. Ley exponencial de fallas ___________________________________ 147 Problema resuelto 3.43. Frecuencia de fallas variable  ________________________________ 148 

IV Teoría de los juegos  _________________________________________________________ 150 1 Simultáneos con estrategias puras __________________________________________________ 152 a Formas del juego ______________________________________________________________ 152 b Equilibrio de Nash _____________________________________________________________ 154 c Eficiencia y justicia _____________________________________________________________ 158 d Estrategias Minimax y MaxiMin  __________________________________________________ 159 e Juegos de suma cero ___________________________________________________________ 162 Problema resuelto 3.45 Sistemas de video _________________________________________ 163 Problema resuelto 3.46 El juego de la contaminación  ________________________________ 164 Problema resuelto 3.47 Competición Cournot  ______________________________________ 165 

2 Simultáneos con estrategias mixtas  _________________________________________________ 167 a Formas del juego ______________________________________________________________ 167 b Equilibrio de Nash _____________________________________________________________ 168 c Funciones de mejor respuesta  (BRF, Best Response Function) __________________________ 169 Problema resuelto 3.48 Estrategia de juego en el saque  ______________________________ 169 Problema resuelto 3.49 Estrategia de juego en el saque  ______________________________ 176 

d Conjunto convexo de ganancias __________________________________________________ 178 3 Secuenciales ____________________________________________________________________ 179 a Formas del juego ______________________________________________________________ 179 b Subjuego  ____________________________________________________________________ 181 c Equilibrios ____________________________________________________________________ 181 d Juegos simultáneos ____________________________________________________________ 184 e Racionalidad secuencial y credibilidad _____________________________________________ 187 Problema resuelto 3.50 Educación parental ________________________________________ 187 

f Aplicación: juego de ajedrez  _____________________________________________________ 189 4 Teoría de las decisiones económicas_________________________________________________ 189 a Formas de la decisión  __________________________________________________________ 190 Problema resuelto 3.51 Mejor inversión ___________________________________________ 191 Problema resuelto 3.52 Acciones y la economía _____________________________________ 192 

b Caso particular: una sola acción __________________________________________________ 193 Problema resuelto 3.53 Rifa para juntar fondos _____________________________________ 193 Problema resuelto 3.54 Costo de la prima de seguros  ________________________________ 194 Problema resuelto 3.55 Ruleta europea  ___________________________________________ 196 Problema resuelto 3.56 Estrategias de ventas _______________________________________ 197 

V Simulaciones  _______________________________________________________________ 199 1 Simulación de distribuciones _________________________________________________________ 199 

Problema resuelto 3.57 Simulación Montecarlo _____________________________________ 201 2 Simulación de juegos _______________________________________________________________ 202 ComLabGames ___________________________________________________________________ 202 a Moderador _____________________________________________________________________ 202 a Design  ______________________________________________________________________ 203 b Assignment  __________________________________________________________________ 206 c Execution ____________________________________________________________________ 207 e Data ________________________________________________________________________ 208 

Page 6: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

6

b Jugador (cliente)  ________________________________________________________________ 209 Client Play _____________________________________________________________________ 209 Problema resuelto 3.58 El empresario y el capitalista _________________________________ 211 

Ensayo: ¿Creer en Dios mejora la existencia? _______________________________________ 215 El peso de la decisión. Blas Pascal  ____________________________________________________ 215 

Ensayo: Intimidades de un casino  ________________________________________________ 217 Introducción _____________________________________________________________________ 217 1. Casinos _______________________________________________________________________ 217 2. Aseguradoras __________________________________________________________________ 222 

Problemas ___________________________________________________________________ 224 Ia Una variable ___________________________________________________________________ 224 Ic Modelos teóricos de una variable  __________________________________________________ 225 Discretas ______________________________________________________________________ 225 Contínuas _____________________________________________________________________ 228 

IV Teoría de los juegos _____________________________________________________________ 231 Problemas con base de datos ________________________________________________________ 234 

Page 7: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Introducción – Objetivos

7

Capítulo 3 Distribuciones

de Probabilidades

Objetivos • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones. • Mostrar cual distribución utilizar y aprender cómo obtener sus valores. • Apreciar las limitaciones de cada una de las distribuciones que utilice.

Page 8: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

8

Introducción

En este capítulo se estudiará la tercera y última de las bases necesarias para afrontar en los capítulos restantes, la inferencia estadística. Como su nombre lo indica, esta tercera base, se apoya en realidad sobre los hombros de las dos anteriores. Este capítulo recorre en gran medida, el esquema del capítulo 1, distribuciones de frecuencias, pero en lugar de tratar muestras, lo haremos con poblaciones.

Variable aleatoria, v.a. Las probabilidades se aplican a eventos A, por ejemplo P(A)=0.5, sin embargo, para realizar estudios matemáticos como los del capítulo 1, los eventos deben ser numéricos. De aquí que resulte necesario definir una variable numérica asociada a cada evento, X =X(A). Esta variable se llama aleatoria (v.a.), pues toma cada uno de sus valores (eventos) con una definida probabilidad. La función que relaciona los eventos con la variable numérica aleatoria debe ser biyectiva, es decir para cada evento A le corresponde uno y solo un valor X(A). EL gráfico de la figura 3-1a indica una v.a. posible para el espacio muestral del lanzamiento de 2 monedas, en el cual la v.a. es el número de Caras. El esquema conceptual general es el de la figura 3-1b.

a

b

A x px=X(A) p=P(x)

p=P(A)

Page 9: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Introducción – Distribución de probabilidades

9

Figura 3-1 Variable Aleatoria

La expresión p(x) es una simplificación de la notación más precisa: ( ) ( : ( ) ) ( ) ( )P A P A X A x P X x p x= = = = =

De aquí en más utilizaremos en general la notación que prescinde de los eventos A, pero el estudiante debe comprender el significado que realmente representa esta notación. En muchos casos, el evento es numérico por sí mismo, como por ejemplo, el número de esferas o mujeres que se extrae de un grupo, la suma de los números de 2 dados, la ganancia monetaria, etc. Cuando esta situación no se presente, los números que se asignan a la v.a son en principio arbitrarios, pero si se relacionan con el evento, mejor. En general se designa una variable aleatoria con letra mayúscula (con dominio sobre los eventos experimentales) y a un valor específico o determinista de ella con letra minúscula (con dominio sobre los números reales), aunque algunas letras configuran la excepción, como por ejemplo: z, t o p̂ .

Esta notación se aplicará en este libro para X e Y, en especial cuando la variable aleatoria se encuentre dentro de una función específica para estas variables, tales como: P(X), E(X), V(X) y Cov(X,Y), dando a entender que su dominio es el de los sucesos experimentales.

Distribución de probabilidades Es una función que asocia a cada valor de todos los posibles x, su probabilidad p(x). En el capítulo 1 hemos estudiado las distribuciones de frecuencias de muestras y en el capítulo 2 hemos visto que la frecuencia relativa muestral a largo plazo es la probabilidad en una población. Uniendo ambos conocimientos, podemos generalizar todos los conceptos vistos cambiando la frecuencia relativa por probabilidad: Por esta razón, la siguiente sección es en realidad una adaptación de conceptos anteriores.

Page 10: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

10

Ia Una variable

Comenzamos con los métodos aplicables a una sola variable. Una variable aleatoria es numérica o cuantitativa y, como vimos en el capítulo 1, se divide en: 1. Discretas 2. Continuas o de escala

1 Métodos tabulares y gráficos

a Variables cuantitativas discretas Recordemos del capítulo 1 que las variables cuantitativas discretas son las variables que resultan de contar, por lo tanto generalmente se definen como "X = número de…"

Tablas Llamamos: • S, al espacio muestral, • E, a cada uno de los eventos del mismo, • X, a la v.a asignada a cada evento, • p = P(X = x) = p(x), a las probabilidades de cada evento. La distribución de probabilidades, se puede definir con una tabla como la de la figura 3-2.

S E1 E2 E3 … En X = x x1 x2 x3 … xn p(x) p1 p2 p3 … pn F(x) p1 p1 + p2 p1 + p2 + p3 … 1

Figura 3-2 Tabla de una distribución de probabilidades categórica

Diagramas

PF El histograma de probabilidades equivalente a la tabla se suele llamar PF (Probability Function) y mostrará un valor de p(x) para cada uno de los valores de discretos de la variable. Para que el área mida una probabilidad, la representación más adecuada es utilizar una flecha para cada x (figura 3-3). Esta simbología matemática se llama delta de Dirac, δ(x) (ver más adelante) la cual permite expresar correctamente los cálculos. De todas formas se acepta también un rectángulo para cada x,

Page 11: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

aunquemismo

Propi( )p x ≥

(p x+∞

−∞∑

CDFLa ojivuna funextremCon exmatem

e debe interpro, excepto par

edades 0≥

) 1x =

F va o CDF (Cunción escalón

mo. xcepción del p

máticas, pues e

Ia Una v

retarse que, a a el punto me

umulative Disn ( )F x con d

punto siguienen estadística

ariable – a V

diferencia deedio.

Prob

stribution Fundiscontinuidad

nte, no se utilisignifica la E

Variables cuan

e un histogram

Figura 3-3 ability Functio

nction), tomardes o saltos. C

zará para el eEsperanza de x

ntitativas disc

ma, no existen

on

rá el aspecto dCada escalón

escalón la notx.

cretas

n valores para

de la figura 3-incluye el ini

ación ( )E x ,

a la base del

-4, mostrandoicio y excluye

usual en

o e el

Page 12: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

12

Matem

Propi(F −∞(F +∞

RelacTal com

Expre1 DeltaFormalsiguien

Genera

Para insalto d

máticamente:

edades ) 0= ) 1=

ción entre pmo vimos en

esión matea de Dirac lmente la funnte forma:

alizando:

nterpretar a ese altura unita

Capí

p(x) y F(x)el capítulo 1

emática de

nción delta de

sta función, apria y ancho d

ítulo 3 Distrib

Jorge

Cumulative

( )F x p=

) para las varia

(p

( )F x

la p(x)

Dirac se defi

( )xδ =

( )a x aδ δ= −

proximemos ee longitud Δ,

buciones de P

e Carlos Carr

Figura 3-4 e Distribution F

( )p X x≤ = ∑

ables numéric( )( ) dF xx

dx=

) ( )x

p x d−∞

= ∫

ine a partir de

( ) dE x en xdx

( )dE x adx

−=

en forma contal como se m

Probabilidade

Function

k

ii

p∑

cas:

dx

e la función es

0x =

en x a=

ntínua al escalmuestra en la

es

scalón unitari

lón unitario, cfigura 3.7.

io E(x), de la

con EΔ(t), un

Page 13: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ia Una variable – a Variables cuantitativas discretas

13

Figura 3-5

EΔ(t), aproximación contínua al escalón unitario

La derivada de EΔ(t) será un pulso de duración Δ, de altura 1/Δ y como su base es Δ, el pulso será por lo tanto de área 1 para todo Δ, como se muestra en la figura 3.8.

Figura 3-6

Derivada de EΔ(t)

Si Δ tiende a 0, entonces δΔ(t) se vuelve más angosto y alto, pero manteniendo su área unitaria, tendiendo a δ(t). En el límite se puede expresar que el área es 1.

00

)0

(

xsi xsi x

δ∞ =

≠=

⎧⎨⎩

( ) 1x dxδ+∞

−∞=∫

2 Expresión de f(x) Por definición:

( )

0 si x asi x

aa

xδ∞ =

=≠

−⎧⎨⎩

¨

En general para todos los puntos del espacio muestral, la función densidad es una función definida por tramos de pulsos modulados por pi (tren de pulsos).

( ) ( )i ii

f x p x xδ= −∑

Valor de p(x) Supongamos que en un punto arbitrario a, p(x) tiene el valor pa. La probabilidad es el área de la función densidad en ese punto, por lo cual debemos integrar entre 2 valores que solo comprendan a dicho punto:

( ) ( ) 1a

a a aap x a p x a dx p pδ

+

−= = − = =∫

Dado que la delta de Dirac se expresa por una flecha, ésta es la representación más adecuada para la gráfica de la PF. Estrictamente el valor en cada punto es infinito, pero suele expresarse el valor de la probabilidad con flechas de altura proporcional a dicho valor, sobreentendiendo que se está expresando el área.

Page 14: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

14

Expresión de F(x) Integrando la función densidad pero ahora entre −∞ y el punto a :

( )1 1( ) ( ) ... ( )a

aF a p x x p x a dxδ δ

−∞= − + + −∫

es decir:

11 ...( 1)a

a iF a pp p−∞

+ + == ∑

Es también una función definida por tramos, en este caso escalonados.

Notación La vinculación funcional entre los valores de eje, x y valores acumulados de área por la izquierda, CDF, se puede expresar de 2 formas alternativas: con subíndice o con paréntesis:

( )( ) ( )

CDF

x CDF

x CDF xCDF x CDF P x x

=

= = < En la unidad 1 usamos en forma indistinta las notaciones de paréntesis y subíndice para CDF, con F CDF= , aunque el subíndice fue más frecuente para los cuantiles ( Fx ). Sin embargo, cuando sea necesario precisar la dependencia a otras variables (media, desviación estándar, tamaño de la muestra, tamaño de la población, grados de libertad, etc), es conveniente normalizar la notación y usar la notación de subíndice para la relación anterior dejando el paréntesis para cualquier vinculación restante. Ejemplo:

0.80 0.80( , ) ( , ) (100,15) 112.6CDFx x s x x s x= = =

Esta expresión significa el valor del eje x para una CDF= 0.80, con media 100, y desviación estándar 15 (los números de este ejemplo corresponden a una distribución normal que veremos luego).

SIG El complementario de la CDF, es decir usando valores acumulados por la derecha, se llama SIG, SIGnificación, nombre proveniente de la inferencia estadística (capítulo 5), o también α1.

1SIG CDFα= = −

Nota En aplicaciones a la confiabilidad se llama también Función Supervivencia, (Survival Function).

Notación Nuevamente, la relación entre los valores del eje y del área se puede representan con un paréntesis o con un subíndice.

( )( ) ( )x

x xx P x x

α

α

αα α

== = >

1 También se usa α para simbolizar el área de ambas colas, incluyendo la cola inferior. El contexto indicará el significado.

Page 15: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ia Una variable – b. Variables cuantitativas de escala

15

b. Variables cuantitativas de escala Recordemos del capítulo 1 que las variables cuantitativas de escala son las variables que resultan de medir.

Diagramas Son la expresión contínua de las relaciones anteriores.

PDF PDF significa Probability Density Function. El SPSS llama PDF tanto a las PF de las distribuciones discretas como a las PDF de las continuas, por lo cual seguiremos en general la misma idea. Un ejemplo se muestra en la figura 3-7.

Figura 3-7

PDF

Propiedades ( ) 0f x ≥

( ) 1f x dx+∞

−∞=∫

Notas 1. La función densidad f(x) no representa la probabilidad de nada. Es el área debajo de ella la que representa

una probabilidad.

2. Para el caso contínuo, debe ser P(x = xi) = 0, pues el área es cero en xi. Desde el punto de vista estadístico esto se interpreta pensando que entre infinitos valores, es altamente improbable que se presente exactamente el resultado x = xi. El cálculo de probabilidades de variables contínuas solo tiene sentido si se utilizan intervalos y no puntos. De aquí que las siguientes expresiones son todas idénticas:

( ) ( ) ( ) ( )P a X b P a X b P a X b P a X b≤ ≤ = < ≤ = ≤ < = < <

Page 16: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

16

Probabilidad de masas Resulta útil una analogía que surge de considerar a la función densidad como una densidad lineal de masa en el eje x. Con esta interpretación, la probabilidad sería el área entre la línea f(x) y el eje x. En particular si la f(x) es constante (distribución uniforme) de valor c y la longitud sobre el eje x es L, la constante deberá ser 1/ L .

CDF Se muestra en la figura 3-8.

Figura 3-8

CDF

Propiedades ( ) 0F −∞ = ( ) 1F +∞ =

Relación entre f(x) y F(x) Tal como adelantamos en el capítulo 1:

( )( ) dF xf xdx

=

( ) ( )x

F x f x dx−∞

= ∫ Más formalmente, por definición de función densidad:

( ) ( )x

P X x f x dx−∞

≤ = ∫

además por definición de función distribución: ( ) ( ) ( ) ( )P X x F x F F x≤ = − −∞ =

Vinculando ambas expresiones, se tiene la relación buscada.

Page 17: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ia Una variable – 2. Métodos numéricos

17

2. Métodos numéricos Parámetros y estadísticos Al igual que la pendiente y la ordenada al origen son parámetros que caracterizan a una recta, los métodos numéricos que veremos a continuación proveen parámetros que caracterizan a la distribución de probabilidades. En cambio, las magnitudes de los métodos numéricos aplicados a muestras aleatorias del capítulo 1, se llaman estadísticos Y, definidos como cualquier función aplicada a los n valores de la muestra

1 2( , ,... )nx x x , es decir 1 2( , ,... )nY H x x x= . Observar que al ser las X variables aleatorias, los estadísticos Y también lo son. Así por ejemplo, la media x de la unidad 1 es un estadístico, en cambio la media μ que se verá en este capítulo es un parámetro de la distribución. Para obtener la versión para la población, se deberá en:

Discretas Reemplazar la frecuencia fx por p

Contínuas Reemplazar la sumatoria por la integral y la frecuencia fx por f(x)dx.. Además, dado que las distribuciones de probabilidades corresponden a una población, en el cálculo de la varianza se deberá dividir por n en lugar de 1n − .

Medidas de posición

Modo M es el valor de x que le corresponde al máximo de la distribución.

Contínua Como es el máximo de la distribución, surgirá de las raíces de:

( ) 0df xdx

=

Mediana Q2 se obtiene con las mismas expresiones vistas en el capítulo 1.

Contínua Q2 será el valor de x que le corresponde a un área del 50% contada desde los extremos.

2 0.( ) 5Q

f x dx−∞

=∫

De forma similar se define cualquier percentil.

Valor esperado La media de una variable aleatoria poblacional se llama además, valor esperado, pues es el valor promedio que esperaríamos obtener si las repeticiones se pudieran realizar en forma indefinida. La notación de la media y la desviación estándar para muestras del capítulo 1, se realizó con letras del

Page 18: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

18

alfabeto latino. Para las distribuciones de probabilidades de poblaciones, se utilizan en cambio, letras del alfabeto griego.

( )x E Xμ→ =

( )s V Xσ→ =

Discretas Reemplazando la frecuencia relativa por la probabilidad, se tendrá:

pxμ = ∑ El valor esperado es entonces un promedio ponderado de los valores de x, donde el peso está dado por la probabilidad de cada x.

Contínuas

( ) ( )E x x f x dx= ∫

Medidas de dispersión

Amplitudes Son idénticas a las ya vistas para las distribuciones de frecuencias.

Desviación Media Discretas

xDM p= Δ∑ Contínuas

( )DM x f x dxμ= −∫

Varianza Discretas

2( ) xV X p= Δ∑ Suma de cuadrados Las expresiones de los SSxx se mantienen, cambiando la frecuencia f por p:

2 2xxSS px nμ= −∑

La varianza será entonces: 2

2 2 2( ) ( )xx pxSSV x E xn n

μ μ= = − = −∑

La varianza de una población es la media de los cuadrados menos el cuadrado de la media.

Contínuas

2( ) ( ) ( )V x x f x dxμ= −∫ Suma de cuadrados

Page 19: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ia Una variable – Propiedades

19

Las expresiones de los SSxx se mantienen, cambiando la frecuencia f por ( )f x dx :

2 2( )xxSS x f x dx nμ= −∫

La varianza será entonces: 2 2( ) ( )xxSSV x E x

nμ= = −

Desviación estándar

( )V Xσ =

Propiedades Se repiten a continuación las propiedades ya estudiadas y demostradas en el capítulo 1. Las demostraciones para variables contínuas son análogas a las de variables discretas, cambiando la sumatoria por la integral.

1 ( )E c c= 1 ( ) 0V c =

2 ( ) ( )E cX cE X= 2 2( ) ( )V cX c V X= 3 ( ) ( )E c X c E X± = ± 3 ( ) ( )V c X V X± = 4 ( ) ( ) ( )E X Y E X E Y± = ± 5 ( ) ( ) ( ) ( )E XY E X E Y Cov XY= − 5 ( ) ( ) ( ) 2 ( , )V X Y V X V Y Cov X Y± = + ± 6 ( , ) ( , )Cov aX bY abCov X Y= 7 ( , ) ( , )Cov a X b Y Cov X Y+ + = 8 ( , ) ( , )Cov aX bY abCov X Y=∑ ∑ ∑

Recordemos que en las propiedades 5 si los eventos son independientes, la covarianza es cero.

Desigualdad de Tchebyscheff La demostración de esta desigualdad se realizó en el capítulo 1 (página Tchevy1), simplemente ahora la expresaremos en términos de probabilidades: Esto resulta directamente de reconocer que una sumatoria de frecuencias relativas se corresponde con una probabilidad, la cual se expresa en el campo contínuo con una integral:

2 2

( ) (| | )x kcolas colas

f f x dz P X zμ σ= = − >∑ ∫

en donde la última expresión indica valores de X en las 2 colas: k kz X zμ σ μ σ− > > + . Por lo tanto la desigualdad se expresa:

2

1(| | )kk

P X zz

μ σ− > <

Page 20: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

20

Problema resuelto 3.1 Selección de 3 esferas

Tres esferas se eligen aleatoriamente de una urna conteniendo 20 esferas numeradas. Si X es el mayor número de las 3 esferas, a) construir la PF, b) ¿cuál es la probabilidad de que solo una de las esferas tenga por lo menos el número 17?, c) hallar F(6). a) Veamos algunos ejemplos:

21

2( 3) 0.000877

203

P X

⎛ ⎞⎜ ⎟⎝ ⎠= = =

⎛ ⎞⎜ ⎟⎝ ⎠

31

2( 4) 0.00263

203

P X

⎛ ⎞⎜ ⎟⎝ ⎠= = =

⎛ ⎞⎜ ⎟⎝ ⎠

41

2( 5) 0.00526

203

P X

⎛ ⎞⎜ ⎟⎝ ⎠= = =

⎛ ⎞⎜ ⎟⎝ ⎠

171

2( 18) 0.119

203

P X

⎛ ⎞⎜ ⎟⎝ ⎠= = =

⎛ ⎞⎜ ⎟⎝ ⎠

181

2( 19) 0.134

203

P X

⎛ ⎞⎜ ⎟⎝ ⎠= = =

⎛ ⎞⎜ ⎟⎝ ⎠

191

2( 20) 0.150

203

P X

⎛ ⎞⎜ ⎟⎝ ⎠= = =

⎛ ⎞⎜ ⎟⎝ ⎠

La distribución es: X  3  4 5 6 7 8 9 10 11 

P(X)  0.001  0.003 0.005 0.009 0.013 0.018 0.025 0.032 0.039 

X  12  13 14 15 16 17 18 19 20 

P(X)  0.048  0.058 0.068 0.080 0.092 0.105 0.119 0.134 0.150 

Figura 3-9 b)

( 17) 0.105 0.119 0.134 0.150 0.508P X ≥ = + + + = c)

(6) ( 6) 0.00087 0.00263 0.00526 0.00877 0.03F P X= ≤ = + + + = Notar que la FDP no es ( 6)P X < pues siempre debe incluir al valor.

Problema resuelto 3.2 Dado 1

Se arroja un dado. Si se define x = número que sale, a) obtener la distribución de probabilidades, b) hallar el valor esperado y la varianza. a)

S X = x 1 2 3 4 5 6 p(x) 1/6 1/6 1/6 1/6 1/6 1/6 F(x) 1/6 2/6 3/6 4/6 5/6 1

Figura 3-10 Tabla

Page 21: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ia Una variable – Desigualdad de Tchebyscheff

21

Figura 3-11

PDF

Figura 3-12

CDF b)

21( ) 3.506

E x = =

V(x)= 2.91735( ) 2.91712

V X = =

1.707σ =

Page 22: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

22

Figura 3-13

Caracterización

SPSS

En la figura 3-13 se ha colocado la salida del SPSS. Sin embargo debe tenerse en cuenta que el programa realiza el cálculo muestral y por lo tanto divide la varianza por n-1. Para obtener el valor poblacional se debe por lo tanto multiplicar por n-1 y dividir por n. Por lo tanto:

5( ) 3.5 2.9176

V x = =

Problema resuelto 3.3 Dado 2

Se arroja un dado 160 veces. Si x es el número que sale, calcular la media y la varianza de: Y X= ∑

En lugar de realizar 6160 cálculos, resulta mucho más práctico aplicar las propiedades de la esperanza y de la varianza y utilizar los resultados del problema anterior.

21( ) ( ) ( ( ) 160 160 5606xE Y E X E X μ= = = = =∑ ∑

35( ) ( ) ( ( ) 160 ( ) 160 466.712

V Y V X V X V X= = = = =∑ ∑

Problema resuelto 3.4 Clientes de un supermercado

El 20% de los clientes de un supermercado leen los precios antes de comprar un artículo. Si 2 clientes entran, hallar la distribución de probabilidades de x = número de clientes que leen los precios, su media y su varianza. Si llamamos N al evento No leen y L al evento Leen, se tiene: P(N) = 0.8 P(L) = 0.2 Por lo tanto:

Page 23: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ia Una variable – Suceso poco común: criterio con probabilidades

23

S NN NL LN LL X = x 0 1 2 p(x) 0.8(0.8) 0.8(0.2)2 0.2(0.2)

Figura 3-14 Distribución de x

E(x)=0.40 V(x)= 0.32

Problema resuelto 3.5 Demanda de nafta

La función densidad de una variable que representa la demanda semanal de nafta de una estación de servicio (en miles de litros) es:

2 0 1( )

0 x x

f xen otro lugar

≤ ≤⎧= ⎨

Obtener a) la F(x), b) la esperanza y la varianza, c) la P(0.5< X < 0.8). a)

2

0

( ) ( ) 2x

F x P X x xdx x= ≤ = =∫

b) 1

0( ) (2 ) 2 / 3E X x x dx= =∫

( )22( ) ( ) ( )V X E X E X= − 1

2 2

0

( ) (2 ) 1/ 2E X x x dx= =∫

2( ) 1/ 2 (2 / 3) 1/18V X = − = c)

0.80.82

0.50.5

(0.5 0.8) 2 0.39P x xdx x< < = = =∫

Suceso poco común: criterio con probabilidades La identificación de sucesos poco comunes ya fue presentada en el capítulo 1, en el cual se utilizaron:

Criterio del diagrama de caja Este criterio hace uso de los valores extremos a más de 1.5(AIC), página outliers1.

Criterio del intervalo z Este criterio solo hace uso de la media y de la desviación estándar de la distribución de probabilidades, página reglaintervalo1.

Page 24: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

24

Veamos ahora otro criterio para una identificación más precisa, pues utiliza las colas de la distribución de probabilidades.

Criterio con probabilidades Si bajo determinados supuestos, existe una probabilidad extremadamente pequeña de obtener resultados al menos tan extremos como los observados, debemos concluir que el suceso es poco común y por lo tanto los mencionados supuestos probablemente no sean correctos.

Ampliaciones 1. La expresión " resultados al menos tan extremos como los observados" es equivalente a decir

"resultados dentro de la cola de la distribución" a partir del valor observado2. 2. Esta probabilidad extremadamente pequeña que se sitúa en las colas de la distribución, se

llamará valor p en el capítulo 5, constituyendo un aspecto esencial de una prueba de hipótesis. Este valor p se combina con los valores máximos convencionales, llamados comúnmente valores α , usualmente 1% y 5% (página 14). A menos que se indique lo contrario adoptaremos

5%α = . Luego de estudiar la distribución normal (página 76), podremos concluir que los 2 últimos criterios coinciden si la distribución es normal y z = 2.

Problema resuelto 3.6 Dados de distintos colores

Se lanzan un dado rojo y otro negro. a) Hallar la distribución de x = suma de los 2 números, la media y la desviación estándar. Se observa que las probabilidades son simétricas respecto de la suma 7 y que estos valores siempre suman 14 (en el caso de 3 dados sucede lo mismo y los totales suman 21). ¿Por qué sucede esto? b) ¿Es un suceso poco común que se lance un par de dados y que la suma sea mayor a 11? a)

X=x 2 3 4 5 6 7 8 9 10 11 12 p(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Figura 3-15 Distribución de x

E(X)= 7 σ = 2.42 b) Si, es poco común pues la probabilidad es 2.77%, menor al 5%. Si sucede al azar, es lícito dudar de la confección de los dados.

2 Según el contexto puede interesar la cola derecha, la cola izquierda o ambas colas. Este aspecto se profundizará en el capítulo 5.

Page 25: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ib Funciones de variables aleatorias (una variable) – Suceso poco común: criterio con probabilidades

25

Ib Funciones de variables aleatorias (una variable)

Muchas veces se conoce la distribución de probabilidad de una v.a. por ejemplo, X y se desea la distribución de probabilidad de otra variable Y, relacionada con X a través de: Y=H(X). Este es el objetivo de esta sección, para el caso de una variable. Más adelante en la sección IIb, se estudiará el caso de 2 o más variables. Llamaremos: f(x), F(x) y RX a la PDF, CDF y campo de valores de X, respectivamente. g(y, G(y) y RY a la PDF, CDF y campo de valores de Y, respectivamente.

Eventos equivalentes Si X es una v.a. definida sobre el espacio muestral S y s es un elemento de S, se tiene que por cada s S∈ , existe la relación: ( )X s . Si además ( )Y H X= , se verificará que [ ( )] ( )y H X s Y s= = . Si la relación definida por H es inyectiva, los dos conjuntos, RX y RY, definidos por:

{ | ( ) } y { | ( ) }x Ys X s R s Y s R∈ ∈

son iguales. Por lo tanto:

( ) ( )Y xP Y R P X R∈ = ∈ El esquema visual se presenta en la figura 3-16.

Figura 3-16

Siendo XR el conjunto de valores de x asociado por la función H al conjunto Y y≤ .

Observar que aunque sea ( ) ( ) ( )YP Y R P Y y G y∈ = ≤ = , ( )xP X R∈ no es en general ( ) ( )P X x F x≤ = (solo es cierto para una H creciente, como se intuye si se realizan gráficas de H

tanto creciente como decreciente).

X Y

P(xeRx) P(yeRy)

Hs

P(s) = =.

Page 26: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

26

Métodos Se divide el desarrollo, según sea una variable discreta o contínua.

1 Caso discreto Se tiene un solo método.

Método de la PF 1( ) ( ) ( ( ) ) ( ( )) ( ) ( )g y P Y y P H X y P X H y P X x f x−= = = = = = = = =

Dado que la distribución no cambia, solo habrá que agrupar las probabilidades para los valores de y coincidentes.

Problema resuelto 3.7 Transformación cuadrática

Dada la siguiente PF en X y la transformación Y=H(X), hallar la PF en Y y el valor esperado E(Y). x -1 0 1

p(x) 0.20 0.30 0.50

2y x= Figura 3-17

Método PF

y 1 0 1 p(y) 0.20 0.30 0.50

Agrupando valores: y 0 1

p(y) 0.30 0.70

E(Y) = 0.70

2 Caso contínuo Se tienen 3 métodos generales: 1. Método de la CDF 2. Método de la PDF 3. Método de la MGF (Función Generadora de Momentos, página 103)

Método de la CDF Se obtiene la CDF, G(y), integrando f(x) en una región de integración RX, pues:

( ) ( ) ( ) ( )X

XR

G y P Y y P X R f x dx= ≤ = ∈ = ∫

Page 27: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ib Funciones de variables aleatorias (una variable) – Métodos

27

Paso 1 Dominio de las x en función de las y

Analítico Encontrar la región de integración RX en función de Y, a partir de 1( )Y y X H y−≤ ⇒ ≤ . Esto implica resolver la inversa de H(x).

Numérico Lo anterior se debe hacer en el dominio numérico de las X de la PDF, por lo cual se deberá obtener la correspondencia entre los dominios numéricos de las X (en la PDF) y de las Y (función H). Para esto bastará dibujar la función H(x).

Paso 2 integrar f(x) en ese dominio Se obtiene la CDF, G(y), integrando f(x) en región anterior. Se remarca nuevamente que en el caso general, al despejar X, no necesariamente resulta una expresión del tipo ( )P X x≤ , en cuyo caso coincidiría con la F(x) (ver método de la PDF). Luego se podrá obtener la PDF, g(y), derivando G(y).

Problema resuelto 3.8 Transformación cuadrática

Dada la siguiente PDF en X y la transformación Y=H(X), hallar la PDF en Y. 1 1 1

( ) 20

x xf x

en otro punto

+⎧ − ≤ ≤⎪= ⎨⎪⎩

2( )y H x x= =

Método de la CDF

Paso 1 Dominio de las x en función de las y Analítico Implica hallar la inversa de H(x).

2Y y X y y X y≤ ⇒ ≤ ⇒ − < < Numérico

Para obtener el dominio numérico de y, basta dibujar la función H(x) y establecer la correspondencia con el dominio de x de la PDF. De esta forma se obtiene: 0 1y≤ < .

Paso 2 Integrar f(x) en ese dominio

( )21 ( 1)( ) ( ) ( )

2 4

yy y

y yy

x xG y P Y y P y X y f x dx dx− −

+ += ≤ = − < < = = =∫ ∫

Observar que la función H(x) solo aparece en los límites de integración.

( ) ( )2 21 1

( )4 4

y yG y

+ − += −

Finalmente, derivando la G(y) se obtiene la g(y).

Page 28: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

28

1 11 1 1( )2 22 2 2y y

g yy y y

+ − += + =

1 0 12( )0

yyg y

en otro punto

⎧ ≤ <⎪= ⎨⎪⎩

Observar que las PDF (y CDF) de ambas variables son distintas entre sí.

Nota Podría obtenerse una ecuación general válida para toda transformación cuadrática. Sea 2( )y H x x= =

2( ) ( ) ( ) ( )G y P Y y P X y P y X y= ≤ = ≤ = − ≤ ≤ es decir:

( ) ( )( )G y F y F y= − −

Por lo tanto:

( ) ( )1( ) '( )2

g y G y f y f yy

⎡ ⎤= = + −⎣ ⎦

Si 2( )y H x ax= = , se deja al alumno demostrar que si se opera en forma similar a este ejemplo, se obtienen:

( ) y yG y F Fa a

⎛ ⎞ ⎛ ⎞= − −⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠

1( )2

y yg y f fa aay

⎡ ⎤⎛ ⎞ ⎛ ⎞= + −⎢ ⎥⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎢ ⎥⎝ ⎠ ⎝ ⎠⎣ ⎦

Método de la PDF Continuamos con el desarrollo del método general anterior, para obtener una expresión más simple, pero válida solo si la función H es monótona (creciente o decreciente), lo cual no sucede en el problema resuelto anterior. Si 1( ) x ( )y H x entonces H y−= = .

Si H es creciente: ( )1( ) ( ) ( ( ) ) ( ) ( )G y P Y y P H X y P X H y F x−= ≤ = ≤ = ≤ =

Si H es decreciente: ( )1( ) ( ) ( ( ) ) ( ) 1 ( )G y P Y y P H X y P X H y F x−= ≤ = ≤ = ≥ = −

Estas relaciones pueden apreciarse claramente si se hacen gráficos de una función creciente y una decreciente. Si H es creciente:

( ) ( ) ( ) ( ) 'x x

G y F x f x dx f x x dy−∞ −∞

= = =∫ ∫

En donde se utilizó la relación de contenidos (que se estudia en análisis matemático): 'dx x dy= Si se deriva la última ecuación surge finalmente que:

( )( ) ( ) ''

f xg y f x xy

= =

Page 29: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ib Funciones de variables aleatorias (una variable) – Métodos

29

Si H es decreciente, se razona igual, pues al derivar G(y), se anula el término igual a 1. El resultado queda afectado por un signo – pero como 'x es negativo al ser H decreciente, pueden resumirse ambos casos con la expresión general:

( )( ) ( ) | ' || ' |f xg y f x xy

= =

Esta relación que permite resolver el problema (solo para H creciente o decreciente) ya fue obtenida informalmente en la unidad 1, página CambioVar1. Como alternativa de demostración se podría derivar la relación ( ) ( )G y F x= respecto de y:

( ) ( ) ( ) ( ) 'dG y dF x dF x dx dF x xdy dy dx dy dy

= = =

Finalmente observar que desde el punto de vista dimensional, tanto 'x como 'y cancelan la dimensión de ( )f x y establecen la de ( )g y .

Nota Puede observarse que la diferencia en el desarrollo de ambos métodos se presenta cuando se despeja X de

( )H X y≤ dentro de la expresión probabilística. Solo resulta la expresión de F(x), si H es creciente o decreciente. En realidad, podría extenderse el desarrollo del método de la CDF en forma similar al seguido en el método de la PDF, obteniéndose así una expresión algo más compleja. Esto se realizó en el problema resuelto anterior, pero para no sobrecargar la memoria, es preferible integrar en cada caso.

Problema resuelto 3.9 Transformación lineal

Dada la siguiente PDF en X y la transformación Y=H(X), hallar la PDF en Y. 2x 0 1

( )0

xf x

en otro punto≤ ≤⎧

= ⎨⎩

3 1y x= + La función H es monótona, por lo tanto puede aplicarse tanto el método CDF como el PDF.

Método de la CDF

Paso 1 1( ) ( ) (3 1 )

3yG y P Y y P X y P X −⎛ ⎞= ≤ = + ≤ = ≤⎜ ⎟

⎝ ⎠

Paso 2 2

( 1)/3

0

1( ) 23

y yG y xdx− −⎛ ⎞= = ⎜ ⎟

⎝ ⎠∫

Por lo tanto: 2( ) '( ) ( 1)9

g y G y y= = −

Page 30: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

30

Método de la PDF

1 1 2( ) ( ) ' 2 ( 1)3 3 9

yg y f x x y−⎛ ⎞= = = −⎜ ⎟⎝ ⎠

Método de la MGF La Función Generadora de Momentos, MGF se desarrollará al final de la sección Ic. Este método se basa en el teorema de unicidad que establece que si dos MGF son idénticas, entonces tienen la misma PDF. Por lo tanto se debe encontrar la MGF de Y y compararla con MGF de funciones conocidas, obteniendo así su G(y). Este método no se utilizará aquí.

Métodos numéricos

Valor esperado de Y Si la variable X es discreta con función de probabilidad ( )p x :

( ) ( ) ( )E Y H x p x∞

−∞

= ∑

Si la variable X es contínua con función densidad conjunta ( )f x :

( ) ( ) ( )E Y H x f x dx∞

−∞= ∫

La demostración de la ecuación anterior es difícil y solo la haremos para el siguiente caso particular.

Y estrictamente creciente En este caso:

( )( ) ( ) ( ) ( )'

yf xE Y yg y dy dy H x f x dxy

∞ ∞ ∞

−∞ −∞ −∞= = =∫ ∫ ∫

En donde se reemplazaron las expresiones: 'dy y dx= ( )y H x=

Page 31: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Métodos numéricos

31

Ic Modelos teóricos de una variable

La mayoría de las veces las distribuciones utilizadas son modelos teóricos generales que ajustan a las distribuciones reales y cuyos valores estandarizados se encuentran en tablas o en programas de computación. Los modelos teóricos constituyen una herramienta que los científicos utilizan para comprender y explorar los procesos que se presentan en el mundo real. Los juguetes que todos usamos cuando niños, son modelos físicos que representan artículos del mundo adulto, con los cuales podemos desarrollar la imaginación, explorar y comprender mejor el mundo en la infancia. En esta sección realizaremos el estudio detallado de algunos modelos matemáticos que se presentan con frecuencia en la realidad. De esta forma se podrán sistematizar los cálculos y análisis, construyendo tablas y elaborando programas y ecuaciones que facilitan sus aplicaciones. Los modelos más importantes se presentan en la figura 3-18.

Discretas Contínuas Bernoulli Constante Binomial Exponencial

Hipergeométrica Gamma Geométrica y Binomial Negativa Normal

Poisson t de Student Multinomial chi cuadrado

Multihipergeométrica F de Fisher

Figura 3-18 Modelos probabilísticos

SPSS y EXCEL En el apéndice B se resumen todos los comandos necesarios para generar CDF, PDF y números aleatorios, con SPSS y EXCEL.

SPSS

PDF Devuelven la función matemática de la densidad de probabilidades para un determinado valor de x. Recordemos que SPSS llama PDF tanto a las PF de las distribuciones discretas como a las PDF de las continuas.

CDF Devuelven la probabilidad acumulativa menor o igual a un determinado valor de x.

Inversos Devuelven el valor de x para un valor dado de CDF.

Page 32: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

32

Significance Devuelven 1-CDF para un determinado valor de x.

Random Numbers Devuelven números aleatorios de varias distribuciones.

EXCEL Devuelven la PDF, CDF, el valor de colas o las Inversas, para varios casos.

1. Modelos discretos Con excepción de la distribución Geométrica y la distribución de Poisson, todos ellos se basan en el primer modelo, la distribución de Bernoulli.

Distribución de Bernoulli, b(y,1,p)

Supuestos También conocido como Proceso de Bernoulli. Se caracteriza por los siguientes 3 supuestos:

Supuesto 1 Dicotómica Los eventos tienen dos resultados posibles, a los que llamaremos en forma genérica E (Éxito) y F (Fracaso), siendo uno de ellos la negación del otro. Luego podrán ser reemplazados por otros nombres más apropiados, como por ejemplo, C (Cara) y S (Seca), D (Defectuoso) y N (No defectuoso), etc. Este tipo de variable se denomina en estadística, dicotómica. Llamaremos: P(E) = p P(F) = q Cada uno de estos valores se asume constante al menos durante la duración del estudio.

Supuesto 2 Variable Aleatoria Se busca la v.a Y = Número de Éxitos, en este caso solo puede tomar los valores 1 o 0 (cuando sea necesario diferenciarla de la distribución binomial, la llamaremos YB).

Supuesto 3 Tamaño Las muestras tienen un tamaño n = 1

Proporción Muestral Es común definir una nueva variable llamada proporción muestral, simbolizada con un acento circunflejo y por esta razón llamada también "p sombrero":

ˆ Número de Exitos ypn n⋅ ⋅

= =

En la distribución de Bernoulli, ambos valores y y p̂ coinciden, pero no será así en la Binomial o Hipergeométrica.

Page 33: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

PDF

Tabla

Histo

Car

( )E Y =

( )V Y =Observes sesg

EjempExtracc

Dis

SupLa distpermiti

Ic M

a

grama

racteriz

0B qμ= = ∗2 (B q pσ= = −

var que si p = gada a la derec

plos ción de un res

stribu

puestostribución llamiendo muestra

odelos teóric

S YB =

p(yB

zación

1 p p+ ∗ = 2 2) ( )p p q+

0.5, la distribcha. Estos co

sultado en jue

ución

s mada Binomiaas con n > 1 y

cos de una va

= yB

B)

FMode

FMode

(( )pq p q= +bución es simmportamiento

egos de azar,

Binom

al surge de la y agregando u

ariable – Dist

F 00 q

Figura 3-19 elo de Bernoul

Figura 3-20 elo de Bernoul

) pq= métrica, si p >

os se mantien

ruleta, dados

mial, b

de Bernoulli,una nueva pro

ribución Bino

E 1 1 p

lli

lli

0.5, es sesgadnen en la distr

, cartas, etc.

b(y,n,

, alterando el opiedad relaci

omial, b(y,n,p

da a la izquieribución binom

,p)

supuesto 3, eionada con es

p)

rda y si p < 0mial.

es decir sta ampliación

0.5

n.

Page 34: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

34

Supuesto 1 Dicotómica Una v.a x tiene solo 2 resultados (dicotómica): E y F, nombres genéricos para Éxito y Fracaso, cuyas probabilidades p y q se mantienen constantes al menos mienras dure el estudio.

Supuesto 2 Variable Aleatoria Se busca la v.a: Y = Número de Éxitos en la muestra de n elementos. Podría pensarse que la distribución depende de 2 variables: número de éxitos EY y de fracasos FY en la muestra, en cuyo caso sería una distribución bivariable. Sin embargo como la suma de ambas es conocida, E FY Y n+ = , dada una variable la otra deja de serlo dado que se puede despejar de esta relación. Esto no ocurre con las distribuciones multinomiales (página 129).

Supuesto 3 Tamaño Las muestras tienen un tamaño n > 1.

Supuesto 4 Independencia Esta propiedad establece la independencia de los n elementos del espacio muestral. Si por ejemplo llamamos E2 a un E en la extracción 2 y E1 a un E en la extracción 1, la definición de independencia implica:

2 1 2( | ) ( )P E E P E= Esta propiedad no es relevante para la distribución de Bernoulli, pero sí lo es para distribuciones en las cuales se toman muestras de n > 1. Para que exista independencia estadística, es decir que el resultado de cualquier observación sea independiente del resultado de cualquier otra observación, debe ser:

MCR o N = ∞

a. muestreo con reemplazo, MCR, para cualquier tamaño (extracción de personas de un grupo) de tal forma que una nueva extracción se realice en las mismas condiciones que las anteriores, o

b. población infinita para cualquier muestreo (juego de ruleta). En la práctica, se considera que una población es infinita si:

5%n N≤ en donde n es el tamaño de la muestra y N es el tamaño de la población. Este criterio se justificará más adelante.

En base a lo expuesto, una binomial se puede sintetizar con la notación:

( , , )b y n p En la figura 3-21 se resume gráficamente el proceso.

Figura 3-21

Se puede apreciar que todos los E se consideran indistinguibles entre sí y lo mismo se aplica a los F.

Page 35: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Binomial, b(y,n,p)

35

Relación con la distribución de Bernoulli Si por ejemplo n = 5 y el resultado fuera:

EEEFE entonces

4y =

Pero por otro lado, puede observarse que cada uno de los eventos es un modelo de Bernoulli, para los cuales cada variable aleatoria By (números de E) toma los valores:

11101 Se observa entonces que:

By y= ∑

Suele utilizarse la notación iid para una sucesión de v.a. independientes e idénticamente distribuidas.

Problema resuelto 3.10 Fiesta numerosa

En una fiesta hay un 40 % de chicas (M) y un 60% de chicos (V). a) ¿Cuál es la probabilidad de que en un grupo de 3 personas elegida al azar haya 2 chicas. b) Construir el histograma con μ y σ. c) Hallar la probabilidad de que en el grupo extraído haya: al menos 2 chicas, más de 2 chicas, 1 chica o menos, al menos 2 varones. d) ¿Es poco común que en una elección al azar de 3 personas, resulten más de 2 mujeres? Observar formulaciones equivalentes de estas preguntas. Así por ejemplo la pregunta a) podría preguntarse así: si se elige un grupo de 3 personas ¿cuál es la probabilidad de que haya una proporción (muestral) de chicas igual a 2/3?

Recorrido de las propiedades 1. Propiedad 1 Dicotómica

La v.a tiene solo 2 resultados (dicotómica), V y M. P(M) = p = 0.4, P(V) = q = 0.6.

2. Propiedad 2 Variable Aleatoria Se busca la v.a: y = Número de Chicas (M).

3. Propiedad 3 Tamaño Las muestras tienen un tamaño n = 3 > 1

4. Propiedad 4 Independencia El problema da la probabilidad (porcentaje) de M y de V y no las cantidades de cada uno. Se debe interpretar entonces que la fiesta es numerosa en el sentido de que n = 3 es menor que el 5% de N (desconocido), por lo cual, a pesar de que el muestreo es sin repetición (muestreo simultáneo), se puede considerar que la probabilidad en la extracción de un joven no influye significativamente en la probabilidad de la extracción del siguiente. En otras palabras los valores de p y q se mantienen de extracción en extracción. Al tratar la distribución hipergeométrica de este mismo ejemplo, se apreciará la diferencia.

a)

3( 2) ( ) (2) 0.288P Y P MMV ppqP= = = = b)

Page 36: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

36

Tabla S 3V 2V1M 2M1V 3M Y = y 0 1 2 3 p̂ 0 0.333 0.666 1

p(y)=p( p̂ ) q3 3q2p 3qp2 p3

0.216 0.432 0.288 0.064

Figura 3-22 Modelo Binomial

Histograma de probabilidades

Figura 3-23

PDF Binomial

Caracterización 0(0.216) 1(0.432) 2(0.288) 3(0.064) 1.2μ = + + + =

2 2 2( ) 2.16 1.2 0.72V Y py μ= − = − =∑

0.848σ = c)

( 2) 0.288 0.064 0.352P Y ≥ = + = ( 2) 0.064P Y > =

( 1) 0.216 0.432 0.648P Y ≤ = + = La probabilidad de que haya al menos 2 varones, es equivalente a que haya a lo sumo 1 chica, es decir 0.648. d) La P(3M) = 6.4% > 5%, por lo tanto no sería un suceso poco común.

SPSS

Los valores de la PDF se obtienen directamente o por diferencia a partir de los valores CDF. Por ejemplo el valor de la PDF para y = 2, se puede obtener así:

Page 37: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Binomial, b(y,n,p)

37

Directamente PDF.BINOM(2,3,0.4)=0.288

Usando la CDF CDF.BINOM(2,3,0.4)-CDF.BINOM(1,3,0.4)=0.936-0.648=0.288

Expresiones generales

PDF

Demostración Generalizando las expresiones del problema resuelto anterior:

( , , ) ( , ) y n ynb y n p P y n yy p q n−= − ≤

Observar que: ( , ) y

n nP y n y C− = La expresión con combinaciones se interpreta considerando que el valor deseado es el número de y posiciones que se puede extraer de un total de n posiciones. El nombre de binomial, proviene de que cada p(y) es un término del binomio ( )np q+ .

0 0 1 1 1 0( , , ) , ,...,n n n nn n nb y n p C p q C p q C p q−=

Esta propiedad puede observarse claramente en la tabla de la figura 3-22. La suma de todos los términos es entonces ) 1 1( n np q =+ = .

Notas • Si bien la distribución binomial puede obtenerse en forma mecánica de las ecuaciones anteriores,

desaconsejo su utilización pues la relación tiempo-beneficio no es mucho más favorable que la construcción a partir de las relaciones probabilísticas tal como se realizó en el problema resuelto 3.10. Por otra parte, dado que no son muchas las distribuciones que permiten utilizar conceptos básicos en su construcción, aprovechemos la oportunidad de aquellas que si los brindan.

• Cuando se dice que una v.a. y tiene una distribución determinada, por ejemplo binomial, se está indicando la ecuación que sigue su PDF, en este caso ( , )( ) y n y

nP y nPD yy pF q −−= .

Expresión recursiva Si se opera sobre la ecuación de cálculo de la probabilidad binomial, se puede obtener en forma directa que:

(1

)(1) n y pb by q

y y−=

++

expresión que puede ser útil al calcular la distribución completa, pues obtiene el valor siguiente a partir de los valores anteriores.

CDF

0( , , ) ( , , )

r

yB r n p b y n p

=

= ∑

Caracterización Media y Varianza En principio existen dos formas de deducir la media y la varianza de la distribución. La primera es aplicar las definiciones de la media y de la varianza a la PDF de la distribución, lo cual implica trabajar con las expresiones factoriales dentro de la sumatoria de los valores esperados y

Page 38: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

38

utilizar la propiedad de que ( ) 1p x =∑ : La otra es vincular la distribución a otra con media y varianza conocidos. Por ser más simple, basaré las demostraciones siguientes en la propiedad que vincula a la Binomial con la de Bernoulli, de la que se conocen la media y la varianza. La relación entre ellas es:

BY Y= ∑ Aplicando las conocidas propiedades de la media y de la varianza, ya recorridas anteriormente, resultan:

( ) ( )BE Y E y npμ = = =∑

y npμ = ( ) ( ) ( )B BV Y V Y V Y npq= = =∑ ∑

Por consiguiente:

y npqσ =

Estas expresiones para μ y para σ, resultan esta vez mucho más simples y rápidas que la aplicación de las definiciones generales.

Modo Resulta de interés establecer la expresión del modo o valor más probable. Sea y = nE, la cantidad de éxitos para obtener la probabilidad máxima. En este caso debe cumplirse que:

1 1 ( 1) 1 1 ( 1)E E E E E E E E En n n n n n n n n n n nn n nC p q C p q C p q− − − − − + + − +< >

Es decir:

1 1E

E

nnn

n

C pC q− > y

1 1E

E

nnn

n

C qC p+ >

Reemplazando las expresiones de cálculo de cada una de las combinaciones y simplificando, resultan: ( 1) 1E

E

n n pn q

− +> y

( 1) 1E

E

n qn n p

+>

Reagrupando, se obtiene finalmente:

( 1) 1 ( 1)En p n n p+ − < < +

Por lo tanto, el modo se encuentra en el máximo entero comprendido en (n+1)p. En símbolos (la expresión entre corchetes significa parte entera):

[( 1) ]En n p= +

Si, en particular el valor (n+1)p es entero, entonces existen 2 términos máximos: en (n+1)p y en (n+1)p–1. En este caso la distribución es bimodal. Si llamamos nF al número de fracasos y dado que nE+nF = n, se obtiene por reemplazo:

1 Fnq p n nq p− + > > −

Page 39: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Binomial, b(y,n,p)

39

Proporción muestral Con la definición de proporción muestral (p sombrero), resultan:

ˆ( ) npE p pn

= =

p̂ pμ = Esta expresión es intuitiva pues dice que la frecuencia esperada del evento ( ˆ( )E p es p. Esto representa la primera verificación teórica de que existe una conexión entre la frecuencia esperada del evento y su probabilidad. Volvemos sobre este tema en el capítulo 4 al estudiar la ley de los grandes números.

2ˆ( ) npq pqV pn n

= =

p̂pqn

σ =

Cualquier problema binomial, puede resolverse en forma indistinta con la variable "número de éxitos" o con "proporción de éxitos". En el capítulo de inferencia se presenta con más frecuencia, esta segunda alternativa. Los restantes modelos asociados con la distribución de Bernoulli, toman a la Binomial como referencia, manteniendo su supuesto 3 (tamaño > 1), surgiendo de la modificación de alguno de sus otros 3 supuestos. Las más importantes son: • Si se altera el supuesto 1, permitiendo variables multicotómicas, la distribución se llama

Multinomial. • Si se altera el supuesto 2, cambiándolo por el Número de Pruebas hasta obtener el primer Éxito,

la distribución se llama Geométrica o Binomial Negativa. • Finalmente si se altera el supuesto 4, cambiándolo por pruebas dependientes, la distribución se

llama Hipergeométrica y en particular si se alteran los supuestos 2 y 4, la distribución se llama Hipergeométrica Negativa.

Uso de tablas Los valores de la distribución Binomial pueden extraerse de paquetes de software como SPSS o EXCEL cuyas instrucciones se encuentran en el apéndice B. Alternativamente, aunque restringido a los valores más usuales, se puede hacer uso de tablas, tal como se muestra en el problema resuelto siguiente. Estas tablas relacionan valores de eje con probabilidades teniendo en cuenta los 2 parámetros de la distribución. Estas 4 magnitudes que se resumen en la siguiente notación:

( , )CDFy n p

Problema resuelto 3.11 Paquetes de una distribuidora

El 30% de los paquetes de una distribuidora no están llegando a destino. Si se envían 10 paquetes, a) ¿Cuál es la probabilidad de que 3 no lleguen a destino? Observar una formulación equivalente de esta pregunta: Si se envían 10 paquetes ¿cuál es la probabilidad de que la proporción muestral de los que no lleguen a destino sea ˆ 0.3p = ? b) ¿Es poco común que más de 5 paquetes no lleguen a destino?

a) Comprobar que se satisfacen las 4 condiciones binomiales.

Page 40: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

40

Se reproCDF esÉxitos. el númemenos prealizar

Es decir

b) La Pde la ta

SPSS

a) PDF.BAlternaCDF.Bb) 1-CDF

Dish(y

SupEs una

SupueUna v.

SupueSe bus

SupueLas mu

SupueLos n eestadíscualqu

oduce en la figs decir las probEn la columna

ero de Éxitos. Apaquetes, en unrse la cuenta P3

r:

(y >5) = 1–0.9sa del 30%.

S

BINOM(3,10,ativamente: BINOM(3,10,

F.BINOM(5,1

stribuy,N,n,

puestosa modificación

esto 1 Dicoa x tiene solo

esto 2 Varica la v.a: y =

esto 3 Tamuestras tienen

esto 4 Depelementos de

stica, es decir ier otra obser

Capí

gura 3-24 partebabilidades acua p = 0.3, se enAsí por ejempln envío de 10. 3 –P2.

953 = 0.047 <5

,0.3)=0.26

,0.3)-CDF.

10,0.3)=0.

ución ,k)

s n de la Binom

otómica o 2 resultados

iable AleatNúmero de

maño n un tamaño n

pendencia l espacio mueque el resulta

rvación, la po

ítulo 3 Distrib

Jorge

de la tabla Binumuladas. En lancuentran las aclo el valor recuComo la pregu

FTabla dis

3 2 0P P− =%, ´por lo cual

7

BINOM(2,10

267

Hiper

mial, en el sup

(dicotómica)

toria e Éxitos.

n > 1

estral son depado de cualqublación debe

buciones de P

e Carlos Carr

nomial para n =a columna del mcumulaciones euadrado 0.65 esunta requiere e

Figura 3-24 stribución Bino

0.65 0.383− =l es un suceso

0,0.3)=0.26

rgeom

puesto 4.

): E y F.

pendientes. Pauier observaciser finita y e

Probabilidade

= 10, del Apénmargen izquieren orden desces la probabilidael valor de la pr

omial

0.267= poco común y

67

métric

ara que no exiión sea depenel muestreo de

es

ndice B. Esta tardo se encuentr

endente, a mediad de que se enrobabilidad par

si sucede al az

ca,

ista independndiente del resebe ser sin re

abla contiene lara el número dida que aumenncuentren 3 o ra y = 3, deberá

zar es lícito dud

dencia sultado de eemplazo (es

a de nta

á

dar

Page 41: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Hipergeométrica, h(y,N,n,k)

41

decir la negación de las condiciones de la binomial), de tal forma que una nueva extracción se realice en condiciones distintas a las anteriores.

MSR N finita∧

En estos casos, en lugar de proporcionar la probabilidad p, se debe dar el número de éxitos k antes de la primera extracción. Recordemos que la población se considera finita si:

5%n N> En base a lo expuesto, una hipergeométrica se puede sintetizar con la notación:

h(y,N,n,k) El segundo término corresponde al tamaño de la población. Veremos luego que los 2 últimos, tamaño de la muestra y número de éxitos en la población, se pueden colocar en cualquier orden. Sin embargo el orden expuesto es coherente con el de una binomial b(y,n,p), utilizando el valor

absoluto k en lugar del relativo kpN

= .

Problema resuelto 3.12 Fiesta no numerosa

En una fiesta de 10 personas, hay 5 varones V y 5 mujeres M. Si se extraen 3 personas al azar, a) dibujar el histograma de x = números de M, con μ y σ. b) obtener la probabilidad de que sean al menos 2 M, c) hallar la probabilidad de que sean al menos 2 M sabiendo que hay al menos 1M, d) obtener la probabilidad de que sean 2M, si ya se eligió una M, e) hallar la probabilidad de que sean 2M sabiendo que hay al menos 1V, f) si se extrae un grupo de 6 personas, hallar la probabilidad de que haya al menos 5M. g) ¿Cuál es la diferencia si en la fiesta hay 600 chicos y 400 chicas? Observar que se satisfacen las 4 condiciones hipergeométricas. a) Se trata de una h(y,10,3,5).

Page 42: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

42

Figura 3-25 PDF Hipergeométrica

3 3 3 35 4 3 5 5 4 5 4 5 5 4 3( ,10,3,5) (3) (1, 2) (2,1) (3)

10 9 8 10 9 8 10 9 8 10 9 8h y P P P P= + + +

( ,10,3,5) 0.0833 0.416 0.416 0.0833h y = + + + 1.5μ =

2 2 2 2 20.0833 1.5 0.416 0.5 0.416 0.5 0.0833 1.5 0.583σ = ∗ + ∗ + ∗ + ∗ = 0.763σ =

b) ( ) 0.0833 0.416 0.499P A = + =

c) 0.416( | ) 0.4540.915

P B A = =

d) 4 5(1,9, 2, 4) ( ) 2 0.5559 8

h P MV= = =

e)

0.416( | ) 0.45400.833 0.416 0.416

P B C = =+ +

f)

5 65 4 3 2 1 0 0.004

10 9 8 7 6p p+ = + =

g) En este caso la fiesta es numerosa en el sentido de que n = 3 es menor que el 5% de N, es decir 50, por lo cual se puede considerar que la probabilidad en la extracción de un joven no influye significativamente en la probabilidad de la extracción del siguiente. Si por ejemplo se extraen 3 personas, la probabilidad de que haya 2 mujeres es:

3400 399 600( 2) ( ) (2) 0.288

1000 999 998P Y P MMV P= = = =

Se observa que los valores de P(M) y de P(V) no difieren mayormente de 0.4 y 0.6. En otras palabras podría aproximarse la hipergeométrica a una binomial con estos valores de p y q:

3( 2) ( ) (2) 0.288P Y P MMV ppqP= = = = Esta similitud en los resultados es aceptable hasta n = 50 (5% N). Por arriba de este valor se considera que las fracciones se alejan apreciablemente del valor original. Por ejemplo la probabilidad de obtener 30 M y 1 V daría para la última M: 371/971 = 0.382, en lugar de 0.4 y para el V: 600/970 = 0.618, en lugar de 0.6.

SPSS

Ejemplo P(y=3)=PDF.HYPER(3,10,3,5)=0.0833 Alternativamente: P(y=3)=CDF.HYPER(3,10,3,5)-CDF.HYPER(2,10,3,5)=0.0833

Expresiones generales

PDF

Demostración Observando la figura 3-26 y utilizando el análisis combinatorio, se obtiene la siguiente expresión compacta de la función de probabilidad (pero, nuevamente menos instructiva):

Page 43: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Hipergeométrica, h(y,N,n,k)

43

( , , , ) -y n yk N k

nN

yC Ch y N n k k yC

n N k−− ≤ ≤= −

Las desigualdades expresan que el número de Éxitos (o Fracasos) de la muestra debe ser, naturalmente, menor o igual al de la población.

Figura 3-26

Comparar esta figura con la respectiva de la distribución binomial y observar las diferencias en los datos proporcionados en ambas poblaciones. La detección de estas diferencias elimina toda duda acerca de qué tipo de distribución se trata. Por otra parte, al resolver una hipergeométrica con las reglas de las probabilidades en lugar de hacerlo con la expresión combinatoria, anteriormente presentada, obliga a calcular las probabilidades sucesivas y por lo tanto informa al usuario acerca de la razonabilidad, o no, de usar una binomial como aproximación. Esta importante información se pierde con la expresión combinatoria.

CDF

0( , , , ) ( , , , )

r

yH r N n k h y N n k

=

= ∑

Caracterización Si llamamos p0 a la probabilidad de éxitos inicial, es decir:

0kpn

=

Al igual que en la Binomial, existen dos formas de deducir la media y varianza de la distribución hipergeométrica. Aplicando las definiciones de la media y de la varianza a la PDF de la distribución o vinculando la distribución a otra con media y varianza conocidos. La primera implica trabajar con las expresiones factoriales dentro de la sumatoria de los valores esperados y utilizar la propiedad de que ( ) 1p x =∑ . Este camino requiere algún esfuerzo para obtener las expresiones finales. La segunda es más simple y se presentará en la página 126 pues se deben utilizar herramientas de las distribuciones multinomiales. En cualquier caso las expresiones finales son:

0npμ =

20 0 1

N nnp qN

σ −=

El factor

Page 44: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

44

11

N ncpfN

−= <

se denomina factor de corrección por población finita y diferencia a las expresiones de σ de la binomial y de la hipergeométrica. Observar que: • La cpf es menor que 1 por lo cual la varianza de la hipergeométrica es menor que la de la

Binomial. • La cpf tiende a 1 cuando N tiende a infinito, como corresponde a su nombre y que es 0 cuando

n = N, pues la dispersión es cero dado que la distribución solo conserva el término en el cual la selección de la muestra es igual a la población, con probabilidad 1. Como ya se ha dicho, una población se considera finita si 5%n N> .

Debe puntualizarse que el muestreo con reemplazo, MCR, equivale a una población infinita y por lo tanto debe considerarse que N tiende a infinito en la ecuación anterior (obteniendo la expresión para una binomial).

Proporción muestral Expresiones similares respecto de la proporción muestral, pueden obtenerse, recordando que:

ˆ ypn

=

Aplicando las propiedades de la media y de la varianza, se obtienen: ˆ 0p pμ =

2 0 0ˆ 1p

p q N nn N

σ −=

Aproximación de una hipergeométrica Como la independencia es la única diferencia entre las distribuciones binomial e hipergeométrica y esta propiedad está asociada al tamaño de la población, puede establecerse que una hipergeométrica se puede aproximar a una binomial si la población puede considerarse infinita, es decir:

Figura 3-27

Aproximación Hipergeométrica a la Binomial

Distribución geométrica, g(y,p) Supuestos Es una modificación de la Binomial, en los supuestos 2 y 3.

Supuesto 1 Dicotómica Una v.a x tiene solo 2 resultados (dicotómica): E y F.

Supuesto 2 Variable Aleatoria Se busca la v.a: y = Número de Pruebas hasta obtener el primer Éxito.

Supuesto 3 Tamaño Las muestras tienen un tamaño n variable que puede ser infinito.

Hipergeométrica Binomialn<5%N

Page 45: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución geométrica, g(y,p)

45

Supuesto 4 Dependencia Los n elementos del espacio muestral son independientes.

Expresiones generales Observemos la siguiente tabla de la distribución para los primeros valores de y:

S E FE FFE … Y = y 1 2 3 … p(y) p pq pq2 …

Figura 3-28

Si llamamos x al número de fracasos antes de aparecer el primer éxito, puede observarse que el número de pruebas y, es igual al número de fracasos más 1:

1y x= +

A partir de esta relación, obtenida la distribución de y se obtiene la de x. De la tabla se desprenden las siguientes expresiones:

PDF

Demostración Observando la figura 3-28 se obtiene la siguiente expresión general de la función de probabilidad.

1 ) ( , 1y pg yy p q −= ≥

CDF

1( , ) ( , ) = ( ) 1- ( )

r

yg P yG r p y r P yp r

=

≤ = >= ∑

Por otra parte:

1 1( ) ( ...)1

r r r rP y r p q p q qq

+ ⎛ ⎞> = + + = =⎜ ⎟−⎝ ⎠

Es decir, la cola de una distribución geométrica es siempre rq .

Caracterización Media Aplicando la definición de la media a los valores de la figura 3-28, se obtiene:

2

2 2 2

( ) (1 2 3 ...)[(1 ...) ( ...) ( ...) ...]E Y p q q

p q q q q qμ = = + + + =

= + + + + + + + + +

Cada una de las expresiones entre paréntesis es una sucesión geométrica (de aquí proviene el nombre de la distribución), de razón q. Para proseguir debemos recordar que la suma de una sucesión geométrica de n términos cuyo primer término es a, y cuya razón es q, es:

11

nqS aq

−=

Tomando el límite de esta suma, cuando n tiende a infinito, si 1q < , resulta:

Page 46: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

46

1aS

q=

Aplicando esta expresión a nuestras sucesiones, se aprecia que los paréntesis finalmente resultan: 2

21 1 1... 1 ...1

q qp q qp p p q p

μ⎡ ⎤

= + + = + + + = =⎢ ⎥ −⎣ ⎦

Se tiene entonces que:

1y p

μ =

Una demostración alternativa es a partir de: 1

1

( ) n

n

E Y npq∞

=

= ∑

Utilizando la identidad:

1

1 1

n n

n n

dnx xdx

∞ ∞−

= =

⎛ ⎞= ⎜ ⎟⎝ ⎠

∑ ∑

Si x < 1, entonces:

( )21

11 1

n

n

d d xxdx dx x x

=

⎛ ⎞ ⎛ ⎞= =⎜ ⎟⎜ ⎟ −⎝ ⎠ −⎝ ⎠∑

Con lo cual se obtiene:

12

1

1 1( )(1 )

n

n

E Y npq pq p

∞−

=

= = =−∑

Aplicando la relación 1y x= + , se obtiene la expresión de la media de x, el número de fracasos antes de aparecer el primer éxito:

xqp

μ =

Varianza Se puede demostrar que:

2( ) qV yp

=

Las varianzas de Y de X son iguales.

Pérdida de la memoria Decimos que una v.a. Y no tiene memoria si:

( | ) ( )P Y s t Y s P Y t> + > = >

Veamos si se cumple para una distribución geométrica.

( | ) ( )s t

ts

qP Y s t Y s q P Y tq

+

> + > = = = >

Esta ecuación dice que si se sabe que no se produjo ningún éxito hasta s, la probabilidad del primer éxito no depende de s.

Page 47: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución geométrica, g(y,p)

47

Las v.a. geométricas son las únicas v.a. discretas que no tienen memoria. Luego veremos que en las variables contínuas la misma propiedad la presenta la distribución exponencial (página 68).

Problema resuelto 3.13 Auditorías con errores

Un contador público ha encontrado que 6 de cada 10 auditorías contienen errores. ¿Cuál es la probabilidad de que: a) la primera contabilidad con errores sea la cuarta compañía revisada, b) la primera contabilidad con errores se produzca a partir de la sexta compañía, c) dibujar la PDF y la CDF, d) ¿Es poco común que la primera contabilidad con errores aparezca a partir de la sexta compañía revisada? a)

3(( 04, .60.6) 00)0.400 0.0384g == b)

1 2 3 40.600 (0.600) (0.1 (4,0.6)

1 0.400 0.400 0.400 0.40600) (0.600) (0.600)1 0.98976 0.01024

0G

− − − − == − =

− =

= −

De otra forma:

5( 5) 0.4 0.01024rP y q> = = = c)

PDF

Figura 3-29

Page 48: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

48

CDF

Figura 3-30

d) La P(y > 5) = 0.01024, por lo cual es un suceso poco común y si sucede al azar es lícito dudar de la tasa de compañías con errores.

SPSS

a) PDF.GEOM(4,0.6)=0.0384 b) 1-CDF.GEOM(4,0.6)=0.01024

Distribución binomial negativa o de Pascal, bn(y,r,p) Supuestos Esta ampliación de la geométrica es una modificación de la Binomial, en los supuestos 2 y3:

Supuesto 1 Dicotómica Una v.a x tiene solo 2 resultados (dicotómica): E y F.

Supuesto 2 Variable Aleatoria Se busca la v.a: y = Número de Pruebas hasta obtener r Éxitos.

Supuesto 3 Tamaño Las muestras tienen un tamaño n variable que puede ser infinito.

Supuesto 4 Dependencia Los n elementos del espacio muestral son independientes. Dado que, respecto de la binomial, el Número de Pruebas es ahora la variable y el Número de Éxitos está predeterminado, puede decirse que esta distribución es la opuesta de la binomial, de aquí el nombre.

Page 49: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución binomial negativa o de Pascal, bn(y,r,p)

49

Expresiones generales Observemos la siguiente tabla de la distribución para los primeros valores de y si r =2:

S EE EFE EFFE EFFFE … Y = y 2 3 4 5 … p(y) 2p 2

2(1,1)P p q 2 23(2,1)P p q 2 3

4(3,1)P p q …

Figura 3-31

Si llamamos x al número de fracasos antes de aparecer el k-esimo éxito, puede observarse que el número de pruebas y, es igual al número de fracasos más el número de éxitos:

y x r= +

A partir de esta relación, obtenida la distribución de y se obtiene la de x. De la tabla se desprenden las siguientes expresiones:

PDF

Demostración Observando la figura 3-31 se obtiene la siguiente expresión general de la función de probabilidad.

1( , 1) , ) , y( y ry y r r

rpbn y r p P q r−− − − ≥=

Se puede observar que solo cambia el coeficiente respecto de la binomial. Como de costumbre conviene razonar la obtención de la probabilidad con un diagrama de árbol en lugar de recordar esta expresión.

CDF

( , , ) ( , , )y r

a

Bn a r p y pb rn=

= ∑

Caracterización Se puede ver que una distribución binomial negativa es una suma de k distribuciones geométricas. Si consideramos por ejemplo r = 3, un resultado genérico puede ser:

FF…FE ..FF…FE FF…FEX1 X2 X3

Si llamamos: X1 = número de ensayos hasta el primer E, X2 = número de ensayos después del primer E hasta el segundo E, X3 = número de ensayos después del segundo E hasta el tercer E, entonces cada una de estas v.a. es geométrica y la variable Y3 = número de ensayos hasta el tercer E (v.a. binomial negativa), será:

Y3 = X1 + X2 + X3 En general:

1

r

bn gy y= ∑

De aquí, resultan:

Page 50: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

50

Media

yrp

μ =

Aplicando la relación y x k= + :

xrqp

μ =

Varianza

2( ) rqV yp

=

Las varianzas de Y de X son iguales.

Relaciones entre las CDF Binomial y Pascal

Pascal y Binomial

Pascal Sea Y el número de pruebas de Bernoulli para obtener k Éxitos E con ( )P E p= .

Binomial Sea X el número de Éxitos E en n pruebas de Bernoulli con ( )P E p= .

a) 1 . ( , , ) . ( 1, , )CDF NEGBIN n r p CDF BINOM r n p− = −

b) . ( , , ) 1 . ( 1, , )CDF NEGBIN n r p CDF BINOM r n p= − −

Demostración a) Si se requieren más de n pruebas para obtener r E, deberá haber a lo sumo ( 1r − ) E en estas n pruebas. b) Este caso resulta del anterior pasando a los eventos complementarios. Si se requieren a lo sumo n pruebas para obtener r E, deberá haber más de r E en estas n pruebas. Una forma equivalente de expresar estas relaciones es:

( ) ( )( ) ( )

P Y n P X rP Y n P X r

> = <≤ = ≥

Utilizando la notación con CDF se aprecia el intercambio de parámetros: el valor de n es el mismo en ambas y el de r disminuye en 1 en la binomial. A modo de ejemplo:

1 . (5, 4,0.5) . (3,5,0.5)CDF NEGBIN CDF BINOM− =

Las relaciones complementarias se obtienen restando de 1 en ambos lados. Se aprecia que llevan los mismos valores, intercambiando CDF por 1–CDF.

. (5, 4,0.5) 1 . (3,5,0.5)CDF NEGBIN CDF BINOM= −

Se observa entonces que la función acumulativa de una, equivale a la función significación de la otra.

Page 51: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución binomial negativa o de Pascal, bn(y,r,p)

51

Geométrica y Binomial Dado que la distribución geométrica es un caso particular de la de Pascal con r = 1, la relación anterior subsiste reemplazando r por 1.

1 . ( ,1, ) 1 . ( , ) . (0, , )CDF NEGBIN n p CDF GEOM n p CDF BINOM n p− = − =

Análogamente:

. ( , ) 1 . (0, , )CDF GEOM n p CDF BINOM n p= −

Este teorema puede utilizarse para calcular las CDF de una distribución de Pascal o Geométrica a partir de una Binomial.

Problema resuelto 3.14 Gripe H1N1

Los empleados de su empresa son examinados para detectar la presencia del virus de la gripe H1N1. El hospital municipal le solicita que le sean enviados 4 empleados con pruebas positivas para profundizar los exámenes. Si el 45% de los empleados tienen pruebas positivas, a) encuentre la probabilidad de que se tengan que examinar a 10 empleados hasta encontrar 4 con pruebas positivas, b) dibujar la PDF y la CDF de Y = número de pruebas hasta obtener k = 4 E, c) ¿Es poco común que se tengan que examinar a menos de 5 empleados hasta encontrar 4 con pruebas positivas? a)

69(6, )

43(10,4,0.45) 0 0.45 = 0.0. 9 55 53 bn P=

b)

PDF

Figura 3-32

Page 52: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

52

CDF

Figura 3-33

c) La P(y < 5) = 0.041 < 5%, ´por lo cual es un suceso poco común y si sucede al azar es lícito dudar de la tasa del 45%.

SPSS

a) PDF.NEGBIN(10,4,0.45)=0.0953

Problema resuelto 3.15 Falla de un motor

La probabilidad de que falle un motor durante cualquier período de una hora es 0.3. Hallar la probabilidad de que funcione bien durante 3 horas (es decir que falle luego de 3 horas).

Geométrica g(>3,1,0.3) Sea Y el número de intervalos de una hora hasta la primer falla.

2( 3) 1 ( 3) 1 0.7 0.3(0.7) 0.3 (0.7) 0.027P Y P Y ⎡ ⎤> = − ≤ = − + + =⎣ ⎦

Binomial bn(<1,3,0.3) Sea X el número de fallas dentro de una hora, en 3 horas.

3( 0) 0.3 0.027P X = = =

Page 53: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribuciones multinomial y multihipergeométrica

53

Distribuciones multinomial y multihipergeométrica Por ser modelos multivariables se tratarán en la sección correspondiente en la página 129.

Distribución de Poisson, p(y,λ) Supuestos Esta distribución modela una v.a que tiene los siguientes 4 supuestos.

Supuesto 1. Variable Aleatoria y Se busca la v.a: Y=Número de casos E en un intervalo determinado (de tiempo, distancia, área, volumen, etc). Este número de casos podría ser, teóricamente infinito. A los efectos de normalizar la notación, usaremos la letra t para denotar al intervalo como si fuera de tiempo. Un ejemplo al cual aplicar cada una de las 4 propiedades podría ser la cantidad de errores cometidos por hoja en un libro.

Supuesto 2. Un evento en dt La propiedad dice dos cosas: a) En un intervalo infinitesimal dt puede ocurrir como máximo un solo evento. En otras palabras la probabilidad de que ocurran 2 o más eventos en un intervalo infinitesimal dt es nula.

( , ) 0 1P n dt n= > b) la probabilidad de que ocurra un evento en un intervalo infinitesimal dt solo depende del ancho del intervalo. Frecuencia promedio ω

Cantidad de casosIntervalo

ω =

Se asume que ω es constante. Observar que ω se mide en cantidad de eventos sobre la unidad del intervalo. Es importante realizar el cambio de unidades necesario para que el intervalo en el que se estudia y, sea el mismo que para ω. Promedio de eventos λ

tλ ω= Observar que λ se mide en cantidad de eventos. Por lo tanto la propiedad 2b se puede expresar como:

(1, )P dt dtω=

Consecuencia Como consecuencia de a y b), la probabilidad de que no ocurra ningún evento en dt será:

(0, ) 1P dt dtω= −

Supuesto 3. n eventos en t Si los intervalos fueran iguales establece que la distribución de probabilidades es la misma en cada uno de ellos, lo cual significa que la probabilidad de que ocurran n Eventos en un intervalo t,

Page 54: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

54

depende solo de la extensión del intervalo (no de la posición del mismo)3. En el ejemplo anterior, la cantidad de errores cometidos depende solo del tamaño de la hoja y no de la posición de la misma.

Supuesto 4. Independencia El número de casos m en el tiempo s es independiente del número de casos n en el tiempo t.

(( , ) | ( , )) ( , )P m s n t P m s= En el ejemplo, la cantidad de errores cometidos en la hoja 4 es independiente de la cantidad de errores en la hoja 2. Se supondrá la validez de las propiedades anteriores en los problemas de aplicación. En forma expresa serán utilizadas las 4 propiedades en la siguiente demostración de la ecuación de la distribución de Poisson.

PDF La PDF de esta distribución es la siguiente:

( , ) 0!

yep y yy

λλλ−

= ≥

Demostración La ingeniosa demostración que sigue es una excelente oportunidad para observar cómo se obtiene la expresión de la PDF de Poisson, utilizando los 4 supuestos anteriores y herramientas estándar de la teoría de las probabilidades y del análisis infinitesimal. Se parte de expresiones del supuesto 4, utilizando además el supuesto 3 al considerar que la probabilidad solo depende de n y del ancho del intervalo t. Por lo tanto las probabilidades de que sucedan 0, 1, …eventos en el intervalo t+dt son:

(0, ) (0, ) (0, )P t dt P t P dt+ = (1, ) (1, ) (0, ) (0, ) (1, )P t dt P t P dt P t P dt+ = + (2, ) (2, ) (0, ) (1, ) (1, ) (0, ) (2, )P t dt P t P dt P t P dt P t P dt+ = + +

etc. Se reemplazan todas las expresiones que contengan dt por las desarrolladas en el supuesto 2. Reemplazando P(0,dt):

(0, ) (0, ) (0, )P t dt P t P t dtω+ = − (1, ) (1, ) (1, ) (0, ) (1, )P t dt P t P t dt P t P dtω+ = − + (2, ) (2, ) (2, ) (1, ) (1, ) (0, ) (2, )P t dt P t P t dt P t P dt P t P dtω+ = − + +

Reemplazando P(1,dt) y P(2,dt): (0, ) (0, ) (0, )P t dt P t P t dtω+ = − (1, ) (1, ) (1, ) (0, )P t dt P t P t dt P t dtω ω+ = − + (2, ) (2, ) (2, ) (1, )P t dt P t P t dt P t dtω ω+ = − +

Se forma un cociente incremental pasando el primer miembro del segundo miembro al primer miembro y dividiendo por dt. Se obtienen así las siguientes ecuaciones diferenciales lineales invariantes de primer grado:

( (0, )) (0, ) 0d P t P tdt

ω+ =

( (1, )) (1, ) (0, )d P t P t P tdt

ω ω+ =

3 Esta condición es probablemente la más inconveniente para modelar un proceso real por lo cual luego suele preferirse una generalización dando origen a los llamados procesos de Poisson no homogéneos.

Page 55: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución de Poisson, p(y,�)

55

( (2, )) (2, ) (1, )d P t P t P tdt

ω ω+ =

Se puede observar que la expresión general de estas ecuaciones diferenciales es recursiva:

1'n n ny y yω ω −+ =

La primera es una ecuación homogénea ' 0y yω+ = que se resuelve directamente por el método de

los coeficientes indeterminados (sustitución de D´Alambert ty eα= ).

Reemplazando en la siguiente se obtiene una ecuación del tipo ' ( ) ty y u t e ωω ω −+ = = . Esta ecuación se puede resolver por el método de variación de parámetros: t

Hy y e ωϕ ϕ −= = , el cual

consigue reducir el término en la variable y, conduciendo a la ecuación: ' ( )te u tωϕ − = . Las restantes ecuaciones se resuelven en forma similar por el método de variación de parámetros. Las soluciones de las mismas son, en sucesión:

(0, ) tP t e ω−=

(1, ) tP t te ωω −= 2( )(2, )

2ttP t e ωω −=

La solución general se obtiene razonando por inducción, resultando: ( )( , )

!

y

P y t ey

λ λ−=

En definitiva:

( , ) 0!

yep y yy

λλλ−

= ≥

Observar que esta ecuación depende naturalmente del y deseado y de λ (la expresión en y es una exponencial sobre un factorial), de aquí la notación general p(y,λ), para una distribución de Poisson.

Expresión recursiva Si se opera sobre la ecuación de cálculo de la probabilidad de Poisson se puede obtener en forma directa que:

1

( 1) 1

!( 1

!)

y

yp y

p y y

eye

y

λ

λ

λλ

λ

− +

+= =

++

Por lo tanto:

( 1) ( )1

p y p yyλ

+ =+

expresión que puede ser útil al calcular la distribución completa, pues obtiene el valor siguiente a partir de los valores anteriores.

CDF

0( , ) ( , )

r

yP r p yλ λ

=

= ∑

Page 56: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

56

Verificación PDF ( ) 0

( ) 1

p x

p x∞

−∞

>

=∑

Esta última propiedad se visualiza fácilmente recordando el desarrollo en serie de una expresión exponencial:

2 3

01 ...

2! 3! !

k

ek

λ λ λ λλ∞

= + + + + = ∑

Caracterización Demostraremos analíticamente (la demostración elegida requiere algún conocimiento de series) que:

μ λ= ( )V Y λ=

Media La tabla de la distribución se muestra en la figura 3-34:

Y = y 0 1 2 3 … p(y) e-λ λe-λ λ2e-λ/2! λ3e-λ/3! ...

Figura 3-34 Distribución de Poisson

Por lo tanto: 22 31 ...

2! 3!e λ λ λμ λ − ⎛ ⎞

⎜= +⎝

+ + ⎟⎠

=

Utilizando el desarrollo en serie de eλ , se tiene: e eλ λμ λ −=

Simplificando: μ λ=

Varianza 2 2( ) ( )V Y E Y μ= −

2 2 12 4 9( ) 1 .

2! 3! !

yyE Y ey

λ λ λ λλ−

− ⎛ ⎞= + + + + =⎜ ⎟

⎝ ⎠

2

1

1

!

yyey

λ λλ−

−∞

= ∑

Pero: 2 1 1! ( 1)! ( 2)!

yy y y

= +− −

Por lo tanto: 2 1

1

2

1

1

1 ! ( 1)! ( 2)!

y y yyy y yλ λ λλ− − −∞ ∞ ∞

= + =− −∑ ∑ ∑

e eλ λλ= + Recordar que el factorial de un número negativo (en el segundo sumando aparece 1!− ) es infinito.

Page 57: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución de Poisson, p(y,�)

57

En definitiva: 2 2( ) (1 )E Y e eλ λλ λ λ λ−= + = +

Reemplazando en la expresión de V(y): 2 2( )V Y λ λ λ= + −

Finalmente: ( )V Y λ=

Ejemplos de procesos de Poisson Modela distribuciones de número de casos. Verificar que los siguientes ejemplos cumplen las 4 propiedades. • Número de llamadas telefónicas en un intervalo de t. • Número de vehículos que pasan en una autopista en un intervalo de t. • Número de nacimientos en una ciudad en un intervalo de t. • Número de fallas al azar en un componente en un intervalo de t. • Número de rayaduras de un vehículo en una superficie. • etc. Observar además que el número de casos en el intervalo no tiene un límite establecido (confrontar con las otras distribuciones anteriores).

Problema resuelto 3.16 Preguntas a un consultor

En promedio, 12 personas por hora hacen preguntas a un consultor. a) Hallar la probabilidad de que 3 personas lo hagan en un período de 10 minutos, b) dibujar el histograma de y = número de personas que preguntan cada 10 minutos, con el valor medio y la desviación estándar, c) hallar la probabilidad de que al menos 3 personas lo hagan en un período de 10 minutos, d) ¿Es poco común que más de 5 personas lo hagan en un período de 10 minutos? a) Verificar que el problema cumple las 4 propiedades de una distribución de Poisson. Luego se debe convertir la media al intervalo de 10 minutos. Una forma, es razonar transformando las unidades del intervalo de ω:

12 12 1 21 1 6*10 10

p p h ph h m m

ω = = =

Luego 2λ =

Alternativamente, se puede utilizar la expresión tλ ω= : 12 1 21 6

t hh

λ ω ⎛ ⎞= = =⎜ ⎟⎝ ⎠

En consecuencia: 3

2 2(3, 2) 0.18043!

p e−= =

b) El histograma se muestra en la figura 3-35 y la PDF en la figura 3-36.

Page 58: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

58

Figura 3-35

Figura 3-36

Distribución de Poisson 2μ λ= =

( ) 2V y λ= = 1.41σ =

c) Observando el histograma, ( 3) 1 ( 2) 1 (0.1353 0.2707 0.2707)P Y P y≥ = − ≤ = − + +

En definitiva: ( 3) 0.323P Y ≥ =

d) La P(y > 5) = 0.016 <5%, ´por lo cual es un suceso poco común y si sucede al azar es lícito dudar del promedio de 2 personas cada 10 minutos.

Page 59: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución de Poisson, p(y,�)

59

SPSS

Por ejemplo el valor de cola superior para y ≥ 3, se obtiene de la siguiente manera: 1-CDF.POISSON(2,2)=0.323

Aproximación de una binomial

Sea una distribución binomial y hagamos tender el tamaño de la muestra n a infinito con μ= np=λ constante.

( 1)( 1)lim ( , ) lim 1!

y n yy n y

nn n

n n n yP y n y p qy n n

λ λ −−

→∞ →∞

− − + ⎛ ⎞ ⎛ ⎞− = −⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

Operando:

1 1lim 1 1!

n yy

n

n n n yn n n y n n

λ λ λ −

→∞

− − + ⎛ ⎞ ⎛ ⎞− −⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

Recordando que, cuando n tiende a infinito: /11 1

/

n n

en n

λλλλ

λ

−−−

⎛ ⎞⎛ ⎞ ⎛ ⎞− = + =⎜ ⎟⎜ ⎟⎜ ⎟ −⎝ ⎠⎝ ⎠⎝ ⎠

Finalmente se obtiene:

lim1 1!

y

ne

yλλ −

→∞

O sea:

!

y

ey

λ λ−

expresión del término general de la distribución de Poisson. Observar además que sien si en λ = np, n tiende a infinito, dado que λ es constante, p debe tender a 0, con lo cual queda establecida una indeterminación (en este caso la binomial tomará valores significativos solo para pequeños valores de y). En síntesis, una distribución binomial, tiende a una de Poisson, si n se hace suficientemente grande y p es chica (eventos raros), tal que su valor medio se mantenga constante. En la figura 3-37 se establece uno de los criterios para precisar los términos grande y chico. Otro criterio que da resultados aceptables es: 20 y p<0.05n > .

Figura 3-37

Aproximación Binomial a Poisson

Uso de tablas Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los valores de la distribución de Poisson, con las instrucciones que se encuentran en el apéndice B, en las secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se puede hacer uso de tablas, tal como las que se encuentran también en el apéndice B. Estas tablas

Binomial Poisson

n>100 y p<0.1

Page 60: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

60

relaciosiguien

Prob

Los autmedio despecífiSe reprolas prob

En la prcualquiaumentencuent

DisUna tabfijos lo1. Ma2. Un3. To4. Ni Para ej

onan valores dnte notación:

blema res

tores y editoresde errores de 0fico. oduce en la figbabilidades acu

rimer columnaer fila se encue

ta el número detren 1 o menos

señosbla de conting

os valores de larginales X e n marginal X otal n fijo: dis

marginales nemplificar ve

Capí

de eje con pr

suelto 3.1

s trabajan ardua.08 por capítul

gura 3-38 parteumuladas.

a se encuentra eentran las acume casos. Así pos casos, para un

s con tgencias condulos marginaleY fijos: distr(o Y) fijo: X

stribución muni total fijo: dieamos el prim

ítulo 3 Distrib

Jorge

robabilidades

17 Error

amente para mlo, hallar la pro

de la tabla de

FTabla dist

el valor de λ. Emulaciones de por ejemplo el van valor de λ = 0

tabla uce a distinto

es, X, Y: ribución hiperdistribucioneltinomial conistribución de

mer caso.

buciones de P

e Carlos Carr

s y el paráme

( )CDFy λ

es en un

minimizar el númobabilidad de q

Poisson, del A

Figura 3-38 tribución de Po

En la fila superiprobabilidadesalor recuadrado0.08. Por lo tan

de coos modelos de

rgeométrica. es binomiales n tantas categoe Poisson.

Probabilidade

etro λ. Las 3 m

libro

mero de erroreque haya meno

Apéndice B. Es

oisson ior se encuentrs de izquierda ao 0.997 es la prnto la respuesta

ontinge probabilidad

independientorías como ce

es

magnitudes se

es en un libro. Ss de 2 errores e

ta tabla contien

ra el número dea derecha, a merobabilidad dea es 99.7%.

genciad, según se ma

tes. eldas.

e resumen en

Si el número en un capítulo

ne la CDF es d

e casos, y. En edida que que se

as antengan o no

la

decir

o

Page 61: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Diseños con tabla de contingencias

61

Diseño hipergeométrico: prueba exacta de Fisher Sea la tabla de contingencias 2×2 que se muestra en la figura 3-39a, en la cual los niveles dicotómicos se han denominado genéricamente (E, F) y (0, 1). Asimilemos dicha tabla a la figura 3-26 de la página 43. Consideramos a la fila de totales como una "urna" con n esferas, de las cuales NE son E y NF son F. Observar que esta interpretación parte de mantener los marginales constantes. Se extraen simultáneamente n1 esferas, de las cuales un número a son E y un número b son F, se trata entonces de una distribución hipergeométrica definida por:

1( , , ), Eh a N n N

Una interpretación similar podría haber sido realizada para la otra fila o por columnas (figura 3-39 b).

E F 1 a b n1

0 c d n0

NE NF N

a

1 0 E a b NE

F c d NF

n1 n0 N

b Figura 3-39

Si se conocen los marginales, basta conocer el valor de una celda para conocer toda la tabla. La distribución completa se genera con el conjunto de tablas que se construyen manteniendo constantes los valores marginales y variando el valor de y = a, desde 0 hasta el máximo del marginal menor (el cual se asigna por simplicidad a la celda a). Este límite se debe a que los totales marginales deben permanecer constantes y por lo tanto si una celda superara el marginal, la otra celda tendría que ser negativa, lo cual no es posible). La cantidad de tablas será el valor del marginal menor + 1 (pues se empieza desde 0).

Propiedad 1 La media de esta distribución es:

10

ENnpN

nμ = =

Puede observarse que este valor no es otro que el valor que debe tener la celda pivote entre los marginales NE y n1 para que esa tabla contenga la condición de independencia entre las variables. Es decir que una de las tablas de la distribución contendrá la independencia, la cual será a su vez la media de la distribución de tablas. Naturalmente cualquiera de los valores de los coeficientes que miden el apartamiento de la independencia, crece a medida que las barras representativas de las tablas se alejan de la media. Esta interpretación se utiliza para generar un test de independencia alternativo al de χ2 para muestras chicas, llamado Fisher's exact test, o test de Fisher–Irwin, que se estudiará en el capítulo 5, página FisherExact5.

Propiedad 2

Utilizando la simbología de la tabla de la figura 3-39, calculamos la 1( , , ), Eh a N n N con la fórmula de la combinatoria.

1

1 01

! ! ! !( , , )! ! ! ! !

, E F

a bN N E F

NN

E

C C N N n nh a N nC N a b c d

N = =

Este valor es, en esta interpretación, la probabilidad (hipergeométrica) de generar cada tabla para cada valor de y = a.

Page 62: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

62

Con la ayuda de esta notación, puede observarse la simetría de la expresión, de la cual resulta que es indistinto el orden de los 2 últimos parámetros de la ecuación, es decir:

1 1( , , ) ( ,, , ),E Eh N Na N n h a N n=

La dama inglesa Una de las aplicaciones más famosas de la interpretación anterior es la protagonizada por una dama inglesa presente en una reunión en la que se encontraba el célebre matemático y estadístico Ronald Fisher. La dama era la bióloga Muriel Bristol, quién aseguraba que era capaz de detectar si en una taza de té con leche se había colocado primero la leche o primero el té. Fisher propuso que se realizara una prueba con 8 tazas de té con leche. En 4 de ellas se había colocado primero la leche y en las 4 restantes, primero el té. Esta información fue provista a la dama pero el orden en el que se le presentaron las tazas fue aleatorio. El resultado de la prueba fue el siguiente:

Dama dice te leche Total

realidad te 3 1 4leche 1 3 4

Total 4 4 8

Figura 3-40

La pregunta es: ¿cómo puede detectarse si el resultado se debe a la habilidad de la dama o al producto del azar? Para responderlo debemos llegar al capítulo 5 (página damaFisher5), pero por el momento podemos al menos crear la distribución de todos los resultados posibles. El alumno no tendrá dificultades de obtener los valores hipergeométricos de la h(y,8,4,4) que se muestran en la figura 3-41.

Figura 3-41

Page 63: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – 2. Modelos contínuos

63

2. Modelos contínuos Excepto la distribución uniforme y exponencial, el resto de las distribuciones contínuas se resuelven con expresiones que requieren el cálculo diferencial, por lo cual se utilizarán exclusivamente tablas o programas informáticos, para el cálculo de sus valores.

Distribución Uniforme, r(x,a,b) También se llama rectangular y es la distribución más simple.

PDF Se define como:

1( , , ) r x a b a x bb a

= ≤ ≤−

siendo: a x b≤ ≤

Figura 3-42

PDF Distribución rectangular

Verificación PDF ( ) 0

( ) 1

f x

f x dx∞

−∞

>

=∫

Esta última propiedad se visualiza fácilmente reemplazando la función uniforme en la integral.

CDF La expresión de la CDF será:

1( , , )x

aR x a b dx

b a=

−∫

es decir:

Page 64: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

64

( , , )x

a

x x aR x a bb a b a

−⎡ ⎤= =⎢ ⎥− −⎣ ⎦

( , , ) x aR x a bb a

−=

Sin embargo resulta en la práctica más conveniente hallar, partir de los datos, la ecuación de la recta correspondiente.

Figura 3-43

CDF Distribución rectangular

Caracterización Media Aplicando la definición de la media:

2 21 1 ( )( )2

b

a

b aE X xdxb a b a

−= =

− −∫

Por lo tanto:

( )2

a bE X +=

La media es el promedio de los valores extremos, conclusión que pudo obtenerse rápidamente por razones de simetría.

Varianza Aplicando la definición de la varianza:

21( )2

b

a

a bV X x dxb a

+⎛ ⎞= −⎜ ⎟− ⎝ ⎠∫

Operando:

Page 65: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Uniforme, r(x,a,b)

65

3 31( )3( ) 2 2

b a a bV Xb a

⎡ ⎤− −⎛ ⎞ ⎛ ⎞= −⎢ ⎥⎜ ⎟ ⎜ ⎟− ⎝ ⎠ ⎝ ⎠⎢ ⎥⎣ ⎦

Por lo tanto: 2

3

3

)2( ) ( )( )

3(2 ( ) 12b a b aV X

b a− −

= =−

2( )( )12

b aV X −=

Nota Se deja al estudiante que obtenga la misma ecuación a partir de la expresión alternativa:

2 21( )b

aV X x dx

b aμ⎛ ⎞= −⎜ ⎟−⎝ ⎠∫

Ejemplos de distribuciones rectangulares • Equiprobabilidad

Aplicaciones del principio de la teoría de las probabilidades conocido como "de la razón insuficiente" o "de la indiferencia", el cual establece que en condiciones de incertidumbre se asume la equiprobabilidad.

• Elección de un punto al azar. La distribución uniforme precisa la noción intuitiva de elección de un punto al azar, pues con esto se quiere decir que las coordenadas X de dicho punto están uniformemente distribuidas. Esta distribución origina los Números Aleatorios Uniformes, NAU y los problemas de muestreo aleatorio.

Problema resuelto 3.18 Distribución uniforme

Dada la distribución r(x,0,1), hallar la CDF (0.8,0,1), la media y la desviación estándar. 0.8 0(0.8,0,1) 0.81 0

R −= =

0 1 0.52

μ += =

21( ) 0.083312

V X = =

0.289σ =

SPSS

CDF.UNIFORM(0.8,0,1)=0.8

Problema resuelto 3.19 Espera del ómnibus

Los ómnibus arriban cada 15 minutos después de la 07:00. Si un pasajero llega a la parada en un tiempo que está uniformemente distribuido entre 07:00 y 07:30, hallar la probabilidad de que tenga que esperar, a) menos de 5 minutos, b) más de 10 minutos.

Page 66: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

66

a) Sea X el tiempo en minutos que el pasajero debe esperar después de las 07:00. Para esperar menos de 5 minutos debe arribar entre 07:10 y 07:15 o entre 07:25 y 07:30. Por lo tanto:

( ) ( )( )15 30

10 25

10 15 25 30 1/ 30 1/ 30 1/ 3P X X dx dx< < + < < = + =∫ ∫

b) Similarmente :

( ) ( )( )5 20

0 15

0 5 15 20 1/ 30 1/ 30 1/ 3P X X dx dx< < + < < = + =∫ ∫

Distribución Exponencial, e(t,ω) Como es habitual que la variable aleatoria sea el tiempo, utilizaré a la letra t como simbología, en esta distribución (sea o no el intervalo un tiempo).

PDF Se define como:

e( , ) 0tt e tωω ω −= < < ∞ donde:

ω = parámetro. Si la variable aleatoria es el tiempo, ω es la frecuencia de casos.

Se define además: 1βω

= .

Si la variable aleatoria es el tiempo, β es el período o también llamado MTBF, Tiempo Medio entre Fallas (Mean Time Between Failures).

Figura 3-44

PDF Distribución exponencial

Page 67: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Exponencial, e(t,�)

67

Se observa que es una distribución asimétrica con sesgo positivo.

CDF La expresión de la CDF será:

0( , ) 1 t tt

E t e dt eω ωω ω − −= = −∫

Figura 3-45

CDF Distribución exponencial

Propiedad de las colas exponenciales De la expresión de la CDF se desprende que: La cola de una distribución exponencial tiene siempre el valor te ω− .

Caracterización El alumno podrá obtener rápidamente con una integración por partes los valores de la media y de la varianza (esta última con la fórmula rápida).

Media

0

1( ) tte dtE T ω βωω

−∞

= = =∫

Varianza

0

222

2( ) tt eE T ωωω

∞−= =∫

Por lo tanto:

22

1( )V T βω

= =

Ejemplo de distribución exponencial Modela el tiempo T1 hasta la primera falla, es decir la duración de un determinado elemento.

Page 68: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

68

Pérdida de la memoria Las v.a. exponenciales son las únicas v.a. contínuas que no tienen memoria y son el equivalente contínuo de las variables discretas geométricas (página 46). Un fusible o un cojinete de material con gran dureza son buenos ejemplos de elementos para los cuales esta propiedad suele cumplirse, pues no cambian mayormente con el uso y son tan buenos como nuevos. Decimos que una v.a. X no tiene memoria si:

( | ) ( )P T s t T s P T t> + > = >

Veamos si se cumple para una distribución exponencial. ( )

( | ) ( )t s

ts

eP T s t T s e P T te

ωω

ω

− +−

−> + > = = = >

En particular para la variable exponencial T1, esta ecuación dice que si se sabe que no se produjo ninguna falla hasta s, la probabilidad a partir de ese tiempo no depende de s. Haciendo intervenir la CDF, resulta:

1 ( )( | ) ( ) 1 ( )1 ( )

F s tP T s t T s P T t F tF s

− +> + > = = > = −

Llamando G al complemento de F: ( ) 1 ( )G t F t= − :

( ) ( ) ( )G s t G s G t+ =

La única función que cumple esta propiedad es la exponencial, por lo cual la inversa de la propiedad anterior también es cierta: si una variable no tiene memoria, es exponencial.

Distribución Gamma Primero debemos introducir la función Gamma.

Función Gamma Está definida por:

1

0

( ) r 0r xr x e dx∞

− −Γ = >∫

Expresión recursiva Si integramos por partes diferenciando 1rx − , se obtiene:

1 2

00

( ) ( 1)x r x rr e x e r x dx∞

∞− − − −Γ = − − − −∫

2

0

0 ( 1) ( 1) ( 1)x rr e x dx r r∞

− −+ − = − Γ −∫

Por lo tanto:

( ) ( 1) ( 1)r r rΓ = − Γ −

Page 69: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Gamma

69

p es entero positivo ( ) ( 1) ( 1)( 1)( 2) ( 2)( 1)( 2)... (1)

r r rr r rr r

Γ = − Γ −= − − Γ −= − − Γ

Como:

0

(1) 1xe dx∞

−Γ = =∫

resulta:

( ) ( 1)!r rΓ = −

Por lo tanto la función Gamma es una generalización de la función factorial.

Problema resuelto 3.20 Γ(1/2)

Demostrar que: (1 / 2) πΓ =

1/2

0

(1/ 2) xx e dx∞

− −Γ = ∫

Realizando el cambio de variable: 2 / 2x u= , se obtiene: 2 21 /2 /2

0 0

(1/ 2) 2 2 u uu e udu e du∞ ∞

− − −Γ = =∫ ∫

Se verá en el punto siguiente que (ver distribución normal): 2 /21 1

2ze dz

π

∞−

−∞

=∫

Por lo tanto: 2 /2

0

1 22

ze dz π∞

− =∫

finalmente:

2 2(1/ 2)2

π πΓ == =

Distribución Gamma(x,r,α) Una X variable aleatoria no negativa sigue una distribución Gamma si su PDF es:

1( ) 0 0 r 0( )( , , )

0

r xx e xrf x r

en otro lado

αα α αα

− −⎧ > > >⎪Γ= ⎨⎪⎩

Tiene 2 parámetros r y α Al primero se lo llama de forma y al segundo de escala. A veces se suelen llamar α y β, respectivamente.

Page 70: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

70

Verificación PDF ( ) 0

( ) 1

f x

f x dx∞

−∞

>

=∫

Esta última propiedad se visualiza fácilmente reemplazando la función Gamma en la expresión. En la siguiente figura se representan las PDF de la distribución Gamma para: α = 1, r = 1 y α = 1, r = 2.

Figura 3-48

Caracterización Se demuestra analíticamente que:

2

( )

( )

rE X

rV X

α

α

=

=

Exponencial Si r = 1, la PDF de la distribución Gamma es:

( ) xf x e αα −=

Por lo tanto la distribución exponencial es un caso particular de la Gamma con r = 1. Además α de la Gamma se convierte en ω de la exponencial.

Page 71: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Gamma

71

Relaciones entre las CDF de Gamma y Poisson Las siguientes relaciones se verifican si el parámetro r es un entero positivo.

Gamma y Poisson Sabemos que la distribución Binomial y la distribución Binomial Negativa o de Pascal forman un conjunto de inversas.

Binomial Número de Éxitos r para una muestra n

Binomial negativa Tamaño de la muestra n para un número de éxitos r. Además la distribución Geométrica es un caso particular de la Binomial negativa con r = 1: Tamaño de la muestra n hasta el primer éxito. De forma similar, la distribución de Poisson forma un sistema de inversas con la distribución Gamma y la Exponencial es un caso particular de la Gamma con r = 1. Sea r un entero positivo. Sea T el tiempo requerido para observar r ocurrencias. Sea X el número de ocurrencias durante [0, t].

a) 1 . ( , , ) . ( 1, , )CDF GAMMA t r CDF POISSON r t tα α− = −

b) . ( , , ) 1 . ( 1, , )CDF GAMMA t r CDF POISSON r t tα α= − − a) Esta relación significa que si se requiere más de un tiempo t para obtener r ocurrencias, deberá haber a lo sumo ( 1r − ) ocurrencias en [0, t]. b) Este caso resulta del anterior pasando a los eventos complementarios. Si se requiere a lo sumo un tiempo t para obtener r ocurrencias, deberá haber más de r ocurrencias en [0, t]. Con otra notación, resultan:

( ) ( )( ) ( )

P T t P X rP T t P X r

> = <≤ = ≥

Observar que α de Gamma es ω de Poisson. Utilizando la notación CDF, se aprecia el intercambio de parámetros. Al igual que para la pareja Pascal-Binomial, en la pareja Gamma-Poisson, el valor de t se mantiene y el de r baja en una unidad en la de Poisson.

Demostración Sean T una variable aleatoria Gamma y X una variable aleatoria Poisson. Utilizaremos la relación:

0! !

x r a rr

ak

e x e adxr k

− −∞

=

= ∑∫

la cual se demuestra integrando sucesivamente por partes la integral: x r

ae x dx

∞ −∫

con: r

x

u xdv e dx−

=

=

Page 72: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

72

Si X tiene una distribución de Poisson con parámetro tλ ω= , entonces: 1

0

( )!

kr

k

eP X rk

λλ−−

=

< = ∑

Reemplazando la sumatoria del segundo miembro por la integral anterior, se obtiene: 1 11

0

( )! ( 1)! ( 1)!

k y r y rr

tk

e e y e yP X r dy dyk r r

λ

λ ω

λ− − − − −− ∞ ∞

=

< = = =− −∑ ∫ ∫

Cambiando la variable: y sω= , 1

( ) ( )( 1)!

s r

t

e sP X r ds P s tr

ω ωω− −∞

< = = >−∫

pues el integrando es una PDF, f(t) de tipo Gamma siempre y cuando r sea un entero positivo. En definitiva ( ) ( )P T t P X r> = < para T Gamma y X Poisson.

Ejemplos . (3, 2,0.5) 1 . (1,1.5)CDF GAMMA CDF POISSON= − ,

en donde 1.5 3*0.5= . 1 . (3, 2,1.3) . (1,3.9)CDF GAMMA CDF POISSON− = , en donde 3.9 3*1.3= .

Exponencial y Poisson La relación anterior entre Gamma y Poisson se convierte entre Exponencial y Poisson, reemplazando r por 1. Por lo tanto resultan las expresiones, con α ω= :

1 . ( , ) . (0, ). ( , ) 1 . (0, )

CDF EXP t CDF POISSON tCDF EXP t CDF POISSON t

ω ωω ω

− == −

Ejemplo . (3,1,0.5) . (3,0.5) 1 . (0,1.5)CDF GAMMA CDF EXP CDF POISSON= = −

en donde 1.5 3*0.5= Sin embargo explicitaremos una demostración que ampliaremos al tiempo entre ocurrencias. En un proceso de Poisson p(X, λ), denotamos: T1, el intervalo de tiempo hasta el primer evento, es decir para X = 1. T2 el intervalo de tiempo total hasta el segundo evento, es decir para X = 2. S12, el intervalo de tiempo entre el primer evento y el segundo evento.

Distribución de T1 Bastará obtener la 1( )P T t> . Para esto observamos que este evento ocurre si y solo si ninguno de los eventos del proceso de Poisson ocurre en el intervalo [0, t].

1( )CDF P T t= ≤ es la probabilidad de falla (al menos una vez) en [0, t]

11 ( )CDF P T t− = > es la probabilidad de no falla en [0, t] Por lo tanto:

0

1( ) ( 1) ( 0)0!

teP T t P X P X e eλ

λ ωλ−− −> = < = = = = =

Por consiguiente, recordando la propiedad de las colas exponenciales, T1 tiene una distribución

exponencial con media 1βω

= .

Page 73: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Gamma

73

Conclusión Las variables Número de Casos y Tamaño del Intervalo hasta el primer caso forman un sistema de inversas. La distribución que considera como variable al Número de Casos es Poisson y la que considera como variable al Tamaño del Intervalo hasta el primer caso es Exponencial.

Distribución de S12 Bastará obtener la 12 1( | )P S t T s> = . Partimos de la siguiente identidad:

12 1 1( | ) ( 0 ( , ) | )P S t T s P X eventos en s s t T s> = = = + = Por la propiedad de independencia:

1( 0 ( , ) | ) (0 ( , ))P X eventos en s s t T s P eventos en s s t= + = = + Finalmente:

(0 ( , )) tP eventos en s s t e eλ ω− −+ = =

Por consiguiente S12 es también una variable aleatoria exponencial con media 1βω

= .

Observando las distribuciones de T1 y S12, podemos concluir en general que: La v.a. igual a la distancia T entre 2 casos sucesivos de un proceso de Poisson es exponencial.

Problema resuelto 3.21 Distribución exponencial

La distribución del tiempo de vida de un elemento de una computadora es exponencial con un MTBF = 560 h. Si llamamos T1 a la v.a. Tiempo antes de la primer falla (es decir la duración), hallar la PDF y la CDF, b) obtener 1( 280)P T ≤ , c) obtener 1( 1120)P T > , d) obtener 1(280 1120)P T< < . a)

PDF

/5601

1e( ,1/ 560)560

tT e−=

Page 74: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

74

Figura 3-46

CDF /560

1( ,1/ 560) 1 tE T e−= −

Figura 3-47

SPSS

PDF.EXP(t,1/560) CDF.EXP(t,1/560) b)

1 Como exponencial 280/560 0.5

1 1( 280) exp( 280, ) 1 1 0.3935P T T e eω − −≤ = ≤ = − = − =

Page 75: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Gamma

75

Observar que el valor pedido es el complemento de la cola a partir de t = 280.

2 Como Poisson 280 0.5560

tλ ω= = =

0.51( 280) ( 0, ) 1 (0,0.5) 1 0.3935P T Poisson Y P eλ −≤ = > = − = − =

c)

1 Como exponencial 1120/560 2

1 1( 1120) exp( 1120, ) 0.1353P T T e eω − −> = > = = = Observar que el valor pedido es la cola a partir de t = 1120.

2 Como Poisson 1120 2560

tλ ω= = =

21( 1120) ( 1, ) (0,2) 0.1353P T Poisson Y t Poisson eω −> = < = = =

d)

1(280 1120) (1120,1/ 560) (280,1/ 560)P T Exp Exp< < = − = 1120/560 280/560(1 ) (1 ) 0.4712e e− −= − − − =

Problema resuelto 3.22 Reparación de aviones

Llega un promedio de 4 aviones a un hangar para su reparación, por cada período de 8 horas. a) Hallar la probabilidad de que la primera llegada no ocurra durante la primera hora, b) hallar la probabilidad de que la primera llegada ocurra dentro de la primera hora. a)

4 0.58

λ = =

Exponencial (t, ω) = (>1, 0.5) 0.5( 1) 0.606P T e eλ− −> = = =

Poisson (x, λ) = (<1, 0.5) 0 0.5 0. =0.6060

0)!

5(P X e−

= =

b)

Exponencial (t, ω) = (≤1, 0.5) 0.5( 1) 1 1 0.394P T e eλ− −≤ = − = − =

Poisson (x, λ) = (≥1, 0.5) ( 1) 1 ( 0) 01 .606=0.394P X P X≥ = − = = −

Page 76: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

76

Distribución Normal, n(z,0,1) Es una distribución tipo campana (ver figura 3-49) con la mayoría de los casos en el medio y los menos en los extremos. Con frecuencia se otorga el crédito de su descubrimiento al alemán Karl Friedrich Gauss o al francés Pierre Laplace, pero aunque no la dibujó, el francés Abraham De Moivre, fue el primero que calculó áreas debajo de esta curva. De Moivre era protestante y por esta razón tuvo que emigrar a Inglaterra en donde entabló amistad con Isaac Newton, de quién se dice que muchas veces contestaba preguntas diciendo: "pregúntele a Monsieur De Moivre, el sabe eso mejor que yo". Sin embargo como era extranjero, nunca logró la fama de los matemáticos británicos, con quienes De Moivre trabajaba y quienes tanto lo respetaban. La distribución Normal es además la distribución estadística más importante pues: • En varias técnicas estadísticas, es la distribución que se adopta como supuesto. • Varias distribuciones derivan de la Normal. • Varias distribuciones tienden a la Normal cuando n es suficientemente grande. En particular lo

hacen las distribuciones de los promedios o de las sumas (Teorema Central del Límite, el cual será motivo de estudio en el capítulo 4). En la naturaleza se presentan con frecuencia comportamientos que son promedios o sumas de muchos factores pequeños e independientes entre sí, tal como los errores accidentales en las mediciones, los pesos y alturas de las personas, la hora de llegada de los estudiantes a una escuela, la cantidad de letras que una persona puede recordar al repetir la prueba, etc. Este comportamiento es bastante lógico pues es probable que estos factores ocurran por azar, con valores extremos que tienden a presentarse en forma equilibrada y por lo tanto con tendencia a cancelarse entre sí. Por esto son menos comunes las cantidades muy altas o bajas.

Supuestos La demostración de la obtención de la ecuación de la PDF normal realizada por Gauss se basa en 4 supuestos de su teoría de errores. Llamamos: • M a la medición aleatoria, v al valor verdadero (desconocido) y x al error

x M v= − • ( )f x a la función densidad de probabilidades.

Supuesto 1 Simetría Los errores de magnitud x y –x son iguales (son simétricos). Los errores no dependen de la orientación θ del sistema de coordenadas.

( ) ( )f x f x= −

Supuesto 2 Promedio El valor más probable v de varias mediciones es el promedio. En otras palabras, Gauss elige entonces al mejor estimador de mínimos cuadrados de los datos (capitulo 1, página LSEMedia1).

Mv M

n= = ∑

Supuesto 3 Comportamiento Errores pequeños son más probables que errores grandes. Esto implica: max ( ) 0f x x⇒ = y por el supuesto 2, esto debe ocurrir en: v M= lim ( ) 0n

f x→∞

=

Page 77: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)

77

Supuesto 4 Independencia Los errores son independientes. Entonces es válida la Regla del Producto, RP, para la distribución conjunta de los errores:

1 2( ) ( ) ( )... ( )nf x f x f x f x=

1 2( ) ( ) ( )... ( )nf x f M v f M v f M v= − − −

PDF Nota

Suelen denominarse ϕ a la PDF y Φ a la CDF. La expresión matemática para una variable sin estandarizar, es:

2121( , , ) ( , , )

2 >0

x

x f x eμ

σϕ μ σ μ σσ π

σ−⎛ ⎞− ⎜ ⎟

⎝ ⎠= =

Observar que el exponente es un polinomio de segundo grado centrado en el vértice con el coeficiente del término cuadrático negativo. Se aprecia en esta ecuación que la distribución solo depende, además de la variable x, de la media μ y la desviación estándar σ. Una vez fijados los mismos, podremos calcular y graficar la ecuación. En este sentido se recomienda al estudiante que obtenga la gráfica de esta función, estudiando la misma (dominio, imagen, asíntotas, puntos de inflexión, máximos y mínimos). Se puede demostrar además que si x tiene una distribución normal y se realiza una transformación de variable a la variable z, la distribución de z, también es normal con media 0 y desviación estándar 1, por lo cual se usa la notación: n(z,0,1). De esta forma se obtiene una expresión que solo es función de z, lo cual permite su cálculo para cualquier combinación de μ y σ.

2 /21( )2

zf z eπ

−=

Esta expresión puede escribirse alternativamente como:

2

1( )2 z

f zeπ

=

La expresión de la función densidad transformada debe verificar la expresión vista en el capítulo 1 (página Escalamientoz1):

( ) ( )f z f xσ=

Por lo tanto, reemplazando por ejemplo f(z) en esta relación, se puede despejar f(x), obteniendo la expresión del comienzo de esta sección.

Page 78: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

78

Figura 3-49

PDF Distribución Normal

Recordemos además que cuando se dice que una v.a. z tiene una distribución determinada, por

ejemplo normal, se está diciendo que 2 /21

2( ) zePDF z

π−= .

Demostración

Gauss La ingeniosa derivación de Gauss de la PDF de esta distribución utiliza los 4 supuestos anteriores y procedimientos estándar de cálculo. Definamos la función auxiliar:

'( )( )( )

f xg xf x

=

De acuerdo al supuesto 1, se obtiene: ( ) ( )g x g x− = −

De acuerdo al supuesto 4, la distribución conjunta de los errores debe verificar:

1 2( ) ( ) ( )... ( )nf x f x f x f x=

De acuerdo al supuesto 3, v maximiza f(x) y por el supuesto 2 v M= , es decir:

1 2

1 2

1 2

( )0

'( ) ( )... ( )( ) '( )... ( ) ...

... ( ) ( )... '( )

n

n

n

f xv

f M M f M M f M Mf M M f M M f M M

f M M f M M f M M

∂= =

∂= − − − − −

− − − − −

− − − −

Multiplicando y dividiendo por f(x):

1 2

1 2

'( )'( ) '( ) ...( ) ( ) ( )

n

n

f M Mf M M f M Mf M M f M M f M M

⎛ ⎞−− −= − + + +⎜ ⎟− − −⎝ ⎠

Es decir:

1 2( ) ( ) ... ( ) 0ng M M g M M g M M− + − + + − =

Page 79: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)

79

Como las mediciones M son arbitrarias, siendo M y N números reales arbitrarios, podemos poner:

1 2 3 ... nM M M M M M nN= = = = = − Por lo tanto:

( 1)M M n N= − − Reemplazando en la expresión de las funciones g:

(( 1) ) ( 1) ( ) 0g n N n g N− + − − =

o también: (( 1) ) ( 1) ( )g n N n g N− = −

Esta propiedad define una función del tipo4: ( )g x kx=

Por lo tanto:

'( )( )

f x kxf x

=

Integrando: 2ln( ( ))

2kf x x c= +

Por lo tanto: 2

2( )k x

f x Ae=

Para cumplir el supuesto 3, la exponencial debe ser negativa, por lo cual podemos poner 2

2k h= − .

Laplace Una demostración distinta se debe al matemático francés Pierre Laplace (1810), la cual constituye el Teorema del Limite Central, TLC, que se estudiará en el capítulo 4.

Verificación PDF ( ) 0

( ) 1

f x

f x dx∞

−∞

>

=∫

Planteando el cuadrado de la integral I y pasando a coordenadas polares se observa que:

2 2 2 2 2 2 2 2 22

2 ( )2

0 0

22

h x h y h x y hI e dx e dy e dxdy e d dh

πρ πρ ρ θ

∞ ∞ ∞ ∞ ∞− − − + −

−∞ −∞ −∞ −∞

= = = =∫ ∫ ∫ ∫ ∫ ∫

de donde:

2 2h xI e dxhπ∞

−∞

= =∫

Por lo tanto la PDF será:

4 ( ) ( )ag x akx g ax= = . Eso no se verifica para otra función como por ejemplo 2( )g x kx= , pues

2 2( ) ( ) ( )ag x akx g ax k ax= ≠ = .

Page 80: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

80

2 2

( ) h xhf x eπ

−=

Luego, al estudiar la caracterización de la función densidad normal, relacionaremos h con la desviación estándar.

CDF Para obtener las áreas debajo de la curva anterior se debe integrar. Sin embargo esta integración no tiene una expresión explícita y se debe realizar el cálculo por integración numérica o en series. En el problema resuelto de página 83, se recorrerá la integración numérica. De todas formas, la buena noticia es que no será necesario utilizar estos procedimientos, pues los valores de esta distribución (estandarizada o no), se obtienen en general con algún programa de computación o de tablas.

Figura 3-50

CDF Distribución Normal

Caracterización Utilizaremos la siguiente relación.

2 2h te dthπ∞

−∞

=∫

Media Para generalizar la función densidad, agregamos un término a dentro del exponente.

2 2( )( ) h x ahE x dxxeπ

− −∞

−∞

= ∫

Realizamos primero el cambio de variable x a t− = : 2 2

) ( h tt teh daπ

−∞

−∞

= +∫

Utilizando la relación anterior: 2 2

h th da t teπ

−∞

−∞

= + ∫

Page 81: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)

81

La segunda integral debe dar 0 pues el integrando es una función impar: ( ) ( )g t g t= − − . Por lo tanto:

( )E x aμ= =

Varianza 2 22 ( ))) (( h xhx eV xx dμμ

π ∞

−∞

−= ∫

Comenzamos nuevamente por realizar el cambio de variable x tμ− = : 2 22( ) h tthV x dxe

π

∞−

−∞

= ∫

Integramos por partes, llamando:

2 2h t

u t

dv t dxe−

=⎧⎪⎨

=⎪⎩

De esta forma se obtiene: 2 2 2 2

2 2

12 2

h t h th dtt e eh hπ

∞− −

−∞ ∞

=⎡ ⎤−⎢

⎣+ ⎥

⎢ ⎥⎦∫

Aplicando el teorema de L´Hopital a la indeterminación del primer término y utilizando la integral

inicial para el segundo término:

2 2

1 12

02

hh h hπ

π⎡ ⎤=⎢ ⎥

⎣ ⎦= +

22

1( )2

V xh

σ= =

Observar que la varianza y 2h se relacionan inversamente por lo cual se suele llamar precisión al valor h y que además el 2 aparece como coeficiente de cualquiera de los dos. Por lo tanto hemos encontrado la relación entre h y la varianza:

22

1 12 2

h hσ σ

= ⇒ =

Reemplazando en la ecuación de Gauss los 2 parámetros encontrados, queda demostrada la ecuación de la función densidad normal.

2

2 21

( ) 21( )2

xh xhf x e e

μμ σ

π σ π

−⎛ ⎞− ⎜ ⎟− − ⎝ ⎠= =

Además la relación inicial toma la forma:

2 /2 2ze dz π∞

−∞

=∫

Nota La media y la desviación estándar en la variable z deben ser 0 y 1, cualquiera sea la distribución, como se demostró en el capítulo 1 (página Mediaz1).

Page 82: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

82

Pro

PuntResolvx μ=

ComSi X1, combin

UsoSi se cuvaloresapéndimás usTodas las 2 m

En cadtabla ytoda la

Prob

Se reprode cola

En la cohalla envalor z

opiedad

to de inflviendo la ecua

σ± .

binación….,Xn son vanación lineal

o de tabuenta con unas de las áreas ce B, en las s

suales, se puedlas tablas de d

magnitudes qu

da problema sy tener en cuena curva.

blema res

oduce en la figsuperior para c

olumna del man la primera fil= 0.52.

Capí

des

exión ación ''( )f x =

lineal ariables aleatode ellas, tamb

blas a computadordebajo de un

secciones SPSde hacer uso distribucione

ue se resumen

e sugiere realnta, si se nece

suelto 3.2

gura 3-51 partecada valor de z

Tabla dargen izquierdoa. De esta form

ítulo 3 Distrib

Jorge

0= , se obtien

orias independbién es norma

ra en la cual sna distribuciónSS y EXCEL.de tablas, tal s contínuas re

n en la siguien

lizar un diagresitan, los val

23 Distrib

de la tabla Noz.

Fdistribución N

o se encuentra ema el recuadrad

buciones de P

e Carlos Carr

ne que los pun

dientes distribal.

se ha instaladon Normal, con Alternativamcomo las que

elacionan valnte notación, e

zα ama de análislores 0.5 de ca

bución n

ormal, del Apén

Figura 3-51 ormal (valoresel valor de z hado 0.3015 corre

Probabilidade

ntos de inflex

buidas norma

o SPSS o EXn las instrucci

mente, aunquee también se eores de eje cen donde α es

sis , colocar eada una de la

normal

ndice B. Esta t

s de cola superiasta el primer desponde a la pr

es

xión se encuen

almente, enton

CEL, se podriones que se ee restringido aencuentran enon valores ds el área de la

el valor que ses 2 mitades d

tabla contiene l

ior) decimal. El segrobabilidad de

ntran en

nces la

rán obtener loencuentran ena los valores n el apéndice e área, es dec

a cola superio

e obtiene de lade la curva o 1

las probabilida

gundo decimal cola superior a

os n el

B. cir

or:

a 1 de

ades

se al

Page 83: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)

83

Problema resuelto 3.24 Método de Sympson

Hemos indicado que en estadística no será necesario utilizar la ecuación matemática de la función densidad de la distribución normal, pues los valores de la misma, se obtienen en general con algún programa de computación o de tablas. Sin embargo es saludable recorrer, al menos una vez, la determinación de los valores que se encuentran en la tabla. Dado que la integración de esta función densidad no tiene una expresión explícita (no hay ninguna primitiva cuya derivada de la función densidad), debe realizarse una integración numérica o la descomposición de la función en series. En este ejemplo he elegido el conocido método numérico de Sympson de aproximación de la curva con segmentos de parábola. Demostraremos que el valor que da la tabla para el área de la cola a partir de z = 0.4, es decir: 0.3446 (ver figura 3-52). Si llamamos S a este valor, se tiene:

20.4

0

10.52

zS e dzπ

−= − ∫

Para calcular la integral definida, elijamos 4 intervalos con un ancho de intervalo h = 0.1. A partir de estas elecciones generamos la siguiente tabla:

i 0 1 2 3 4 zi 0 0.1 0.2 0.3 0.4

2i-ze 1 0.995 0.980 0.9559 0.923

Figura 3-52

Aplicando ahora la expresión de Sympson: 2

0.4

0

( 4 2 )3

z he dz E I P− = + +∫

donde: E = suma de los valores extremos = 1.923 I = suma de los valores en posición impar = 1.9509 P = suma de los valores en posición par = 0.980 Por lo tanto:

20.4

0

0.1 (1.923 4(1.9509) 2(0.980)) 0.38963

ze dz− = + + =∫

Finalmente: 10.5 (0.3896) 0.34462

= − =

Con lo cual hemos demostrado el valor de la tabla.

Problema resuelto 3.25 Coeficiente de inteligencia

Suponiendo que el coeficiente de inteligencia CI, se distribuye según una distribución normal con media 100 y desviación estándar 15: a) obtener el porcentaje de personas que tienen un CI entre 90 y 110, b) obtener el porcentaje de personas que tienen un CI mayor que 75, c) obtener el porcentaje de personas que tienen un CI entre 105 y 115. d) hallar el coeficiente de curtosis definido por AIC/AEP (capítulo 1, página curtosis1). e) ¿Es poco común que una persona tenga un CI mayor a 125? a)

Page 84: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

84

Transformación a valores z Para entrar a la tabla se debe estandarizar la n(x,100,15) en n(z,0.1). Esta conversión de la variable original x a la estandarizada z se puede realizar dentro o fuera de la ecuación probabilística.

Método 1: dentro de la ecuación probabilística 90 100 100 110 100(90 110)

15 15 1590 100 110 100

15 15

xP x P

P z

− − −⎛ ⎞< < = < < =⎜ ⎟⎝ ⎠

− −⎛ ⎞= < < =⎜ ⎟⎝ ⎠

( ) 1 0.0.667 0.667 2514 0.2514 0.497P z= − − − =< < = Diagrama de análisis

Figura 3-53

Diagrama de análisis

Método 2: fuera de la ecuación probabilística 90 100 0.667

15iz −= = −

110 100 0.66715sz −

= =

Por lo tanto: ( )0.667 0.47 76 90.6P zp − < <= =

b)

Transformación a valores z Proseguiremos con el formato fuera de la ecuación probabilística.

75 100 1.66715

z −= = −

Diagrama de análisis

Figura 3-54

Diagrama de análisis Por lo tanto:

1 0.0475 0.9525 95.25%p = − = = c)

Transformación a valores z 105 100 0.33

15iz −= =

115 100 115sz −

= =

Page 85: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)

85

Diagrama de análisis

Figura 3-55

Diagrama de análisis Por lo tanto:

0.3707 0.1587 0.212 21.2%p = − = = d) En todos los casos bastará obtener el valor z correspondiente a los siguientes valores de p (o de frecuencia relativa).

Figura 3-56

Diagrama de análisis Para: p = 0.90, z = 1.2816 p = 0.10, z = -1.2816 p = 0.75, z = 0.6745 p = 0.25, z = -0.6745 Por lo tanto:

0.6745 ( 0.6745) 1.351.2816 ( 1.2816) 2.56

0.527

AICAEP

AICCurtosisAEP

= − − == − − =

= =

e) La P(CI > 125) = 0.047 < 5%, ´por lo cual es un suceso poco común y si sucede al azar, o ha sucedido un evento muy infrecuente o es lícito dudar de los valores dados de la media y de la varianza.

SPSS

A modo de ejemplos: El porcentaje de personas entre CI = 110 y CI = 90 se obtiene a partir de los valores CDF de la siguiente manera: CDF.NORMAL(110,100,15)-CDF.NORMAL(90,100,15)=0.495 La AIC se obtiene de: IDF.NORMAL(0.75,0,1)-IDF.NORMAL(0.25,0,1)= 1.35

Nota Observar que en las distribuciones contínuas, la expresión PDF devuelve la función densidad y no una probabilidad, como en las distribuciones discretas.

Regla empírica Utilizando la tabla o el SPSS, se obtienen los valores de probabilidad que se encuentran debajo de la curva normal para los intervalos -1< z <1, -2< z <2 y -3< z <3.

Page 86: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

86

Compapágina

AprCorreLa aprocada vala curvEn la fde subí

(b x =(b x ≥(b x >(b x ≤(b x <

En igude x po0.5n

Si por (P x ≥

ˆ(P p ≥

Para va

arar estos valo Tchevy1).

roximaección por coximación dealor, de tal fo

va normal figura 3-58, seíndices), que:2) (1.5n→ <2) ( 1n x→ >2) (n x→ >2) ( 2n x→ <2) ( 1n x→ <al sentido, si or n, la cpc re

ejemplo, n = 23) (P x→23 ˆ) (60

P p≥ →

alores grande

Capí

ores con los m

ción decontinuidae una distribucorma que el ár

e muestra por:

2.5)x< < 1.5) 2.5) 2.5) 1.5) en el eje se en

esultará de sum

60: la cpc est22.5)>

23 0.5ˆ )60 60

p > −

s de n, la cpc

ítulo 3 Distrib

Jorge

-1< z-2< z-3< z

F

mínimos posib

e una bad, cpc ción discreta rea de los rect

r ejemplo (uti

ncuentra la prmar o restar e

tablece que:

)

no se justific

buciones de P

e Carlos Carr

<1 68%<2 95%<3 99%

Figura 3-57

bles, aplicand

binomia

por una contítángulos se co

lizando por e

roporción muel valor:

ca.

Probabilidade

do el teorema

al y de

ínua, mejora sorresponda m

sta vez la not

uestral, la cual

es

de Tchebysh

e una P

si se amplía emás cercaname

tación con par

l surge de div

heff (capítulo

oisson

en media unidente con los d

réntesis en lu

vidir cada valo

1,

dad de

gar

or

Page 87: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)

87

Figura 3-58 CPC

1 Binomial a Normal En el capítulo 4 se verá que cualquiera sea la distribución de una v.a x, la sumatoria de x, sigue una distribución Normal si n, el número de términos de la sumatoria, tiende a infinito. Este teorema puede aplicarse a una binomial, pues esta distribución es en definitiva una sumatoria de una distribución de Bernoulli. Un criterio para realizar que esta aproximación asintótica sea adecuada, es:

5np ≥ y 5nq ≥

Algunos autores recomiendan adoptar el valor 15 en lugar del valor 5. Naturalmente bastará que se cumpla para el menor valor de p o q. Si lo desea puede interactuar con el applet: Aproximación de una binomial, que se encuentra en la dirección electrónica de la bibliografía bajo el título Simulaciones.

Problema resuelto 3.26 Estudiantes promocionados

El 52% de los estudiantes ha promocionado la materia estadística (evento E). Si se seleccionan aleatoriamente a 40 estudiantes, ¿cuál es la probabilidad de que la mayoría haya promocionado la materia estadística?

Propiedades binomiales 1. Propiedad 1 Dicotómica

Una v.a x tiene solo 2 resultados (dicotómica), E y E' (el apóstrofo significa no E) 2. Propiedad 2 Variable Aleatoria

Se busca la v.a: y = Número de alumnos E. P(E) = p = 0.52, P(E') = q = 0.48.

3. Propiedad 3 Tamaño Las muestras tienen un tamaño n = 40 > 1

4. Propiedad 4 Independencia Se supone una población suficientemente grande como para que la probabilidad en la extracción de un joven no influye significativamente en la probabilidad de la extracción del siguiente. Es decir se considera que n < 5%N.

Por lo tanto es una binomial ( , 40, 0.52)b y El resultado exacto es:

( 20) 1 . (20, 40,0.52) 0.538P y CDF BINOM> = − =

Condición de aproximación 40 0.48 19.2 5nq = ∗ = ≥

Por lo tanto la binomial se puede aproximar con la normal ( , 20.8,3.16)n y El resultado aproximado (con cpc), es:

( 20.5) 1 . (20.5, 20.8,3.16) 0.538P y CDF NORMAL> = − =

2 Poisson a Normal Considerando la distribución de Poisson como un límite de la Binomial ( npλ = ) para n tendiendo a infinito (página 59) y sabiendo que además bajo estas condiciones la Binomial tiene a una Normal, concluimos que la distribución de Poisson se aproxima a una Normal, para valores grandes del promedio λ. El criterio práctico para realizar una aproximación adecuada, debe ser consistente con los criterios de

Page 88: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

88

las aproximaciones Binomial-Poisson y Binomial-Normal (ver figura siguiente). Se adopta en general:

10λ >

Síntesis Si reunimos estas dos nuevas aproximaciones, con las dos ya vistas, obtenemos el cuadro general que se muestra en la figura 3-59, con los respectivos criterios de validez.

Figura 3-59

Aproximaciones entre distintas distribuciones

Distribución t de Student, f(t,ν) Una distribución muy utilizada en estadística es la desarrollada por el matemático inglés William Gosset, alias Student. Gosset fue contratado por los fabricantes de la cerveza Guinnes en Dublin, para estudiar la forma en que la calidad de la cerveza fuera más estable. Para controlar la economía de la producción, se le impuso la condición de no utilizar grandes muestras. Gosset publicaba con el seudónimo de Student pues la cervecería impedía que sus empleados publicaran artículos que pudieran vulnerar el secreto industrial. Como veremos en el capítulo 4, su descubrimiento es la base del estudio inferencial para pequeñas muestras.

PDF 1

2 2( , ) (0) 1 1tf t f

ν

νν

ν

+⎛ ⎞−⎜ ⎟⎝ ⎠⎛ ⎞

+⎜ ⎟⎝ ⎠

≥=

En el resto de las distribuciones utilizaremos el símbolo general de una función densidad (f) o de la función distribución (F) para evitar confusiones, pues, excepto para la normal, las distribuciones llevan el mismo nombre que el eje.

Verificación PDF ( ) 0

( ) 1

f x

f x dx∞

−∞

>

=∫

Esta última propiedad no se demuestra aquí.

Hipergeométrica Binomialn<5%N

Normal

np y nq >5

Poissonn>100 y p<0.1

λ>10

Page 89: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución t de Student, f(t,�)

89

Grados de libertad Se aprecia en la ecuación que esta distribución, además de t, depende de otra variable simbolizada con la letra griega nu (ν), llamada grado de libertad. Esta variable estará presente en las 3 distribuciones que restan. Los grados de libertad son la cantidad de valores que son libres de variar, conocidos algunos parámetros de la distribución. Su cálculo se definirá en cada distribución, pero en general es función del tamaño de la muestra. En la figura 3-60 puede apreciarse que es una distribución simétrica y también de forma acampanada. Respecto de la distribución normal es platicúrtica (capítulo 1), es decir presenta más variabilidad. Sin embargo, a medida que aumentan los grados de libertad, la distribución t se aproxima a la normal.

Figura 3-60

PDF Distribución t de Student

CDF

Figura 3-61

CDF Distribución t de Student

Caracterización ( ) 0 1E t ν= ≥

Page 90: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

90

( ) 22

V t ν νν

= >−

Observar que, a diferencia de la distribución normal, la desviación estándar es algo mayor que 1, por lo cual es platicúrtica.

Propiedades Suma o resta Si X1, ….,Xn son variables aleatorias independientes distribuidas con t de Student, entonces la combinación lineal de ellas, también se distribuye con t de Student.

Relación con la chi-cuadrado En la distribución χ2 se verá que la siguiente variable, sigue una distribución t de Student con ν grados de libertad, la cual será utilizada extensamente en los capítulos siguientes:

( )/

xts n

μν −=

Se observa que si bien la variable t no depende del grado de libertad, se usa la simbología t(ν) para expresar que la distribución de t si depende de ν (ver la anterior expresión de la PDF). El cálculo del grado de libertad está dado por:

1nν = −

Uso de tablas Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los valores de la distribución t de Student, con las instrucciones que se encuentran en el apéndice B, en las secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se puede hacer uso de tablas, tal como las que se encuentran también en el apéndice B. Se aprecia que, a diferencia de la normal, esta tabla solo devuelve algunos percentiles de cola superior. Estas tablas relacionan las 3 magnitudes: valores de eje, valores de área y grados de libertad, los cuales se resumen en la siguiente notación en donde α es el área de la cola superior:

( )tα ν Puede apreciarse que los valores de la t de Student se aproximan a una normal, aproximación que es satisfactoria para ν mayor que 30 (por lo cual las tablas generalmente terminan en este valor). Se puede verificar que la última fila de la tabla (infinitos grados de libertad) contiene los valores de la normal. Por otra parte, para un determinado valor de una cola, por ejemplo 0.05, los valores de t aumentan al disminuir los grados de libertad. Este comportamiento explica el hecho de hacerse cada vez más platicúrtica, pues al tener colas de igual área cada vez más alejadas, deberá hacerse menos alta en el centro (el área total debe ser siempre 1).

Problema resuelto 3.27 Distribución t de Student

Se reproduce en la figura 3-62 parte de la tabla t de Student, del Apéndice B. Esta tabla contiene los valores t para determinadas probabilidades de cola superior y de grados de libertad ν. En la columna del margen izquierdo se encuentran los grados de libertad y en la primera fila el valor de probabilidad de cola superior, llamado α. a) Hallar el valor t correspondiente a 6 grados de libertad y un α = 0.0125, b) hallar el coeficiente de curtosis definido por AIC/AEP (capítulo 1, página curtosis1), para 6 grados de libertad, c) hallar la cola superior para un valor t =2.015 y 5 grados de libertad. .

Page 91: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

a) La respb) Dado quc) La resp

SPSS

a) IDF.Tb) AIC =AEP =

Valor muna distc) 1-CDFEl valor

DisEsta diinventolos térmRonaldsuaviza

PDF Es un c

1//r

αν

==

donde:

Ic Mod

puesta es el valo

ue la tabla no e

puesta es 0.05.

S

(0.9875,6)

= IDF.t(0.7= IDF.t(0.9

menor que 0.52tribución platic

F.T(2.015,5r no es exactam

stribuistribución fuor de la ciencminos histogrd Fisher (ver dar los problem

caso particula/ 2/ 2

delos teóricos

Ta

or recuadrado:

es suficienteme

)=2.97

75,6)- IDF90,6)- IDF

27 (correspondicúrtica.

5)=0.0452 mente 0.05 pue

ución e desarrolladaia estadísticarama y asimedistribución Fmas entre ello

ar de la distrib

(f

s de una varia

Fabla de valores

2.9687.

ente completa,

.t(0.25,6)

.t(0.10,6)

Curtosis

iente a una dist

es el valor de t

chi cua por Karl Pe. Inventó ademetría. Fue amF). El pacíficoos, sin éxito.

bución Gamm

2 (( , ) C χνχ =

able – Distrib

Figura 3-62 t de Student (c

debe calculars

)= 0.7176-)= 1.4398-

0AICsAEP

= =

tribución meso

en la tabla (2.0

uadraarson, un matmás el cálculo

migo de Williao Gosset, ami

ma con:

2

2 /2 1

/2

) e

ν

χ

χ ν−

bución chi cua

cola superior)

se con el SPSS

(-0.7176) (-1.4398)

0.498

ocúrtica), como

015) se encuen

do, f(temático inglo del coeficieam Gosset, peigo de ambos,

2 1 0ν χ≥ >

adrado, f(��

S.

= 1.4352 = 2.8796

o era de espera

ntra redondeado

(χ2, ν) és, a veces ac

ente de correlero acérrimo e, estaba siemp

� �

ar al tratarse de

o.

clamado comolación y acuñenemigo de pre intentando

o el ñó

o

Page 92: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

92

/2

12 ( / 2)

C ν ν=

Γ Se aprecia en la ecuación que esta distribución, además de χ2, depende de otra variable simbolizada con la letra griega nu (ν), llamada grado de libertad. Para ν < 2, la distribución tiene al eje y como asíntota vertical y al eje x como asíntota horizontal (figura 3-63). Para ν ≥ 2, la distribución comienza en el origen y es sesgada hacia la derecha (figura 3-63). En cualquier caso el eje no toma valores negativos. A medida que aumentan, los grados de libertad la distribución se hace cada vez más simétrica y si ν > 100, se puede considerar normal.

Figura 3-63

PDF Distribución chi cuadrado para 2ν ≥

Verificación PDF ( ) 0

( ) 1

f x

f x dx∞

−∞

>

=∫

Esta última propiedad resulta como caso particular de la distribución Gamma.

Page 93: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución chi cuadrado, f(�� �

93

CDF

Figura 3-64

CDF Distribución chi cuadrado

Caracterización Reemplazando los valores particulares de los parámetros de la distribución chi cuadrado en la media y varianza de la distribución Gamma, se obtienen:

2( ) 1E χ ν ν= > 2( ) 2 1V χ ν ν= >

Propiedades Suma Si X1 y X2 son dos variables chi-cuadrado independientes con ν1 y ν2 grados de libertad, entonces la suma de ambas es también una variable aleatoria chi-cuadrado con ν = ν1 + ν2 grados de libertad.

Cociente Se verá en la siguiente distribución.

Relación con la distribución Normal Si Z1, ….Zn son variables aleatorias normales independientes, entonces la variable:

2 2

1( )

n

ii

zχ ν=

= ∑

tiene una distribución chi cuadrado con nν = grados de libertad. Observar que este tipo de expresiones son una forma contracta de expresar la ecuación probabilística:

2 2 2

1( ( ) )

n

ii

P P z aαχ ν χ α=

⎛ ⎞> = > =⎜ ⎟

⎝ ⎠∑

En lugar de la CDF superior podría haberse usado la CDF inferior. Caso particular: transformación cuadrática

Page 94: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

94

Si ν = 1, resulta un problema de cálculo de la PDF de la variable 2w z= , si la PDF de la variable z es normal. Aplicando la relación de PDF para una transformación cuadrática (página 27), resulta:

( ) ( ) 1/2 /21 1( )2 2

sg w w w w ew

ϕ ϕπ

− −⎡ ⎤= + − =⎣ ⎦

Dado que (1/ 2) πΓ = (página 69), observamos que 2w z= tiene una distribución chi cuadrado. Por lo tanto:

2 2 2( (1) ) ( )P P z aαχ χ α> = > =

Desarrollando la expresión del segundo miembro: 2( ) ( )P z a P a z a α> = − > > =

o también: 2

/2 /2( ) ( )P z a P z z zα α α> = − > > = Por lo tanto:

2 2/2 /2( (1) ) ( )P P z z zα α αχ χ α> = − > > =

Esta relación se resume con la expresión: 2 2

/2(1) zα αχ = En un lenguaje cercano al de la sintaxis del SPSS:

. ( ,1) . ( ( ), 0,1)sig chisq x sig norm sqrt x=

donde ( )sqrt x x= . Observar que la variable del eje de la función SIG de la normal es el cuadrado de la correspondiente a la variable de la función SIG de la chi-cuadrado. En la figura siguiente se presenta la gráfica de las PDF de estas funciones (coincidentes). La curva de la normal converge a la de la chi-cuadrado debido al escalamiento de su eje x con x .

Page 95: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución chi cuadrado, f(�� �

95

Figura 3-65

Si en la ecuación de z se usa x , en lugar de μ: 2 2

22 2

1

( ) ( 1)( )n x x s nχ ν

σ σ− −

= =∑

con 1nν = − grados de libertad.

Relación con la distribución t de Student

2 2

2

x

xz xt ss

n

μσ μ

χν σ

−−

= = =

donde se ha usado la relación x nσσ = que se verá en la unidad 4. Esta expresión es en realidad la

definición de una distribución t de Student que será utilizada a partir del capítulo 4, para modelar la distribución de medias en muestras pequeñas.

Aproximación a una normal Si ν >100, la distribución χ2 se puede aproximar a una normal (con la media y desviación estándar anteriores). Es por esta razón que las tablas de χ2 usualmente llegan solo a ν = 100.

Si χ2 se aproxima a una distribución normal, entonces 2 2

2

1s

nχ σ

=−

también, con.

22

2

( 1)( ) 1s nE E nχσ

⎛ ⎞−= = −⎜ ⎟

⎝ ⎠

de donde: 2 2( )E s σ=

Análogamente: 2

22

( 1)( ) 2( 1)s nV V nχσ

⎛ ⎞−= = −⎜ ⎟

⎝ ⎠

de donde: 4

2( ) 21

V snσ

=−

Uso de tablas Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los valores de la distribución χ2, con las instrucciones que se encuentran en el apéndice B, en las secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se puede hacer uso de tablas, tal como las que se encuentran también en el apéndice B. Estas tablas relacionan las 3 magnitudes: valores de eje, valores de área y grados de libertad, los cuales se resumen en la siguiente notación, en donde α es el área de la cola superior:

2 ( )αχ ν

Page 96: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

96

Se apredevueldistribu

Prob

Se reproχ2 para En la cocola supun α =

SPSS

IDF.CCDF.C

Nota Para lassig.c

DisEsta dipor el mFisher el más notableaños enkm al n

PDF Es un m

ecia que, debive algunos peución χ2 se ap

blema res

oduce en la figdeterminadas

olumna del maperior. Así por0.950.

S

CHISQ(0.05,CHISQ(1.64,

s distribucionechisq(1.64,

stribuistribución se matemático nfue contempobrillante de l

emente en su n contacto conorte de Lond

miembro de l

Capí

ido a que la dercentiles. El proxima a la N

suelto 3.2

gura 3-66 parteprobabilidades

argen izquierdor ejemplo el val

,6)=1.64 ,6)=0.0503

s χ2 y F, SPSS,6)=0.946

ución debe al estad

norteamericanoráneo de Wios miembros producción yn problemas r

dres.

a familia de d

ítulo 3 Distrib

Jorge

distribución esvalor máxim

Normal.

28 Distrib

de la tabla Chs de cola supero se encuentranlor recuadrado

FTabla de v

tiene también

F, f(Fdístico inglés no George Sneilliam Gosset del cerrado g

y en el desarroreales, en una

distribuciones

buciones de P

e Carlos Carr

s asimétrica ymo de ν es 100

bución χ

hi-cuadrado, derior y de gradosn los grados de o 1.64 es el valo

Figura 3-66 valores chi cua

una sintaxis d

F,ν1, ν2)sir Ronald Fiedecor, con c(alias Studen

grupo de estadollo de podera estación exp

s beta.

Probabilidade

y por limitacio0, pues a parti

2

el Apéndice B. s de libertad ν.libertad y en l

or χ2 correspon

adrado

directa para dev

) isher, por la cuyo nombre t

nt) y de Karl Pdísticos británrosas herramiperimental ag

es

ones de espacr de este valo

Esta tabla con a primera fila e

ndiente a 6 gra

volver la cola s

ual lleva su intambién se la Pearson. Fue pnicos. Influyeientas metodogrícola en Her

cio, solo or, la

ntiene los valor

el valor de α ddos de libertad

superior:

nicial (propueasocia).

probablementeron ológicas, sus 1rtfordshire, a 5

es

de d y

esta

te

14 50

Page 97: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución F, f(F,���

97

1 2

1 /2 2

11 2 21 1

2

( , , ) 1 1, 1f F CF Fν ν

ν ν νν

νν ν+⎛ ⎞−⎜ ⎟

⎝ ⎠− ⎛ ⎞ ≥ ≥⎜ ⎟⎝ ⎠

= +

donde: 1

1 2 1

1 2

2

2

( ) / 2)( / 2) ( / 2)

ν ν νν ν νΓ +

=Γ Γ

⎛ ⎞⎜ ⎟⎝ ⎠

No debe confundirse el símbolo f usado para simbolizar la función densidad, del F usado para simbolizar la variable de la distribución F. Se aprecia en la ecuación que esta distribución, además de F, depende de otras 2 variables simbolizadas con la letra griega nu (ν), llamadas grados de libertad. Además se observa que la dependencia con ambos grados de libertad no es simétrica, por lo cualν1 y ν2 no pueden ser intercambiados (ver propiedad recíproca más adelante) Para ν1 ≤ 2, la distribución tiene al eje y como asíntota vertical y al eje x como asíntota horizontal. Para ν1 ≥ 2, la distribución comienza en el origen y es sesgada hacia la derecha. En cualquier caso el eje de la distribución F no toma valores negativos.

Figura 3-67

PDF Distribución F

Verificación PDF ( ) 0

( ) 1

f x

f x dx∞

−∞

>

=∫

Esta última propiedad no se demuestra aquí.

Page 98: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

98

CDF

Figura 3-68

CDF Distribución F

Caracterización

22

2

( ) , 22

E F ν νν

= >−

22 1 2

221 2 2

2 ( 2)( ) , 4( 2) ( 4)

V F ν ν ν νν ν ν

+ −= >

− −

Propiedades Relación con χ2

12

122

12 2

( ) /( )/( )

,F χ νν νχ

νν ν

=

Recordar nuevamente que esta expresión resume una ecuación probabilística del tipo CDF.

222

11 2

12 /( )(

( ( ,)

) )/

P F a P bνν

χ νν ν αχ ν

⎛ ⎞> = > =⎜ ⎟

⎝ ⎠

Esta relación es en realidad la definición de la distribución F que será utilizada en el capítulo 5 y es equivalente a la siguiente, ver página 95:

2 21 2

1 2 2 22 2

/( , )/

s sF ν νσ σ

=

con los grados de libertad de la PDF dados por:

1 1 1nν = − 2 2 1nν = −

Page 99: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribución F, f(F,���

99

Se observa que si bien la variable F puede no depender del grado de libertad, se usa la simbología F(ν1, ν2) para expresar que la distribución de F si depende de (ν1, ν2) (ver la anterior expresión de la PDF).

Relación con t de Student

2(1, ) ( )F tν ν=

Demostración

( )

2

2

22 2 22

2 222 22 2

2212

(1, ) ( )) / 1 ((1)

( )n

xz xF t

s sx

μχ μσν ν

χ ν ν μσν σ

−−⎛ ⎞= = = = =⎜ ⎟− ⎝ ⎠∑

También podría haberse utilizado la relación: 2

ztχν

= .

En forma similar al tratamiento visto en χ2, se desarrolla la expresión del segundo miembro: 2( ) ( )P t a P a t a α> = − > > =

o también:

/2 /2( (1, ) ) ( )P F F P t t tα α αν α> = − < < =

Esta relación se resume con la expresión: 2

/2(1, ) ( )F tα αν ν=

Propiedad reciproca Permite calcular los puntos porcentuales de cola izquierda a partir de una tabla de cola derecha.

1 22 1

1,)

( )( ,I

S

FF

ν νν ν

=

En la figura 3-69, se puede observar el procedimiento. Para hallar el valor FI de cola inferior, se entra con valores invertidos de los grados de libertad y se invierte el valor de F cola superior. Por ejemplo:

0.05 1 20.95 2 1

1( , )( , )

a FF

ν νν ν

= =

Siendo 0.05 y 0.95, valores CDF de la distribución.

Page 100: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

100

Figura 3-69

Propiedad reciproca

Uso de tablas Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los valores de la distribución F, con las instrucciones que se encuentran en el apéndice B, en las secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se puede hacer uso de tablas, tal como las que se encuentran también en el apéndice B, para determinados valores de ν1 y ν2. Estas tablas relacionan las 4 magnitudes: valores de eje, valores de área y los 2 grados de libertad, los cuales se resumen en la siguiente notación, en donde α es el área de la cola superior:

1 2( , )Fα ν ν Se aprecia que, debido a que la distribución es asimétrica y por limitaciones de espacio, solo devuelve algunos percentiles de cola superior. Afortunadamente, los de cola inferior se obtienen con la propiedad recíproca.

Problema resuelto 3.29 Distribución F

Se reproduce en la figura 3-70 parte de la tabla F, del Apéndice B. Esta tabla contiene los valores F para determinadas probabilidades de cola superior (α = 0.05 en este encabezamiento) y de grados de libertad ν1 (primera fila) y ν2 (primera columna). Así por ejemplo el valor recuadrado 4.12 es el valor F correspondiente a una cola superior de 0.05, 4 grados de libertad ν1 y 7 grados de libertad ν2.

Page 101: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Distribuciones truncadas

101

Figura 3-70 Tabla de valores F

SPSS

IDF.F(0.95,4,7)=4.12 CDF.F(4.12,4,7)=0.9499

Nota Para las distribuciones χ2 y F, SPSS tiene también una sintaxis directa para devolver la cola superior: sig.F(4.12,4,7)=0.05

Problema resuelto 3.30 Propiedad reciproca

Obtener el valor F del límite superior de una cola inferior CDF = 0.05 con grados de libertad ν1 = 10 y ν2 = 5. Por la propiedad recíproca esto es equivalente al valor inverso del límite de cola superior 0.05 y grados de libertad ν1 = 5 y ν2 = 10. De la tabla que se muestra en la figura 3-70, se extrae el valor F = 3.33. Por lo tanto el valor buscado es:

1 0.33.33

F = =

SPSS

IDF.F(0.05,10,5)=0.30

Estimador de Densidad Kernel, Kernel Density Estimate, KDE. En el capítulo 1, página kernel1, vimos los gráficos de Estimadores de Densidad Kernel, KDE, construidos con rectángulos. Estos gráficos se corresponden con la elección de una distribución uniforme la cual pesa todos los datos de igual forma, pero podría elegirse otra distribución. Entre ellas podemos citar: triangular, normal o gausiana y la epanechnikov (de tipo parabólico que pesa menos los extremos). En el apéndice A se brinda la sintaxis para obtener varias de ellas con el SPSS.

Distribuciones truncadas Se desea convertir una distribución PDF ( )f x que no es cero a la derecha de un punto x r= en otra que lo sea y se llamará distribución truncada hacia la derecha del punto r (sin considerarlo). La expresión de su CDF se obtiene calculando la probabilidad condicional dada la probabilidad

( )P X r≤ (ver figura 3-71), es decir:

( )( | ) ( )

P X xF x x r x rP X r

≤≤ = ≤

Por lo tanto su PDF en función de la PDF original, será:

Page 102: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

102

( ) ( )( | )

0

f x x rP X rf x x r

x r

⎧ ≤⎪ ≤≤ = ⎨⎪ >⎩

Figura 3-71

Análogamente, para una distribución truncada a la izquierda:

( ) ( )( | )

0

f x x rP X rf x x r

x r

⎧ ≥⎪ ≥≥ = ⎨⎪ <⎩

Ejemplos

Contínua Una PDF exponencial truncada a la izquierda de x r= , será:

( | )r

xef x x re α

αα−

≥ =

Discreta Una PDF de Poisson truncada a la derecha de x r= será:

( )!

xeP X x Cx

λλ−

= =

con:

0

1

!

jr

j

Ce

j

λλ−

=

=

Por lo tanto:

0

1( ) x 0,1,...,!

!

x

jr

j

P X i rx

j

λλ

=

= = =

Problema resuelto 3.31 Normal truncada a la izquierda

El tiempo de vida de un componente está normalmente distribuido Con media 4 y varianza 4. Dado que esta variable no puede tomar valores negativos y la distribución normal asume valores positivos y negativos, no sería válida para X < 0. Si el valor de la probabilidad para X < 0 es despreciable, el modelo puede ser válido, pero si no lo es, se debe truncar a la PDF. En este caso:

Page 103: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Momentos de orden n

103

0 4( 0) ( 2) 0.0232

P X −⎛ ⎞< = Φ = Φ − =⎜ ⎟⎝ ⎠

Con este valor, el modelo sin truncar no es muy preciso, por lo tanto debemos truncar a la izquierda de X = 0, resultando:

21 1 4exp2 22 2( )

(2)

x

f x π−⎛ ⎞− ⎜ ⎟

⎝ ⎠=Φ

Momentos de orden n Los momentos de orden n vistos en el capítulo 1 (página momentosr), se generalizan tanto a variables discretas como contínuas. En las siguientes ecuaciones, la expresión con sumatoria corresponde a variables discretas y la expresión con integral a variables contínuas.

Naturales Centrados

1 ( ) ( )a E X xp xf x dx μ∞∞

−∞ −∞

= = = =∑ ∫

1 ( ) ( ) ( ) ( ) 0E X x p x f x dxc μ μ μ∞∞

−∞ −∞

= − = − = − =∑ ∫

2 2 22 ( ) ( )a E X x p x f x dx

∞∞

−∞ −∞

= = =∑ ∫

2 2 2 22 ( ) ( ) ( ) ( )E X x p x f x dc xμ μ μ σ

∞∞

−∞ −∞

= − = − = − =∑ ∫

( ) ( )n n nna E X x p x f x dx

∞∞

−∞ −∞

= = =∑ ∫

( ) ( ) ( ) ( )n n nn E X x p x f x dxc μ μ μ

∞∞

−∞ −∞

= − = − = −∑ ∫

Función generadora de momentos, MGF m(t) Muchas distribuciones de probabilidades distintas tienen la misma media y varianza, pero si dos distribuciones tienen todos los momentos de orden n iguales (capítulo 1, página momentosr y sección anterior), entonces se puede demostrar que ambas distribuciones son idénticas. Se puede definir una función que contiene todos los momentos naturales de una distribución y por esta razón se llama Función Generadora de Momentos o MGF (Moment Generator Function), MX(t). Si la variable es discreta demostraremos que es:

( ) ( ) ( )tx txXM t E e e p x

−∞

= = ∑

Si la variable es contínua demostraremos que es:

( ) ( ) ( )tx txXM t E e e f x dx

−∞

= = ∫

Puede observarse que la MGF es simplemente el valor esperado de txe .

Page 104: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

104

La notación ( )XM t expresa la dependencia con X y prepara la expresión para cuando se consideren

2 o más variables (como regla nemotécnica, del exponente de txe , el valor t pasa al paréntesis de M y el valor x al subíndice).

Demostración Desarrollaremos (Mc Laurin) tanto el primer miembro como el segundo y luego identificaremos ambas resultados.

1 Desarrollo del segundo miembro La expansión en series de txe (desarrollo de Mc Laurin) es:

2 3( ) ( )1 ...2! 3!

tx tx txe tx= + + + +

Realizaremos la demostración para una variable discreta (la de variable contínua es idéntica).

2 3( ) ( )( ) ( ) ( ) 1 ... ( )2! 3!

tx txX

tx txM t E e e p x tx p x∞ ∞

−∞ −∞

⎡ ⎤= = = + + + +⎢ ⎥

⎣ ⎦∑ ∑

Si los momentos ai son finitos se pueden intercambiar las sumatorias:

2 32 3( ) ( ) ( ) ( ) ...

2! 3!t tp x t xp x x p x x p x

∞ ∞ ∞ ∞

−∞ −∞ −∞ −∞

= + + + +∑ ∑ ∑ ∑

Finalmente: 2 3

1 2 3( ) 1 ...2! 3!Xt tM t ta a a= + + + +

2 Desarrollo del primer miembro El desarrollo de Mc Laurin de la función MX(t) es:

2 3

( ) (0) '(0) ''(0) '''(0) ...2! 3!X X X X Xt tM t M M t M M= + + + +

Es decir: 2 3

( ) 1 '(0) ''(0) '''(0) ...2! 3!X X X Xt tM t M t M M= + + + +

3 Identificación Comparando ambos desarrollos, resulta:

12

23

3

( ) '(0)

( ) ''(0)

( ) '''(0)...

( ) (0)

X

X

X

k kk X

a E X M

a E X M

a E X M

a E X M

= =

= =

= =

= =

Nota Los momentos centrados se pueden obtener de los naturales aplicando la propiedad de transformación lineal que se verá luego.

Page 105: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Función generadora de momentos, MGF m(t)

105

Problema resuelto 3.32 Obtención de MX(t)

Hallar la MGF de las siguientes distribuciones: binomial, geométrica, uniforme, gamma, exponencial y normal.

a) Binomial

( )0 0

( )n n xtx x n x t n x

Xx x

n nM t e p q pe q

x x− −

= =

⎛ ⎞ ⎛ ⎞= =⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠∑ ∑

( )( )nt

XM t pe q= +

Verificar las ecuaciones de la media y de la varianza.

Media

( ) 1'( )

'(0)

nt tX

X

M t n pe q pe

M npμ

−= +

= =

Varianza

2( ) ( )Y XV X E Y

μ= −

=

Si bien la propiedad de transformación lineal se verá en el punto siguiente, se puede operar constructivamente:

( )( ) ( ) ( ) ( ) ( )nyt xt t t xt t t t

Y XM t E e E e e E e e M t e pe qμ μ μ μ− − − −= = = = = +

Hallando la primera derivada en t y luego la segunda, se obtiene (la expresión tpe q+ se reemplaza por (.) : 2 1 (1 ) 1 (1 ) 2''( ) (.) (1 ) (.) ( 1)(.)t t n t t n t n t

YM t e e n e pe n pe n n peμ μ μ μμ μ μ− − − − − − −= − + − + −

Reemplazando 0t = , 1q p= − y simplificando, resulta:

( ) ''(0)YV Y M npq= =

b) Geométrica

( )1

0 0

( )n n xtx x t

Xx x

pM t e q p qeq

= =

= =∑ ∑

La suma de la serie es una serie geométrica y si restringimos los valores de t tal que 1to qe< < , converge y por lo tanto:

( )1

t

X t

p qeM tq qe

=−

( )1

t

X t

peM tqe

=−

c) Poisson

( )0 0

( )! !

xtxtx

Xx x

eeM t e ex x

λλ

λλ−∞ ∞−

= =

= =∑ ∑

De la expansión en series de ye , resulta.

Page 106: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

106

tee eλ λ−= ( )1( )

teXM t eλ −

=

d) Uniforme

( )b tx

Xa

eM t dxb a

=−∫

( )1( ) 0( )

bt atXM t e e t

t b a= − ≠

e) Gamma

( ) 1 1 ( )

0 0

( )( ) ( )

rrtx x r x t

XM t e x e dx x e dxr r

α αα αα∞ ∞

− − − − −= =Γ Γ∫ ∫

Haciendo el cambio de variable ( 1)u x α= −

1

0

1( )

rr uu e du

t rα

α

∞− −⎛ ⎞= ⎜ ⎟− Γ⎝ ⎠ ∫

1

0

( )( ) ( )

rru

XuM t e du

t r tα

α α

−∞−⎛ ⎞= ⎜ ⎟− Γ −⎝ ⎠∫

como la integral es ( )rΓ ,

( )r

XM tt

αα

⎛ ⎞= ⎜ ⎟−⎝ ⎠

f) Exponencial

Es un caso especial de la Gamma con 1r = .

( ) XM t tt

α αα

= <−

g) Chi cuadrado

Es un caso particular de la distribución Gamma con 1/ 2α = y / 2r ν= . Por lo tanto. /2( ) (1 2 )XM t t ν−= −

h) Normal

1 (0,1)N

2 2/2 /21 1( )2 2

tz z tz zZM t e e dz e dz

π π

∞ ∞− −

−∞ −∞

= =∫ ∫

completando cuadrados;

( )2 2/ 2 / 2 /212

z t te dzπ

∞− − +

−∞

= ∫

Page 107: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ic Modelos teóricos de una variable – Función generadora de momentos, MGF m(t)

107

2 22 2

/2 /2/22 2

2 2

t tu te ee du eπ

π π

∞−

−∞

= = =∫

2 /2( ) tZM t e=

2 ( , )N μ σ Si bien la propiedad de transformación lineal se verá en el punto siguiente, se puede operar constructivamente: Y Zμ σ= + Por lo tanto:

2 2 /2( ) ( ) ( ) ( ) ( )yt t Zt t Zt t t tY ZM t E e E e e E e e M t e eμ σ μ σ μ μ σσ+= = = = =

2 2 /2( ) t tYM t e eμ σ=

2 2 /2( ) t tYM t e eμ σ=

Propiedades de la MGF

Unicidad Si una distribución de probabilidades f(x) tiene una MX(t), ésta es única. Este teorema que adoptamos sin demostración, demuestra la afirmación realizada al principio en el sentido de que si dos distribuciones tienen los todos sus momentos iguales, es decir sus MX(t) iguales, entonces ambas distribuciones son idénticas. Esta conclusión será utilizada en el capítulo 4 para demostrar el Teorema Central del Límite, TCL.

1 Variable: Transformación lineal Y aX b= +

( )( ) ( )) ( )aX b t bt atXYM t E e e E e+= =

( ) ( )btY XM t e M at=

La traslación b aparece como parte del exponente de coeficiente exponencial y el cambio de escala a como parte de la variable dentro del paréntesis.

>1 Variables: Suma + independencia Se demuestra para 2 variables pero se extiende a más de 2. Z X Y= +

( ) ( )( )( ) ( )Zt X Y t Xt YtZM t E e E e E e e+= = =

si además X e Y son independientes, ( ) ( ) ( ) ( )Xt Yt

X YE e E e M t M t= = +

( ) ( ) ( )Z X YM t M t M t= +

>1 Variables: Propiedad reproductiva (algunas distribuciones) Algunas distribuciones poseen la siguiente propiedad: la distribución de la suma es del mismo tipo que la de los sumandos.

Page 108: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

108

Poisson independientes ( )

( )

1

2

1

1

( )

( )

t

t

eX

eY

M t e

M t e

λ

λ

=

=

Por lo tanto: ( )1 2( ) 1( ) ( ) ( )

teZ X YM t M t M t e λ λ+ −

= =

Esta es la MGF de una distribución de Poisson con parámetro 1 2λ λ+ . Se demuestra para 2 variables pero se extiende a más de 2.

Normal independientes 2 2 2 2

1 1 2 2( ) ( ) ( ) exp( / 2)exp( / 2)z X YM t M t M t t t t tμ σ μ σ= = + +

( )2 2 21 2 1 2exp ( ) ( ) / 2t tμ μ σ σ= + + +

Esta es la MGF de una distribución normal con media 1 2μ μ+ y varianza 2 21 2σ σ+ .

Se demuestra para 2 variables pero se extiende a más de 2.

Chi cuadrado independientes 1 2( )/2( ) ( ) ( ) (1 2 )Z X YM t M t M t t ν ν− += = −

Se demuestra para 2 variables pero se extiende a más de 2.

Exponencial independientes Esta distribución no tiene la propiedad reproductiva pero tiene una similar: Si r distribuciones exponenciales tienen el mismo parámetro α, la distribución suma tiene una distribución Gamma con parámetros α y r. Esto es así pues:

( ) r

ZM tt

αα

⎛ ⎞= ⎜ ⎟−⎝ ⎠

Corolario Dada la distribución Z anterior, la variable aleatoria 2W Zα= tiene una distribución chi cuadrado con ν = 2r.

( ) 2 /2( ) (2 ) 1 22

rr

W ZM t M t tt

αα αα α

−⎛ ⎞= = = −⎜ ⎟−⎝ ⎠

Esta es una distribución chi cuadrado con 2rν = grados de libertad. Este corolario brinda una forma de calcular una distribución Gamma con una distribución chi cuadrado. Así por ejemplo ( 4) (2 8 )P Z P Zα α≤ = ≤ . Esta última se calcula como una distribución chi cuadrado (dados α y r) de 2W zα= y 2rν = . Por ejemplo, si r = 3 y α = 4: CDF.GAMMA(1,r,α)=CDF.GAMMA(1,3,4)=CDF.CHISQ(2(1)(4),2(3))=CDF.CHISQ(8,6)=0.762.

Page 109: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIa Dos variables – 1. Métodos tabulares y gráficos

109

IIa Dos variables

En esta sección y la siguiente, la variable en estudio es de tipo vectorial, llamado vector aleatorio:

1 2( , ,... )kY Y Y Y=

Se tratará esencialmente el caso de 2 variables, pero el tratamiento es extensivo al caso multivariable.

1. Métodos tabulares y gráficos Sean X e Y con funciones de distribución contínuas, F1(x) y F2(y) y funciones densidad, f1(x) y f2(y) (resultará más práctico usar, para la variable independiente, la notación con paréntesis en lugar de subíndices).

a Variables discretas Son las expresiones vistas en el capítulo 1 (2 variables), cambiando la frecuencia relativa por la probabilidad p.

PF Se define la probabilidad conjunta (llamada también PF, Probability Function o PDF, Probability Density Function) como:

( , ) ( , )p x y P X x Y y= = =

CDF Se define la probabilidad acumulativa conjunta como:

( , ) ( , )F x y P X x Y y= ≤ ≤ Siendo:

( , ) ( , )a b

P X a Y b p x y−∞ −∞

≤ ≤ = ∑∑

Page 110: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

110

PF marginales

2

1

1

2

( ) ( , )

( ) ( , )

x

x

p x p x y

p y p x y

=

=

PF condicionales

12

( , )( | )( )

p x yxpp

yy

=

21

( , )( | )( )

p x yypp

xx

=

Independencia X e Y se dicen independientes si:

1 1( | ) ( )yp x p x=

2 2( | ) ( )xp y p y= Combinando las ecuaciones anteriores, se obtiene la condición de independencia:

1 2( , ) ( ) ( )p x y p x p y=

b Variables contínuas Las funciones conjuntas se simbolizarán como F(x,y) y f(x,y), las cuales se definen a continuación, a partir de sus correspondientes categóricas.

CDF Como ya adelantamos en el capítulo 1, las expresiones para variables categóricas se generalizan informalmente a variables de escala, cambiando: la frecuencia relativa fx por fdx la frecuencia relativa conjunta fxy por f(x,y)dxdy y las sumatorias por integrales.

( , ) ( , ) ( , )x y

F x y P X x Y y f x y dxdy−∞ −∞

= ≤ ≤ = ∫ ∫

PDF La vinculación entre una función PDF y su correspondiente CDF, se obtendrá derivando la expresión de ( , )F x y , primero con respecto de x y luego respecto de y, recordando la regla de derivación de una función integral (integral definida que depende de su límite superior).

( , )( , ) F x yf x yx y

∂∂=

∂ ∂

Page 111: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIa Dos variables – 2. Métodos numéricos

111

Probabilidad de masas Al igual que para una variable, página 16, resulta útil la analogía que surge de considerar a la función densidad como una densidad superficial de masa en el plano xy. Con esta interpretación la función densidad sería el volumen entre la superficie y el plano xy. En particular si la PDF es constante (distribución uniforme) de valor c y el área en el plano xy es A, la constante deberá ser 1/ A .

PDF marginales

1( ) ( , )f x f x y dy∞

−∞= ∫

Si se representa la PDF bivariable en 3D (con la función densidad en el eje vertical), se puede visualizar este resultado asimilándolo al caso discreto visto en el capítulo 1, discretizando la gráfica en un diagrama de barras elementales y acumulando las probabilidades de ( , )f x y (tabla de contingencias con celdas elementales en el plano x-y) a lo largo de líneas paralelas al eje y. Análogamente:

2 ( ) ( , )f y f x y dx∞

−∞= ∫

PDF condicionales

12

( , )( | )( )

f x yf x yf y

=

21

( , )( | )( )

f x yf y xf x

=

La visualización de estas fórmulas con una tabla de contingencias se realiza en forma similar al de las PDF marginales.

Independencia X e Y se dicen independientes si:

1 1( | ) ( )f x y f x=

2 2( | ) ( )f y x f y= Combinando las ecuaciones anteriores, se obtiene la condición de independencia:

1 2( , ) ( ) ( )f x y f x f y= Esta ecuación es equivalente a:

1 2( , ) ( ) ( )F x y F x F y=

2. Métodos numéricos A menos que se exprese específicamente, las expresiones que se enumeran a continuación son genéricas y deberán ser calculadas con la expresión discreta o contínua según corresponda. Adicionalmente, se recuerda que las expresiones para variables cuantitativas discretas son las mismas que para variables cuantitativas contínuas cambiando las sumatorias por integrales y la probabilidad ( )p xy por ( )f xy dxdy .

Page 112: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

112

Medidas de posición

Vector esperanza Como la variable aleatoria es vectorial, la esperanza también. Es el vector esperanza de las distribuciones marginales.

( ( ), ( ))E X E Y

Este vector, tal como se indicó en el capítulo 1, se corresponde con las coordenadas del centro de gravedad, en este caso, de la nube de puntos.

Esperanza conjunta Como ya vimos en el capítulo 1, página E2var1, se puede calcular como: Discretas

( ) xyx y

E XY XYp= ∑∑

Contínuas

( ) ( , )E XY xyf x y dxdy+∞ +∞

−∞ −∞

= ∫ ∫

Esperanza condicional Discretas

( | ) ( | )i i ii

E X y x p x y= ∑

La interpretación es directa. Es simplemente la media de la distribución condicional ( | )i ip x y . Observar que ( | )E X y depende de y, por lo tanto es una variable aleatoria. La notación indica estrictamente hablando, el valor de la variable aleatoria ( | )E X Y .

Contínuas

( | ) ( | )E X y xf x y dx∞

−∞= ∫

Medidas de dispersión

Vector varianza Al igual que las de posición, como la variable aleatoria es vectorial, la varianza también los es. Es el vector varianza de las distribuciones marginales.

( ( ), ( ))V X V Y.

Como ya vimos en el capítulo 1, página Steiner1, se puede calcular como:

( )2 2

22( ) ( ) ( )xx X NSSV X E X E XN N

μ−= = = −∑

Page 113: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIa Dos variables – Medidas de asociación

113

Varianza conjunta La varianza conjunta es la covarianza y se desarrollará en la próxima sección.

Varianza condicional 2( | ) ( ( | )) |Var Y X E Y E Y X X⎡ ⎤= −⎣ ⎦

En otras palabras es la misma definición general de varianza aplicada a la distribución condicional con X conocido (observar que todas las esperanzas son condicionales).

Medidas de asociación La extensión de las expresiones del capítulo 1 es análoga a la de las medidas de posición.

Covarianza Discretas

( ) x yy

xyx

pCov XY Δ Δ= ∑∑

Contínuas

( ) ( , )x yCov XY f x y dxdy+∞ +∞

−∞ −∞

= Δ Δ∫ ∫

Como ya vimos en el capítulo 1, página Steiner2var1, se puede calcular como:

( , ) ( ) ( ) ( )xySSCov X Y E XY E X E Y

N= = −

Correlación lineal

( , )

x y

Cov X YS S

ρ =

Si se multiplica numerador y denominador por N , se obtiene una expresión en función de los SS:

xy

xx yy

SSSS SS

ρ =

Si se aplica a variables de escala, se obtiene el coeficiente de correlación de Pearson, en cambio si las variables son ordinales (por ejemplo tomando los rangos o posiciones ordenadas de una variable de escala, a los que llamaremos RX y RY), se obtiene el coeficiente de correlación de Spearman.

Matriz Covarianzas, P Al igual que en la unidad 1, página SSCP1, se presentan todos los resultados de varianzas y covarianzas en el formato de matriz, P, como en la siguiente figura.

Varxx CovxyCovyx Varyy

Page 114: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

114

Figura 3-72

Matriz de correlaciones, R La matriz de correlación R, contiene las correlaciones:

( , )i jij

ii jj

Cov Y Yr

s s=

Por lo tanto los elementos de la diagonal principal serán 1 y los restantes se calculan tomando de la matriz de covarianzas, el valor de la celda en cuestión, dividiéndolo por la raíz cuadrada del producto de los 2 valores de la diagonal principal que intersectan la celda en cuestión.

Problema resuelto 3.33. Género de los hijos

En una comunidad, 15% de las familias no tienen hijos, 20% tienen 1, 35% tienen 2 y 30% tienen 3. Suponer que el nacimiento de varón es independiente de mujer. Una familia es elegida al azar, V es el número de hijos Varones, M es el número de hijos Mujeres. a) Construir la TC de las variables V y M, b) Hallar la probabilidad de que esa familia tenga 1 V sabiendo que tiene 1 M, c) obtener la distribución condicional dada M = 2, d) hallar la E(V|M=2). a) TC

p(x,y) M 0 1 2 3 Total

V

0 0.15 0.10 0.0875 0.0375 0.375 1 0.10 0.175 0.1125 0 0.3875 2 0.0875 0.1125 0 0 0.20 3 0.0375 0 0 0 0.0375 Total 0.375 0.3875 0.20 0.0375 1

Figura 3-73

Estos valores surgen de construir el árbol de probabilidades condicionales.

23(2,1)

( 0, 0) ( ) 0.15( 0, 1) (1 ) (1 |1 ) 0.20(0.5) 0.10( 0, 2) (2 ) (2 | 2 ) 0.35(0.5)(0.5) 0.0875( 1, 2) (3 ) ((2 ,1 ) | 3 ) 0.30(0.5) (0.5) 0.1125

P V M P No hijosP V M P H P M HP V M P H P M HP V M P H P M H H P

= = = == = = = == = = = =

= = = = =

El resto del árbol se deja al lector. b)

0.175(1 |1 ) 0.4520.3875

P V M = =

c) Es simplemente el perfil columna de M = 2.

V 0 1 2 3 Total E(V|M=2) 0.4375 0.5625 0 0 1

Figura 3-74 d)

( | 2) 0(0.4375) 1(0.5625) 0.5625E V M = = + =

Page 115: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIa Dos variables – Medidas de asociación

115

Problema resuelto 3.34. Demanda diaria

La siguiente PF representa la demanda diaria de dos determinados productos. a) Construir la distribución para todos los valores de las variables, b) expresar las funciones marginales, c) obtener las medias y varianzas de las marginales y la media conjunta, d) hallara la media condicional de x1 = 3, e) hallar la covarianza, la correlación y decidir si las variables son independientes.

21 2 1 2 1 2

1( , ) ( ) 2,3 1, 220

f x x x x x x= − = =

a)

f(x1,x2) x1 Total 2 3

x2 1 3/20 8/20 11/20 2 2/20 7/20 9/20

Total 5/20 15/20 1

Figura 3-75 b)

( )( )

1

2

5 / 20, 15 / 20

11/ 20, 9 / 20x

x

f

f

=

=

c)

( )( )

1

222

1 1 1

222 2 2

1 2

( ) 2(5 / 20) 3(15 / 20) 2.75( ) 1(11/ 20) 2(9 / 20) 1.45

( ) ( ) ( ) 0.187

( ) ( ) ( ) 0.247( , ) 2(1)(3 / 20) 3(1)(8 / 20) 2(2)(2 / 20) 2(3)(7 / 20) 4

E xE x

V x E x E x

V x E x E xE x x

= + == + =

= − =

= − =

= + + + = d)

2 18 / 20 7 / 20( | 3) 1 2 1.467

15 / 20 15 / 20E x x ⎛ ⎞ ⎛ ⎞= = + =⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠

e)

1 2 1 2 1 2( , ) ( , ) ( ) ( ) 4 (2.75)(1.45) 0.0125Cov x x E x x E x E x= − = − =

También podría calcularse en forma análoga a la esperanza 1 2( , )E x x , celda por celda reemplazando las variables por sus desviaciones.

1 2

1 2

( , ) 0.0125 0.058( ) ( ) 0.432(0.497)

Cov x xx x

ρσ σ

= = =

La covarianza no es cero (o equivalentemente, 1 2 1 2( , ) ( ) ( )E x x E x E x≠ ), por lo tanto las variables son dependientes. Observar que se trata de una magnitud poblacional, por lo tanto es un modelo teórico exacto y entonces cualquier valor distinto de 0 (aunque sea pequeño), indica dependencia.

Page 116: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

116

Problema resuelto 3.35. Tiempo de vida de 2 dispositivos electrónicos

La siguiente función densidad conjunta representa el tiempo de vida de dos dispositivos electrónicos. a) Obtener P(X > 1, Y < 1), b) P(X < Y), c) P(X < a), d) f(x|y), e) E(X|y), f) Cov(x,y) y ρ, g) E(XY), E(X) y E(Y).

22 0 , 0( , )

0

x ye e x yf x y

en otro punto

− −⎧ < < ∞ < < ∞= ⎨

a)

12

0 1

( 1, 1) 2 x yP X Y e e dxdy∞

− −> < = ∫ ∫

12 1 2

10

2 |- | (1 )y xe e dy e e− − ∞ − −= = −∫

b) Construir un diagrama para observar la región de integración.

2( ) 2 x y

x y

P X Y e e dxdy− −

<

< = ∫∫

2

0 0

2 y

x ye e dxdy∞

− −= ∫ ∫

2

0

2 (1 ) 1 2 / 3 1/ 3y ye e dy∞

− −= − = − =∫

c) Construir un diagrama para observar la región de integración.

2

0 0

( ) 2 a

x yP X a e e dydx∞

− −< = ∫ ∫

0

1a

x ae dx e− −= = −∫

d) Para las restantes preguntas es conveniente calcular previamente las distribuciones marginales.

2 21

0 0

2 2 22

0 0

( ) 2 2 dy =

( ) 2 2 dx =2

x y x y x

x y y x y

f x e e dy e e e

f y e e dx e e e

∞ ∞− − − − −

∞ ∞− − − − −

= =

= =

∫ ∫

∫ ∫

Observar que:

1 2( , ) ( ) ( )f x y f x f y= por lo cual las variables son independientes.

2

1 22

( , ) 2 ( | )( ) 2

x yx

y

f x y e ef x y ef y e

− −−

−= = =

lo cual no extraña pues al ser independientes, ( | ) ( )f x y f x= . e)

Page 117: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIa Dos variables – Medidas de asociación

117

1 00 0 0( | ) ( | ) 1x x xE X y xf x y dx xe dx xe e

∞∞ ∞ ∞− − −= = = − − =∫ ∫

f) Por ser independientes la covarianza debe ser 0 y por lo tanto también la correlación. g)

1 000 0 0 0

( ) ( ) 1x x x xx

xE X xf x dx xe dx xe e dx e dxe

∞∞ ∞ ∞ ∞∞− − − −= = = − + = − + =∫ ∫ ∫ ∫

Análogamente:

22

0 0

( ) ( ) 2 0.5yE Y yf y dy y e dy∞ ∞

−= = =∫ ∫

E(XY) se podrá calcular con su expresión, pero como por independencia la covarianza debe ser 0, ( , ) ( , ) ( ) ( )Cov X Y E X Y E X E Y= − , EXY) deberá ser 0.5. Verificar entonces que:

2

0 0

( ) 2 0.5x yE XY xy e e dxdy∞ ∞

− −= =∫ ∫

Page 118: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

118

IIb Funciones de variables aleatorias (dos variables)

El problema es similar al caso de una variable, página 25. Se conoce la distribución de probabilidad conjunta de dos v.a. 1 2( , )f x x y se desea la distribución de probabilidad conjunta 1 2( , )g y y de otras dos variables Y, relacionadas con X a través de:

1 1 1 2

2 2 1 2

( , )( , )

Y H X XY H X X

=⎧⎨ =⎩

Este es el objetivo de esta sección.

Métodos Se presentan los mismos tres métodos vistos en el caso de una variable. Se divide el desarrollo, según sea una variable discreta o contínua.

1 Caso discreto Se tiene un solo método.

Método de la PF

1 2 1 1 2 2 1 1 2 2 1 2( , ) ( , ) ( , ) ( , )g y y P Y y Y y P X x X x f x x= = = = = = = Dado que la distribución no cambia, solo habrá que agrupar las probabilidades para los valores de y coincidentes.

Problema resuelto 3.36 Defectuosos en 2 líneas de producción

La siguiente es una distribución bidimensional discreta de dos variables independientes, x1 y x2, representando el número de artículos defectuosos en 2 líneas de producción. Obtener la distribución de 1 1 2y x x= +

x1 1 2 3 p(x1) 0.2 0.6 0.2 x2 1 2 3 p(x2) 0.5 0.2 0.3

Figura 3-76

Page 119: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIb Funciones de variables aleatorias (dos variables) – Métodos

119

Método de la PF

La siguiente tabla muestra la distribución de y1. La obtención de los mismos puede facilitarse dibujando en un sistema de ejes los puntos (x1, x2) y en cada intersección el valor de y1. Así por ejemplo:

1 1 2 1 2( 3) ( 2) ( 1) ( 1) ( 2) 0.34P y P x P x P x P x= = = = + = = = y1 2 3 4 5 6 p(y1) 0.1 0.34 0.28 0.22 0.06

Figura 3-77

2 Caso contínuo Métodos generales: 1. Método de la CDF 2. Método de la PDF 3. Método de la MGF Solo veremos los 2 primeros, válidos para funciones H uno a uno.

Método de la CDF Las funciones de transformación son uno a uno y por lo tanto admiten inversa. Además este método se aplicará solo al caso de una sola función de transformación H y por lo tanto al caso en que se desea obtener la FDP de una sola variable. Se obtiene esa CDF, integrando la PDF original en una región de integración RX, pues:

1 21 1 1 1 2 1 2 1 2( ) ( ) ( , , ) ( , )X

X XR

G y P Y y P X X R R f x x dx dx= ≤ = ∈ = ∫∫

Paso 1 Dominio de las x en función de las y Encontrar la región de integración de las X en función de la Y1.

Analítico La función de transformación se expresa en general:

1 1 1 2( , )Y H X X= En el plano 1 2( , )X X se debe establecer la región 1 1Y y≤ .

Numérico Lo anterior solo se cumplirá en el dominio de las X (con la PDF). Para expresar la PDF de la Y1, es necesario hallar su dominio numérico (con la H).

Paso 2 integrar la PDF en ese dominio Para obtener la CDF, 1 2( , )G y y , se debe resolver la integral de 1 2( , )f x x en la región obtenida del paso 1. Luego se podrá obtener la PDF, 1 2( , )g y y , derivando 1 2( , )G y y .

Page 120: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

120

Problema resuelto 3.37 Transformación suma

Dada la siguiente PDF en 1 2,X X y la transformación 1 1 2( , )Y H X X= , hallar la PDF en Y1.

1 21 2

1 0 1 0 1( , )

0 x x

f x xen otro punto

≤ ≤ ≤ ≤⎧= ⎨

1 1 2y x x= +

Método de la CDF

Se debe calcular la integral correspondiente a: 1 1 1 1( ) ( )G y P Y y= ≤ ,

1 1 1 1 1 2 1 1 2 1 2( ) ( ) ( ) ( , )XR

G y P Y y P X X y f x x dx dx= ≤ = + ≤ = ∫∫

Paso 1 Dominio de las x en función de las y Analítico El dominio de la PDF es el cuadrado unitario que se muestra en la siguiente figura. Los puntos que implican la región RX = 1 2 1x x y+ ≤ , se muestran sombreados en la misma figura. La línea de la igualdad tiene pendiente –1. Numérico Vinculando el dominio de 1 2( , )f x x con la región 1 2 1x x y+ ≤ , se obtiene que 1y puede tomar cualquier

valor en el intervalo : 10 2y≤ ≤ . Observando ahora la figura siguiente se concluye que la integración cambia

según sea 10 1y≤ ≤ o 11 2y≤ ≤ .

Figura 3-78

Paso 2 Integrar la PDF en ese dominio

1 2 1

1 1 1 2 1 2( ) ( , )x x y

G y f x x dx dx+ ≤

= ∫∫

Región 10 1y≤ ≤

Este caso se presenta en la figura siguiente. Los límites de integración, en el orden x1 y luego de x2, se obtienen (para y1 = constante), de la siguiente forma: • Para x1: límites del segmento horizontal con trazo grueso dibujado sobre el área en cuestión.

Page 121: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIb Funciones de variables aleatorias (dos variables) – Métodos

121

• Para x2: límites de la proyección, (segmento con trazo grueso), del área sobre el eje x2.

Figura 3-79

11 2

21

1 1 1 200

( ) 12

yy x yG y dx dx

−= =∫ ∫

Región 11 2y≤ ≤

Este caso corresponde a la figura inicial. Se observa que es preferible integrar el complemento en lugar de la región sombreada. Los límites de integración en el orden x1 y luego x2, se muestran con segmentos de trazo grueso.

1 21 1

11 212

1 1 2 1 21 1

( ) 1 1 1 (1 )2y x

y y

xG y dx dx y x−

− −

⎡ ⎤= − = − − +⎢ ⎥

⎣ ⎦∫ ∫

21

1 1( ) 2 12yG y y= − + −

En definitiva:

12

11

1 1 21

1 1

1

0 0

0 12( )

2 1 1 22

1 2

y

y yG y

y y y

y

<⎧⎪⎪ ≤ ≤⎪= ⎨⎪− + − ≤ ≤⎪⎪ >⎩

Se observa que ambos volúmenes podrían haberse obtenido de la geometría elemental (las bases son el área de un triángulo y el área de un cuadrado menos el área de un triángulo, respectivamente). Finalmente:

1 11 1

1 1

0 1( )

2 1 2y y

g yy y

≤ ≤⎧= ⎨ − ≤ ≤⎩

Método de la PDF Continuando con el desarrollo anterior, pero para dos funciones de transformación H, la cual se expresa en general:

Page 122: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

122

1 1 1 2

2 2 1 2

( , )( , )

Y H X XY H X X

=⎧⎨ =⎩

Resolviendo el sistema (debe ser una relación biunívoca), surgen las funciones M1 y M2.

1 1 1 2

2 2 1 2

( , )( , )

X M Y YX M Y Y

=⎧⎨ =⎩

Se obtiene la CDF de la Y, integrando la PDF original en una región de integración RX:

1 21 2 1 1 2 2 1 2 1 2 1 2( , ) ( , ) ( , , ) ( , )X

X XR

G y y P Y y Y y P X X R R f x x dx dx= ≤ ≤ = ∈ = ∫∫

Si la relaciones H son biunívocas (uno a uno), se puede utilizar la conocida relación de contenidos que se estudia en análisis matemático (involucra al valor absoluto del jacobiano de la transformación (el cual es un determinante):

1 21 2 1 2

1 2

,,

x xdx dx J dy dyy y

⎛ ⎞= ⎜ ⎟

⎝ ⎠ se obtiene:

1 21 2 1 2 1 2 1 2 1 2

1 2

,( , ) ( , ) ( , ),

X XR R

x xG y y f x x dx dx f x x J y dyy y

⎛ ⎞= = ⎜ ⎟

⎝ ⎠∫∫ ∫∫

Finalmente:

1 21 2 1 2

1 2

,( , ) ( , ),

x xg y y f x x Jy y

⎛ ⎞= ⎜ ⎟

⎝ ⎠

Esta ecuación es la equivalente del caso univariable: ( ) ( ) 'g y f x x= Dada la relación uno a uno, se verifica además que:

1

11 2 1 2

1 2 1 2

, ,, , H

x x y yJ J Jy y x x

−⎛ ⎞⎛ ⎞ ⎛ ⎞= =⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎝ ⎠ ⎝ ⎠⎝ ⎠

De esta forma se puede expresar alternativamente: 1

1 2 1 2( , ) ( , ) Hg y y f x x J −=

siendo HJ el jacobiano de la transformación H. Si solo se plantea una sola relación H1 (como en el método anterior de la CDF), se completa el esquema anterior con una segunda relación ficticia del tipo: 2 1 2 2 Y X o Y X= = , resultando, por

ejemplo:

1 1 1 2

2 1

( , )Y H X XY X

=⎧⎨ =⎩

Funciones 1 2( , )Y H X X= importantes

Resultan de interés las siguientes transformaciones:

Page 123: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIb Funciones de variables aleatorias (dos variables) – Métodos

123

1 1 2

1 1 2

11

2

y x xy x x

xyx

= ±=

=

Si se completa la transformación con la ecuación 2 2y x= , verificar que los valores absolutos de los

jacobianos resultan: 1, 2x y 21/ x , respectivamente.

Transformación suma Como la transformación suma tendrá especial importancia en el capítulo 4, Distribuciones Muestrales, veamos los detalles.

1 1 2

2 2

y x xy x

= ±⎧⎨ =⎩

1 11

0 1HJ = =

11 2 1 2 1 2 2( , ) ( , ) ( , )Hg y y J f x x f y x x−= = −

1 1 1 2 1 2 2 1 2 2 2( ) ( ) ( , ) ( , )g y f x x f y y dy f y x x dx∞ ∞

−∞ −∞= + = = −∫ ∫

Caso particular: X1, X2 independientes 1

1 2 1 1 2 2 1 1 2 2 2( , ) ( ) ( ) ( ) ( )gg y y J f x f x f y x f x−

= = −

1 1 1 2 2 1 1 2 2 2 2( ) ( , ) ( ) ( )g y f y y dy f y x f x dx∞ ∞

−∞ −∞= = −∫ ∫

Esta integral se llama en matemáticas, integral de convolución y se representa 1 2*f f .

1 2 1 1 2 2 2 2* ( ) ( )f f f y x f x dx∞

−∞= −∫

Propiedad

1 2 2 1* *f f f f=

Es decir no interesa donde se coloca la resta.

Demostración Basta hacer el cambio de variables: 1 2 2 1 2, y x z x y z dx dz− = ⇒ = − = − , e invertir el intervalo de integración.

Problema resuelto 3.38 Transformación suma

Resolver el problema resuelto anterior, pero ahora con el método de la PDF. Dada la siguiente PDF en 1 2,X X y la transformación 1 1 2( , )Y H X X= , hallar la PDF en Y1.

1 21 2

1 0 1 0 1( , )

0 x x

f x xen otro punto

≤ ≤ ≤ ≤⎧= ⎨

1 1 2y x x= +

Page 124: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

124

Método de la PDF

Para aplicar este método completamos la ecuación de transformación con 2 1y x= o 2 2y x= .

1 1 21 2

2 2

( , )y x x

H x xy x

= +⎧= ⎨ =⎩

La función inversa es:

1 1 211 2

2 2

( , )x y y

H y yx y

− = −⎧= ⎨ =⎩

Para determinar la región del plano 1 2( , )y y en el que se transforma la región del plano 1 2( , )x x , la cual es el

cuadrado 1 2 1 20, 0, 1, 1x x x x= = = = , observamos que reemplazando en las ecuaciones anteriores, resulta:

2 2 1

2 1 2

0, ,1, 1,

y y yy y y

= == − =

la cual se ha dibujado en la figura siguiente.

Figura 3-80

El jacobiano de la transformación es: 1 1

10 1HJ = =

su valor absoluto es 1. Por lo tanto:

1 2( , ) 1*1 1g y y = =

Para hallar 1( )g y , debemos integrar respecto de 2y . Los límites de integración son (observar las rayas de trazo grueso de la figura anterior):

1

1

1 2 2 1 101 1 1

1 2 2 1 11

( , ) 0 1( )

( , ) 2 1 2

y

y

g y y dy y yg y

g y y dy y y−

⎧ = ≤ ≤⎪= ⎨= − ≤ ≤⎪

∫∫

Valores que coinciden con el cálculo por el método de la CDF.

Métodos numéricos

Sea el vector aleatorio 1 2( , ,... )kX X X X= e ( )Y H X= una función escalar de variable vectorial.

Page 125: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIb Funciones de variables aleatorias (dos variables) – Métodos numéricos

125

Valor esperado de Y

Si la variable X es discreta con función de probabilidad conjunta ( )p x :

1 2

( ) ... ( ) ( )kx x x

E Y H x p x= ∑∑ ∑

Si la variable X es contínua con función densidad conjunta ( )f x :

1 2

( ) ... ( ) ( ) ( )kx x x

E Y H x f x d x= ∫ ∫ ∫

La demostración de la ecuación anterior es difícil y no la haremos aquí.

H lineal

En particular, sea la función lineal 1

n

i ii

Y a X=

= ∑ donde las ai son constantes.

Valor esperado de Y

1( ) ( )

n

i ii

E Y a E X=

= ∑

Demostración Esta expresión surge de aplicar cualquiera de las expresiones anteriores a Y .

Varianza de Y

2

1

( ) ( ) 2 ( , )n

i i i j i ji i j

V Y a V X a a Cov X X= <

= +∑ ∑∑

donde la suma doble se forma para todos los pares (i, j) que resultan de la combinación de n elementos tomados de a 2 (si el alumno conoce el análisis combinatorio reconocerá que esto equivale a i < j).

Demostración La demostración surge de aplicar la definición de varianza a la Y definida anteriormente. Para ejemplificar el proceso veamos el caso más simple con Y aX bZ= + .

( ) ( )( )22( ) ( ( )) ( )x zV Y E Y E Y E aX bZ a bμ μ= − = + − +

( ) ( )( )( ) ( )( )2 2x z x zE aX a bZ b E a bμ μ= − + − = Δ + Δ

( )2 2 2 2 2 2 2 22 ( ) ( ) 2 ( )x z x z x z x zE a b ab a E b E abE= Δ + Δ + Δ Δ = Δ + Δ + Δ Δ 2 2( ) ( ) 2 ( , )a V X b V Y abCov X Z= + +

Esta demostración se extiende al caso de más de 2 variables.

Page 126: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

126

Problema resuelto 3.39 Distribución hipergeométrica

En este problema deduciremos las expresiones de la media y varianza de una distribución hipergeométrica en forma parecida al camino seguido con la distribución Binomial, vinculándola con la distribución de Bernoulli. Una urna con N esferas tiene r esferas Rojas y N–r esferas Negras. Se muestrean n esferas sin reemplazo (MSR) y se observa Y = número de esferas Rojas. Hallar E(Y) y V(Y).

Solución

Al igual que en la binomial, si X = número de esferas cada extracción: Y X= ∑

Características de un MSR

Analicemos el siguiente árbol de las 2 primeras extracciones sin reemplazo.

Figura 3-80

De este árbol se extrae.

Probabilidad incondicional En forma directa:

1( 1) rP XN

= =

Esto también es cierto para la segunda extracción, pues:

2 1 2 1 2( 1) ( 1, 1) ( 0, 1)1 11 1 1

P X P X X P X Xr r N r r r N rN N N N N N N

= = = = + = =− − −

= + = =− − −

2( 1) rP XN

= =

El lector puede verificar que los resultados anteriores son válidos para cualquier extracción, no solo para las 2 primeras.

.

1

0

1.

0.

1..

0..

r/N

1-r/N

(r-1)/(N-1)

r/(N-1)

(N-r)/(N-1)

(1-(r-1)/N)/(N-1)

Page 127: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIb Funciones de variables aleatorias (dos variables) – Métodos numéricos

127

Por lo tanto, si se conforma la tabla de la distribución, en forma similar a la construida para la distribución de Bernoulli, se verifica:

0( )irE X pN

= =

0 0( ) 1ir rV X p qN N

⎛ ⎞= − =⎜ ⎟⎝ ⎠

Probabilidad conjunta

1 21( 1, 1)1

r rP X XN N

−= = =

El lector puede verificar que los resultados anteriores son válidos para cualquier extracción. Dado que en el cálculo de ( )i jE X X , solo queda el término con 1, 1i jX X= = , se verifica:

1( )1i j

r rE X XN N

−=

E(Y)

A partir de la definición de la esperanza y del resultado anterior:

0 0( ) ( )E Y E X E X np q= = =∑ ∑

V(Y)

En la sección anterior se demostró que. ( ) ( ) 2 ( )i j

i i j

V Y V X V X Cov X X<

= = +∑ ∑ ∑ ∑∑

Esta relación corresponde a variables multivariables y es por esta razón que esta demostración se realiza en esta sección. Se puede observar que en las distribuciones Binomiales, el segundo término es 0 por la independencia entre eventos. Esto no es así en la hipergeométrica, como veremos ahora. Se tiene:

0 0( ) ( )V Y V X V X np q= = =∑ ∑

( ) ( ) ( ) ( )i j i j i jCov X X E X X E X E X= − Reemplazando:

2

1r r rN N N

⎛ ⎞ ⎛ ⎞= − −⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

Operando:

0 01( )

1i jCov X X p qN

⎛ ⎞= − ⎜ ⎟−⎝ ⎠

Reemplazando ambos resultados en la expresión de ( )V Y , finalmente resulta:

( )0 0 0 01( ) 1 2

1i j

V Y np q p qN<

⎛ ⎞= − + − ⎜ ⎟−⎝ ⎠∑∑

En la sumatoria doble se deben formar todos los pares (i, j) que resultan de la combinación de n elementos

tomados de a 2, es decir ( se requiere análisis combinatorio) ( 1)

2n n −

. Por lo tanto, reemplazando esta

relación y expresando todos los valores en función de r, n y N, resulta: ( 1 1( ) 1 2 1

2 1r r n n r rV Y nN N N N N

−⎛ ⎞ ⎛ ⎞⎛ ⎞= − − −⎜ ⎟ ⎜ ⎟⎜ ⎟−⎝ ⎠ ⎝ ⎠⎝ ⎠

Page 128: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

128

Realizando algunas operaciones algebraicas que se dejan al lector, se obtiene finalmente:

0 0( )1

N nV Y np qN

−=

Page 129: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIc Modelos teóricos de dos variables – 1 Modelos discretos

129

IIc Modelos teóricos de dos variables

1 Modelos discretos Los modelos discretos de mayor interés son los siguientes: Distribución Multinomial y Distribución Multihipergeométrica

Multinomial, m(yA,yB,yC,n,pA,pB,pC) Supuestos Es una modificación de la Binomial, en el supuesto 1.

Supuesto 1 Multicotómica Una v.a Y tiene k resultados A1, A2, A3, …, Ak.

Supuesto 2 Variable Aleatoria Dada una muestra de tamaño n, la variable aleatoria se define como el número de elementos de cada categoría Ai. En otras palabras se busca el vector aleatorio: Y tal que

1 2 ... kY Y Y n+ + + = . Dada esta relación, las variables realmente independientes son k–1.

Supuesto 3 Tamaño Como ya se estableció, las muestras tienen un tamaño n > 1.

Supuesto 4 Dependencia Los n elementos del espacio muestral son independientes.

Expresiones generales Observemos la siguiente tabla de una distribución de n = 5, con una variable tricotómica. Se presentan solo algunos valores y se utilizaron A, B y C en lugar de A1, A2 y A3.

S ABBBC AAAAB AABBC …

Y y= 1,3,1 4,1,0 2,2,1 …

( )p y 35(1,3,1) A B CP p p p

45(4,1,0) A BP p p 2 2

5(2,2,1) A B CP p p p …

Figura 3-81

Page 130: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

130

De la misma se desprende la siguiente expresión, la cual es una generalización de la binomial:

PDF conjunta Observando la figura 3-81 se obtiene la siguiente expresión general de la función de probabilidad.

( , , )( , , , , ) C

A C

A B

BA A B C n yyy

y A Cyy

Bm y n p p p p p pP= siendo:

y n=∑

Relación con la binomial Si se toma cualquier agrupación de las variables, por ejemplo Y1 e Y2, puede considerarse una variable dicotómica X con la categoría Y1 e Y2 por un lado y las restantes variables por el otro. Esta variable es entonces Binomial.

Caracterización

Esperanza Por la relación anterior con la Binomial, cada uno de los componentes del vector Esperanza tiene la forma:

( )i iE Y np=

Varianzas Por la relación anterior con la Binomial, cada uno de los componentes del vector Varianza tiene la forma:

( )i i iV Y np q=

Covarianzas Consideremos solo a dos variables Yi e Yj:

( ) ( ) ( ) 2 ( , )i j i j i jV Y Y V Y V Y Cov Y Y+ = + +

Por la relación anterior con la Binomial, se tiene:

( )( )( ) 1 2 ( , )i j i j i i j j i jn p p p p np q np q Cov Y Y+ − + = + +

Despejando la covarianza, resulta:

( , )i j i jCov Y Y np p= −

La covarianza es negativa pues para un fijo n, dado que 1 2 ... kY Y Y n+ + + = , un incremento en una variable requiere un decrecimiento en otra.

Matriz Covarianzas, P Al igual que en la unidad 1, página SSCP1, se presentan todos los resultados de varianzas y covarianzas en el formato de matriz, P, como en la siguiente figura.

np1q1 -n p1p2 … -n p1pk… … … …-n p1pk … … npkqk

Figura 3-82

Page 131: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIc Modelos teóricos de dos variables – Distribución Multihipergeométrica

131

Matriz de correlaciones, R Se construye a partir de la matriz de covarianzas como se detalló en la página 114.

Problema resuelto 3.40 Examen de selección múltiple

En un examen de selección múltiple usted debe elegir entre 3 posibles respuestas, A, B y C. Si la elección se realiza al azar, calcular: a) la probabilidad de que 6 alumnos hayan elegido: yA= 1, yB= 2, yC= 3, b) expresar el vector esperanzas, la matriz de covarianzas P y la de correlaciones R. a) n = 6

6(1,2,3)1 2 3(1,2,3,6,1/ 3,1/ 3,1/ 3) (1/ 3) (1/ 3) (1 0.0823/ 3)m P ==

b) 2 2 2

Vector Esperanzas

1.33 –1.33 –1.33

–1.33 1.33 –1.33–1.33 –1.33 1.33

Matriz Covarianzas 1 –1 –1

–1 1 –1–1 –1 1

Matriz Correlaciones Figura 3-83

Distribución Multihipergeométrica Es una modificación de la Binomial en los supuestos 1 y 4.

Supuesto 1 Multicotómica Una v.a Y tiene k resultados A1, A2, A3, …, Ak.

Supuesto 2 Variable Aleatoria Dada una muestra de tamaño n, se busca el número de elementos de cada categoría Ai. En otras palabras se busca el vector aleatorio: Y tal que 1 2 ... kY Y Y n+ + + = . Dada esta relación, las variables realmente independientes son k–1.

Supuesto 3 Tamaño Como ya se estableció, las muestras tienen un tamaño n > 1.

Supuesto 4 Dependencia Los n elementos del espacio muestral son dependientes (muestreo sin reemplazo o población finita).

PDF conjunta Es una combinación de la multinomial y de la hipergeométrica.

Page 132: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

132

1 2

1 21 2

...( , , , , ... )

k

kA k

AA Ay y y

m y N n A A ANn

⎛ ⎞⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟⎜ ⎟

⎝ ⎠⎝ ⎠ ⎝ ⎠=⎛ ⎞⎜ ⎟⎝ ⎠

Al igual que para el caso univariable, si N tiende a infinito, la Multihipergeométrica tiende a la Multinomial.

Relación con la hipergeométrica Si se toma cualquier agrupación de las variables, por ejemplo Y1 e Y2, puede considerarse una variable dicotómica X con la categoría Y1 e Y2 por un lado y las restantes por el otro. Esta variable es entonces Hipergeométrica.

Caracterización

Esperanza Por la relación anterior con la Hipergeométrica, cada uno de los componentes del vector Esperanza tiene la forma:

0( )i iE Y np=

Varianzas Por la relación anterior con la Hipergeométrica, cada uno de los componentes del vector Varianza tiene la forma:

0 0( )i i iV Y np q=

Covarianzas Consideremos solo a dos variables Yi e Yj:

( ) ( ) ( ) 2 ( , )i j i j i jV Y Y V Y V Y Cov Y Y+ = + +

Por la relación anterior con la Hipergeométrica, se tiene:

( )( )0 0 0 0 0 0 0 0( ) 1 2 ( , )1 1 1i j i j i i j j i j

N n N n N nn p p p p np q np q Cov Y YN N N

− − −= + − + = + +

− − −

Despejando la covarianza, resulta:

0 0( , )1i j i j

N nCov Y Y np pN

−= −

Matriz Covarianzas, P Al igual que en el caso general, se presentan todos los resultados de varianzas y covarianzas en el formato de matriz, P, como en la siguiente figura.

Var11 Cov12 … Cov1k… … … …Cov1k … … Varkk

Figura 3-84

Page 133: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIc Modelos teóricos de dos variables – 2 Modelos contínuos

133

Matriz de correlaciones, R La matriz de correlación R se construye a partir de la matriz de covarianzas en forma análoga al caso general, página 114.

2 Modelos contínuos

Distribución uniforme

PDF conjunta Su PDF conjunta es simplemente:

( , )f x y k=

Problema resuelto 3.41 Encuentro

Una pareja decide encontrarse en un cierto lugar. Si cada persona arriba independientemente con una distribución del tiempo uniforme entre 17:00 y 18:00, encontrar la probabilidad de que el primero en llegar tenga que esperar más de 10 minutos. Llamemos X e Y al tiempo pasadas las 17:00 que cada persona tarda en llegar, cada una uniformemente distribuido sobre (0, 60). Las probabilidades son ( 10 )P X Y+ < y ( 10 )P Y X+ < . Por la simetría son iguales, por lo tanto:

10 10

2 ( 10 ) 2 ( ) 2 ( ) ( )x y x y

P X Y f xy dxdy f x f y dxdy+ < + <

+ < = =∫ ∫ ∫ ∫

Haciendo un gráfico de análisis para definir los intervalos de integración, resulta.

( )21060 60

210 0 10

1 2 252 1060 60 36

y

dxdy y dy−

⎛ ⎞= = − =⎜ ⎟⎝ ⎠∫ ∫ ∫

Distribución binormal El modelo contínuo de mayor interés es el de la distribución binormal. Dado el vector aleatorio ( , )Y X Y= , se dice que tiene una distribución binormal si su distribución de probabilidades es la que se define a continuación. Es de particular interés presentar la distribución normal conjunta, pues es una condición requerida en algunos procedimientos estadísticos.

Page 134: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

134

nXY(μx, μy, σx, σy, ρ)

PDF conjunta /2

2( , , , , )

2 1

Q

xy x y x

x y

yef μ μ σ σ ρ

πσ σ ρ

=−

donde: 22

2 2 2

( )( ) ( )( )1 21

x y yx

x x y y

x y yxQμ μ μμ ρ

ρ σ σ σ σ⎡ ⎤− − −−

= − +⎢ ⎥− ⎢ ⎥⎣ ⎦

2 22

1 21 x x y yz z z zρ

ρ⎡ ⎤= − +⎣ ⎦−

Esta PDF es función de 5 parámetros, los cuales llevan esos símbolos pues se corresponden con los parámetros que se verán a continuación.

PDF marginales Son:

2( , )x xN μ σ y 2( , )y yN μ σ .

Caracterización

Esperanza El vector aleatorio de las esperanzas es:

( ), ( ))( ) (( , )x yE X EY YE μ μ==

Varianzas El vector aleatorio de las varianzas es:

2 2( ), ( ))( ) ( , )( yxVV Y V X Y σ σ==

Covarianza

( , ) x yCov X Y ρσ σ=

Matriz de covarianzas, P 2xσ x yρσ σ

x yρσ σ 2yσ

Figura 3-85

Observar que el denominador del coeficiente de la PDF es 2π por la raíz cuadrada del determinante de la matriz P. Observar además que si la covarianza es cero, es decir ρ = 0, entonces fxy se puede expresar como:

2 2( , ) ( , )x x yxy yf N Nμ σ μ σ=

Page 135: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IIc Modelos teóricos de dos variables – Distribución binormal

135

por lo tanto X e Y son independientes. Recordemos que una covarianza cero, no significa necesariamente independencia. Sin embargo, si la distribución es normal conjunta, entonces la independencia es equivalente a la incorrelación lineal.

Matriz de correlaciones, R La matriz de correlación R se construye a partir de la matriz de covarianzas en forma análoga al caso general.

Page 136: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

136

III Confiabilidad, R(t)

En el capítulo 2 definimos la confiabilidad como la probabilidad de que un sistema funcione. En esta sección ampliaremos el concepto introduciendo la forma de calcular una confiabilidad dependiente de la variable tiempo.

Definición Confiabilidad, R(t) (Reliability): mide la probabilidad de que un componente no falle en [0, t] o equivalentemente que dure hasta t. En otras palabras t es lo que antes llamamos T1 = tiempo hasta el primer evento o falla. En notación matemática:

( ) ( )R t P T t= >

donde T es la v.a. duración del componente. Llamaremos f(t) a la PDF de T y F(t) a la CDF. La cola de la distribución f(t) a partir de t = T1, es la confiabilidad. Por lo tanto:

( ) ( ) 1 ( ) ( )R t P T t F t F t= > = − = Destaquemos que la F(t) (área de f(t) entre 0 y t) mide la probabilidad de que la primer falla se presente en [0, t]. En cambio su complemento ( )F t , mide la probabilidad de que la primer falla no se presente en [0, t] o equivalentemente que se presente luego de t. En este contexto también suele definirse la falta de confiabilidad (unreliability) o probabilidad de falla en [0,t] como:

( ) 1 ( ) ( )Q t R t F t= − = Es decir es la CDF F(t). En la siguiente figura se representan gráficamente los sectores de:

1( )R t : probabilidad de no falla en [0, t1] (pues la primera falla sucede luego de t1).

1( )Q t : probabilidad de falla en [0, t1] (pues la primera falla sucede antes de t1).

Figura 3-86

Conceptualmente, si por ejemplo un componente tiene una confiabilidad de 90% para 1 12t = horas, entonces si 100 componentes operan 12 horas, aproximadamente 90 no fallarán.

Page 137: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

III Confiabilidad, R(t) – Distribución binormal

137

Veamos cómo se obtienen 3 funciones de interés en función de la confiabilidad:

1 FDP f(t) en función de R(t) La FDP se obtiene derivando R(t), pues:

( ( ))'( ) ( )d F tR t f tdt

= − − = − Por lo tanto:

( ) '( )f t R t= −

Observar que para obtener R(t) de la expresión anterior se debe integrar a f(t) entre t e infinito.

2 Media E(t) en función de R(t) La media de f(t) será:

0

( ) ( )E t t f t dt∞

= ∫

Teorema

0

( ) ( )E t R t dt∞

= ∫

Expresando el límite superior con la letra a:

00 0

( ) ( ) ( ) ( )a a

aE t t f t dt tF t F t dt= = −∫ ∫

pero:

00

( ) ( )a

atF t aF a a dt= = = ∫ , pues ( ) 1F a = .

por lo tanto:

0 0 0

( ) ( ) 1 ( )a a a

E t dt F t dt F t dt= − = −∫ ∫ ∫

Naturalmente esta forma de calcular la esperanza en función de la CDF, es válida siempre.

Otra demostración

0 0

( ) ( )t

R t dt f s ds dt∞ ∞ ∞⎛ ⎞

= ⎜ ⎟⎝ ⎠

∫ ∫ ∫

Integrando por partes (considerando dv= dt):

0 0 0

( ) ( ) ( ) ( ) ( )t t

R t dt t f s ds tf t dt t f s ds tf t dt∞ ∞ ∞ ∞ ∞

= − − = +∫ ∫ ∫ ∫ ∫

El segundo sumando es E(t), por lo cual solo queda demostrar que el primero es 0. En t = 0, es evidente que lo es. Para demostrar que lo es para el resto de valores se debe introducir el requisito que E(t) sea finita. Se deja la demostración al lector.

3 Frecuencia de fallas instantánea h(t) en función de R(t) Se llama también función de riesgo (hazard) y por esta razón se simboliza h(t).

( )( )1 ( )

f th tF t

=−

Page 138: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

138

Por la definición de confiabilidad, esta expresión se puede escribir:

( )( )( )

f th tR t

=

Si en la figura siguiente consideramos la probabilidad condicional 1 1 1( | )P t T t t T t≤ ≤ + Δ > , para un tΔ pequeño, observamos que es:

1 1 1( )( | )

( )tf tP t T t t T tR t

Δ≤ ≤ + Δ > =

Por lo tanto ( )th tΔ representa la probabilidad de fallar en un intervalo pequeño después de t1 dado que sobrevivió hasta t1 o en otras palabras, la frecuencia de fallas h(t) es proporcional a esta probabilidad condicional.

Figura 3-87

Como veremos luego, para la distribución exponencial, ( )h t ω= , por lo cual podría utilizarse la notación ( ) ( )h t tω= .

Teorema

0

( )

( )

t

h t dt

R t e−∫

=

La demostración es directa a partir de:

( ) '( ) (ln( ( ))( )( ) ( )

f t R t d R th tR t R t dt

−= = = −

Integrando entre 0 y t y bajo la suposición que R(0) = 1, es decir que la probabilidad de una falla inicial es 0 (suposición que equivale a F(0) = 0 y que mantendremos de aquí en más), se obtiene la expresión que se quiere demostrar. Si el elemento tiene una h(t) definida por tramos, la integral deberá ser dividida con límites acordes con los tramos. La PDF se obtiene a partir de:

0

( )

( ) '( ) ( )

t

h t dt

f t R t h t e−∫

= − =

Síntesis Las 3 importantes vinculaciones que hemos demostrado se resumen a continuación:

Page 139: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

III Confiabilidad, R(t) – Distribución binormal

139

0

( ( ))( )

( ) ( )

(ln( ( ))( )

d R tf tdt

E t R t dt

d R th tdt

= −

=

= −

Si bien se utilizan varias distribuciones como modelos matemáticos de fallas (Weibull, Rayleight, etc), las distribuciones más comunes que siguen los componentes, son la exponencial, la Gamma, la de Weibull y la normal.

Distribución exponencial

Se utiliza este modelo cuando la tasa de fallas ω se puede suponer constante y el objeto no cambia con el uso (no tiene memoria, ver página 68). En este modelo se distingue, el tiempo de operación a partir de un valor arbitrario t a= , de la edad de operación, partir de 0t = .

R(t)

( ) 1 ( )R t CDF t= −

En este caso, por la propiedad de las colas de una función exponencial, se tiene:

( ) tR t e ω−=

En particular si t = MTBF = β, la confiabilidad resulta: / 1( ) 0.37R e eω ωβ − −= = =

valor que puede ser tomado como referencia.

Figura 3-88

La confiabilidad disminuye con el tiempo como es habitual.

f(t)

( ) '( ) tf t R t e ωω −= − =

Page 140: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

140

Figura 3-89

E(t)

0 0

1( ) ( ) tE t R t dt e dtω βω

∞ ∞−= = = =∫ ∫

Figura 3-90

h(t)

( )( )( )

t

t

f t eh tR t e

ω

ω

ω ω−

−= = =

Observar que para este modelo, la frecuencia de fallas h(t) es una constante, lo cual indica que aunque el ítem se encuentre en uso, la probabilidad de falla no cambia. Dicho de otra forma no interviene el "efecto de uso", lo cual ya adelantamos al estudiar la distribución exponencial en la página 88.

Exponencial y Poisson Recordemos, página 71, que si T es el tiempo requerido para observar r ocurrencias y X es el número de ocurrencias durante [0, t], entonces:

Page 141: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

III Confiabilidad, R(t) – Distribución binormal

141

a) ( ) ( )P T t P X r> = <

b) ( ) ( )P T t P X r≤ = ≥ Además si T tiene una distribución Gamma, entonces X sigue una distribución de Poisson. Utilizando el formato CDF, se verifica:

1 . ( , , ) . ( 1, , ). ( , , ) 1 . ( 1, , )

CDF GAMMA t r CDF POISSON r t tCDF GAMMA t r CDF POISSON r t t

α αα α

− = −= − −

En particular si r = 1, la distribución Gamma se convierte en exponencial (con α igual a ω):

1 . ( , ) . (0, ). ( , ) 1 . (0, )

CDF EXP t CDF POISSON tCDF EXP t CDF POISSON t

ω ωω ω

− == −

Distribución Gamma, (t,r,α) El apartado anterior permite generalizar la distribución exponencial a una distribución Gamma para tratar el tiempo en el que ocurren r fallas (no una), en tanto las mismas aparezcan de acuerdo a un proceso de Poisson.

Distribución de Weibull, (x,ω,β) Es otra generalización de la exponencial para la cual h(t) es polinómica de la forma:

1( )h t tβωβ −=

donde ω y β son constantes positivas. Al variar β (con valores menores o mayores a 1), varía el exponente y se observa que se obtienen curvas de h(t) con tramos decrecientes, DFR (Decreasing Failure Rate) o crecientes, IFR (Increasing Failure Rate), por lo cual se lo llama parámetro de forma. Se puede observar que la exponencial es un caso particular con β = 1. Con β = 3.6 se aproxima a una normal. En esta distribución se llama a ω parámetro de escala, para el cual también suele usarse la letra α.

R(t) 1

0 0

( )

( )

t t

h t dt t dttR t e e e

ββ

ωβω

−− −−

∫ ∫= = =

( ) tR t eβω−=

En la figura siguiente se muestra la confiabilidad para ω = 1, β = 1 y ω = 1, β = 3.

Page 142: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

142

Figura 3-91

f(t)

1( ) '( ) tf t R t t eββ ωωβ − −= − =

En la siguiente figura se muestra la PDF para ω = 1, β = 1 y ω = 1, β = 3.

Figura 3-92

F(t) A partir de:

( ) 1 ( )F t R t= − ,

( ) 1 tF t eβω−= −

Page 143: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

III Confiabilidad, R(t) – Distribución binormal

143

En la siguiente figura se muestra la CDF para ω = 1, β = 1 y ω = 1, β = 3.

Figura 3-93

E(t) Se puede demostrar que:

1/ 1( ) 1E t βωβ

− ⎛ ⎞= Γ +⎜ ⎟

⎝ ⎠

h(t) 1

1( )( )( )

t

t

f t t eh t tR t e

β

β

β ωβ

ω

ωβ ωβ− −

−= = =

Según el valor de β, se obtienen funciones de falla, constantes, lineales, parabólicas, etc. Cuando 1β > se obtiene un crecimiento de h(t) con el tiempo, lo cual indica un esperable efecto de uso. Cuando 1β = , el valor de h(t) es constante (modelo exponencial) lo cual indica que se trata de un modelo aplicable en los casos en que no existe el efecto de uso. Finalmente cuando 0 1β< < , h(t) es decreciente, aplicable a casos no comunes en donde h(t) decrece con el tiempo. En la siguiente figura se muestra la h(t) para ω = 1, β = 1 y ω = 1, β = 3.

Page 144: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

144

Figura 3-94

Distribución normal La ley normal de fallas es un modelo apropiado cuando la mayor parte de las fallas se producen alrededor de la media μ y cuando la falla tiene memoria (intervienen efectos del uso). Sin embargo, no es el modelo más encontrado. Naturalmente, como T debe ser mayor o igual a 0, debe ser P(T <0) =0 lo cual implica que deben ser

truncados los valores de z menores a z μσ−

= por lo cual la distribución es normal truncada a la

izquierda (página 101).

R(t)

( ) 1 ( )R t CDF t= −

Valor que deberá ser calculado numéricamente como en cualquier distribución normal, con tablas o programas informáticos.

Page 145: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

III Confiabilidad, R(t) – Distribución binormal

145

Figura 3-95

La confiabilidad disminuye con el tiempo como es habitual.

f(t) ( ) ( , , )f t n t μ σ=

Figura 3-96

La mayor parte de los artículos fallan alrededor de μ.

E(t) Si la distribución normal no fuera truncada sería:

0

( ) ( )E t tf t dt μ∞

= =∫

Si 2μ σ≥ , los valores que se truncan corresponden a 2z ≤ − , por lo cual la media es muy similar a μ.

Page 146: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

146

h(t) ( ) ( , , )( )( ) 1 ( , , )

f t n th tR t N t

μ σμ σ

= =−

Figura 3-97

La frecuencia de fallas aumenta con el tiempo lo cual indica el habitual efecto de uso.

Sistemas

1 Sistemas con componentes en serie o paralelo Los teoremas de confiabilidad equivalente para circuitos serie o paralelo con valores constantes R vistos en el capítulo 2, pueden ahora aplicarse a componentes con confiabilidades dependientes de una variable t, R(t).

Elementos en serie

Figura 3-98

La confiabilidad equivalente de componentes en serie es el producto de las confiabilidades.

( ) A B CR t R R R= En particular si la ley de falla es exponencial:

( )( ) A B C tR t e ω ω ω− + +=

En este caso, el T del sistema también está distribuido exponencialmente, con una frecuencia de fallas que es la suma de las de los componentes.

Page 147: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

III Confiabilidad, R(t) – Distribución binormal

147

Elementos en paralelo

Figura 3-99

Expresión directa

( ) R R R R R R R R R R R RA B C A B A C B C A B CR t = + + − − − + En particular si la ley de falla es exponencial y expresando, por simplicidad un sistema de 2 componentes:

( )( ) A B A Bt t tR t e e eω ω ω ω− − − += + −

Se observa que en este caso T no está distribuido exponencialmente.

Expresión por complementos El complemento de la confiabilidad equivalente de componentes en paralelo es el producto de los complementos de las confiabilidades.

1 (1 )(1 )(1 )A B CR R R R= − − − − Cualquier otra combinación con componentes en serie y en paralelo se resuelve reemplazando las partes serie y paralelo por su confiabilidad equivalente.

2 Sistemas con componentes en Stand By Son sistemas en los cuales un componente está inactivo y solo funciona cuando otro falla (stand by). Una llave sensa la falla y cambia al componente en espera que funcionará en lugar del primero. Si llamamos S a la llave que funciona con probabilidad P(S), aplicando la RP de las probabilidades, se tiene (Billinton R. 1992, página 96):

( | ) ( ) ( | ) ( )Q Q sistema S P S Q sistema S P S= +

El componente redundante está normalmente inactivo con lo cual se reduce el tiempo de uso.

Problema resuelto 3.42. Ley exponencial de fallas

Ver el problema resuelto de página ConfiabilidadPR2. El sistema de controles de un modelo de aviones A es de tipo eléctrico y consiste en 3 circuitos en paralelo, A, B y C, para aumentar la redundancia, en serie con un sistema D. Por su lado, otro modelo de aviones B, tiene un sistema similar pero con 2 circuitos eléctricos en paralelo. Además tiene un sistema manual, mecánico de emergencia, C. Considerar que todos los sistemas tienen una ley de falla dad por una distribución exponencial con igual parámetro ω. Hallar la confiabilidad R(t) de cada sistema de control: a) avión A, b) avión B y luego la confiabilidad si 0.0001ω = y el tiempo de operación es de 1000 horas. Ambos circuitos se muestran en la figura 3-100.

Page 148: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

148

Avión A

Avión B

Figura 3-100

Modelo A 31( ) (1 )t

ABCR t e ω−= − − 3(1) )( (1 )t tR t e eω ω− −= − −

Modelo B 21 (1( ) )t

AB tR e ω−= − − 2(1 (( )) 1 )t t

ABDR e et ω ω− −= − − 2( ( (1 ) )) 1 1t t

ABDR e et ω ω′ − −= − − − 21 (1 )(1 (1 (1 ))( ) )t t tR e et eω ω ω− − −= − − − − −

La confiabilidad para los valores numéricos establecidos resulta: 0.9040.997

A

B

RR

==

Problema resuelto 3.43. Frecuencia de fallas variable

La tasa de fallas h(t) de un componente está dada por:

0 0

0 1 0 0

0( )

+ ( - ) C t t

h tC C t t t t

≤ ≤⎧⎨ >⎩

Obtener la PDF f(t) y la R(t).

R(t)

00 t t≤ ≤

0 00 0 0

( ) ( )t t t

h t dt h t dt C dt C t= = =∫ ∫ ∫

0t t> 0

0

210 0 1 0 0 0 0 0 0 0

0 0

( ) + ( - ) ( - )2

tt t

t

Ch t dt C dt C C t t dt C t C t C t t t= + = + − +∫ ∫ ∫

210 0

0

( ) ( - )2

t Ch t dt C t t t= +∫

Por lo tanto:

0

( )

( )

t

h t dt

R t e−∫

=

Page 149: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

III Confiabilidad, R(t) – Distribución binormal

149

0

210 0

0

( - )2

0

e 0( )

C t

CC t t t

t tR t

e t t

− −

⎧ ≤ ≤⎪⎨⎪ >⎩

f(t)

0

( )

( ) '( ) ( )

t

h t dt

f t R t h t e−∫

= − = 0

210 0

0 0

( - )2

0 1 0 0

C e 0( )

+ ( - )

C t

CC t t t

t tf t

C C t t e t t

− −

⎧ ≤ ≤⎪⎨⎪ >⎩

Page 150: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

150

IV Teoría de los juegos

La teoría de los juegos provee un modelo para tratar la complejidad relacionada con aprender a pensar e interactuar estratégicamente con otras personas, habilidad imprescindible para poder tomar decisiones inteligentes. La teoría de los juegos interactúa con más de una persona (acciones), con o sin la presencia de estados de la naturaleza (eventos). Por su parte, la teoría de las decisiones económicas que veremos luego involucra a una sola persona interactuando con estados de la naturaleza. Por esta razón, la teoría de los juegos también podría llamarse Teoría de la Decisión Multipersonal. Entre los beneficios de este modelo se encuentra el de proveer un sistema lógico con el cual poder analizar los razonamientos, además de un lenguaje común para poder dialogar y comunicar los resultados. Poder modelar todas las estrategias propias y del competidor, proporciona un mejor entendimiento de los escenarios posibles, con los cuales se puede saber, por adelantado, que conviene hacer y que no. Sin embargo debe decirse que, más que un modelo predictivo, es un modelo de cómo deberían comportarse las personas en las experiencias reales. De cualquier forma debe quedar claro que aquel que conoce la teoría de los juegos, estará en mejores condiciones de competir que el que no la conoce. Los economistas ganadores del Premio Nobel de Economía 2005, Robert J. Aumann y Thomas C. Schelling ganaron este premio por utilizar la teoría de juegos para explicar y facilitar la resolución de conflictos. En los siguientes apartados aplicaremos esta utilización entretenida de las matemáticas y de la estadística, a simples juegos de mesa o deportes, acciones de guerra, comportamiento de mercados competitivos, relaciones empresariales, disputas comerciales, crimen organizado, decisiones políticas, negociaciones salariales o discriminación racial y sexual. El término jugador podrá entonces identificar a personas, empresas, máquinas e incluso animales.

Objetivo El objetivo del juego es encontrar una solución que implique la mayor ganancia estable, es decir la mejor posible dada la competencia, que buscará lo mismo que uno. La obtención de la matriz de ganancias para todas las acciones de una situación real determinada, puede ser la parte más difícil para el diseñador del juego y queda fuera del objeto de esta introducción, puesto que solo nos concentraremos en el análisis y resolución de juegos ya diseñados. De todas formas es oportuno aclarar que no se necesita conocer los valores de la matriz de pagos exactamente. Para analizar un juego basta con saber sus magnitudes relativas. Llamaremos: Acciones: alternativas controladas por el usuario. Eventos: alternativas no controladas por el usuario y asociadas con una distribución de probabilidades. Se suelen llamar también Estados de la Naturaleza.

Estrategia Es una regla de decisión acerca de que acción elegir en cada instante del juego.

Page 151: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – Distribución binormal

151

Supuestos • Racionalidad

Todos los jugadores actúan racionalmente buscando maximizar sus ganancias. • Conocimiento

Todos los jugadores conocen todas las reglas del juego. • Conocimiento común

Consiste en una iteración de lo que cada jugador sabe. Un jugador A sabe que otro jugador B es racional: S(R), donde S significa Sabe, R Racional y se sobrentiende que el ordenamiento alterna a los distintos jugadores. Además B sabe que A sabe que B es racional: S(S(R)) Además A sabe que B sabe que A sabe que B es racional: S(S(S(R))) y así sucesivamente hasta el infinito.

Clasificación Los juegos pueden clasificarse de acuerdo a distintas consideraciones. 1. Cooperativos y no cooperativos

En los juegos cooperativos los jugadores pueden hacer compromisos de cooperación al margen de los equilibrios del juego que veremos luego. En los no cooperativos, no pueden acordar entre ellos. Aquí solo trataremos a los no cooperativos.

2. Información completa o incompleta Se refiere a la información privada que un jugador tiene antes de comenzar el juego. Es incompleta cuando la naturaleza mueve primero y al menos un jugador no la observa. Solo trataremos juegos con información completa.

3. Información perfecta IP o imperfecta II La diferencia esencial se encuentra en la cantidad de información que tiene cada jugador a la hora de decidir (derivada de causas de orden legal, físico o técnico). Un juego es de información perfecta cuando el jugador conoce todo lo que desea antes de realizar su movida. El juego del ajedrez o el tatetí son juegos con información perfecta, en cambio el póker o el truco son con información imperfecta.

4. Simultáneo o secuencial Estos términos se relacionan con el tiempo y se refieren a si las jugadas se realizan en forma simultánea o luego de conocer la jugada del adversario. Naturalmente existen juegos que combinan ambas situaciones. En relación con la clasificación anterior, un juego simultáneo, tiene siempre información imperfecta. En cambio un juego secuencial puede tener cualquier tipo de información, lo cual se aprecia con los ejemplos secuenciales del ajedrez y el póker.

Simultáneo IIIP Secuencial

⇒⇒

La clasificación entre decisiones simultáneas o secuenciales se presenta rutinariamente en la competencia entre empresas.

5. Puro o mixto Se llama juego de estrategias puras, EP cuando éstas son deterministas (el resultado es alguna de las ganancias dadas). Se llama de estrategias mixtas, EM cuando en la elección de las mismas interviene además el azar y por lo tanto la teoría de probabilidades (el resultado es una distribución de probabilidades de las ganancias dadas). Un jugador buscará primero analizar si existen estrategias puras que le permitan establecer por adelantado todo lo que debe hacer. Cuando esto no es posible, lo mejor que puede hacer es ser impredecible, actuando aleatoriamente o en otras palabras, utilizando una estrategia mixta. Esto se observa claramente en juegos como el tenis en el que un jugador que no tiene un juego dominante, combina jugadas para aumentar su imprevisibilidad.

6. Suma cero o suma variable Un juego se llama de suma cero o también estrictamente competitivo, cuando la ganancia de

Page 152: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

152

uno es igual a la pérdida del otro, para todas las estrategias. En realidad la suma de ambas no requiere ser 0, sino un valor siempre constante k (por ejemplo 100 en porcentajes), por lo cual sería más correcto llamarlos de suma constante. De todas formas siempre es posible convertir las ganancias de un juego de suma constante en uno de suma cero, o viceversa, utilizando una simple transformación lineal de variables. Si las sumas de ganancias no es constante, se llaman de suma variable o de suma no cero y son los juegos más habituales. Los juegos de suma no cero de n jugadores se pueden convertir siempre en juegos de suma cero de n +1 jugadores, al adicionar un jugador no influyente llamado en inglés “dummy player”, el cual recibe la ganancia neta del juego, pero no puede interferir con el desarrollo del mismo.

7. Número de jugadores Los juegos pueden ser de 2 jugadores (2-personal) y de más de 2 jugadores (n-personal). Solo trataremos juegos de 2 jugadores.

8. Número de acciones El mínimo número de acciones para cada jugador es naturalmente 2. Si un juego es de 2 jugadores y cada uno solo tiene 3 acciones posibles se llama juego de 2 jugadores 3 × 3.

9. Número de repeticiones Juego de una sola ronda o estático: cada jugador juega una sola vez. Juego repetido: Cada jugador se encuentra varias veces con el otro, en el mismo juego. En este caso se presentan muchas formas en que esto puede hacerse: con repetición finita o infinita, con ganancias sumadas, promediadas, solo la última, etc. Dado que se tienen en cuenta los resultados de las jugadas anteriores, los jugadores pueden evaluar las acciones pasadas y determinar si deberían repetirla o cambiarlas.

Utilidad La ganancia no tiene por qué ser solo monetaria, podrían ser tiempos, distancias, probabilidades, etc. Por otra parte, es conveniente resaltar que no todas las personas reaccionan de igual forma ante el riesgo. Así por ejemplo, una E(G) > 0, incluirá necesariamente eventos con pérdida y ganancia de dinero. Aunque la probabilidad de una pérdida sea baja, especialmente si el valor monetario de ésta pérdida es muy importante, una persona puede decidir no participar (y por lo tanto quedarse sin ganancias o pérdidas), debido a sus importantes consecuencias económicas. En cambio otra persona puede ser más proclive al riesgo y aceptar el juego sabiendo que puede hacerse más rica con rapidez, aceptando el riesgo de corto plazo. El análisis de estas posturas se puede resumir en 3 grandes grupos. Los evitadores de riesgos, los buscadores de riesgos y los indiferentes al riesgo. Esto se llama Teoría de la Utilidad. Se desarrolla una curva de utilidad para la persona, para luego convertir las sumas de dinero en utilidades, realizando el cálculo de la esperanza con estas últimas. Esta conversión no será tratada aquí. Dividiré esta sección en 4 partes: 1. Simultáneos con estrategias puras 2. Simultáneos con estrategias mixtas 3. Secuenciales 4. Teoría de las decisiones económicas

1 Simultáneos con estrategias puras

a Formas del juego Se puede representar a un juego con 2 formatos: tabla y árbol.

Forma normal o estratégica Todo juego debe incluir las ganancias (en general utilidades) para determinar cuánto gana o pierde cada jugador. Estas ganancias se pueden resumir en una tabla llamada tabla del juego o bimatriz de

Page 153: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 1 Simultáneos con estrategias puras

153

ganancias. En cada fila o columna se encuentran las acciones posibles de cada uno de ellos. En cada celda se cruzan 2 acciones Acción A × Acción B. En ellas se ubican los resultados o ganancias de ambos jugadores. Convencionalmente se utiliza una bimatriz colocando primero la ganancia del jugador colocado en filas (A en la figura siguiente). Si el juego es de suma cero, el otro tendrá los mismos valores cambiados de signo (suma 0) o los valores complementarios (suma constante), por lo cual se sobreentienden y no se colocan.

Acciones B b1 b2

Acciones Aa1 GA11,GB11 GA12,GB12

a2 GA21,GB21 GA22,GB22

Figura 3-101 Tabla del juego puro

Simetría Un juego es simétrico si la matriz de ganancias tiene simetría respecto de la diagonal principal (de izquierda a derecha y de arriba hacia abajo) atendiendo a los índices de posición de cada celda. La siguiente matriz de juego es simétrica.

Acciones B b1 b2

Acciones Aa1 4,4 –3,5

a2 5,–3 –6,–6

Figura 3-102

Tabla del juego puro

Una celda es simétrica si ambos valores de ganancia son iguales. Por lo tanto los resultados a1b1 y a2b2 del juego de la figura anterior son simétricos.

Forma extensiva Un árbol del juego es la expresión de la tabla en forma de árbol y se lo llama forma extensiva del juego. Recodemos que un árbol es un grafo, conjunto de nodos (puntos) unidos por ramas (rectas), tal que en cada nodo solo entra una rama. Repasar los conceptos de nodo inicial, nodos finales, rama, camino y estrella, vistos en el capítulo 2. En esta aplicación, a los nodos de decisión de cada jugador se los llama nodos de acciones y a los nodos de acción de la naturaleza, nodos de eventos. Se debería agregar además una columna adicional que contiene los valores de la variable G (equivalente a la matriz de ganancias). Sin embargo, el formato usual en teoría de juegos, es colocar en los nodos a los jugadores, en las ramas a las acciones y en los nodos finales a las ganancias de cada camino, en el orden en el que están los jugadores reales en el árbol, como indica la siguiente figura. La naturaleza no tiene ganancias, solo los jugadores reales las tienen. En el caso de estrategias mixtas y en los nodos de eventos de la naturaleza, se incluirán en las ramas también a las probabilidades.

Page 154: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

154

Figura 3-103

Árbol del juego puro

Conjunto de información Una forma de diferenciar un juego simultáneo de uno secuencial es colocando una línea vertical (si el árbol se dibuja horizontal) al final de las acciones de cada jugador (ver figura). De esta forma se recuerda que el siguiente jugador no conoce lo que hizo el anterior (está impedido de "verlo" por este límite). Una forma alternativa es agrupando con un óvalo a los nodos que tienen información imperfecta, lo cual indica que no se sabe cuál de ellos se presentará en el juego (en la figura anterior los nodos B). Este conjunto de nodos se llama conjunto de información. Observar que: • El número de acciones de cada nodo en un conjunto de información debe ser idéntico para todos,

de otra forma el jugador podría distinguir entre estos nodos. • Los conjuntos de información de los juegos con información perfecta, solo contienen un nodo,

en tanto que los juegos con información imperfecta, contienen más de uno.

b Equilibrio de Nash El concepto de equilibrio de Nash se aplica a la forma normal no a la forma extensiva.

Estrategias dominantes En los juegos de 2 acciones es conveniente utilizar flechas para indicar el sentido de las ganancias dominantes, tal como se indica en la figura 3-104a. Las flechas verticales se refieren a las ganancias de A dentro de cada acción de B (recordar que es el primer valor dentro del paréntesis). Así por ejemplo la flecha vertical de la izquierda indica que dentro de b1 la ganancia de A con la acción a2 (2) es mayor que la de la acción a1 (1). Análogamente, la flecha horizontal superior hacia la izquierda indica que dentro de a1 la ganancia de B con la acción b1 (4) es mayor que la de la acción b2 (3).

B b1 b2

A a1 1,4 3,3

a2 2,2 4,4

a

B b1 b2

Aa1 1,4 3,3

a2 1,2 4,4

b

A

B

B.

GA11,GB11

GA12,GB12

GA21,GB21

GA22,GB22b2.

||||||||||||||||

a1

a2

b1

b2

b1.

Page 155: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 1 Simultáneos con estrategias puras

155

Figura 3-104

En los juegos con estrategias puras, las acciones dominantes fuertes son las acciones que tienen ganancias dominantes para todas las elecciones. En la figura anterior la acción a2 es dominante fuerte pues todas las flechas verticales se dirigen a ella. Eso no sucede con las acciones de B, quien no tiene ninguna acción dominante (las flechas horizontales no tienen igual sentido). En particular, si un valor de salida es igual al de llegada, se representa por una flecha doble y si en este caso existe dominancia, se llama débil. En la figura siguiente la acción a2 es dominante débil. En los juegos con más de 2 acciones, más cómodo que las flechas, es el marcado de las ganancias dominantes en cada fila o columna, con un recuadro o asterisco. Lo mismo sucede con la representación en forma de árbol.

Equilibrio de Nash La estrategia dominante se refiere a las filas o columnas, en cambio el equilibrio se refiere a los resultados o celdas (cruce de 2 estrategias llamada también, estrategia conjunta). La siguiente definición del equilibrio es debida al matemático norteamericano John Nash, quién recibió el premio Nobel de economía de 1994 por sus aportaciones a la teoría de los juegos, en especial la que se deriva de su tesis doctoral de 1951: Juegos no cooperativos. Observar que fue elaborada 43 años antes del premio5. Dos estrategias cruzadas conforman un equilibrio de Nash si ningún jugador tiene incentivos para cambiar la suya unilateralmente y por lo tanto lo mejor que puede hacer es quedarse en la estrategia elegida. Un equilibrio de Nash para estrategias puras se detecta cuando 2 flechas (o 2 marcas) se encuentran en una celda, pues en este caso cada jugador está utilizando la mejor estrategia dadas las estrategias de los demás.

Cadena de conjeturas El análisis de juegos siempre se comienza pensando nuestra acción, la reacción racional del otro jugador, nuestra nueva reacción racional, …. De este análisis surge nuestra mejor estrategia en consecuencia. La palabra "pensando" es conducente en este párrafo pues al ser un juego simultáneo, todo este proceso solo tiene lugar en la mente de cada jugador. Apreciar que la reacción del otro se asociará con un perfil fila o columna. Observar el juego de la figura 3-104b. • Acción: el jugador B elige por ejemplo b1. • Reacción: el jugador A elegiría la acción dominante en ganancias a2, dado b1 (dentro del perfil

b1). • Reacción: el jugador B elegiría la acción dominante en ganancias b2, dado a2. • Reacción: el jugador A seguiría eligiendo a2, con lo cual las acciones a2, b2, conforman un

equilibrio estable. Formalmente se tienen las siguientes correspondencias6:

1 2( )AR b a=

2 2( )BR a b=

2 2( )AR b a=

5 Su vida fue llevada al cine en la película: "Una mente brillante", protagonizada por Russell Crowe. Este film narra sus dificultades para relacionarse con las personas, su esquizofrenia paranoide y sus delirios de persecución, todos los cuales finalmente pudo controlar. 6 Estas relaciones no son funciones pues podrían existir valores iguales y por lo tanto expresiones del tipo:

1 2 3( ) ,AR b a a= , sin un valor único. Los economistas las llaman correspondencias.

Page 156: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

156

En síntesis, si el jugador B elige b2, entonces el jugador A elegirá a2, pues no tiene incentivos para cambiarla y tener mayores ganancias (y viceversa). El equilibrio se detecta comenzando desde cualquier acción de cualquier jugador. En la figura siguiente se aprecia este equilibrio con un diagrama de relaciones como el que se utiliza en matemáticas. Si B elige b2, A elige a2, y B se queda en b2, lo cual indica un punto de equilibrio estable.

Figura 3-106

El valor de la ganancia en el equilibrio, se llama Valor del juego, en este ejemplo (4, 4). Los equilibrios pueden naturalmente también obtenerse tildando en la forma extensiva, como se muestra en la figura siguiente (con un * dentro de A y con un ' dentro de B). El equilibrio se detecta ahora cuando las 2 marcas se encuentran en el mismo nodo final.

Figura 3-107

Equilibrio de Nash

Se deja al lector concluir que el juego de la figura 3-107 tiene 2 equilibrios de Nash. En general un juego puede tener 0, 1 o más equilibrios de Nash. Un equilibrio no produce necesariamente el mejor resultado posible para cada jugador individual, pero es una situación que conforma a todos ante la amenaza de resultados peores. Más adelante veremos cómo obtener (si existen) los equilibrios de Nash para estrategias mixtas.

Teorema de Nash (Nash, 1951) Cualquier juego de n jugadores (de suma variable o constante), tiene al menos un equilibrio de Nash (puro o mixto).

b1 a2 b2RA RB

RA.

A

B

B.

1,4*

3,3

2',2

4',4*b2.

||||||||||||||||

a1

a2

b1

b2

b1.

Page 157: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 1 Simultáneos con estrategias puras

157

Condiciones necesarias y suficientes para una solución

Condición necesaria Un equilibrio de Nash es una condición necesaria (pero no suficiente) para ser solución del juego, esto es:

Solución Equilibrio⇒

Esto implica que una situación que no es un equilibrio, no puede ser solución. Pero un equilibrio podría presentarse con ambas estrategias no dominantes, dominantes o dominadas.

Condición suficiente Una condición suficiente para una solución del juego en estrategias puras, es que el equilibrio de Nash sea con ambas estrategias dominantes.

Equilibrio con estrategias dominantes Solución⇒

Esto se comprende pues sería ilógico que una estrategia dominada sea solución.

Conocimiento común Cuando las estrategias son dominantes, podemos visualizar una aplicación directa de la cadena de razonamientos llamada conocimiento común. Sea el juego de la siguiente figura.

B b1 b2

Aa1 1,4 3,3

a2 3,3 4,2

Figura 3-108

La racionalidad de A lo conduce a jugar la estrategia dominante a2 y la racionalidad de B, a jugar la estrategia dominante b1, por lo cual ambos pueden predecir el equilibrio. Utilizando el concepto de conocimiento común (página 151): • R: B es racional y elige b1. • S(R): A sabe que B es racional y elige b1 => A elige a2 • S(S(R)): B sabe que A elige a2 (B sabe que A sabe que B es racional y elige b1) = > B elige b1. En general son pocos los juegos que tienen este tipo de equilibrios (un ejemplo es el dilema del prisionero, en la sección problemas del final del capítulo). A diferencia de los equilibrios con estrategias no dominantes, estos equilibrios no dependen de las estrategias del otro. Como consecuencia, si un juego tiene estrategias dominantes no importa quién es el primero. Por lo tanto nos encontramos con un juego en el que con igual información, se presentan 2 formas extensivas equivalentes, cada una de ellas con los órdenes invertidos.

Juego de suma cero Si en particular un juego es de suma cero, el máximo (mínimo) de una fila o columna de un jugador será el mínimo (máximo) del otro. En la siguiente figura se presenta un juego de suma 10. Se han colocado por esta vez también las ganancias de B, aunque sabemos que en estos juegos solo se colocan las de A (jugador de filas), pues las del otro se sobrentienden. En la figura se ha incluido una columna y una fila adicionales con los valores de ganancias máximas (expresadas en valores de A), las cuales facilitan la comprensión del siguiente análisis, que cada jugador pensaría antes de hacer su juego.

Page 158: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

158

• Acción: A por ejemplo elige a1. • Reacción: B elegiría la acción dominante en ganancias, b1, (coincidirá con el mínimo de A). • Reacción: A elegiría la acción dominante en ganancias (máximo valor de esa columna), a2. • Reacción: B elegiría la acción dominante en ganancias (máximo valor de esa fila), b1, (coincidirá

con el mínimo de A). Observar que en este caso existe un equilibrio de Nash, la celda (a2, b1), pues B elige b1 y A se queda en a2, lo cual indica un punto de equilibrio estable.

B b1 b2

Aa1 1,9 3,7

a2 2,8 4,6

Figura 3-109

Como en los juegos de suma cero no se incluyen las ganancias de B, se debe tener en cuenta que las flechas de B resultan invertidas respecto de las ganancias de A.

B b1 b2

Aa1 1 3

a2 2 4

Figura 3-110

c Eficiencia y justicia

Eficiencia Este concepto (como el equilibrio) se refiere a los resultados (celdas) y no a las estrategias (filas o columnas).

Comparación local (uno a uno) Un resultado es Pareto Dominante o Dominante en Ganancias sobre otro, si las ganancias son al menos iguales a la del otro y una es estrictamente mayor. Si todas son estrictamente mayores, el resultado es estrictamente Pareto Dominante.

Comparación global (todas las celdas) Un resultado es Pareto Eficiente si no es Pareto dominado por ningún otro. Si esto no ocurre, se dice que es Pareto Ineficiente. Un equilibrio no necesariamente coincidirá con un resultado Pareto Dominante o Pareto Eficiente, pudiendo existir un resultado Pareto Dominante o Eficiente que no es un punto de equilibrio. Como es un desequilibrio no puede subsistir y sus ganancias, aunque altas, son efímeras, por lo cual no debe ser considerado.

Justicia Un resultado es justo si cada jugador gana lo mismo, es decir si es simétrico. Este concepto normalmente se encuentra en conflicto con el concepto de eficiencia, en el sentido de que eficiencia y justicia no puedan satisfacerse a la vez. Este conflicto aparece frecuentemente en economía, por lo cual no debe sorprender que lo haga en juegos de economía.

Page 159: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 1 Simultáneos con estrategias puras

159

Juegos de coordinación Es habitual que 2 equilibrios (puros o mixtos) contrapongan características deseables, como por ejemplo: • Dos equilibrios eficientes (tienen iguales ganancias totales). Esto sucede siempre en los juegos

de suma cero con 2 jugadores que presentan varios equilibrios puros. • Un equilibrio es eficiente y el otro es dominante. • Un equilibrio es eficiente y el otro es justo. En estos casos, con varias soluciones posibles, el juego se llama juego de coordinación. Si los jugadores desearan una estrategia común, deberán coordinar entre ellos dado que el que mueve primero tendrá una ventaja, pues induciría al otro a adoptar el mismo equilibrio.

d Estrategias Minimax y MaxiMin

MiniMax y Maximin Son definiciones aplicables a cualquier matriz (pertenezca o no a un juego).

MiniMax Se halla el máximo de cada fila o columna y luego el mínimo de ese vector.

MaxiMin Se halla el mínimo de cada fila o columna y luego el máximo de ese vector. A modo de ejemplo, en la figura siguiente se colocaron en los márgenes de la tabla, los máximos o mínimos de cada fila o columna con los subíndices R por Row (fila) y C por Column (columna). Luego se colocó un * o un ' para marcar los MiniMax y MaxiMin.

MaxR1' 6 0 6 2 0 3* 3*3 2 4 4

MinC 1' 0 0

MinR 1 6 0 0 2 0 3 03 2* 4' 2*

MaxC 3 6 4'

Figura 3-111

Aplicación a la forma normal de un juego A modo de ejemplo aplicaremos los conceptos de MiniMax o MaxiMin a la bimatriz de un juego.

Acciones B MaxR b1 b2

Acciones Aa1 4,4 –3',5 5

a2 5,–3* –6,–6 –3* MaxC 5 –3'

Figura 3-112

Minimax

Estrategia MiniMax (con la matriz del adversario) Supongamos que nos enfocamos en las estrategias de A. • Acción: A elige una acción cualquiera (fila). • Reacción: la estrategia usual de B es elegir la dominancia de sus ganancias en esa fila, Max(B)

(máximo dentro de ese perfil fila).

Page 160: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

160

Consecuencia Si A prevé que B tenga la estrategia de dominancia en sus ganancias, elegiría de entrada la fila que contenga el mínimo de esos máximos (la solución menos mala), esto es el Mini(Max(B))7, al que llamaremos simplemente MiniMax de B. B luego elegiría la celda de ese MiniMax. ¿Podrá B terminar eligiendo el Mini(Max(A))? Esto ocurre algunas veces y será desarrollado en la siguiente sección. En la figura anterior se colocaron en la columna marginal los máximos que puede elegir B a cada acción de A (máximos de fila = MaxRow) y en la fila marginal los máximos que puede elegir A para cada acción de B (máximos de columna = MaxColumn). Se colocó una marca * al lado de cada ganancia para resaltar el MiniMax de fila y un tilde ' para el MiniMax de columna.

: 3: 3

R

C

Columna MiniMaxFila MiniMax

= −= −

Observar que la intersección de ambas acciones no se encuentra en la misma celda.

Estrategia MaxiMin (con la matriz propia) • Acción: A elige una acción cualquiera (fila). • Reacción: en lugar de maximizar sus ganancias, B podría optar por elegir como estrategia

mínimizar las ganancias de A, Min(A) (la cual es una acción algo paranoica). En este caso le convendrá a A calcular previamente el máximo de esos mínimos, lo cual lo conduce a la estrategia llamada Maxi(Min(A))8, es decir el MaxiMin de A.

Ambas estrategias se llaman estrategias conservadoras o de seguridad y por lo tanto son contrarias a la expresión de mercado: mayor riesgo, mayor beneficio: No es aplicable, por ejemplo, en la apertura de un mercado si una empresa busca captar mayor participación, en donde se debería pretender bastante más que una estrategia mínima de seguridad para explotar las debilidades del adversario. El valor numérico del MiniMax (o del MaxiMin) se llama nivel de seguridad.

Equilibrio MiniMax o MaxiMin Sucede cuando el par de estrategias (acciones elegidas) de ambos jugadores se interceptan en la misma celda.

Equilibrio MiniMax -MiniMax Se presenta cuando ambos usan la estrategia MiniMax (por lo tanto utilizan la bimatriz) y se cumple que:

R CMiniMax MiniMax≡ En los juegos de suma no cero, no tiene porque existir o coincidir con el equilibrio de Nash (que siempre existe).

Equilibrio MaxiMin -MaxiMin En forma totalmente análoga se puede analizar si existe equilibrio cuando los jugadores deciden minimizar las ganancias del otro en lugar de maximizar las suyas (por lo tanto usan la bimatriz).

7 El anidamiento indica las estrategias de cada jugador, en este caso: A(B). 8 El anidamiento indica las estrategias de cada jugador, en este caso nuevamente: A(B).

Page 161: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 1 Simultáneos con estrategias puras

161

Equilibrio MaxiMin -MiniMax Si un jugador, por ejemplo B, utiliza la estrategia MaxiMin y el otro A, la estrategia MiniMax, ambos jugadores utilizarán una sola matriz para el análisis, en este ejemplo solo la matriz de B.

Punto de silla Es una propiedad que tienen algunas matrices, por la cual el mínimo de fila coincide con el máximo de columna. Por esta razón, a este punto se lo llama punto de silla, dada la semejanza con la silla de montar en la cual existe un punto que cruza el mínimo en una dirección (curva cóncava hacia arriba) con el máximo en la dirección perpendicular (curva cóncava hacia abajo). Este punto, si existe, no tiene que ser necesariamente único. En la figura siguiente la celda sombreada contiene el máximo de su columna y el mínimo de su fila.

MinR0 1 7 0 4 2*' 3 2* 9 0 0 0

MaxC 9 2' 7

Figura 3-113 Punto de silla

Se puede demostrar el siguiente teorema: La condición necesaria y suficiente para un equilibrio MaxiMin–MiniMax, es que esa celda sea un punto de silla. Observar que el punto de silla requiere que sea la misma matriz para ambos jugadores, por lo cual el equilibrio debe ser MaxiMin–MiniMax. En la figura siguiente, la celda inferior izquierda es un punto de silla, pues el 2 es el máximo de su columna y el mínimo de su fila. Si suponemos ahora que esta matriz representa la ganancia de A de un juego, el punto de silla sería el punto de equilibrio de las estrategias MaxiMin–MiniMax, pues A elegiría la acción a2 del MaxiMinR y B la acción b1 del MiniMaxC

9. La estabilidad del punto de equilibrio se percibe razonando así: • Acción: si por ejemplo A eligiera a1. • Reacción: B elegiría b1. • Reacción: A elegiría a2. • Reacción: B elegiría b1. Observando las 3 últimas reacciones, se aprecia la estabilidad del la estrategia a2-b1.

G(A) Acciones B MinR b1 b2

Acciones Aa1 1 3 1

a2 2*' 4 2* MaxC 2' 4

Figura 3-114 Punto de silla

9 Esto también ocurrirá si esta matriz fuera de un juego de suma constante (por ejemplo igual a 10).

Page 162: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

162

e Juegos de suma cero

MiniMax = MaxiMin En estos juegos se verifica que el MaxiMin de una matriz es siempre igual al MiniMax de la otra.

Equilibrio Como es un juego de suma cero se podrían utilizar siempre los valores de las ganancias de un solo jugador en el análisis y por lo tanto una sola matriz. Si por ejemplo se utilizan solo las de A, se tiene: • Acción: A elige una acción. • Reacción: B elegiría el mínimo de esa fila Min(A) (coincidirá con el máximo de la fila de su

matriz). • Reacción: A concluirá que su solución menos mala será el máximo posible de estos valores, es

decir el MaxiMin de A. Se llega a la misma estrategia utilizando la matriz de ganancias de B. Sin embargo, estas estrategias no necesariamente coincidirán en la misma celda.

Teorema MiniMax (Von Neumann, 1928) Cualquier juego de 2 jugadores de suma constante, tiene exactamente un equilibrio MiniMax-MaxiMin (puro o mixto). Obviamente que si el equilibrio fuera puro sería un punto de silla. Se aprecia que este teorema un caso particular del teorema de Nash, aplicable a cualquier juego. En un juego de suma constante, el equilibrio de Nash coincide con el equilibrio MiniMax. Esta analogía solo es válida para juegos de 2 jugadores. Ejemplo En la figura 3-115 se presenta un juego de suma constante 10, con las matrices de A y de B.

G(A) B MinRb1 b2

A a1 1 3' 1

a2 4 2* 2*

MaxC 4 3'

a

G(B) B MaxR b1 b2

Aa1 9 7' 9

a2 6 8* 8* MinC 6 7'

b Figura 3-115

Observando la columna marginal de ambas figuras a y b, se obtienen los siguientes valores, el primero calculado con las ganancias de A y el segundo con las ganancias de B. Corresponden a la acción a2.

2 8R RMaxiMin MiniMax= ≡ =

En forma análoga, observando la fila marginal, se obtienen los siguientes valores, el primero calculado con las ganancias de B y el segundo con las ganancias de A. Corresponden a la acción b2.

7 3C CMaxiMin MiniMax= ≡ =

Page 163: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 1 Simultáneos con estrategias puras

163

Observar que esta matriz no posee un equilibrio MiniMax en estrategias puras. En la sección siguiente se estudiará como calcular el equilibrio en estrategias mixtas.

Problema resuelto 3.45 Sistemas de video

Una empresa debe decidir entre adoptar la tecnología de un sistema de video VHS o la de Beta. Ambos son igualmente buenos, pero una vez adoptada una tecnología, no podrá trabajar con la que utilice la otra. La matriz de pagos se muestra en la siguiente figura. Obtener las estrategias MiniMax, los equilibrios puros de Nash, la eficiencia; los valores del juego e interpretar la situación.

B Beta VHS

ABeta 1,1 0,0

VHS 0,0 1,1

Figura 3-116

Solución

Colocando los máximos de columna y de fila y las flechas, resulta la siguiente tabla:

B MaxRBeta VHS

A Beta 1',1* 0,0 1*

VHS 0,0 1',1* 1*

MaxC 1' 1'

Figura 3-117

Equilibrio MiniMax-MiniMax : ( ) 1

: ( ) 1Columna MiniMax para AFila MiniMax para B

==

Se encuentran 2 celdas en las que coinciden los MiniMax.

Equilibrio de Nash Con las flechas se aprecia que ninguna acción es dominante. Los equilibrios MiniMax coinciden aquí con los 2 equilibrios de Nash, en los cuales las empresas elegirían el mismo sistema.

Valores del juego Los valores del juego son 1, 1 para ambos jugadores en ambos equilibrios.

Eficiencia Como los equilibrios no son dominantes y la eficiencia es igual para ambos, nos encontramos en un juego de coordinación, en el que ambas empresas deberían coordinar una única estrategia.

Page 164: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

164

Problema resuelto 3.46 El juego de la contaminación

Una empresa preferiría contaminar a instalar un caro sistema para controlar la contaminación. La siguiente tabla muestra los beneficios para todos los cruces. Obtener las estrategias MiniMax, los equilibrios puros de Nash, la eficiencia, los valores del juego e interpretar la situación.

B Poca

contaminación Mucha

contaminación

A

Poca contaminación 100,100 –30,120

Mucha

contaminación 120,–30 100,100

Figura 3-118

Solución

Colocando los máximos de columna, de fila y las flechas, resulta la siguiente tabla:

B MaxR Poca

contaminación Mucha

contaminación

A

Poca contaminación 100,100* –30,120 100*

Mucha

contaminación 120,–30 100',100* 100*

MaxC 120 100'

Figura 3-119

Equilibrio MiniMax-MiniMax Estrategias MiniMax

: 100: 100

R

C

Columna MiniMaxFila MiniMax

==

La estrategia conjunta Mucha Contaminación – Mucha Contaminación es un equilibrio MiniMax-MiniMax.

Equilibrio de Nash Es la celda en que ambas empresas eligen Mucha contaminación. La acción Mucha contaminación es dominante para la empresa A. Cuando un jugador A tiene una estrategia dominante y el otro B no, B debe suponer que A la va a elegir y por lo tanto elegirá la mejor jugada dado este supuesto. En este caso, B elegiría Mucha contaminación.

Valor del juego El valor del juego del equilibrio de Nash es 100 para ambos jugadores.

Page 165: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 1 Simultáneos con estrategias puras

165

Eficiencia El equilibrio de Nash no es eficiente pues no domina al resto de las ganancias. Observar que el equilibrio de Nash es en este caso antisocial. El mercado no siempre conduce al resultado deseable. El estado puede resolver este problema con exenciones impositivas para imponer un equilibrio en la celda superior izquierda.

Problema resuelto 3.47 Competición Cournot10

Un juego simultáneo en el que dos firmas compiten en cantidades, se llama modelo de competencia de Cournot, debido al economista francés Agustín Cournot, quien lo estudió por primera vez en 1838, apareciendo en el último capítulo de su libro, Recherches sur les príncipes mathématiques de la Theorie des richesses. Cuando la competencia simultánea es en precios, se llama competencia de Bertrand, cuando la competencia es secuencial en cantidades se llama de Stackelberg y cuando es secuencial en precios se llama Liderazgo en precios. Sea un duopolio11 conformado por 2 chocolaterías A y B que desean maximizar sus beneficios y cuyas cantidades de unidades enviadas al mercado llamaremos qA y qB. La ley de la oferta y la demanda establece que los precios y las cantidades se relacionan en forma inversa. Asumiremos que el precio de mercado P se determina por la demanda, en función de la siguiente ecuación lineal:

( ) ( )0

A B A BP a b q q si a b q qP en caso contrario

= − + > +=

Observar que P es función de la cantidad que producen ambas empresas, debido a lo cual aparece entre ellas una relación estratégica. Supongamos que a = 130, b = 1 y el costo C = 10$ para ambas firmas. Además consideremos por simplicidad que solo existen 3 posibles cantidades qi, 30, 40 y 60. a) Construir la matriz de pagos. b) Obtener los equilibrios puros de Nash, los valores del juego y la eficiencia. Interpretar.

Solución

a) Resolviendo P para cada valor de los cruces, se obtiene la siguiente tabla de ganancias. Recordemos que en los paréntesis, convencionalmente se colocan primero las ganancias del jugador colocado en filas, es decir A. Por ejemplo, si A elige q1=30 y B elige q2=60, se tiene:

130 (30 60) 40$P = − + = Por lo tanto, • La ganancia para A es: 1( ) (40 10)30 900$P c q− = − = .

• La ganancia para B es: 2( ) (40 10)60 1800$P c q− = − = .

10 Ejemplo tomado de Gardner, 1995, Games for Business and economics, pag 136. 11 Un oligopolio es una industria formada por n empresas con capacidad para modificar los precios en función de su producción. En particular si n = 2 se llama duopolio. Lo contrario se llama competencia perfecta.

Page 166: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

166

B qB1=30 qB2=40 qB3=60

A

qA1=30 1800,1800 1500,2000 900,1800

qA2=40 2000,1500 1600,1600 800,1200

qA3=60 1800,900 1200,800 0,0

Figura 3-120 b)

Eliminación de estrategias fuertemente dominadas Se observa que en este problema, las acciones 3 para ambas fábricas son estrategias fuertemente dominadas. Estas acciones pueden eliminarse del análisis pues nunca serán elegidas. Se obtiene así la tabla reducida siguiente.

B qB1=30 qB2=40

A qA1=30 1800,1800 1500,2000

qA2=40 2000,1500 1600,1600

Figura 3-121

Repitiendo la reducción de estrategias fuertemente dominadas, se eliminarían las acciones 1 de cada fábrica, resultando como equilibrio de Nash, la estrategia de elegir la acción 2 para ambas empresas. Cada empresa producirá 40 unidades y por lo tanto el precio de mercado será:

130$ 2(40)$ 50$P = − = 40$ por arriba de los costos (10$), lo cual produce unos beneficios totales de 1600$.

Nota Por la condición de suficiencia antes vista (página 157), al eliminar estrategias débilmente dominadas, se pierden los equilibrios de Nash que pudieran existir en estas estrategias. Un método alternativo es el siguiente.

Celda por celda Colocar las flechas verticales y horizontales indicando el sentido de las ganancias. La tabla resulta:

B qB1=30 qB2=40

A qA1=30 1800,1800 1500,2000

qA2=40 2000,1500 1600,1600

Figura 3-122

Si existe una celda en la que concurren todas las flechas, será la estrategia común para ambos jugadores, en este caso la celda (1600,1600). Este es entonces el equilibrio de Nash de esta competición y 1600 es el valor del juego. Ambas fábricas elegirían las producciones de 40 unidades pues es la mejor estrategia dada la estrategia del otro.

Eficiencia Observar que la solución es ineficiente pues existe una situación (1800,1800) con ganancia s mayores para los jugadores, pero que no es un equilibrio.

Page 167: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas

167

2 Simultáneos con estrategias mixtas El equilibrio de estrategias mixtas implica volverse impredecible. Esto es deseable en el caso de que no exista un equilibrio de estrategias dominantes, pues evitará conductas sistemáticas que puedan ser aprovechadas por el otro jugador. Esta conducta es la que se observa por ejemplo en los jugadores de póker que desean tener algún tipo de éxito. Una estrategia mixta es una distribución de probabilidades sobre el conjunto de estrategias. Por lo tanto:

1 1 2 2 ... 1n np a p a p a+ + =

La selección de cualquiera de las acciones es un evento aleatorio para el jugador. Como resultado, cada jugador aleatoriza su decisión, algunas veces elige la acción a1, otras veces la a2, etc. En este sentido, su estrategia resulta una mezcla aleatoria de las estrategias puras.

a Formas del juego

Forma normal Además de la tabla de ganancias, se debe incluir la tabla de contingencias con las probabilidades de cada acción. Llamamos: pA = probabilidad de que A juegue la acción a1. pB = probabilidad de que B juegue la ación b1. Dado que las acciones son independientes entre sí, resulta entonces el esquema que se muestra en la siguiente figura, con la tabla de contingencias y la de ganancias en una sola tabla.

Acciones B b1 b2 T

Acciones A

a1 GA11, GB11pApB

GA12, GB12 pA(1–pB)

pA

a2 GA21, GA21(1- pA)pB

GA22, GB22 (1–pA)(1–pB)

1- pA

T pB 1–pB 1

Figura 3-123 Tabla del juego mixto

Forma extensiva Un árbol del juego sería simplemente el árbol de probabilidades condicionales correspondiente a la tabla anterior (recordando que los eventos son independientes), adaptado al formato habitual en la teoría de juegos.

Page 168: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

168

Figura 3-124

b Equilibrio de Nash El equilibrio de Nash de estrategias mixtas se materializa con la obtención adecuada de los valores de pA y pB necesarios para que cada jugador maximice sus respectivas ganancias. Esta estrategia también es llamada estrategia óptima. Si un juego verifica la condición suficiente de solución de un equilibrio puro con estrategias dominantes (página 157), no existirá un equilibrio en estrategias mixtas y por lo tanto finaliza el análisis. Esto se comprende pues sería ilógico que se le asignara una probabilidad a la estrategia dominada. De todas formas, si se resolviera por el enfoque de estrategias mixtas, se obtendría un valor de probabilidad mayor que 1 o menor que 0, lo cual indica esta situación al modelador. Esto se podrá apreciar desde el punto de vista gráfico en el siguiente problema resuelto. La esperanza obtenida es el valor del juego y será favorable a alguno de ellos o 0. En este último caso se dice que el juego de 2 jugadores 2 × 2 de suma cero, es neutro. Sin embargo, el valor del juego es en este caso un valor al cual tenderá la ganancia del promedio de muchos juegos. Si el número de repeticiones no es muy alto, la suerte podrá aumentar o disminuir la ganancia. Existen 3 métodos de resolución. A continuación los describiré conceptualmente y dejaré los detalles para el próximo problema resuelto.

1 Método de maximización Consiste aplicar el análisis infinitesimal a la expresión general de la ganancia conjunta del juego, para obtener el valor máximo de la misma. Por lo tanto primero deberá derivarse la misma respecto de sus variables pA y pB y luego igualar esta expresión a 0. La resolución proveerá los valores de pA y pB. Notar que al derivar respecto de una probabilidad se considera a la otra como si fuera constante. Esto solo es verdad en el equilibrio.

2 Método de igualación de ganancias Este método se basa en la igualación de ganancias esperadas. En un juego de n×m se llega a un sistema superdeterminado (más ecuaciones que incógnitas).Los dos métodos principales de resolución de estos sistemas son el de mínimos cuadrados ya visto en la

A

B

B.

pA a1

(1-pA) a2

GA11, GB11

GA12, GB12

GA21, GB21

GA22, GB22

pB b1

(1-pB) b2

pB b1.

(1-pB) b2.

(1-pA)pB

(1-pA)(1-pB)

pApB.

pA(1-pB)

||||||||||||||||

Page 169: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas

169

regresión (capítulo 1) y la programación lineal12. Sin embargo, podremos resolver los siguientes dos casos particulares sin usar ninguna de estas técnicas: • Juegos n×n

En estos casos se llega a un sistema determinado, el cual se resuelve como es habitual. • Juegos 2×n

El sistema es superdeterminado pero al ser 2 el número de filas o columna), se puede resolver en forma gráfica en el plano.

Ambas situaciones se presentan en el siguiente problema resuelto.

3 Método de Williams Es el resultado de la aplicación de la geometría a 2 triángulos semejantes que se encuentran en la solución gráfica del método de igualación de ganancias de un juego 2×2.

c Funciones de mejor respuesta (BRF, Best Response Function) Son las gráficas de una probabilidad pA en función de la otra pB. Se construirán luego en un problema resuelto.

Problema resuelto 3.48 Estrategia de juego en el saque

Un jugador de tenis sabe que cuando espera el saque, no debe decidirse a cubrir un determinado lado de la cancha hasta el último momento pues de lo contrario el sacador puede aprovecharse y tirar la pelota en sentido contrario. Si bien las decisiones son simultáneas, predecir la jugada del contrario tiene muchas ventajas. Supongamos que los jugadores Del Potro, S (Sacador) y Federer, R (Receptor) tienen una matriz de ganancias como la de la figura siguiente. Estas probabilidades pueden ser calculadas de las estadísticas correspondientes a los partidos previos entre ambos. Indican por ejemplo que si R prevé correctamente el saque derecho, tiene éxito el 90% de las veces. Apreciar que este es un problema de suma cero pero el procedimiento es totalmente general. Luego en los problemas finales se pedirá resolver por ejemplo el juego del gallina, de suma no cero.

Del Potro SacadorDerecho Revés

FedererReceptor

Derecho 90% 20% Revés 30% 60%

Figura 3-125

Obtener los equilibrios de Nash (puros y mixtos) e interpretarlos. Compararlos con los equilibrios MiniMax. ¿Son los equilibrios eficientes?

Solución

Primero se debe analizar la existencia o no de estrategias puras dominantes (fila o columna con valores sistemáticamente superiores a la otra). De la siguiente tabla se concluye que en este caso no existen estrategias puras dominantes para las ganancias de ninguno de los jugadores. Además, por ser un juego de suma cero, los equilibrios de Nash coinciden con los equilibrios MiniMax.

12 El objetivo de esta técnica es optimizar (en general maximizar), una ecuación W = f(X,Y,Z,…, con inecuaciones de vínculo (desigualdades en lugar de igualdades). Se llama lineal pues todas las ecuaciones e inecuaciones son lineales. Scheid, F. 1972, pag 368.

Page 170: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

170

Del Potro Sacador Derecho Revés

FedererReceptor

Derecho 90% 20%

Revés 30% 60%

Figura 3-126

1 Método de maximización

El paso siguiente es analizar las estrategias mixtas, debido a lo cual, en la siguiente tabla se muestran las probabilidades pR y pS de que el receptor prevea un saque derecho o que el sacador realice un saque derecho. El método de maximización consiste en obtener los valores de pR y pS de la distribución conjunta. Si se expresa en forma tabular, se obtiene la tabla de la siguiente figura.

Del Potro Sacador 1 Derecho 2 Revés T

Federer Receptor

1 Derecho 90% pR pS

20% pR (1- pS)

pR

2 Revés 30% (1- pR) pS

60% (1- pR)(1- pS)

1- pR

T pS 1- pS 1

Figura 3-127 La expresión de la ganancia conjunta del receptor es:

((90 20(1 )) (1 )(30 60(1 ))(70 20) (1 )( 30 60)(100 40) 60 30

R R S S R S S

R S R S

R S S

G p p p p p pp p p pp p p

= + − + − + − == + + − − + == − + −

Diferenciando con respecto de pR, se obtiene: 100 40 0

0.4048%

S

S

R

ppG

− = ⇒==

Observar que si el sacador utiliza este valor de pS, no interesa cual sea el valor de pR que elija el receptor, pues en la ecuación de GR se anula el término que contiene a pR. Una breve reflexión indicará que esto siempre ocurrirá (en un juego de 2 jugadores 2×2), dado el formato con el que resulta la ecuación. Análogamente para la ganancia del sacador (utilizando en la matriz de ganancias, las complementarias de las anteriores), resulta:

((10 70(1 )) (1 )(80 40(1 ))( 60 70) (1 )(40 40)( 100 30) 40 40

S S R R S R R

S R S R

S R R

G p p p p p pp p p pp p p

= + − + − + − == − + + − + =

= − + + +

Diferenciando con respecto de pS, se obtiene: 100 30 0

0.3052%

R

R

S

ppG

− + = ⇒==

Nuevamente observar que si el receptor utiliza este valor de maximización de ganancias, no interesa cual sea el valor de pS que elija el sacador, pues en la ecuación de GS se anula el término que contiene a pS. Es decir que la

Page 171: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas

171

maximización de la ganancia conjunta en un juego de 2 jugadores 2×2, equivale a la obtención de un pR tal que esa ganancia sea independiente de pS. De esta forma se minimiza la habilidad del oponente de reconocer comportamientos sistemáticos en nuestras propias elecciones y nada de lo que haga afectará el resultado. Para que estos resultados tengan validez, deben ser aplicados en forma totalmente aleatoria (por ejemplo mirando la posición del minutero de un reloj, asignando sectores o cuadrantes al tiro derecho y al revés). De todas formas recordar que las ganancias tenderán a los valores esperados del juego, solo si el número de repeticiones es suficientemente grande. Las ganancias del equilibrio mixto son (48, 52), por lo tanto la estrategia es Pareto Ineficiente pues sus ganancias no son iguales o mayores que las de cualquier otro resultado. Además, esta solución no domina a ninguna de las estrategias de la matriz del juego (la bimatriz se muestra en la figura siguiente). Claramente, si existieran estrategias puras y mixtas, debería elegirse aquella que domine en ganancias. La matriz de ganancias con las probabilidades encontradas se muestra en la figura siguiente. Así por ejemplo se extrae que si ambos jugadores utilizan sus estrategias mixtas, la probabilidad de que el Sacador lo haga con el revés y el Receptor reciba también con el revés es del 42%, con las cuales el Receptor tendrá una probabilidad de éxito del 60% (ganancia de 60).

Del Potro Sacador 1 Derecho 2 Revés T

Federer Receptor

1 Derecho (90,10) 0.12

(20,80)0.18

0.3

2 Revés (30,70) 0.28

(60,40)0.42

0.7

T 0.4 0.6 1

Figura 3-128

2 Método de la igualación de ganancias

Utilizando el concepto deducido en el método anterior, la maximización de ganancias conduce a que cada jugador obtenga siempre la misma ganancia esperada con independencia de la acción del otro jugador13 .Esto implica igualar las esperanzas dentro de cada perfil (luego se ampliará el concepto para cualquier juego de 2 jugadores, no solo de 2×2). Para igualar los pagos se ha agregado a la tabla una columna y fila marginal, que contienen las expresiones de las esperanzas dentro de cada perfil. Observar que para obtener estas ecuaciones, se deben utilizar las ganancias de la distribución que corresponda.

Del Potro Sacador 1 Derecho 2 Revés T

Federer Receptor

1 Derecho (90,10) pR pS

(20,80) pR (1-pS)

pR 70pS+20

2 Revés (30,70) (1-pR) pS

(60,40) (1-pR)(1-pS)

1-pR

-30pS+60

T pS 1-pS 1 -60pR+70 40pR+40

Figura 3-129

13 Además de ser los perfiles fila (columna) iguales entre sí por tratarse de eventos independientes.

Page 172: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

172

Analíticamente

1

2

70 2030 60

R S

R S

E pE p

= += − +

Observar que si el sacador S eligiera pS =1, es decir siempre juega Derecho, la esperanza de S, si solo juega Derecho, daría ER1 = 90, el cual naturalmente coincide con el valor de la celda superior izquierda. Análogamente se puede analizar el valor pS = 0 y la otra ecuación. Igualando las esperanzas, se llega a un sistema de 2 ecuaciones con 2 incógnitas, al que procedemos a resolver. 70 20 30 60

0.40S S

S

p pp

+ = − +

⇒ =

Del Potro debe sacar el 40% de los tiros de derecha y el 60% de revés. Análogamente:

1

2

60 7040 40

S R

S R

E pE p

= − += +

60 70 40 400.30

R R

R

p pp

− + = +⇒ =

Federer debe posicionarse para recibir el 30% de los tiros de derecha y el 70% de revés. El valor del juego para cada jugador se obtiene reemplazando el valor obtenido en cualquiera de los miembros de la igualdad.

48%52%

R

S

GG

==

Se obtienen así los mismos valores que con el método anterior.

Diagrama de árbol Contiene los valores condicionales, los conjuntos y las ganancias. Notar que las ganancias se colocan en el orden en el que se construye el árbol.

Figura 3-130

.

Federer

Federer.0.60 Revés

(10,90)

(70,30)

(80,20)

(40,60)

0.30 RecibeDerecho

0.70 RecibeRevés

0.30 RecibeDerecho.

0.70. RecibeRevés.

0.12

0.28

0.18

0.42

||||||||||||||||

0.40 Derecho

Del Potro

Page 173: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas

173

Comprobar que los valores del juego para cada jugador, dada cualquier acción del otro, se pueden obtener también del diagrama de árbol. Así por ejemplo:

| 0.3(90) 0.7(30) 48%Federer DerechoG = + = .

Gráficamente Estas ecuaciones pueden resolverse en forma gráfica, dibujando las esperanzas ER1 y ER2 en un solo diagrama.

Figura 3-131

En la figura anterior puede verse que la combinación 40:60 del sacador es la mejor que tiene el servicio pues es la única que no puede ser aprovechada por el receptor. Si el sacador S eligiera cualquier otra estrategia, por ejemplo 30%, el receptor R contestará con la estrategia ER2 anticipando al revés, lo cual le proporcionaría un porcentaje de éxito de 51%, superior al 48%. En el límite, si S eligiera pS = 0%, es decir sacando siempre de revés, R tendría una ganancia de 60%, tal como indica la matriz de pagos. Lo mismo sucede si por ejemplo S eligiera el 50%, pues R contestaría eligiendo la estrategia ER1, anticipando a la derecha, con un porcentaje de éxito de 55%, superior al 48%. Es por esto que el punto 40:60 es ciertamente un punto de equilibrio, en el sentido de que cualquier alejamiento de él, nos retorna al mismo. Matemáticamente:

0.4 00.40.4 1

S R

S R

S R

p pp pp p

< ⇒ == ⇒ ∀> ⇒ =

Observar además que este razonamiento se corresponde con una estrategia MiniMax del Sacador, pues: • Acción: S elige una estrategia. • Reacción: R elige la dominancia de sus ganancias. Dado que las rectas corresponden a las ganancias del

receptor, los valores máximos que elegiría racionalmente el Receptor, se encuentran en la poligonal superior. Debido a esto, el Sacador reaccionaría con el mínimo de esos valores, es decir el vértice inferior de esa poligonal.

Razonando en forma análoga, en la figura siguiente puede verse que la combinación 30:70 del receptor es la mejor que tiene, pues es la única que no puede ser aprovechada por el sacador. Cualquier otra, si se aprovecha por el sacador, le proporciona un porcentaje superior al 52%.

Page 174: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

174

Figura 3-132

Matemáticamente: 0.3 10.30.3 0

R S

R S

R S

p pp pp p

< ⇒ == ⇒ ∀> ⇒ =

Notas 1. Pueden dibujarse ambas rectas a partir de los 2 valores extremos (ver figuras anteriores), valores que

pueden leerse directamente en la bimatriz, en una posición cuyo patrón podrá el lector fácilmente encontrar y recordar.

2. La grafica de estas rectas puede anticipar la existencia o no de solución real, es decir con la intersección de las mismas dentro del intervalo [0, 1]. Si la intersección se presenta fuera de este intervalo, o no existe, entonces podrá decirse que no se presenta un equilibrio en estrategias mixtas.

Juegos 2×n El MiniMax para un juego de 2×2, consiste en la igualdad de esperanzas, pero esto ya no es cierto para un juego de 2×n. Si por ejemplo fuera un juego de 2×3, se tendrían 3 rectas E1, E2 y E3, como se muestra en la figura siguiente.

Page 175: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas

175

Figura 3-133

En este caso, el equilibrio no consiste en igualar las 3 esperanzas entre sí, sino en encontrar el vértice inferior del polígono delimitado por los ejes y la parte superior de las rectas, pues para cualquier otro valor, el oponente contestará con una estrategia que le produce mayor ganancia. En la figura, este vértice inferior corresponde a la igualación de E1 con E2. Observar que si se calculara el valor p correspondiente a la igualación entre E2 y E3, el oponente B contestará con la estrategia E1, pues le produce una mayor ganancia y por lo tanto no sería la estrategia óptima. Este es un problema típico de programación lineal pero, como puede apreciarse, se resuelve perfectamente graficando las rectas y hallando la intersección que corresponda al vértice más bajo de la poligonal superior.

Juegos n×n En este caso simplemente deberá resolverse el sistema determinado de n ecuaciones con n incógnitas, en forma similar al del sistema de 2 ecuaciones con 2 incógnitas correspondiente a este ejemplo.

3 Método de Williams

Método solo válido para un juego 2×2. Comparando los 2 triángulos semejantes que se observan a cada lado de la recta vertical que pasa por la intersección de las rectas inclinadas, se deducen las siguientes relaciones, de donde se extraen los valores de pR y pS. Para la probabilidad del Receptor (primer gráfico):

60 201 90 30

0.40

S

S

S

ppp

−=

− −

⇒ =

Para la probabilidad del Sacador (segundo gráfico): 70 40

1 80 100.30

R

R

R

ppp

−=

− −⇒ = La forma más directa para obtener estas relaciones es hacer una figura de análisis, graficando a mano alzada las rectas del diagrama respectivo.

Page 176: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

176

Problema resuelto 3.49 Estrategia de juego en el saque

Para el problema anterior, obtener las funciones de mejor respuesta.

Función de mejor respuesta (BRF, Best Response Function) La siguiente figura de pR en función de pS, muestra en forma gráfica las relaciones encontradas:

0.4 00.40.4 1

S R

S R

S R

p pp pp p

< ⇒ == ⇒ ∀> ⇒ =

Figura 3-134

Función de mejor respuesta (BRF, Best Response Function) La siguiente figura de pS en función de pR, muestra gráficamente las relaciones:

0.3 10.30.3 0

R S

R S

R S

p pp pp p

< ⇒ == ⇒ ∀> ⇒ =

Page 177: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas

177

Figura 3-135

En la figura siguiente se muestra la combinación de las funciones de mejor respuesta, BRF. Los equilibrios de Nash son las intersecciones de ambos, en este caso solo el equilibrio mixto.

Figura 3-136

Notas 1. Un juego que tiene un equilibro de estrategias puras, puede ser interpretado como un caso particular del de

estrategias mixtas con 0p = o 1p = . Si por ejemplo las funciones de mejor respuesta, BRF, fueran como las de la siguiente figura, se tendrían 3 equilibrios, el mixto en (0.30, 0.40) y los 2 puros en las intersecciones (0, 0) y (1, 1).

2. Si se construyen las BRF para un juego 2×2 que contenga una sola estrategia pura, es decir con algunas de las soluciones: (pA, pB) = (0, 0), (0, 1), (1, 0) o (1, 1),

Page 178: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

178

se observará que las rectas solo se pueden cortar en los vértices del cuadrado delineado en la figura anterior, por lo cual no existirá la posibilidad de un equilibrio en estrategias mixtas.

Figura 3-137

Del análisis gráfico precedente puede apreciarse que los juegos presentan en general un número impar de equilibrios.

d Conjunto convexo de ganancias

Conjunto convexo Un conjunto es convexo si al contener 2 puntos, también contiene la recta que los une. Es decir, A es convexo:

,Si x y A ax by A∈ ⇒ + ∈

Conjunto convexo de ganancias Dado un juego de 2 oponentes A y B, graficamos en un sistema de ejes G(A), G(B), los puntos de cada celda de la bimatriz. El conjunto convexo de ganancias es el menor conjunto convexo que contiene a dichos puntos. Por lo tanto será el contorno de esos puntos. Sea por ejemplo la bimatriz de un juego, de la siguiente figura. Se marcaron con un * los resultados dominantes de columna y con un ' los dominantes de fila. Se aprecia por lo tanto que la estrategia a2, b3 es un equilibrio puro de Nash y que además es Pareto eficiente.

B b1 b2 b3

A a1 2*,-1 -1,2' 1,0 a2 1,1' 3*,0 2*,1'

Figura 3-138

El conjunto convexo de ganancias se muestra en la figura 3-139.

Page 179: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 3 Secuenciales

179

Figura 3-139

Cualquier punto del interior de este conjunto podría ser una estrategia conjunta entre ambos jugadores, sea pura (un punto ya existente en la bimatriz) o mixta (un punto cualquiera no perteneciente a la bimatriz). Esta estrategia podría incluso provenir de un acuerdo cooperativo entre los jugadores, aunque no coincida con un resultado de la teoría.

3 Secuenciales Los juegos secuenciales se presentan a menudo. Ejemplos habituales son por ejemplo: • un comprador hace una oferta y el vendedor debe decidir si acepta o no, • un político debe decidir si realiza una costosa campaña, observando la decisión de su oponente. Al igual que los juegos simultáneos, los secuenciales pueden representarse en forma normal o en forma extensiva.

a Formas del juego

Forma extensiva En la forma extensiva, es decir con un diagrama de árbol, se encuentra implícito el orden del juego, por lo cual es más adecuada para los juegos secuenciales.

Page 180: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

180

Figura 3-140

Observar en la figura que se colocaron distintas acciones de B en cada estrella. Esto se hizo así pues en un juego secuencial no es imprescindible que las acciones de un jugador en las distintas estrellas sean las mismas.

Forma normal La representación normal de un juego secuencial requiere modificar las acciones del jugador B que sigue al primero A, pues dado que modelan un juego sucesivo, cada acción de B debe contemplar la reacción para cada una de las acciones que A previamente ha decidido.

Juego simultáneo Tomando como ejemplo el juego 2×2 de la figura anterior, las acciones de B son solo 2, (b1 y b2) y la tabla de ganancias es de 2×2.

Juego secuencial Tomando el mismo ejemplo, las acciones del segundo jugador B, deben ser 4: (b1|a1 o b3|a2), (b1|a1 o b4|a2, (b2|a1 o b3|a2), (b2|a1 o b4|a2). La tabla de ganancias será de 2×4, como se muestra en la figura 3-141. De esta forma, cualquier acción que elija B, contiene la respuesta a la acción que elija A, exactamente como si se actuara en forma sucesiva.

B b1|a1 o b3|a2 b1|a1 o b4|a2 b2|a1 o b3|a2 b2|a1 o b4|a2

A a1 G(b1|a1) G(b1|a1) G(b2|a1) G(b2|a1)a2 G(b3|a2) G(b4|a2) G(b3|a2) G(b4|a1)

Figura 3-141

Por razones de simplicidad podría sobreentenderse la condicionalidad y entonces la tabla quedaría como en la figura siguiente (la primera acción de B es |a1 y la segunda es |a2).

A

B

B.

a1

a2

G(b1|a1)

G(b2|a1)

G(b3|a2)

G(b4|a2)

b1

b2

b3

b4

Page 181: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 3 Secuenciales

181

B b1b3 b1b4 b2b3 b2b4

A a1 G(b1|a1) G(b1|a1) G(b2|a1) G(b2|a1)a2 G(b3|a2) G(b4|a2) G(b3|a2) G(b4|a1)

Figura 3-142

Se aprecia así que las columnas están formadas por las combinaciones de cada una de las acciones de B de una estrella con cada una de las otras estrellas. Por ejemplo: • en un juego de 2×3, B tendrá 3*3 = 9 acciones. • en un juego de 3×2, B tendrá 2*2*2 = 8 acciones. • en un juego de m×n, B tendrá mn acciones.

b Subjuego Es una parte de un juego, que al ser separado, constituye por sí mismo un juego independiente. Debe cumplir las siguientes propiedades: 1. Comenzar en un solo nodo. 2. Contener todos los sucesores de ese nodo en el árbol. 3. Contener todos los nodos de los conjuntos de información que incluya el subjuego. Todo juego con información perfecta, IP, tiene subjuegos. Un juego con información imperfecta, II, no puede tener más subjuegos que el mismo pues debe comprender en forma completa al conjunto de información. Sin embargo, los juegos pueden contener ambas modalidades, con subjuegos con IP y subjuegos con II. Se resuelven cada uno de los subjuegos y luego se colocan los resultados en el juego general.

c Equilibrios

Forma extensiva

Condición suficiente La condición suficiente para resolver un juego en forma extensiva es la siguiente: Un equilibrio es perfecto en subjuegos si cada jugador lo hace en forma óptima (ganancia dominante) en cada subjuego. Todas las estrategias que no satisfacen esta condición, se llaman imperfectas.

Inducción hacia atrás El procedimiento para construir un equilibrio perfecto en subjuegos es el principio de inducción hacia atrás, basado en el conocimiento común (página 151). Se busca la mejor estrategia mirando hacia adelante y razonando hacia atrás. • R

El último jugador actuará racionalmente => se comienza hallando la ganancia dominante de cada uno los subjuegos finales (se elige esa rama de cada una de las estrellas finales, marcándola por ejemplo con una flecha).

• S(R) El penúltimo jugador sabe que el último jugador actuará racionalmente => se retrocede en el árbol hallando la ganancia dominante de cada subjuego mayor que anida a los

Page 182: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

182

últimos (nuevamente se elige y se marca con una flecha a una rama de cada estrella penúltima, lo cual descartará a las estrellas finales existentes no elegidas).

Se sigue con el conocimiento común hasta llegar al principio del juego. El camino continuo de ramas con flechas que resulta, se llama Trayectoria o Sendero del equilibrio. Esta solución es un equilibrio perfecto en subjuegos pues es dominante en todos los subjuegos La inducción hacia atrás no puede ser usada en juegos simultáneos pues existen nodos desde los cuales no se puede observar todo lo que ha pasado (conjuntos de información con más de un nodo), los cuales impiden aplicar este principio. En estos juegos debe utilizarse la solución del equilibrio de Nash, antes estudiado para estos juegos.

Teorema de Nash En realidad se trata de un caso particular del teorema ya visto (página 156), para juegos secuenciales. Los juegos finitos de información perfecta, tienen al menos un equilibrio perfecto en subjuegos. Esto es simplemente la consecuencia de que la inducción hacia atrás necesariamente termina después de una serie de pasos. Si existiera algún empate entre 2 acciones, se deberían realizar 2 diagramas, uno por cada una de las elecciones. Observar entonces que, a diferencia de los juegos simultáneos, en los juegos secuenciales siempre existe un equilibrio en estrategias puras.

Ejemplo En el ejemplo del siguiente árbol, se han marcado con una flecha las ramas que en cada estrella tienen las mayores ganancias, comenzado desde el final. Recordemos que las ganancias se colocan al final del árbol, en el orden de los jugadores. Así por ejemplo, en la estrella (subjuego), ubicada en la parte superior derecha del árbol, las ganancias del jugador C son 3 para la rama superior y 1 para la inferior, por lo cual se resaltó la superior c1. Análogamente para la estrella que se encuentra por debajo se resaltó la rama superior, pues 5 es mayor que 1. El siguiente paso es analizar las estrellas penúltimas. Siguiendo con el ejemplo, se resaltó la rama superior b1 pues 3 es mayor que 2. Se continúa con este proceso hasta llegar al inicio del árbol. El sendero del equilibrio será, por lo tanto, el conformado por las ramas superiores y el equilibrio se conforma con las ganancias (4, 3, 3). Notar que el jugador A obtiene una ganancia de 4 aunque existe una ganancia mayor de 5, la cual no es alcanzada por la racionalidad de los otros jugadores. El estudiante puede averiguar si en este juego el orden importa, colocando a los jugadores en por ejemplo, el orden BAC y resolviendo nuevamente el equilibrio (las ganancias no cambian de valor, solo de ubicación).

Page 183: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 3 Secuenciales

183

Figura 3-143

Forma normal En la forma normal equivalente aparecen tanto los equilibrios perfectos como los imperfectos. Esta particularidad se analizará con un ejemplo en el siguiente problema resuelto.

Estrategias dominadas y la inducción hacia atrás La eliminación de ramas de la inducción hacia atrás de la forma normal es equivalente a la eliminación de estrategias dominadas de la forma normal. Esto se cumple siempre, pero debe tenerse una precaución por la existencia de estrategias débilmente dominadas, debiendo seguirse, por las dudas, el mismo orden de eliminación de ramas de la inducción hacia atrás, para obtener igual resultado. A modo de ejemplo, en la siguiente figura se presenta un ejemplo en el cual el equilibrio de Nash (100, 100) se pierde si se eliminan las estrategias débilmente dominadas correspondientes a su fila o columna.

(1, 1) (100; 0)

(0, 100) (100, 100)

Figura 3-144

En la figura que sigue, si se eliminan las estrategias dominadas en un orden distinto, se obtienen diferentes resultados. Si la columna dominada se elimina primero, queda la columna derecha. Si la fila dominada se elimina primero, queda la fila inferior.

(0, 0) (0; 1)

(1, 0) (0, 0)

Figura 3-145

A

B

B.

a1

a2

C

C.

C..

C...

b1

b2

b1.

b2.

4,3,3

4,4,14,2,5

5,5,1

1,4,4

1,5,2

3,3,4

1,2,5

c1

c2c1.

c2.

c1..

c2..

c1...

c2...

Page 184: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

184

d Juegos simultáneos

Simultáneo en forma extensiva Sabemos resolver los juegos simultáneos buscando los equilibrios con su forma normal. Pero ¿es esto equivalente a la resolución con la inducción hacia atrás con la forma extensiva? La respuesta es no. Veamos porque. Recordemos que el equilibrio en la forma normal se basa en colocar flechas según las dominancias de ganancias dentro de cada acción (fila o columna) independientemente de la elección del otro (son simultáneos). Por su parte, la inducción hacia atrás, excepto para el último jugador, las flechas se colocan dentro de las estrategias ya elegidas por los anteriores.

Figura 3-146

A modo de ejemplo, en el juego de la figura anterior las flechas de C corresponden a dentro de b1 o dentro de b2. Luego de C se coloca la flecha de B. Dado que en este caso la acción c1 fue dominante en ambas estrellas, la flecha de B es el resultado de las ganancias dominantes dentro de c1. En este caso existe coincidencia con el procedimiento de la forma normal, lo cual puede corroborarse con el diseño del juego en forma normal que se muestra en la siguiente figura, del cual resulta un equilibrio de Nash para el par b1c1.

C c1 c2

Bb1 3, 3 4, 1

b2 2, 5 5, 1

Figura 3-147

Pero veamos ahora la siguiente figura en la cual se intercambiaron las ganancias de la mitad inferior. La flecha de B debe ser ahora dentro de la estrategia c1c2, la cual deja de ser una acción pura de C (en la tabla 2×2 de la forma normal se correspondería con dentro de diagonal en lugar de dentro de fila o columna).

B

C

C.

b1

b2

3,3

4,12,5

5,1

c1

c2c1.

c2.

|||||||||

Page 185: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 3 Secuenciales

185

Figura 3-148

Este ejemplo muestra que, salvo para el caso particular de estrategias dominantes en ambos jugadores, en un juego simultáneo la inducción hacia atrás no puede aplicarse.

Secuencial con partes simultáneas A modo de ejemplo, observar la forma normal del siguiente juego dado en la forma extensiva. Forma extensiva

Figura 3-149

Forma normal La parte simultánea puede reemplazarse por su solución de equilibrio.

Ejemplo Consideremos las siguientes ganancias.

B

C

C.

b1

b2

3,3

4,15,1

2,5

c1

c2c1.

c2.

|||||||||

A

B

B.

a1

a2

G11

G12

G21

G22

b1

b2

b1.

b2.

B..a3

||||||||||

G31

G32

b1..

b2..

Page 186: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

186

Figura 3-150

Si se resuelve el equilibro de Nash del subjuego simultáneo se obtiene (verificarlo) el equilibrio a1, b1, resultando, por lo tanto el siguiente juego.

Figura 3-151a

La forma normal equivalente es la siguiente.

B b1b1 b1b2

A a1 3, 2 3, 2 a3 4, 6 3, 5

Figura 3-151b

Volviendo a la forma extensiva y resolviendo ahora por inducción hacia atrás, resulta finalmente el camino de equilibrio a3 b1.

A

B

B.

a1

a2

3,2

0,1

1,5

-1,3

b1

b2

b1.

b2.

B..a3

||||||||||

4,6

3,5

b1..

b2..

A

3,2a1

B..a3 4,6

3,5b2..

b1

Page 187: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 3 Secuenciales

187

Figura 3-152

e Racionalidad secuencial y credibilidad Los equilibrios imperfectos conformados por caminos del árbol que contienen flechas no elegidas en una etapa posterior, presentan dos características.

Racionalidad secuencial Los caminos de equilibrios imperfectos no serían elegidos por un jugador racional pues no obedecen a una dominancia en ganancias. Esta propiedad de la inducción hacia atrás se llama Racionalidad Secuencial, pues implica que cada jugador actuará en forma racional en todo punto del juego.

Credibilidad Se llaman movidas estratégicas a las acciones realizadas afuera del juego, que lo transforman. Dos de estas acciones son las promesas y amenazas (según el carácter de la acción), cuyo cumplimiento generalmente tiene un coste para el jugador que la efectúa. En el caso de que un jugador prometa elegir un equilibrio imperfecto, es decir una estrategia que contradiga su dominancia en ganancias, realiza lo que se llama una amenaza (o promesa) no creíble y es por esto que un problema de credibilidad siempre acompaña a estas acciones. Por el contrario, una amenaza (o promesa) resulta creíble si para el jugador que la realiza es dominante en ganancias. La promesa es un ritual en los políticos en campaña, quienes realizan promesas que luego no pueden cumplir por los costos que les acarrea, perdiendo credibilidad. Las estrategias imperfectas no son dominantes en ganancias en algún momento del juego, por lo cual presentan un problema de credibilidad.

Problema resuelto 3.50 Educación parental

Considerar un juego entre un padre y su hijo. El hijo puede elegir entre ser Bueno (B) o Malo (M). El padre puede Castigar (C) o No castigar (N). Consideremos como referencia a la ganancia del hijo BN como 0. Además el hijo tiene una ganancia de 1 siendo M y se le resta –2 si es castigado C. Por lo tanto la ganancia del hijo si MN es 1, si MC es 1–2 = –1 y si BC es 0 – 2 = –2. Por su parte las ganancias del padre que no castiga suben –2 si el hijo se comporta M y 0 si se comporta B.

A

B

B.

a1

a2

3,2

0,1

1,5

-1,3

b1

b2

b1.

b2.

B..a3

||||||||||

4,6

3,5

b1..

b2..

Page 188: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

188

Además el padre que castiga obtiene –1. Por lo tanto, la ganancia del padre si BN es 0, si BC es 0–1=–1, si MN es –2 y si MC es –3. Si el hijo juega primero y el padre reacciona observando su comportamiento, a) dibujar la forma extensiva (el árbol del juego) y encontrar el camino del equilibrio, b) dibujar la forma normal y encontrar los equilibrios de Nash.

Solución

a) Representación extensiva de un juego secuencial

Figura 3-153

Aplicando la inducción hacia atrás, se encuentra que el equilibrio del juego es M, NN, el óptimo para el Hijo es Malo, por lo que el Padre elige No castigar. Se podría argumentar que no es necesario agregar que en el nodo 2, el Padre elegiría N (primera N de la estrategia M, NN) pues ese nodo no es alcanzado nunca si el Hijo elige el nodo 3. Sin embargo, este razonamiento es incorrecto pues el equilibrio resulta de pensar todas las alternativas. Si el Hijo llegara al nodo 2, el Padre elegiría N y si llegara al nodo 3, el Padre elegiría N. Como entre estas 2 estrategias del Padre, la dominancia en ganancias para el Hijo es el nodo 3 (1 es mayor que 0), el Hijo elegiría este nodo. b) Representación normal de un juego secuencial El Padre tiene 4 estrategias, pues debe contemplar lo que hará el Hijo.

Padre

CC CN NC NN

Hijo Bueno –2, –1 –2, –1 *0, 0' 0, 0' Malo *–1, –3 *1, –2' –1, –3 *1, –2'

Figura 3-154

Las 4 estrategias del Padre, son: • CC. Castigar si es Bueno o Castigar si es Malo (Castigar siempre). • CN. Castigar si es Bueno o No castigar si es Malo. • NC. No castigar si es Bueno o Castigar si es Malo. • NN. No castigar si es Bueno o No castigar si es Malo (No castigar siempre). Se marcaron con * las ganancias dominantes del Hijo dentro de las estrategias del Padre y con ' las de Padre dentro de las estrategias del hijo. Los equilibrios de Nash son los sombreados (pues contienen 2 marcas en una misma celda), a saber:

Hijo

Padre.Padre

1,-2-1,-30,0-2,-1

B M

C N C. N.

1

32

Page 189: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 4 Teoría de las decisiones económicas

189

1. (M, NN) El Padre decide jugar: No castigar si es Bueno o No castigar si es Malo y el óptimo para el Hijo es Malo. Por lo tanto el Padre elige No castigar.

2. (M, CN) El Padre decide jugar: Castigar si es Bueno o No castigar si es Malo y el óptimo para el Hijo es Malo. Por lo tanto el Padre elige No castigar.

3. (B, NC) El Padre decide jugar: No castigar si es Bueno o Castigar si es Malo y el óptimo para el Hijo es Bueno. Por lo tanto el Padre elige No castigar.

El equilibrio de Nash 1 es coincidente con el equilibrio perfecto obtenido con la forma extensiva. Los dos equilibrios de Nash restantes son equilibrios imperfectos, más fáciles de detectar en la forma normal y que presentan las siguientes características derivadas de la dominancia en ganancias. Por último los equilibrios (M, NN) y (M, CN) son equivalentes pues producen las mismas ganancias. Observar que si se eliminan las estrategias débilmente dominadas de la forma normal (columnas CC, CN y NC y luego la fila Bueno), se obtiene la celda del equilibrio de Nash (M, NN), igual a las del equilibrio perfecto de la inducción hacia atrás de la forma extensiva.

Racionalidad secuencial Estos equilibrios imperfectos contradicen la propiedad de la Inducción hacia atrás, llamada Racionalidad Secuencial, por la cual cada jugador actúa en forma racional en todo punto del juego. Así por ejemplo, en el equilibrio (B, NC) el Hijo es Bueno y el Padre elige No castigar (el cual, por otra parte, aparece como el más consistente), se elimina en la forma extensiva pues si el Hijo es racional nunca elegiría el nodo 2, dada la racionalidad del Padre.

Credibilidad Estos equilibrios imperfectos contienen una promesa no creíble, pues contradicen la dominancia en ganancias de algún jugador.

f Aplicación: juego de ajedrez Veamos someramente el procedimiento para analizar por computadora el juego secuencial de ajedrez. Los computadores no pueden pensar pero el programa contiene un diagrama de árbol con las jugadas más comunes (digamos 20) que pueden hacerse en cada situación. Las ganancias se establecen de acuerdo a la importancia de cada pieza. La computadora decide su movimiento aplicando el principio de inducción hacia atrás. Si por ejemplo fueran 20 alternativas por cada jugada y el programa analizara un árbol de 5 jugadas sucesivas, se tendrían 205 = 32000000 posibilidades para analizar en los 3 minutos asignados a cada jugada. Si bien no es posible para el computador tener almacenado el árbol completo pues se estiman en alrededor de 101050 jugadas de ajedrez, estos programas pueden ganarle actualmente a cualquier oponente (incluidos los campeones de ajedrez). En esta introducción he presentado los conceptos básicos de la teoría de los juegos. A partir de aquí el lector que lo desee puede profundizar en la abundante bibliografía existente, agregando nuevos conceptos como, subastas, negociaciones, arbitrajes, votaciones, etc.

4 Teoría de las decisiones económicas Es un caso particular de la Teoría de los Juegos en la cual solo interviene un jugador contra la naturaleza. Trata de establecer algún criterio que permita a una persona elegir una de varias alternativas económicas que se presenten en condiciones de incertidumbre.

Page 190: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

190

a Formas de la decisión

a Forma extensiva Es el formato habitual dado que intervienen eventos aleatorios de estados de la naturaleza. Con el objeto de favorecer el cómputo de las ganancias dominantes, en la teoría de decisiones económicas suele complementarse el árbol expresando los nodos de los eventos con un círculo y el nodo del jugador con un rectángulo. Dentro del círculo se coloca el valor esperado de las ganancias correspondientes a ese nodo y dentro del cuadrado la ganancia dominante, es decir el valor máximo de las esperanzas de las acciones que se derivan de ese cuadrado. Se deja la decisión de utilizar o no esta notación a juicio del lector. En la figura siguiente, G1 y G2 expresan los valores esperados de las respectivas estrellas, es decir:

1 11* 11 12* 122 21* 21 22* 22

G G p G pG G p G p

= += +

Figura 3-155

Árbol de decisiones

b Forma normal La tabla de decisiones es una tabla de doble entrada con las acciones controlables por el usuario en la primera columna y los eventos de la naturaleza incontrolables o aleatorios en la primera fila. En realidad son 2 tablas en una. La que contiene las ganancias y la que contiene las probabilidades. Esta última es en realidad una tabla de contingencias (con frecuencias relativas) que cruza las variables Acciones y Eventos.

Naturaleza e1 e2

Acciones a1 G11, p11 G12, p12 a2 G21, p21 G22, p22 a3 G31, p31 G32, p32

Figura 3-156

Tabla de decisiones

Gdominante

G1

G2

a1

a2

G11

G12

G21

G22

p11

p12

p21

p22

A

Page 191: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 4 Teoría de las decisiones económicas

191

Problema resuelto 3.51 Mejor inversión

Un operador desea invertir 100$ ¿Cuál de las 3 siguientes es la mejor inversión? a1: acciones A cuya probabilidad de aumentar en un año a 110$ es 0.85 y la de decrecer a 95$ es 0.15, a2: acciones B cuya probabilidad de aumentar en un año a 140$ es 0.67 y la de decrecer a 40$ es 0.33, a3: plazo fijo al 5% anual.

Árbol de decisiones

Figura 3-157

Árbol de decisiones Como ya sabemos, la construcción del árbol se realiza de izquierda a derecha pero el llenado de los valores numéricos de las ganancias se hace aplicando el principio de inducción hacia atrás (página 181), de derecha a izquierda. Observar que se ha remarcado con flechas el camino del equilibrio y que se han colocado además las ganancias esperadas o dominantes en cada nodo, según corrsponda.

Tabla de decisiones Se muestra en la figura 3-158. El primer valor de cada celda es la ganancia para cada evento y el segundo la probabilidad de cada evento.

E1 E2 E(G)

Acciones a1 10, 0.85 -5, 0.15 7.75 a2 40, 0.67 -60, 0.33 7 a3 5, 1 0, 0 5

Figura 3-158

Distribución de x=G Las ganancias de cada alternativa son:

a1 ( ) 7.75$E G =a2 ( ) 7$E G = a3 ( ) 5$E G =

Por lo tanto, si se adopta el criterio de maximizar este valor, deberá elegirse la alternativa a1.

7.75.

7.75

0

Invertir

No Invertir

7.75..

7

5

a1

a2

a3

10

-5

40

-60

5.

0.85

0.15

0.67

0.33

1

Page 192: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

192

Aplicación del teorema de Bayes Las probabilidades incluidas en el árbol de decisiones pueden actualizarse mediante la aplicación del teorema de Bayes, estudiado en el capítulo 2, originando un árbol de probabilidades anexo al árbol de decisiones.

Problema resuelto 3.52 Acciones y la economía

Antes de tomar una decisión, el operador del problema resuelto anterior desea evaluar el comportamiento de las acciones según las condiciones de la economía. Tomando como base a la experiencia, sabe que: • cuando las acciones A suben, el 90% del tiempo ha habido prosperidad económica • cuando las acciones A bajan, el 60% del tiempo ha habido recesión económica • cuando las acciones B suben ,el 95% del tiempo ha habido prosperidad económica • cuando las acciones B bajan, el 50% del tiempo ha habido recesión económica En el momento de la inversión, la situación era de prosperidad. Revisar las probabilidades a priori del ejemplo 3.5, a la luz de la nueva información.

Figura 3-159 Árboles de probabilidades condicionales

Por consiguiente, utilizando el teorema de Bayes para calcular las probabilidades a posteriori de la nueva evidencia, llamando S al evento Sube y B al evento Baja, resultan: Para la acción A:

0.765( | ) 0.9280.765 0.06

P S P = =+

( | ) 0.206P B P = Para la acción B:

0.6365( | ) 0.7940.6365 0.165

P S P = =+

( | ) 0.072P B P = Las probabilidades de la inversión a plazo fijo, no cambian. Las ganancias actualizadas de cada alternativa, resultan ahora:

.

Sube0.85

P

R

0.90

0.10

Baja0.15

P.

R.0.60

0.40

Acciones A

0.765

0.085

0.06

0.09

.

Sube0.67

P

R

0.95

0.05

Baja0.33

P.

R.0.50.

0.50

Acciones B

0.6365

0.0335

0.165

0.165.

Page 193: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 4 Teoría de las decisiones económicas

193

a1 ( ) 8.25$E G =a2 ( ) 27.4$E G =a3 ( ) 5$E G =

Por lo tanto, decisión óptima es ahora invertir en la acción B.

b Caso particular: una sola acción Un caso particular del anterior se presenta cuando existe una sola acción voluntaria elegida y controlada por el usuario: la de participar, la cual contiene varios eventos aleatorios. En realidad, en forma implícita, esta acción siempre se contrasta con la acción de no participar, pero esta acción no tiene eventos y su E(G) = 0. En este contexto, el árbol de decisiones es un caso particular del caso anterior y se muestra en la figura 3-160.

Figura 3-160

Árbol de decisiones

La decisión se corresponde con el siguiente criterio.

Criterio del signo del valor esperado • Si E(G) > 0 => decisión favorable (a la larga conduce a la fortuna) • Si E(G) < 0 => decisión desfavorable (a la larga conduce a la ruina) • Si E(G) = 0 => decisión neutra.

Problema resuelto 3.53 Rifa para juntar fondos

a) Determinar el valor C, que debe tener una rifa para juntar fondos de 1000 números y con un premio de 200$, si se desea que sea equilibrada. b) ¿Cuál es el valor esperado si C = 1$? c) ¿Cual deberá ser el premio si C = 1$ y la rifa es neutra? a)

Tabla de decisiones Como alternativa de presentación se han colocado las probabilidades en una fila separada de las ganancias.

AE(G)

E(G)

0

a1:participar

a2: noparticipar

G1

G2

p1

p2

Page 194: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

194

Eventos S Pierde Gana G = g -C 200-C p(g) 999/1000 1/1000

Figura 3-161 Distribución de x=G

Árbol de decisiones

Figura 3-162 Árbol de x=G

Operando para un juego neutro: 999 200( ) 0

1000C CE G − + −

= =

Por lo tanto: 0.20$C =

b) Reemplazando el valor de C en la ecuación de E(G), resulta E(G) = -0.80$ c) Reemplazando en E(G) = 0, el valor de C y el número 200 por una variable P (premio), resulta P = 1000$.

Problema resuelto 3.54 Costo de la prima de seguros

a) Determinar la prima anual C para un seguro de daños de un auto de 10000$. La póliza cubre siniestros que por experiencias previas ocurren 1 de cada 200. Basar el cálculo en E(G)=0, es decir sin ganar ni perder. Luego se agregarán las utilidades y los gastos administrativos. b) Comparar las siguientes acciones: a1: situación anteriormente descripta. a2: persona que no compra el seguro. a)

Tabla de decisiones Eventos S No Siniestro Siniestro G = g -C 10000-C p(g) 199/200 1/200

Figura 3-163 Distribución de x=G

E(G)

-C

200-C

999/1000

G

1/1000

Page 195: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 4 Teoría de las decisiones económicas

195

Árbol de decisiones

Figura 3-164 Árbol de x=G

Operando para un juego neutro: 10000( ) 0

200E G C= − + =

Por lo tanto: 50$C =

b)

Tabla de decisiones Eventos S No Siniestro Siniestro a1 -50 9950 a2 0 -10000 p(g) 199/200 1/200

Figura 3-165 Distribución de x=G

Árbol de decisiones

Figura 3-166

El E(G) de a1 es 0 y el de a2 es -50$. Por lo tanto si se adopta el criterio de maximizar este valor, se deberá elegir la acción a1, es decir contratar el seguro.

E(G)

10000-C

-C

1/200

G

199/200

1/200

199/200

0

0.

-50

-50.

9950

0..

-10000

199/200.

1/200.

G

Page 196: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

196

Prob

Una rulcasino pcolumnnúmerojuego se

a)

b)

c)

blema res

leta europea (sipaga 36$ por c

na hay 12 plenoo 17 (pleno), b)ea neutro?

Capí

suelto 3.5

in doble 0), tiecada pleno y paos y por lo tant) calle, c) negro

S G = p(g)

(E G

S G = p(g)

(E G

ítulo 3 Distrib

Jorge

55 Ruleta

ene números deara el resto de lo se pagará 36o (color). Ver f

F

no sag 3

FDistribución

36) 137

G = − +

no sag 3

FDistribución

34) 137

G = − +

buciones de P

e Carlos Carr

a europe

el 1 al 36 (18 rolas jugadas en /12, es decir 3$figura 3-167. d

Figura 3-167 Ruleta

Eventosale el 17 sa-16/37

Figura 3-168 de probabilida

1 135

37 3+ = −

Eventoale la calle

-134/37

Figura 3-169 de probabilida

3 11137 37

+ = −

Probabilidade

a

ojos, 18 negrosforma proporc$). Hallar la E(

d) ¿Cuánto deb

ale el 17 35

1/37

ades de G

1 0.027$7

= −

os sale la calle

11 3/37

ades de G 1 0.027$7

= −

es

s y el 0 de coloional (por ejem(G) si se apuesería pagar la b

$

or verde). El mplo en cada sta 1$ a: a) al anca para que el

Page 197: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

IV Teoría de los juegos – 4 Teoría de las decisiones económicas

197

Eventos S colorado o cero negro G = g -1 1 p(g) 19/37 18/37

Figura 3-170 Distribución de probabilidades de G

19 18 1( ) 1 1 0.027$37 37 37

E G = − + = − = −

d)

Figura 3-171

Distribución de probabilidades de G Por lo tanto:

1 36( ) ( 1) 037 37

E G C= + − =

Despejando resulta: 36$C =

A partir de este valor, puede concluirse que la Posibilidad de Pago, PP, definida en el capítulo 2 (página PP2), resulta:

36 361

GPPA

= = =

En síntesis y generalizando, si el juego es neutro, las posibilidades de pago resultan ser iguales a las posibilidades en contra de ganar, en este caso, 36:1. Naturalmente, los casinos fijan las posibilidades de pago en un valor inferior, en este caso 35:1 (una ganancia del jugador de 35$ por cada 1$ colocado en un pleno, equivale a un monto total de 36$).

Problema resuelto 3.56 Estrategias de ventas

Un comercio A vende una mercadería a 280$. Otro comercio B la vende a 300$ pero regala una rifa de 1000 números con un premio único de 10000$. ¿Dónde conviene comprar? Calculemos la distribución de la ganancia de comprar en B, respecto de comprar en A.

Eventos S no gana gana G = g -20 10000-20 p(g) 999/1000 1/1000

Figura 3-172 Distribución de probabilidades de G

De aquí que la ganancia de comprar en B respecto de A, resulta: ( ) 10$E G = −

Por lo tanto conviene comprar en A.

.

Sale

No sale

C

-1

1/37

36/37

Page 198: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

198

Page 199: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

V Simulaciones – 4 Teoría de las decisiones económicas

199

V Simulaciones

1 Simulación de distribuciones

En el capítulo 2, sección simulaciones, hemos utilizado la serie de frecuencias acumuladas de una distribución particular en estudio para recodificar números aleatorios uniformes a esa distribución. En esta última sección del capítulo 3, justificaremos esa construcción. También hemos adelantado que bajo el nombre de Método Monte Carlo o Simulación Monte Carlo, SMC, (ver figura 3-173), se agrupan una serie de procedimientos que reproducen por muestreo aleatorio, distribuciones poblacionales arbitrarias F(x)14 de variables aleatorias x, normalmente con la intervención de la computadora. Estas características que son parte esencial de un algoritmo por SMC. Llamaremos NAF a los Números Aleatorios de cualquier distribución F(x). Si por ejemplo la F(x) en estudio es normal, se generarán NAN, si es exponencial, NAE, etc.

Figura 3-173

Simulación Montecarlo SMC

Los paquetes de software que contienen técnicas estadísticas disponen en general de números aleatorios que generan varios de los modelos vistos en este capítulo (ver resumen para SPSS y EXCEL en el apéndice B). El procedimiento que veremos a continuación es válido para la generación aleatoria de cualquier distribución, sea o no uno de los modelos vistos y se inicia con un generador de Números Aleatorios Uniformes, NAU15. En este caso, al esquema anterior se le agrega este generador, como se muestra en la figura 3-174.

14 Simbolizamos con F(x) a la probabilidad acumulativa P(X < x). 15 Una utilización de los mismos fue realizada en el capítulo 2, página NAU2.

Page 200: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

200

Figura 3-174 SMC con NAU

Recordemos del capítulo 2, que existen 3 pasos en la obtención de una simulación:

1 Población Definida con su distribución de probabilidades y por lo tanto es conocida su F(x).

2 Muestra: Método de la CDF inversa Uno de los métodos de generación de NAF de cualquier distribución, se llama de la CDF inversa, ya utilizado intuitivamente en el capítulo 2, aún sin conocer su nombre.

Propiedad de las CDF Sea una función cualquiera F(x). Se cumple siempre que:

( ) ( )1( ) ( ) ( ) ( )G y P F X y P X F y P X x−= ≤ = ≤ = ≤ .

En el ejemplo de la figura 3-175, izquierda es: 1(0.52) ( ( ) 0.52) ( (0.52) ( 6.02)G P F X P X F P X−= ≤ = ≤ = ≤

Pero hasta ahora no conocemos su valor. Si además la F(x) es la CDF de x, podemos conocer la función ( )G y pues el penúltimo miembro es:

( ) ( )1 1( ) ( ) ( )G y P X F y F F y y− −= ≤ = =

Por lo tanto se trata de una CDF ( )G y igual a una recta a 45° (ver figura 3-175, centro). Su PDF, ( )g y es entonces una distribución uniforme comprendida entre 0 y 1, y por lo tanto igual a 1 (ver

figura 3-175, derecha). La CDF de una CDF es una distribución uniforme comprendida entre 0 y 1.

Figura 3-175

Método CDF inversa

Esta propiedad se utiliza para generar un muestreo aleatorio de una x, conocida su CDF, ( )F x , procediendo de forma inversa al desarrollo anterior (ver nuevamente la figura): 1. y

Se genera un NAU y. Supongamos que éste valor es y = 0.52. 2. 1( ) ( )y F x x F y−= ⇒ =

Analíticamente Igualamos la ecuación de F(x) a este número y despejamos la x. Gráficamente Lo buscamos en el eje de ordenadas de la CDF a simular (si admitimos que la distribución es

Page 201: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

V Simulaciones – 4 Teoría de las decisiones económicas

201

discreta, podríamos tomar el siguiente mayor es decir: 0,80). Bajamos al eje x, de donde extraemos el valor final de la simulación de x = 6.02.

Nota Si los elementos a muestrear son objetos, los NAU deben ser enteros, por lo cual se deberá multiplicar a los anteriores NAU entre 0 y 1 por el tamaño de la muestra, n y obtener así NAU entre 0 y n.

3 Repetición Se repite el procedimiento para obtener varias muestras que luego se podrán aplicar al proceso en estudio. En los programas informáticos, tal como el SPSS, existen en forma directa números aleatorios de la mayoría de las distribuciones teóricas vistas en este capítulo (ver resumen en el apéndice B), pero el método anterior de SMC permite resolver cualquier tipo de distribución y por lo tanto encarar, aunque sea en forma aproximada, problemas que por su complejidad no podrían ser estudiados por los alumnos. Por otra parte, y dada la fructífera relación modelo-experiencia inherente al método, se recomienda su utilización, aún en los casos en los que la resolución matemática del problema sea sencilla.

Problema resuelto 3.57 Simulación Montecarlo

Dada la siguiente distribución arbitraria de x, a) simular un muestreo aleatorio para hallar la P(x = 2) en 40 extracciones. b) Confrontar luego con el valor teórico: b(2,40,0.34).

x 0 1 2 3 P(x) 0.20 0.25 0.34 0.21

Figura 3-176 P(x)

a)

1 Población Se conforma la siguiente tabla, en la que se definen los intervalos, para ubicar los NAU, por ejemplo entre 0 y 100.

x 0 1 2 3 u= F(x) 0-19 20-44 45-78 79-99

Figura 3-177 CDF inversa

El lector observará que este proceso de codificación de valores ya fue utilizado en el capítulo 2.

2 Muestra Se generan NAU entre 0 y 100

3 Repetición Repitiendo el paso 2 se conforma una tabla como la siguiente, en donde se tildan las veces que este valor se encuentra entre 45 y 78. Se deja al lector el llenado de esta tabla, usando el generador que prefiera (tabla, calculadora, SPSS, urna con 100 papeles, etc).

nEsale 2

no sale 2

Page 202: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

202

Figura 3-178 P(x = 2)

b) Confrontar el valor anterior con:

2 (40,0.34) 0.118 11.8%b = =

2 Simulación de juegos

ComLabGames No hay mejor manera para entender las estrategias de un juego que jugar con otros. Para esta función se han creado algunos programas informáticos. ComLabGames (Computational Laboratory Games) es un software libre implementado en Java, creado por Robert Miller, Marko Gorbelnik y Vesna Prasnikar de la universidad Carnegie Mellon, Graduate School of Industrial Administration. Permite correr y analizar los resultados de juegos entre computadoras conectadas por Internet o dentro de una red. Una PC (server) actúa como moderadora, en donde el moderador diseña el juego y en las restantes PC (clientes) están los jugadores, quienes pueden actuar simultáneamente o secuencialmente. Pero además de poder simular escenarios y testear hipótesis acerca del comportamiento humano, esta simulación, al igual que la simulación Monte Carlo, podrá crear datos experimentales para luego analizarlos estadísticamente. Para dar al juego un incentivo que semeje a la realidad y motivar a los participantes a probar la eficacia (o no) de aprender la teoría de estrategia de juegos, se suele ofrecer como incentivo una ganancia proporcional a la obtenida por cada estudiante al final del juego, la cual puede extraerse de un pago inicial requerido a cada participante. Se dividirá esta sección en 2 partes: a. Moderador b. Cliente

a Moderador El creador del juego se llama moderador y es el que define el juego. Desde la página con el nombre de este software descargar y ejecutar el archivo ComLabGame, versión 0.4: clg_standalone.jar. Se abre la siguiente ventana, con la pestaña Design (Diseño) pre-seleccionada. Observar que figura el nombre Server en la parte superior para indicar que se trata de la computadora del moderador.

Page 203: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

V Simulaciones – a Moderador

203

Figura 3-179

Se aprecia que las pestañas siguen la secuencia normal de un proceso de investigación: 1. Design: diseño del juego. 2. Assignment: asignación de parámetros específicos del juego, tales como número de

repeticiones, duración, etc. 3. Execution: análisis del juego. 4. Data: resultados de la simulación. La última ventana Client Play es utilizada por el jugador y no por el moderador.

a Design Los elementos de diseño se muestran en los botones de la columna izquierda. Para incorporarlos al modelo se los debe arrastrar hacia el espacio de trabajo y soltar. Los 3 primeros se refieren a subastas, tipo de juego que no será analizado en esta introducción. Los 2 siguientes se usan para elegir el tipo de diseño: tabla (Matrix) o árbol (Tree entry). Los 3 últimos se utilizan para crear los jugadores (Players) y los estados de la naturaleza (Nature) que modela un jugador especial con decisiones aleatorias. Las Ganancias (Payoff) se aplican específicamente al caso de un diseño por árbol, con las ganancias en los nodos terminales. Con un doble clic en los elementos arrastrados se les cambia el nombre. Con un doble clic derecho se abre una ventana de edición.

Page 204: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

204

HTML El programa acepta algunos comandos de código HTML para editar los nombres. En particular si se desea que el nombre aparezca en varias líneas, colocar una barra invertida \ al comienzo de la nueva línea.

Borrar Para borrar un elemento, seleccionarlo (a varios con el botón Ctrl) y presionar el botón Remove de la barra de herramientas.

Duplicar Con el botón Duplicate se puede duplicar cualquier parte del diseño, previamente seleccionada.

Player Arrastrando un elemento Player (Jugador) al espacio de trabajo, lo incorpora al juego. Cambiarle el nombre con un doble clic sobre el icono. Automáticamente cambiará el color. Si se desea otro color, editar con un clic derecho, seleccionándolo de la ventana de edición.

Matrix (forma normal) Diseño de un juego simultáneo. Arrastrar tantos elementos Player, como jugadores existan en el juego y Nature, en el caso de que existan estados aleatorios de la naturaleza. Arrastrar Matrix (matriz) para crear la tabla del juego. Hacer un doble clic derecho sobre Matrix. Se abre la ventana de la siguiente figura para editar la tabla del juego. Se observará que los nombres de los jugadores aparecen en la parte inferior dentro del panel Others y todos los elementos Nature en el panel Nature.

Figura 3-180

Page 205: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

V Simulaciones – a Moderador

205

• Show player's values only Esta opción se usa para determinar si los jugadores solo pueden mirar sus ganancias o también las de los restantes jugadores.

• Simultaneous move Esta opción determina si el juego es simultáneo o sucesivo.

Número de filas y columnas Si se desean agregar filas o columnas arrastrar el icono superior Insert Column a las filas o columnas y soltar. Si se desea borrar alguna fila o columna, arrastrar el icono Remove column y soltar en la que se desea borrar. Asignar el nombre a las acciones con un doble clic en los encabezamientos. El orden entre las acciones puede modificarse arrastrando el encabezamiento a la posición deseada.

Seleccionar jugadores fila y jugadores columna Hacer clic derecho sobre las filas o columnas y seleccionar el jugador de la lista. Alternativamente arrastrar el icono del jugador del panel inferior y soltarlo en filas o columnas. Si se arrastra un tercer jugador, se anida en la tabla. Luego de asignar los jugadores, sus iconos pasan del panel inferior Others al panel Payoffs (Ganancias). Se puede arrastrar un jugador no seleccionado directamente de Others al Payoffs. Este jugador no interviene en las decisiones pero tendrá asignadas ganancias. Si un jugador permanece en Others será solo observador del juego.

Introducir las ganancias Clic en cada celda y escribir la ganancia de cada jugador. En lugar de un valor numérico se puede escribir una función, eligiéndola de un editor de funciones que se abre al hace un clic derecho sobre la celda. Si por ejemplo se desea que la ganancia sea un valor aleatorio entre 10 y 20, se colocaría Uniform(10,20). Guardar el modelo con File > Save. Los archivos tendrán la extensión .mgd. Para volver a abrirlos, ejecutar el programa y luego File > Open.

Tree Entry (forma extensiva) Diseño de un juego secuencial. Arrastrar el nodo inicial Tree Entry (Entrada del árbol) al espacio de trabajo para iniciar el árbol del juego. Editar el nombre con un doble clic sobre él. Para conectar sucesivos elementos al árbol (entrada del árbol, jugadores, estados de la naturaleza y ganancias al nodo final), se tienen 2 formas: • Cuando ambos elementos ya se encuentran en el espacio de trabajo, se selecciona el que va a

recibir la conexión y se arrastra el símbolo + inferior al elemento a conectar. • Con el botón Standard layout de la parte inferior de la ventana seleccionado, se

selecciona previamente el icono al cual va a ser conectado y se arrastra el nuevo elemento del panel izquierdo. En particular y dado que un elemento arrastrado al espacio de trabajo queda seleccionado, se conectará automáticamente con el próximo elemento que se arrastre.

Page 206: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

206

Figura 3-181

El cuadro intermedio que aparece en cada rama se utiliza para colocar el nombre de la acción, con un doble clic. En el caso particular de Nature, es imprescindible colocar la probabilidad correspondiente (en forma absoluta o relativa, pues el programa siempre divide por la suma de los valores colocados). Si se desea poner un nombre a la acción, debe estar separado de la probabilidad por un espacio. En base a estas probabilidades el software utiliza un mecanismo aleatorio para seleccionar las ramas conectadas a Nature.

Simulación de decisiones económicas Observar que un juego con Nature y con un solo jugador, equivale a la situación ya vista en la sección Teoría de las decisiones económicas (página 189).

Simultaneidad Si parte del árbol implica simultaneidad (página 153), hacer clic en el icono de uno de los nodos y arrastrar el símbolo + superior al otro nodo. Se observará que quedarán conectados con una línea punteada para indicar el conjunto de información. Repetir para todos los nodos involucrados. En este caso cualquiera de los 2 jugadores puede elegir su acción pero el movimiento de uno no es observado por el otro hasta después de completar ambos sus movimientos. Comparar con un diseño secuencial, en el cual cada jugador solo podrá mover cuando le llegue el turno.

Introducir las ganancias La tabla de ganancias que se coloca en el nodo final, contendrá todos los jugadores que intervienen en el diseño. Con un doble clic, colocar el valor numérico o función (ver párrafo anterior) en el panel Number del jugador deseado. Con Label > Append, se puede colocar una etiqueta particular para la ganancia de ese nodo.

b Assignment

• Number of subjects Se puede configurar para un mayor número de participantes que el requerido por el juego, para poder repetir el juego para otras personas.

• Number of rounds No olvidar elegir aquí el número de corridas de la sesión.

• Probability to continue Se puede indicar una probabilidad de que el juego continue luego de la última corrida, con el objeto de que el número de corridas sea aleatorio.

Page 207: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

V Simulaciones – a Moderador

207

c Execution Posibilita probar y ejecutar el juego. La dirección y puerto de la computadora del moderador se muestra en la parte superior. Estos datos deben ser informados a los jugadores para que puedan conectarse al juego (ver Client play, más adelante). Si el moderador desea correr varios juegos desde la misma PC (abriendo distintas sesiones del software), debe cambiar la puerta de cada uno de ellos. El nombre del juego aparece al pie de la pantalla.

Definir el ítem de comienzo En el espacio de trabajo, hacer clic en el elemento de comienzo, Matrix o Tree Entry y luego en el botón Toggle start de la barra de herramientas. El icono del elemento toma un color rojo claro para indicar que el juego comenzará por él.

Pruebas

Test session(s) El moderador puede probar el juego antes de conducir el experimento, lo cual le permite visualizar la ventana que verá cada uno de los jugadores (clientes), probar el juego y corregir posibles errores.

Forma normal En la figura siguiente se observa una de estas ventanas (tiene el nombre Client). En este ejemplo se simuló con un clic del mouse que B eligió b2 y A eligió a1. Ninguno de los jugadores ve la elección del otro hasta que ambos confirmen sus elecciones con Continue. Luego se muestra en la celda elegida, un 1 en rojo (en general se verá la frecuencia acumulada absoluta de elecciones para esa celda).

Figura 3-182

Forma extensiva En la figura siguiente se observa la ventana que vería el jugador. Las ramas que cada jugador puede seleccionar se destacan al pasar el mouse por ellas y se eligen con un clic del mouse en el nombre de la acción. En este ejemplo se muestra un juego secuencial, por lo cual luego de que el primer jugador

Page 208: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

208

en el árbol elige su acción, se muestra la misma en la ventana de los restantes jugadores. En el ejemplo de la figura siguiente se simuló que A eligió Entra y luego de verla, B eligió Sale, por lo cual se muestra en la celda inferior de las ganancias de este camino, un 1 en rojo y los totales en la raíz del árbol.

Figura 3-183

Two session(s) Prueba dos sesiones corriendo a la vez, duplicando el número de jugadores.

Trace Windows Muestra informaciones relativas a la prueba.

Start sessións Para correr el juego, el moderador presiona Start sessions y en la barra de estado se observa Started.

Stop sessions Detiene el experimento. En la barra de estado se observa Waiting.

e Data Los datos son almacenados en un archivo en la computadora del moderador, dentro de una carpeta llamada log que se crea dentro de la carpeta en donde se encuentra el archivo del juego. Después de ejecutado el juego ir a Data > Open log. Abrir la carpeta log. Dentro de los iconos que aparecen en la ventana, arrastrar los deseados al panel Viewer.

Page 209: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

V Simulaciones – b Jugador (cliente)

209

Con el icono Matrix de color rojo, se muestran entre otros, el número de sesión, el tiempo que demandó la decisión, el nombre del jugador, el número de celda y las ganancias que recibió cada jugador. Con el icono Matrix de color turquesa se muestra información que el sujeto eligió. Para ordenar los valores en forma ascendente, hacer clic en el encabezamiento de la columna deseada. Con un nuevo clic se ordena en forma descendente. Con la selección adecuada de elementos a la izquierda, se puede parcializar la vista de los datos.

b Jugador (cliente) Los clientes pueden entrar al juego luego de haber sido iniciado por el moderador (ver pestaña Execution, página 208). Cada jugador en su PC debe ejecutar el archivo clg_standalone.jar e ir a la pestaña Client Play (podría ser ejecutado en la misma PC del moderador abriendo otra sesión del programa).

Client Play Tal como se indica en la siguiente figura, se deben ingresar: • Server

datos que provee el moderador, por ejemplo: 192.168.1.47:6789. Notar que luego del IP se colocan dos puntos y el puerto del servidor (9789). Si el jugador usa un navegador en lugar del programa, debe colocar http:// antes de la dirección.

• Username puede ser cualquier nombre.

• Password no es necesario.

Page 210: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

210

Figura 3-184

Presionar el botón Login para conectarse al juego. Se muestra una ventana similar a la de la prueba realizada en la sección anterior, tanto en la PC del jugador como en la del moderador.

Asignación de roles Cada cliente es asignado a un jugador en forma aleatoria, luego de lo cual cada jugador deberá comenzar a jugar eligiendo con el mouse una de las acciones (las de los otros jugadores están desactivadas), en función del rol que se le haya asignado. Presionar el botón Continue, luego de cada selección para confirmarla. En la ventana Execution del moderador, los nombres de los jugadores pasan de color rojo a verde.

Datos Al finalizar el juego se muestra un resumen en la PC del moderador. Pasar los 2 iconos Matrix al panel Viewer, con lo cual se muestran todos los datos de las corridas, tal como se indica en la siguiente figura. Se puede parcializar la información según la selección que se realice con los botones de la izquierda. Si se presiona el botón Statistics, se muestran las medidas de posición (media, mediana y modo) y de dispersión (varianza, mínimo y máximo) de la distribución de ganancias correspondiente a las selecciones realizadas en el panel de la izquierda. Presionando Export table, se puede exportar la tabla como un archivo de texto delimitado por tabulación (tsv, tab separated value), el cual se puede abrir con Excel.

Figura 3-185

La simulación de un juego con jugadores reales provee datos experimentales. En el capítulo 5 nos servirán para probar hipótesis acerca de la cercanía o no de las experiencias con las predicciones teóricas.

Page 211: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

V Simulaciones – b Jugador (cliente)

211

Problema resuelto 3.58 El empresario y el capitalista

Un empresario decide si buscar o no un inversor para un proyecto. En la siguiente figura se muestran las posibles 4 posibles acciones. 1 El empresario ignora la idea y continúa su trabajo, 2 El empresario decide buscar un inversor y el inversor acepta con una probabilidad de falla q. 3 El empresario decide buscar un inversor y el inversor acepta con una probabilidad de éxito p. 4 El empresario decide buscar un inversor y el inversor no acepta. a) Asignar libremente p y q y obtener teóricamente el camino del equilibrio Diseñar el juego con ComLabGame y realizar experimentos (juegos) con jugadores sin conocimientos teóricos acerca de la teoría de juegos. Estos datos experimentales luego podrán ser utilizados para analizar inferencias en el capítulo 5. En particular extraer datos para probar luego las siguientes hipótesis. b) La muestra está de acuerdo con las predicciones teóricas respecto de por ejemplo una selección al azar de los nodos (o cualquier .otra opción). c) Los resultados dependen del tipo de diseño, secuencial o simultáneo (el juego simultáneo no se refiere a la forma normal equivalente del juego secuencial, sino a un diseño distinto de tipo simultáneo).

Figura 3-186

Solución

a) Supongamos que p = 0.50. En este caso y tal como hemos visto en la sección, Teoría de las decisiones económicas en condiciones de incertidumbre, la contribución de los estados de la naturaleza se reemplaza por la esperanza matemática:

( ) 0.5(10) 0.5(100) 55( ) 0.5( 15) 0.5(20) 2.5

E empresarioE Capitalista

= + == − + =

El camino del equilibrio, resulta entonces como se muestra en la siguiente figura, en la cual se incluye la codificación de nodos realizada por ComLabGame en la figura 3-187.

Page 212: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

212

Figura 3-187

El equilibrio perfecto de dominancia en ganancias conduce, con estas ganancias, al equilibrio: Empresario: Busca Inversor –Capitalista. Invierte. b) Para la toma de datos de esta prueba se requiere realizar varias experiencias (al menos 20 repeticiones) para obtener la frecuencia de resultados que conducen a los nodos que predice la teoría, es decir a los nodos 2 y 3. Luego se realizará el análisis comparando este valor con una elección al azar de los nodos (considerando los nodos 2 y 3 como uno solo), utilizando por ejemplo una prueba de la bondad del ajuste (capítulo 1). Se calculará entonces el valor χ2. Sean por ejemplo 20 juegos, con los resultados observados que se muestran en siguiente figura.

Nodos 1 Nodo2 Nodos 3y 4 Total Frec observada 3 5 12 20 Nodo 1 Nodo2 Nodos 3 y 4 TotalFrec esperada 6.67 6.67 6.67 20

Figura 3-188 2 2 2

2 (3 6.67) (5 6.67) (12 6.67) 6.696.67 6.67 6.676.69 0.50

6.69 20C

χ − − −= + + =

= =+

No puede anticiparse ninguna conclusión hasta completar la prueba estadística en el capítulo 5. c) Para esta prueba se requiere crear otro modelo en el cual otro juego se realice en forma Estratégica o Normal (tabla). En este caso se tienen 2 jugadores; Empresario y Capitalista con las ganancias mostradas en la figura 3-189. Observar que ambas celdas inferiores de la forma Normal tendrán igual valor pues si el Empresario Ignora la idea, no interesa la acción del inversor. Se puede apreciar que en este diseño el resultado Empresario Busca Inversor – Capitalista Invierte, es un equilibrio de Nash y que el resultado Empresario Ignora la idea – Capitalista No Invierte, es otro equilibrio de Nash.

Empresario

10,0Capitalista

-5,055,2.5

Busca Inversor Ignorar la idea

Invierte No invierteNodo1

Nodo 4Nodos 2 y 3

Page 213: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

V Simulaciones – b Jugador (cliente)

213

Para la toma de datos se debe realizar ahora la experiencia con esta tabla, con igual cantidad de repeticiones que la forma extensiva. Se obtendrán así las frecuencias en cada celda.

Figura 3-189

El análisis se realizará con una prueba chi-cuadrado de la bondad del ajuste, con los valores de frecuencias de ambas experiencias y los valores esperados en caso de independencia entre la forma Extensiva y la forma Normal. Por lo tanto, se deberá preparar una tabla con el formato que se muestra en la figura 3-190, en la cual se muestra un ejemplo ficticio de 25 juegos.

Observados Nodo 1 Celda Inf Izq

Nodos 2 y 3 Celda Sup Der

Nodo 4 Celda Sup Izq

Total

Forma Extensiva 15 6 4 25 Forma Normal 2 20 3 25

Total 17 26 7 50

Figura 3-190 Comparar esta tabla con la de valores esperados en el caso de que exista independencia y calcular el valor χ2.

Esperados Nodo 1 Celda Inf Izq

Nodos 2 y 3 Celda Sup Der

Nodo 4 Celda Sup Izq

Total

Forma Extensiva 8.5 13 3.5 25 Forma Normal 8.5 13 3.5 25

Total 17 26 7 50

Figura 3-191 2 2

2 (15 8.5) (6 13) ... 17.6228.5 13

17.622 0.51017.622 50

C

χ − −= + + =

= =+

Page 214: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

214

Si este valor fuera cercano a 0, la forma de presentación sería independiente del resultado, lo cual indicaría que estos no varían significativamente en las 2 presentaciones. En este caso no puede anticiparse la conclusión hasta completar la prueba estadística en el capítulo 5.

Aplicaciones Buscar en Internet o en la biblioteca documentación concerniente a teoría de juegos o economía, y elegir algunos juegos de 2 jugadores. En la sección problemas del final del capítulo, se incluyen algunos. Resolverlos teóricamente (incluso con varias matrices de ganancias) y luego crearlos con ComLabGame, para experimentar las estrategias utilizadas por 2 oponentes. Es conveniente ofrecer algún tipo de incentivo a los jugadores, aunque sea mínimo, para aumentar el interés. Con los resultados obtenidos se podrán realizar interesantes pruebas estadísticas en el capítulo 5. Acompañar los datos indicando cuáles fueron las estrategias utilizadas por los jugadores, si buscaron o no los equilibrios del juego, si tenían o no una base teórica, si realizaron o no coordinaciones fuera del juego o si se detectaron errores a corregir.

Page 215: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ensayo: ¿Creer en Dios mejora la existencia? – El peso de la decisión. Blas Pascal

215

Ensayo: ¿Creer en Dios mejora la existencia?

En el capítulo 2 hemos presentado un ensayo acerca de la existencia de Dios. En este ensayo veremos un enfoque histórico para responder a otra pregunta relacionada pero distinta16. ¿Quién tiene el mejor modo de existencia, el que cree en Dios o el que no? El enfoque se basa en la interrelación conjunta de utilidades y probabilidades.

El peso de la decisión. Blas Pascal ¿Es más conveniente creer en Dios? El filósofo francés Blas Pascal (1623-1662), planteó en el siglo XVII, en su libro "Pensamientos" (Pascal, B. 1996), un análisis basado en probabilidades y utilidades, que luego sería conocido como la Apuesta de Pascal. La historia cuenta que Pascal se convierte en un ferviente religioso, como consecuencia de haberse salvado milagrosamente de morir ahogado, cuando los caballos del coche en el que viajaba, cruzaron desbocados un puente. Pascal plantea que en el caso de creer en la existencia de Dios, la decisión es más favorable hacia los creyentes. Veamos su razonamiento a la luz de las 4 alternativas que se muestran en el árbol de decisiones de la figura 3E-1. Si se cree que Dios existe, dice Pascal, el creyente recibirá la felicidad eterna (ganancia infinita) y en cambio para el resto de las alternativas, las ganancias serán finitas (sean positivas o negativas). De esta forma, no importa cuán pequeña sea la probabilidad de la existencia de Dios pues la esperanza matemática de este camino del árbol siempre será mayor que la de los demás. Veamos el detalle. Un rectángulo simboliza un nodo de decisiones controladas por la persona. Un círculo significa un nodo de eventos no controlables por la persona, pero de los cuales se conocen las probabilidades p de cada uno. Al final de cada una de estas ramas se encuentran las ganancias o utilidades que proporciona cada evento. De acuerdo a la teoría de las probabilidades, el valor esperado para el creyente y el ateo son, respectivamente:

( ) 1 2G creyente p a p= ∞ ∗ + ∗ = ∞ ( ) 3 4G ateo b p c p finito= ∗ + ∗ =

Estos valores se colocan en cada uno de los círculos, como ganancias de esas ramificaciones. En los nodos de decisión se decide finalmente cual es la decisión más conveniente, eligiendo naturalmente la acción que maximiza las ganancias. En este caso es la que le corresponde a ganancia infinita, por cuya razón se ha colocado una doble raya en la rama eliminada. En conclusión, según Pascal, sin importar el valor de las probabilidades acerca de la existencia de Dios, la esperanza es mayor si optamos por creer en él. 16 A pesar de que en algunos textos también se la enuncia incorrectamente también como ¿Dios existe?

Page 216: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

216

Figura 3E-1

Árbol de decisiones

Para finalizar el razonamiento de Pascal, deben mencionarse algunas críticas matemáticas al mismo. Entre ellas se encuentran las siguientes dos. La primera es que debe exceptuarse el valor de p1 igual a cero, pues produce un resultado indeterminado (0 por ∞ ), el cual no es infinito. La segunda crítica es planteada por quienes no ven en la noción de infinito, un valor legítimo. El argumento es que si se reemplaza ∞ por un valor muy grande pero finito, siempre se podrá asignar a p1 el valor inverso, lo cual producirá una ganancia finita, comprometiendo, de esta forma, el argumento de Pascal. Al igual que para el ensayo sobre la existencia de Dios (página Dios1), el lector podrá sumar su interpretación y opinión personal a la discusión que seguirá generando la respuesta de Pascal.

Infinito

creyente

ateo

Infinito.

Finito

Existe

No existe

Existe.

No Existe.

Ganancia

a

b

c

Infinito..p1

p2

p3

p4

Page 217: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ensayo: Intimidades de un casino – Introducción

217

Ensayo: Intimidades de un casino

Introducción Sabemos que la teoría de las probabilidades tiene amplia aplicación tanto en Casinos como en Compañías de Seguros. Utilizando la distribución binomial veremos aquí una consecuencia que resultará sin duda sorprendente y que resulta aplicable en ambas actividades.

1. Casinos Conocemos del capítulo 3 que en una ruleta la esperanza matemática de la ganancia a la larga, por cada peso apostado es la misma independientemente del tipo de apuesta. Veremos en cambio ahora una extensión de la teoría matemática en condiciones de incertidumbre, para establecer algún criterio que nos permita elegir una de las dos siguientes alternativas: ¿Cuál es la mejor acción: realizar pocas apuestas grandes o muchas apuestas chicas? Para responder a esta pregunta demostraré previamente que la probabilidad de salir ganando (por lo menos 0 $) en un número dado de jugadas, presenta las siguientes tendencias: • para un determinado tipo de apuestas, decrece a medida que el número de jugadas aumenta. • para un determinado número de jugadas, aumenta al elegir los mayores pagos (y por lo tanto las

menores probabilidades). Por lo tanto la respuesta a la pregunta será: lo mejor es realizar pocas jugadas de altos pagos. Observaremos experimentalmente el comportamiento anterior simulando con el SPSS un gran número de apuestas en distintos juegos, por ejemplo: docena, mayores, calle, etc.

Page 218: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

218

En una,,( nxb

VincEn un ccomen

PlenoPor cad

Por lo Si se ju35$.

Para escon un

a ruleta, la dis)p .

ulación ecasino europecemos por raz

o da 1$ que se j

tanto para obuega a pleno,

stablecer la ren asterisco, res

Capí

stribución de l

entre X y eo B, un jugadzonar los valo

juegue, la rule

tener la ganansi no sale, se

S X G

elación para nsulta:

ítulo 3 Distrib

Jorge

F

la variable X

G dor A juega nores de G par

eta siempre p

M

ncia G del juepierde 1$ (G

F0

FGanancia d

n jugadas, se p

buciones de P

e Carlos Carr

Figura 3E-2 Ruleta

: número de a

n veces 1$. Para: 1) pleno, 2

paga un monto36$M

pleno=

ego, se debe rG = –1$) y si s

F 0–1

Figura 3E-3 de pleno en una

procede en fo

Probabilidade

aciertos en n

ara obtener la2) docena.

o M (incluyen

restar 1$ a la sale, paga 36/

E 1

35

a jugada

orma similar.

es

n jugadas es u

a relación entr

ndo la apuesta

cuenta anterio1 = 36$, resu

Si denotamos

na binomial

re X y G,

a):

or. ultando una G

s a las pérdida

=

as

Page 219: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ensayo: Intimidades de un casino – 1. Casinos

219

S E F

X XA X'A G 35 XA – X'A

Figura 3E-4 Ganancia de pleno en n jugadas

Es decir: 35 A AG X X ′= −

Como: 2 A AX X ′= + Se obtiene:

36 2AG X= −

Docena Si se juega a docena, si no sale, se pierde 1$ (G = –1$) y si sale, paga 36/12 = 3$, resultando una G = 2$. Las tablas son las de las figuras 3E-5 y 3E-6.

S F E X 0 1 G –1 2

Figura 3E-5 Ganancia de Docena en una jugada

S E F

X XA X'A G 2 XA - X'A

Figura 3E-6 Ganancia de Docena en n jugadas

Hallar, a) E(GA) a la larga, b) la probabilidad de que A salga ganando o empatando al término de las n veces, c) el número de éxitos necesario para salir ganando o empatando. Es decir:

2 A AG X X′ ′= − Como: 2 A AX X ′= + Se obtiene:

36 2AG X= − Si se hace intervenir la ecuación de pagos M, enunciada al principio, puede observarse que estas ecuaciones responde a la siguiente ecuación general, válida para todas las jugadas:

AG M X n= ∗ − La cantidad de éxitos XA necesarios para salir por lo menos a la par, es decir ganando o empatando, se obtendrá haciendo G = 0. Si llamamos a este valor de X, X0, se tiene entonces:

0nXM

=

Elección de la mejor acción El número de éxitos que se deben obtener para estar a la par, es:

Page 220: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

220

. 0nXM

=

Analizando la gráfica 3E-7 se concluye que la probabilidad de ganar por lo menos 0 $ deberá ser ),,(.1 0 pnxBINOMCDF− .

Figura 3E-7 Histograma

Combinando las dos expresiones anteriores se obtiene una fórmula para calcular la probabilidad de salir ganando del casino para cualquier juego y para cualquier valor de n. Por ejemplo para los juegos Pleno, Cuadro y Color, resultará:

Pleno:

)37/1,,01.0

36(.1 nnBINOMCDF −−

Cuadro:

)37/4,,01.09

(.1 nnBINOMCDF −−

Color:

)37/18,,01.02

(.1 nnBINOMCDF −−

Nota Para que cuando x0 coincida con un valor entero, la ganancia 0 se compute correctamente a la probabilidad de salir ganando, restemos un valor pequeño, por ejemplo 0.01 a dicho valor x0).

Para la simulación solo basta generar los valores de n. Esto se realiza fácilmente con EXCEL hasta un límite de 65536 (es decir 216) y luego se pasa a una columna de SPSS con copiar y pegar. Llamaremos n a dicha columna. Si se generan las 3 variables anteriores, se observarán las 2 tendencias enunciadas al principio de esta actividad y además ciclos bien definidos de 36, 9 y 2 elementos. ¿Cómo se explican estos ciclos? (si no se le ocurre nada, seguir leyendo).

CDF.BINOM(x ,n,p)0 P(ganar o empatar)

x0

0

x

G

Page 221: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ensayo: Intimidades de un casino – 1. Casinos

221

Figura 3E-8

Probabilidad de ganar en función del número de apuestas

Las tendencias se aprecian nítidamente generando gráficos como los que se muestran. En la figura 3E-8, se muestra la tendencia general al aumentar n, en tanto que en la figura 3E-9 se amplifica la escala para observar los ciclos. Observar como la probabilidad de salir ganando del casino converge a cero con el número de jugadas y lo hace más rápidamente para los juegos con menores pagos.

Figura 3E-9

Probabilidad de ganar en función del número de apuestas (amplificado)

Para obtenerlos se utilizará el ya conocido menú Graphs. Si se desea representar a todas las variables en un mismo gráfico como se muestra en las figuras, utilizar Graphs > Sequence…> colocar todas las variables en el cuadro Variables y la variable n en el cuadro Time Axis Labels. Los gráficos que representan a una variable categórica tienen en SPSS un límite de 3000 niveles por lo cual, para ver los ciclos del segundo gráfico, limitar los casos a n < 3001 (con Select Cases) y para ver la tendencia del primer gráfico para los 65536 valores de n, seleccionar solo un valor de cada ciclo con Data > Select Cases…> If condition is satisfied > If > buscar la función módulo o teclear mod(n,36)=1 (esto elimina por ejemplo, los ciclos de 36 valores. ¿Por qué?). Repetir la simulación anterior para otros juegos distintos a los ejemplificados, y también computando la probabilidad de salir ganando (no empatando), es decir sin restar ningún valor a 0x .

Número de apuestas

6292959617

5630552993

4968146369

4305739745

3643333121

2980926497

2318519873

1656113249

99376625

33131

Prob

abilid

ad d

e ga

nar 0

ó m

ás

.6

.5

.4

.3

.2

.1

0.0

PLENO

CUADRO

COLOR

Número de apuestas

28512701

25512401

22512101

19511801

16511501

13511201

1051901

751601

451301

1511

Prob

abilid

ad d

e ga

nar 0

ó m

ás

.8

.6

.4

.2

0.0

PLENO

CUADRO

COLOR

Page 222: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

222

Sugerencia para explicar los ciclos Crear la variable 0x y analizar el siguiente comportamiento. La probabilidad de salir ganando, crece en los tramos comprendidos entre valores enteros de 0x y decrece en forma brusca exactamente en dichos valores, pues al término de la CDF se le agrega el salto correspondiente a la barra de probabilidades de 0x . Además de observarlo en la planilla de datos, esto se puede ver nítidamente limitando los casos a por ejemplo 100, como se indica en el diagrama 3E-10, correspondiente a la apuesta cuadro. En otras palabras estos ciclos se originan por las discontinuidades de una distribución discreta, pero lo que interesa realmente es la tendencia general, la cual, como se observa en la figura 3E-9, es decreciente con el número de jugadas.

Figura 3E-10

Probabilidad de ganar en función del número de apuestas

Esta actividad ayudará a comprender los efectos de la ventaja que tiene un Casino en la esperanza matemática (ciertamente muy moderada) y porque no es negocio para el Casino que se juegue poco. Todos los Casinos buscan atraer a muchos jugadores (que equivale a jugar muchas veces para el Casino). El negocio redondo sería tener una ciudad atractiva, con sorteos gratis, incluso con hoteles y restaurantes baratos, para atraer siempre a una gran cantidad de jugadores.

2. Aseguradoras Estas compañías también utilizan la teoría de las probabilidades en su gestión. Por razones similares a los Casinos es conveniente para ellas asociarse en lugar de operar cada una por su cuenta, pues de esta forma disminuyen el riesgo de perder. Por lo mismo, aparece la figura de las reaseguradotas, es decir sociedades que aseguran a las aseguradoras. En la punta de la pirámide se encuentra el Lloyd de Londres, quien al distribuir el riesgo lo minimiza.

Número de apuestas

91.0082.0073.0064.0055.0046.0037.0028.0019.0010.001.00

Prob

abilid

ad d

e ga

nar 0

ó m

ás

.7

.6

.5

.4

.3

.2

.1

0.0

Page 223: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Ensayo: Intimidades de un casino – 2. Aseguradoras

223

Page 224: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

224

Problemas

Ia Una variable 1. Inglés y francés

En un conjunto de 330 estudiantes argentinos, 200 hablan inglés, 90 hablan francés y 70 no hablan ni inglés ni francés. Se elige un estudiante al azar, a) hallar la distribución de probabilidades de x: número de idiomas extranjeros que habla, b) Si se elige 1 estudiante ¿cuál es la probabilidad de que hable un solo idioma extranjero, c) Si se eligen 2 estudiantes, ¿cuál es la probabilidad de que el primero hable un solo idioma extranjero y el segundo por lo menos uno? Realizar primero el cálculo exacto y luego suponiendo que los eventos son independientes. R: a) μ = 0.88, σ = 0.53, b) 0.697, c) 0.549.

2. Tanques de agua con impurezas Se examinan tanques de agua en la búsqueda de 2 impurezas A y B. Se encontró que el 20% no revelaban impurezas, 40% tenían la A y el 50% la B. Hallar, a) la distribución de probabilidades de X: el número de impurezas encontradas si se elige un tanque al azar, b) si se eligen 2 tanques independientes, cual es la probabilidad de que el primero tenga 1 impureza y el segundo por lo menos 1, c) si se elige un tanque del que se sabe que tiene por lo menos 1 impureza, hallar la probabilidad de que tenga una sola. R: a) µ=0.9, σ=0.54, b) 0.56, c) 0.875.

3. Válvulas de agua En el circuito de la figura, A B y C son válvulas de agua que se abren con una probabilidad p=0.8. a) Hallar el histograma de probabilidad de X: el número de ramas abiertas luego de haber enviado la señal. b) ¿Cuál es la probabilidad de que una rama este abierta sabiendo que por lo menos una lo está? c) Calcular la confiabilidad del sistema.

R: a) µ=1.44, σ=0.62, b) 0.448. c) 0.928.

4. Lanzamiento de una moneda Se lanza una moneda hasta que aparezcan 1 cara o 5 secas. Si X es el número de lanzamientos, a) hallar µ y σ de la distribución, b) ¿cuál es la probabilidad de que salgan no más de 2 secas? R: a) µ=1.94, σ=1.19, b) 0.875.

Page 225: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Problemas – Ic Modelos teóricos de una variable

225

Ic Modelos teóricos de una variable

Discretas 5. Equipos y la probabilidad de ganar

El equipo A tiene 2/3 de probabilidad de ganar cuando juega. Si A juega 4 partidos, hallar: a) la distribución de probabilidades, µ y σ de X: resultados (número de partidos ganados) de A, b) la probabilidad de que A gane 2 partidos, c) de que gane un partido por lo menos, d) de que gane más de la mitad de los partidos, e) ¿Es poco común que A gane menos de 1 partido? f) Si Y = 2X+4, hallar la distribución de probabilidades de Y, su esperanza y su varianza. Resolver manualmente y con el SPSS. R: a) 8/3; 0.943, b) 8/27, c) 80/81, d) 16/27, f) SPSS.

6. Equipos de radar Siete equipos de radar están disponibles para detectar cualquier avión. Cada equipo tiene una probabilidad p = 3/4 de detección. Sea X el número de radares detectores. a) Dibujar el histograma con µ y σ, b) si un avión entra en el área, cuál es la probabilidad de que no sea detectado y cuál de que sea detectado por 2 radares por lo menos, c) cuantos radares debe haber para que la probabilidad de detección de por lo menos 1 de ellos sea 15/16, d) cuál es la probabilidad de que uno de los equipos detecte 3 aviones antes de fallar e) ¿Es poco común que un avión sea detectado por menos de 2 aviones? f) Si Y = 2-X, hallar la distribución de probabilidades de Y, su esperanza y su varianza. Resolver manualmente y con el SPSS. R: a) 5.25, 1.14, b) 0.006%, 99.8%, c) 2, d) 10.54%, f) SPSS.

7. Examen de selección múltiple Hallar la probabilidad de que un estudiante en un examen de selección múltiple, conteste correctamente y al azar, a) 12 o más de un total de 20, si tiene 2 respuestas posibles, b) al menos 10 de un total de 15, si tiene 5 respuestas posibles, c) ¿Es poco común que conteste más de 15 de un total de 20, si tiene 2 respuestas posibles? Resolver manualmente y con el SPSS. R: a) 0.2511, b) 0.

8. Vuelos sobre registrados Una compañía aérea tiene aviones pequeños con capacidad para 18 personas y tiene la política de registrar hasta 20 personas pues la experiencia anterior indica que el 80% de los pasajeros registrados realmente toman el vuelo. a) Calcular la probabilidad de que, habiendo registrado 20 pasajeros, no haya asientos disponibles. b) Si consideramos como un valor inusualmente bajo cuando la probabilidad sea menor al 5%, ¿será esta sobreventa un problema real para los pasajeros? Resolver manualmente y con el SPSS. R: 0.069, b) si.

9. Cara reticente Dado que se ha lanzado 5 veces una moneda normal sin obtener una cara, ¿cuál es la probabilidad de que se tenga que lanzar al menos dos veces para obtener la primera cara? R: 0.5.

10. Computadoras de un avión Un avión tiene 3 computadoras pero solo una de ellas se encuentra en servicio. Las otras son de reserva en caso de falla. Durante una hora de operación, la probabilidad de falla es 0.0005 (el número de ensayos y equivale en este problema al número de horas). a) ¿Cuál es el tiempo promedio de falla de las 3 computadoras? b) ¿Cuál es la probabilidad de que las 3 fallen en un vuelo de 5 horas (es decir: ( 5) ( 3) ( 4) ( 5)P y P y P y P y≤ = = + = + = )? c) ¿Es poco común que las 3 fallen en un vuelo de 5 horas? Resolver manualmente y con el SPSS. R: a) 6000 horas, b) 1.25E-9.

Page 226: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

226

11. Muestreo de aceptación Un producto se embarca en lotes de 20. Se muestrean 5 artículos de cada lote y se rechaza el lote si se encuentra más de 1 defectuoso. Si un lote contiene 4 defectuosos, a) ¿cuál es la probabilidad de ser rechazado?, b) si X es el número de defectuosos encontrados en el lote, hallar el µ y σ de la distribución. Resolver manualmente y con el SPSS. R: a) 0.248, b) µ=1, σ=0.7947.

12. Acciones preferentes y ordinarias Un inversionista desea comprar 3 acciones. Tiene 5 alternativas de las cuales 2 son preferentes y 3 ordinarias. Si toma la decisión al azar, hallar: a) el histograma para X: el número de acciones preferentes que comprará, b) µ y V(X), c) la probabilidad de que x caiga a no más de dos σ de µ, d) ¿Es poco común que compre menos de 2 acciones ordinarias? R: b) µ=1.2, V(X) = 0.36, c) 1. Resolver manualmente y con el SPSS.

13. Elección de trabajadores Un capataz de una fábrica tiene 3 hombres y 3 mujeres trabajando para él. Desea elegir 2 trabajadores al azar. a) Hallar el histograma de probabilidad de X: el número de mujeres en su selección. b) ¿Es poco común que elija menos de 1 mujer? Resolver manualmente y con el SPSS. R: µ=1, σ=0.63.

14. Soldadura defectuosa La probabilidad de que se haga una soldadura defectuosa en una conexión dada es 10-4. Hallar: a) el número de soldaduras en un sistema si la probabilidad de que no se presenten defectos en dicho sistema es 6.7363.10-3, b) el número esperado de uniones defectuosas. R: a)5 104., b) 5.

15. Test para detectar una enfermedad Un médico aplica un test a una muestra de 10 personas para detectar una enfermedad que afecta al 10% de los trabajadores de una fábrica. Se sabe que el test acierta un 80% a un individuo enfermo y un 75% a un individuo sano. a) Hallar la probabilidad de que a 4 personas de las 10, el test les dé positivo (predice enfermedad), b) Si hay 4 personas que el test les da positivo, cual es la probabilidad de que entre éstas exactamente 2 estén sanas, c) hallar la probabilidad de que el test se equivoque en 2 personas de las 10, d) calcular la probabilidad de que el test acierte a por lo menos 8 personas de las 10. R: a) 0.2047, b) 0.2246, c) 0.285, d) 0.5407. Resolver manualmente y con el SPSS.

16. Suspensión de clases como medida de protesta De los 800 alumnos de una facultad, 560 están en contra de la suspensión de clases como medida de protesta resuelta por el gremio. Veinticinco estudiantes son elegidos al azar, sin reposición. a) Hallar la probabilidad de que menos de 5 estén a favor de la medida de fuerza. b) ¿Es poco común que menos de 4 estén a favor de la medida de fuerza? Resolver manualmente y con el SPSS. R: 9%.

17. Envío de artículos Una empresa debe enviarle a un cliente 5 artículos y posee en existencia 12. De estos 12 artículos, 3 son del tipo A, 2 del tipo B y el resto del tipo C. ¿Cuál es la probabilidad de que el cliente reciba exactamente 2 del tipo A, 1 del tipo B y 2 del tipo C? R: 0.159.

18. Técnica de captura- marcación- recaptura Muchas veces se estima el tamaño de la población de animales utilizando la técnica de captura- marcación- recaptura. Utilizando este procedimiento para estimar el tamaño de la población de truchas de un lago se capturan 10 truchas, se las marca y luego se las devuelve al lago. Posteriormente se toman muestras al azar de 2 truchas y se anota el número X de animales marcados. Si se ha determinado por este proceso que la frecuencia relativa de X=1 es 0.05, ¿cuántas truchas se estima que haya en el lago? R: 390.

Page 227: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Problemas – Ic Modelos teóricos de una variable

227

19. Número de fallas En un servidor web, el número de fallas que un requerimiento puede generar es de 1 por cada 100 requerimientos y el servidor procesa 500 requerimientos por hora. Hallar manualmente y con el SPSS, la probabilidad de que se presenten: a) 7 fallas en 1.5 horas b) al menos 3 fallas en media hora c) ¿Es poco común que se presenten menos de 2 fallas en media hora? R: a) 0.1465, b) 0.456.

20. Errores de inventario En un supermercado el número promedio de errores de un cierto empleado es 2.3. a) Si se consideran 3 períodos consecutivos, ¿cuál es la probabilidad de que el número de errores se aleje de la media en, a lo sumo, una desviación estándar? Un programa de incentivos para disminuir la cantidad de errores consiste en: 1) si comete menos de 5 errores, su sueldo no se verá afectado por descuentos, 2) si comete por lo menos 5 pero menos de 10 errores, su sueldo tendrá un descuento del 5%, 3) si comete por lo menos 10 errores, su sueldo tendrá un descuento del 10%. b) Calcular el descuento esperado por período de inventario. R: a) 0.778, b) 0.42%.

21. Seguros por enfermedad La probabilidad de que una persona de entre 20 y 30 años muera de cierta enfermedad durante un período de un año es de 0.00001. a) Si una compañía de seguros tiene 100000 personas de este grupo, ¿cuál es la probabilidad de que deba pagar más de 4 seguros por esta enfermedad? b) Si la póliza de seguros es de $ 200000, ¿cuál debe ser la prima anual si la compañía desea tener un beneficio de $ 10? R: a) 0.00366, b) $ 12.

22. Páginas con avisos comerciales Forme un grupo de estudiantes que cuenten las páginas con avisos comerciales en una revista. Luego deben crear la distribución de frecuencias en una columna del SPSS, comparar esta distribución real con una binomial ( , , )b y n p (forma de la CDF y parámetros). Calcular en forma manual y con la computadora, para ambas distribuciones: a) la probabilidad de que la proporción muestral de páginas con avisos comerciales se encuentre a menos de 0.09 de la media, b) el percentil 59 de la distribución binomial de la proporción de páginas con avisos comerciales, c) la proporción de páginas con avisos comerciales a partir de la cual sería un suceso poco común.

23. Lanzamiento de una moneda Cada estudiante debe lanzar 10 monedas, anotar el número de caras y repetir el experimento 30 veces. Luego debe crear una distribución de frecuencias en una columna del SPSS y comparar esta distribución real con una binomial ( , , )b y n p (forma de la CDF y parámetros). Con ambas distribuciones: a) calcular la probabilidad de que la proporción de veces que sale cara, sea mayor a 0.60, b) hallar la AIC, c) ¿es poco común que el número de caras sea mayor a 28?

24. Búsquedas en Google Realizar 20 búsquedas de un tópico cualquiera y registrar el número de errores que se presentan debido a páginas que no se conectan. Repetir para otras 30 búsquedas. Colocar los resultados en una columna de 30 filas del SPSS y comparar esta distribución real con una binomial ( , , )b y n p o con una ( , )p y λ (forma de la CDF y parámetros). Con ambas distribuciones: a) hallar la probabilidad de recibir menos de 1 error, b) hallar el percentil 50. ¿Que hubiera sucedido con las diferencias si la muestra hubiera sido de 500? ¿Puede ser usada la distribución de Poisson para aproximar esta distribución observada?

Page 228: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

228

Contínuas 25. Distribución definida con una PDF constante

Si X es una variable aleatoria distribuida con la siguiente función densidad: , 2 2

( )0 k si x

f xen otros puntos

− < <⎧= ⎨

a) Obtener la media y la varianza, b) hallar la CDF, c) hallar la AIC, d) ¿cuál es la probabilidad de que X sea mayor que 1 sabiendo que es positiva? e) dibujar la CDF y el diagrama de caja, encolumnados con la PDF. R: a) 0, 0.333, b) (x+2)/4, c) 2, d) 0.5.

26. Distribución definida con una PDF Triangular Un error X se distribuye de acuerdo a la PDF que se muestra en la figura. a) Hallar la probabilidad de que el error respecto de 10 sea superior a ± 0.5% (es decir de que X se encuentre a mas de 0.05 de µ), b) la PDF analítica con la media y la varianza, c) la CDF, d) la AIC, e) dibujar la CDF y el diagrama de caja, encolumnados con la PDF. R: a) 0.25,

b) 100 990 9.9 10

( )100 1010 10 10.1

x xf x

x x− < <⎧

= ⎨− + < <⎩ μ = 10, σ2 = 0.001667.

c) 2

2

50x -990x+4900.5 9.9 10( )

-50x +1010x-5099.5 10 10.1x

F xx

⎧ < <⎪= ⎨< <⎪⎩

d) 10.0293-9.9707= 0.0586

27. Distribución definida con una PDF cuadrática

Dada la siguiente función: 2( ) (1 ) 0 1f x ax x x= − < <

a) Hallar a para que sea una PDF, b) obtener la CDF, la media y la varianza. Dibujar encolumnadas la PDF y la CDF, c) hallar la moda, d) hallar la mediana. R: a) 12, b) 3 44 3x x− , μ = 0.60, σ2 = 0.04, c) 0.667, d) 0.615.

28. Distribución definida con una PDF por tramos La densidad de probabilidades del tiempo de duración (en horas) de un determinado producto se puede suponer representada por la f(x) que toma los valores siguientes:

, 1 23 2 4

( )1, 5 60,

a si xa si x

f xsi x ó xpara los demás valores de x

< <⎧⎪ ≤ <⎪= ⎨ = =⎪⎪⎩

Hallar: a) )5.1( ≤Xp b) la CDF, la media, la desviación estándar y graficarla encolumnada con la PDF. c) la amplitud intercuartílica y el diagrama de caja,

Page 229: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Problemas – Ic Modelos teóricos de una variable

229

d) Si un producto ha tenido una duración comprendida entre 1.3 y 2.4 horas, hallar la probabilidad de que haya superado 2 horas, e) Se seleccionan 10 productos en forma independiente. Calcular la probabilidad de que por lo menos 9 tengan una duración superior a 3 horas. R: a) 0.0714, b)

1 1 , 1 27 7( )3 5 2 47 7

x si xF x

x si x

⎧ − < <⎪⎪= ⎨⎪ − ≤ <⎪⎩

μ = 2.785, σ = 0.757 c) AIC = 1.167, Q2 = 2.833, d) 0.631,e) 2.99 10-3.

29. Distribución definida con una CDF cuadrática Dada la siguiente función:

2

( ) 0 24xF x x= < <

a) Determinar si cumple las propiedades de una función de distribución, b) Hallar los cuartiles y dibujar el diagrama de caja, c) hallar el percentil 80., d) hallar la PDF, la media y la varianza. e) graficar la PDF y la CDF en forma encolumnada. R: a) si, b) 1.414, 1, 1.732, c) 1.789, d) x/2, μ = 4/3, σ2 = 2/3.

30. Cantidad de chocolate La cantidad de chocolate utilizada por una fábrica en un día se puede modelar con una distribución exponencial con media β = 300 kg. a) Hallar la probabilidad de que la fábrica utilice más de 300 kg en un día determinado. b) El gerente le pide que calcule qué cantidad de chocolate tendría que almacenar para que la probabilidad de agotar la existencia sea poco común. Resolver manualmente y con el SPSS. R: a) 0.368, b) 898 kg.

31. Dado el valor del eje de una normal, hallar la probabilidad Si X es una variable aleatoria distribuida normalmente con µX=0 y σx=1, hallar manualmente y con el SPSS: a) P(0<x<1.42), b) P(-0.73<x<0), c) P(-1.37<x<2.01), d) P(0.65<x<1.26), e) P(-1.79<x<-0.54), f) P(x>1.13), g) P(-0.5<x<0.5). R: a) 0.422, b) 0.2673, c) 0.892, d) 0.154, e) 0.258, f) 0.13, g) 0.383.

32. Dada la probabilidad de una normal, hallar el valor del eje Sabiendo que Z está distribuida normalmente con µZ=0 y σZ=1, determinar su valor, manualmente y con el SPSS, si: a)

0zA = 0.377, b) CDF=0.377, c) 1.5

zA− = 0.0217, d) zA−∞ = 0.8621. R: a) ±1.16, b) –0.31, c) –1.35, -1.69, d) 1.09.

33. Admisión de un colegio Los resultados de admisión de un colegio tienen una distribución normal con µ=7.5 y σ=1. a) ¿Qué fracción de resultados se encuentra entre 8 y 9? b) Hallar la puntuación máxima del 10% inferior de la clase. Resolver manualmente y con el SPSS. R: a) 24.17%, b) 6.22.

34. Error con distribución normal En una medición se comete un error e que se distribuye normalmente con µ=0 y σ=2. Determinar la probabilidad de que en 5 mediciones independientes todas resulten con error superior a 0.5 (en ambos sentidos). R: 0.333

35. Dígitos al azar Hallar la probabilidad de que entre 10000 dígitos al azar con reposición, el dígito 3 aparezca 950 veces a lo sumo. Resolver manualmente y con el SPSS. R: 4.75%.

Page 230: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

230

36. Un persona, su padre y su abuelo ¿Cuál es la probabilidad de que una persona, su padre y su abuelo paterno tengan el mismo cumpleaños? b) En una ciudad de 2000000 de habitantes, cuantos habrá término medio con esta característica. c) ¿Cuál es la probabilidad de que haya menos de 10 habitantes con dicha característica? d) ¿Cuál de que haya más de 5 con dicha característica? R: a) 7.5 10-6, b) 15, c) 7.78%, d) 99.5%.

37. Dos máquinas independientes E n un proceso de fabricación de una pieza mecánica intervienen 2 máquinas: la A taladra y la B corta en trozos. Ambas son independientes. El diámetro del taladro de A en mm sigue una n(23; 0.5), y el grosor producido por B, una n(11.5; 0.4). a) ¿Qué porcentaje de las piezas tienen un diámetro entre 22.5 mm y 24 mm? b) ¿Qué porcentaje tiene un grosor entre 10.5 mm y 11.7 mm? c) Si solo son aceptadas las piezas que cumplen a) y b), ¿qué porcentaje de piezas será aceptado? R: a) 81,8%, b) 68,53%, c) 56%.

38. Lanzamiento numeroso de una moneda Una moneda se lanza 400 veces. Calcular la probabilidad de que a) el número de caras difiera de 200 en más de 10, b) el número de caras se encuentre en el intervalo 200 ±20. c) Si el número de caras resultó menor que 212, cual es la probabilidad de que hayan salido más de 203. d) En que intervalo se encuentra el 77% de los resultados (número de caras) alrededor del valor medio. e) Se realizan 2 pruebas. Cuál es la probabilidad de que en la primera salgan menos de 194 caras y en la segunda menos de 190 secas. Resolver manualmente y con el SPSS. R: a) 31.7%, b) 95.4%, c) 30%, d) 200±12, e) 4.3%.

39. Suma de los dígitos de un dado Se tira un dado 60 veces. Hallar la probabilidad de que la suma de todos los dígitos sea menor que 200. R: 0.2358

40. Probabilidad de salir ganando del casino Con una ruleta americana (con 0 y 00), se realizan 64 apuestas de 1$ a colorado. a)¿Cuál es la probabilidad de salir ganando del casino?, (pensar en el número mínimo de éxitos que aseguran esto), b) ¿cuál es la probabilidad de ganar exactamente 20$?, c) ¿cuál es la probabilidad de perder al menos 10$?, d) si se realizan 10000 jugadas, ¿cuál es la probabilidad de salir al menos a la par?, e) si se juega a pleno 1$ en 500 jugadas, ¿cuál es la probabilidad de ganar al menos 40$?. R: a) 0.295, b) 0.0014, c) 0.242, d) ~0, e) 0.337.

41. Lavado automático Los automóviles llegan un lavado automático en promedio 20 cada hora. Hallar manualmente y con el SPSS: a) la probabilidad exacta de que en cualquier período dado de media hora lleguen menos de 4 automóviles. b) la probabilidad aproximada de que en cualquier período dado de 30 minutos lleguen menos de 4 automóviles (usar la cpc). R: a) 0.010, b) 0.019.

42. Persona que entra a un shopping y compra. Los dueños de un shopping saben que una de cada cuatro personas que entra, compra algo. Si se selecciona una muestra de 5 personas, hallar la probabilidad de que a) 2 o más realicen alguna compra b) a lo sumo 4 realicen alguna compra Si se selecciona una muestra de 90 personas, hallar la probabilidad aproximada de que, c) menos de 15 realicen alguna compra d) al menos 20 realicen alguna compra R: a) 0.367, b) 0.999, c) 0.025, d) 0.767

Page 231: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Problemas – IV Teoría de los juegos

231

43. Entrega de la Tesis De acuerdo a estudios anteriores, el 5% de los alumnos de estadística no presentan la tesis. Se toma una muestra aleatoria de 20 alumnos, hallar las siguientes probabilidades en forma exacta y con todas las formas de aproximación válidas: a) no más de 2 no presenten la tesis, b) cuanto menos 18, presenten la tesis, c) 3 no presenten la tesis. d) dibujar el histograma de probabilidades R: a) 0.925, 0.919, b) 0.925, 0.919, c) 0.059, 0.0613.

IV Teoría de los juegos 44. Problemas Resueltos

Obtener los equilibrios en estrategias mixtas de todos los problemas resueltos de la sección: "Simultáneos con estrategias puras", los cuales comienzan en la página 163. R: Sistemas de video: 0.5, 0.5, El juego de la contaminación: no tiene equilibrios en estrategias mixtas, Competencia Cournot: no tiene equilibrios en estrategias mixtas.

45. El dilema del prisionero Dos prisioneros, A y B, que efectivamente cometieron un delito, son interrogados por separado. Cada uno tiene 2 acciones posibles: Delatar, C o No Delatar, N. Si los 2 niegan, la sentencia es solo 1 año por evidencias menores. Si solo uno delata, se le libera, pero al otro se le sentencia con la condena máxima establecida por el código que es de 15 años. Si ambos delatan se les rebaja la condena y son sentenciados a 10 años de prisión. a) Confeccionar la matriz de ganancias (años de prisión) y verificar que en este juego simétrico, cada uno tiene una estrategia dominante y que existe un solo equilibrio de Nash dominante. ¿Cuál es el valor del juego? ¿Cuál es el dilema? ¿Subsiste si el juego se repite? ¿El equilibrio es Pareto eficiente? b) Convertir el problema simultáneo en secuencial y verificar que, al tener estrategias dominantes, no importa quién es el primero. c) Para un posterior análisis, genere datos experimentales creando una simulación con el programa ComLabGame y confronte a 2 jugadores. Repita el juego y exporte los principales datos de la experiencia a un archivo EXCEL.

46. Aplicación del dilema del prisionero Documentarse en el dilema del prisionero para involucrar los conceptos de cooperación y confianza (es una situación muy común en el combate del crimen). Luego adaptar el juego a por lo menos 2 situaciones en las que se presente una dicotomía entre el incentivo individual para no cooperar y el incentivo social para cooperar. Ejemplos: guerra de precios de 2 empresas duopólicas (Coca y Pepsi), hacer o no publicidad (existe un ejemplo testigo con las empresas tabacaleras y la publicidad en TV), conducir siempre por la izquierda o respetar la norma, pagar impuestos o no, divorcio amigable o con juicio, licitaciones, negociaciones políticas, quiebra de bancos por retiros en masa, consumo de agua de red, tragedia de los comunes, carrera armamentista, etc.

47. El juego del gallina Dos adolescentes conducen cada uno un auto en sentidos contrarios, siendo inminente un choque. Cada uno puede decidir Continuar o Virar hacia un lado. Si ambos continúan, ambos mueren lo cual se representará con una ganancia de –3. Si ambos viran, se salvan (ganancia 1) pero pierden prestigio. Si solo uno de los dos continúa se cubre de gloria (ganancia 2), pero el que vira tiene una ganancia de 0. a) Obtener los equilibrios de Nash (puros y mixtos), el valor del juego y la probabilidad de que ambos adolescentes se salven. ¿Son los equilibrios Pareto eficientes? ¿Existen estrategias dominantes débiles o fuertes? b) Convertir el problema simultáneo en secuencial y analizar si importa quién es el primero. c) Para un posterior análisis, genere datos experimentales creando una simulación con el programa ComLabGame y confronte a 2 jugadores sin base teórica. Repita el juego y

Page 232: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

232

exporte los principales datos de la experiencia a un archivo EXCEL. R: a) dos equilibrios de Nash de estrategias puras no dominantes y un equilibrio de Nash de estrategias mixtas con p(continuar) = 0.25. La probabilidad de que se salven es: 0.9375.

48. Juego de entrada al mercado Dos empresas A y B deben decidir si abrir un restaurant en un shopping. Las estrategias son Entrar, E y No entrar, N. Si las 2 empresas deciden N, la ganancia será 0 para ambas. Si un decide E y la otra N, la firma que entra gana 30000$. Si ambas deciden E, ambas pierden 10000$ pues no ha suficiente demanda para ambas. a) Obtener los equilibrios de Nash (puros y mixtos) y el valor del juego. ¿Son los equilibrios Pareto eficientes? Construir las formas normal y extensiva del juego. b) Repetir el análisis si la matriz de pagos cambia de tal forma que B gane 400000$ si entra sola. c) Para un posterior análisis, genere datos experimentales creando una simulación con el programa ComLabGame y confronte a 2 jugadores sin base teórica. Repita el juego y exporte los principales datos de la experiencia a un archivo EXCEL. Este problema será continuado en el capítulo 5. R. a) ambas deben utilizar una estrategia mixta de 0.75 para Entrar. Valor del juego = 0. b) La probabilidad para Entrar de A cambia de 0.75 a 0.80. El valor del juego no cambia.

49. Los generales juegan a la guerra Dos generales Smith y Gonzalez deciden jugar un juego de guerra. El general Smith puede atacar por Tierra o por Mar. El general Gonzalez puede defender por Tierra o por Mar. Ambos acuerdan la siguiente matriz de pagos (los valores representan las ganancias del general Smith). a) Obtener los equilibrios de Nash (puros y mixtos) y el valor del juego. ¿Son los equilibrios Pareto eficientes? Construir las formas normal y extensiva del juego. b) Para un posterior análisis, genere datos experimentales creando una simulación con el programa ComLabGame y confronte a 2 jugadores sin base teórica. Repita el juego y exporte los principales datos de la experiencia a un archivo EXCEL.

General GonzalezTierra Mar

General Smith Tierra –25$ 75$

Mar 90$ –50$

R: a) Estrategia mixta con pSmith = 0.583, pGonzalez = 0.521. Valor del juego = 22.92$.

50. Roca, papel, tijera Dos amigos Juana y Juan realizan este conocido juego en forma simultánea mostrando los dedos. Roca rompe Tijera, Tijera corta Papel y Papel envuelve Roca. Si Juana gana, obtiene 1$ de Juan y viceversa. Construir la tabla de pagos y el árbol del juego. a) Obtener los equilibrios de Nash (puros y mixtos) y el valor del juego (deberá resolver un sistema de ecuaciones de 4×4). ¿Son los equilibrios Pareto eficientes? b) Para un posterior análisis, genere datos experimentales creando una simulación con el programa ComLabGame y confronte a 2 jugadores. Repita el juego y exporte los principales datos de la experiencia a un archivo EXCEL. R: a) probabilidades = 0.33, G = 0.

51. Monedas y ases En un juego usted elige cara o seca y su compañero elige uno de 4 ases. Dependiendo de si él elige: Oro, Copa, Espada o Bastos, si usted elige Cara, recibe un pago de 15$, 4$, –5$ y 1$, y si selecciona Seca, recibe un pago de –10$, –2$, 1$ y –5$. a) ¿Está de acuerdo con jugar? Deberá obtener el valor del juego para las estrategias puras o mixtas que posea (utilice el método gráfico para resolver la igualdad de ganancias). b) Si aceptó el juego y luego de 4 repeticiones ganó 5$, ¿Qué concluiría? R: a) estrategia mixta p = (0.5, 0.5). Valor del juego: –2$. b) o tuvo mucha suerte o su compañero es un ignorante.

Page 233: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Problemas – IV Teoría de los juegos

233

52. Campaña publicitaria Dos senadores compiten por la reelección. El senador A mueve primero y debe decidir si invierte en una costosa campaña publicitaria. El senador B mueve después y debe decidir si entra o no en el juego. B sabe que le será más fácil ganar si A no realiza una campaña publicitaria. Modelar las 4 ganancias de cada uno con los valores 1, 2, 3 y 4. Si en el orden A (Campaña, No campaña) y B (Entra, No entra), se utilizan las siguientes ganancias en los nodos finales: (1,1), (3,3), (2,4) y (4,2), a) ¿Cuál es el equilibrio del juego?, b) hallar el equilibrio si se mantienen las ganancias pero B mueve primero. ¿Importa quién mueve primero? ¿Por qué? c) rediseñar las ganancias de tal forma que el orden no importe y calcular el equilibrio. R: a) (3,3), b) (4,2).

53. Póliza de seguro Hallar la prima anual (de equilibrio) de una póliza de seguro contra incendio de $ 20000 en una zona que por experiencia anterior puede tener pérdida total con p=0.001 y pérdida del cincuenta por ciento con p=0.01. Ignorar todas las otras pérdidas parciales. R: $ 120.

54. Empresa petrolera Una empresa petrolera va a realizar 10 exploraciones. La probabilidad de una exploración exitosa es 0.1. El conjunto tiene un costo fijo de $ 20000. Además cada exploración exitosa cuesta $ 30000 y las fallidas $ 15000. Hallar el costo esperado para las 10 exploraciones. R: $ 185000.

55. Bonos de inversión Usted debe aconsejar a un cliente que tiene $1000 para invertir, el cual está interesado en 2 bonos con riesgos. Los bonos A tienen un rendimiento anual del 6.5%, pero tienen una tasa de incumplimiento del 1% (se pierden los $1000). Los bonos B tienen un rendimiento anual del 8.6%, con una tasa de incumplimiento del 2%. ¿Cuál de los bonos aconsejaría? R: B.

56. Envases defectuosos Una empresa provee envases para distintas industrias. El control de calidad de la misma realiza un muestreo mensual de 350 envases para detectar la cantidad de fallas, cuyo último resultado se indica en la tabla siguiente. Por cada envase la empresa cobre 6$. El costo de cada uno es de 3$, pero si debe ser corregido se incrementa en 1.20$, independientemente de las fallas que tenga. Los envases que tienen hasta 2 fallas se corrigen y los que tienen 3 o más se descartan. Calcular la ganancia esperada mensual por envase.

Número de fallas por envase 0 1 2 3 4 Cantidad de envases 86 112 83 47 22

R: 1.150$.

57. Instrumentos de laboratorio Todas las mañanas debe ajustarse un sistema de instrumentos en 2 laboratorios A y B de la misma empresa, en forma independiente. Cada puesta a punto requiere una serie de ensayos que no superan a 3, cuyas probabilidades se dan en la siguiente tabla. Cada ensayo cuesta 3$. a) ¿Cuál es el laboratorio con mayores gastos diarios y cuál es el de gastos más irregulares. b) Si U es el número total de ensayos en le empresa, calcular la esperanza y varianza del gasto total G.

Laboratorio A X 1 2 3 P(X) 0.2 0.6 0.2 Laboratorio B Y 1 2 3 P(Y) 0.5 0.2 0.3

R: a) A, B, b) 11.40$, 10.44$.

Page 234: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Capítulo 3 Distribuciones de Probabilidades

Jorge Carlos Carrá

234

58. Apuestas simples y dobles Un jugador a cara o seca tiene un capital de 3 $. Apuesta 1 $ siempre a cara (apuesta simple). Hallar el valor esperado de la ganancia si a) juega 2 veces, b) juega 3 veces. Luego decide usar la técnica de la apuesta doble, es decir duplica la apuesta (2 $) si pierde, en tanto tenga capital suficiente, c) repetir a), d) repetir b). ¿Qué diferencia se observa en los histogramas? Justificarlas. R: a) 0 $, b) 0 $, c) 0 $, d) 0 $.

59. Casino de ruleta europea y el equilibrio En un casino de ruleta europea, establecer cuál de los siguientes juegos, conduce a: la fortuna, la ruina o es equilibrado. Suponer que en cada uno se apuesta 1 $. a) Apostar al número tres, (pleno), b) apostar a una línea, c) apostar a la primer docena, d) jugar a pleno dos veces con apuesta simple, e) jugar tres veces a pleno con apuesta doble. R: a) E(G)=-0.027, b) E(G)=-0.027, c) E(G)=-0.027, d) E(G)= - 0.054, e) E(G)= - 0.108.

60. Dados y el equilibrio Establecer cuál de los siguientes juegos, conduce a: la fortuna, la ruina o es equilibrado, suponiendo que en cada uno se apuesta 1 $. a) Apostar a obtener por lo menos un 6 en 4 tiros de un dado, b) apostar a obtener por lo menos un doble 6 en 24 tiros de dos dados, (ídem anterior). R: a) E(G)=0.035, b) E(G)=-0.01718.

Problemas con base de datos Todos los archivos que se mencionan en los problemas, se encuentran en la dirección (acceso restringido a alumnos): http://www.aprehender.net/JCC/viewtopic.php?f=52&t=267

61. Telefonistas en la mira Abrir el archivo Llamadas.sav. La empresa en la que usted trabaja atiende pedidos por teléfono, para lo cual cuenta con un grupo de telefonistas. El gerente desea bajar los costos y le pide que estudie optimizar el número de telefonistas. Como primera medida necesita datos para analizar, por lo que solicita que le confeccionen un registro del número de llamadas que se reciben de los clientes, agrupados por hora desde las 8 de la mañana hasta las 4 de la tarde. Estos datos se obtienen durante el transcurso de 22 días y le son entregados en el archivo Llamadas.sav Supondremos en principio que el número de llamadas por hora sigue una distribución normal lo cual será validado en el capítulo 7. Las inquietudes del gerente son las siguientes: a) ¿Qué cantidad de telefonistas por hora recomendaría para estar 98 % seguro de que cada uno de ellos solo tenga que atender 8 clientes por hora? Sugerencia: calcular primero el número de llamadas por hora asociado al 98 % (percentil 98). b) El gerente observa que los datos parecen indicar algunas horas pico, por lo cual le solicita evaluar una solución menos costosa que utilice por ejemplo distinta cantidad de telefonistas en cada hora. Repetir entonces la pregunta anterior pero ahora analizando la cantidad requerida de telefonistas por cada una de las horas entre las 8 de la mañana y las 4 de la tarde. ¿Cuántas horas de telefonistas se ahorraría el gerente? Sugerencia: Usar Split File para dividir los datos por hora. Para calcular los percentiles 98 de las nueve distribuciones en un solo paso, colocar en dos columnas de la vista de datos los valores de μ y σ para cada una de las 9 horas pedidas (tomándolos del visor con: Frequencies > Pivoting Trays > pasar Statistics a Layer > seleccionar las medias y luego las desviaciones estándar). Luego colocar el nombre de estas dos variables generadas, en la fórmula de cálculo del percentil (IDF.Normal). R: a) 6 telefonistas por hora, b) cantidad de telefonistas por hora entre las 8 de la mañana y

Page 235: Capítulo 3 Distribuciones de Probabilidades 7aprehender.net/Estadistica/Ch3SPSS/CH3.pdf · • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones

Problemas – Problemas con base de datos

235

las 4 de la tarde. 4-6-5-6-5-6-7-7-4. Se ahorra 4 horas de telefonistas por día (por ejemplo reasignándolos en otras funciones) y puede mejorar la deficiencia que se observa en la solución a) a las 2 de la tarde y a las 3 de la tarde.