distribuciones muestrales
TRANSCRIPT
Distribuciones fundamentales Distribuciones fundamentales de Muestreode Muestreo
Población: Consiste en la totalidad de las observaciones en las que estamos interesados.
Cada observación en una población es un valor de una v. a. X que tiene alguna distribución de probabilidad . xf
La media(valor esperado) de una población
La varianza de la población
población normal
población xf
Muestra
Población
Muestra
Población
INFERIR
Muestra Aleatoria: ''observaciones realizadas al azar en forma independiente''
¿Qué información nos trasmiten los datos?
v. a. Xi i= 1,...,n Xi :''i_ésima medición o valor de la muestra que observemos''
nXX ,,1muestra aleatoria de la población )(xf
MuestraMuestra AleatoriaAleatoria
nxx ,,1
Cualquier función de las v. a. que forman una muestra aleatoria.
EstadísticoEstadístico
n
X
X
n
ii
1
11
2
2
n
XX
S
n
ii
La distribución de probabilidad de un estadístico
Distribución Muestral
Distribución Muestral de la Media
2,.~ normalX
n
normalX2
,.~
Sea una población con media μ y desviación típica σ.
tiene por media μ y desviación típica σ/√n
La distribución de las medias de las muestras aleatorias (con reposición) de tamaño n,
Teorema del límite centralTeorema del límite central
Dada una población, con media μ y desviación típica σ finitas, y seleccionamos al azar muestras aleatorias de tamaño n, entonces a medida que n crece la distribución de las medias muestrales se aproxima a una distribución normal.
Teorema del límite centralTeorema del límite centralDada una población, con media μ y desviación típica σ finitas, y seleccionamos al azar muestras aleatorias de tamaño n, entonces la forma límite de la distribución de Z conforme n crece indefinidamente
)1,0;(~ zNn
XZ
Distribución muestral de la media
Veremos primero el caso de que la distribución subyacente sea normal, con media y varianza 2
La media de la distribución muestral de medias es
La varianza de la distribución muestral de medias es 2 / n
La forma de la distribución muestral de la media muestral es normal.
Ejemplo 1
N10
400
300
200
100
0
Desv. típ. = 4.75
Media = 99.9
N = 3600.00
Distribución poblacional subyacente (dist. Normal):
Media = 100
Varianza = 225
Desv. típica = 15
Distribución muestral de la media:
Tamaño muestral =10
Media = 100
Varianza = 225/10 =22.5
Desv.típica =En este y sucesivos gráficos: Número de muestras n 22.5 4.74
Distribución muestral de la mediaVeamos ahora el caso en que la distribución subyacente sea arbitraria, con media y varianza 2
La media de la distribución muestral de medias es
La varianza de la distribución muestral de medias es 2 / nLa forma de la distribución muestral de la media TAMBIÉN tiende a ser normal. En concreto, la distribución muestral se acercará más y más a la distribución normal (media y varianza 2/n) a medida que se aumente el tamaño de cada muestra.
Ejemplo 4Distribución poblacional subyacente (dist. Gamma):
Media = 100
Varianza = 100
0
0.005
0.01
0.015
0.02
0.025
0.03
0.035
0.04
0.045
80 85 90 95 100 105 110 115 120
0,)(
)( 1
xexp
qxf qxp
p
q
pXE ][
2][
q
pXVar
Ejemplo 4Distribución poblacional subyacente (dist. Gamma):
Media = 100
Varianza = 100
DISGAMMA
500
400
300
200
100
0
Desv. típ. = 3.12
Media = 100.0
N = 3600.00
Distribución muestral de la media:
Tamaño muestral = 10
Media = 100
Varianza = 100/10 = 10
Desv. típica = 10 3.16
Distribuciones usadas en inferenciaDistribuciones usadas en inferenciaDistribución Ji-Cuadrado o Chi-cuadrado o 2 de Pearson con “n” grados de libertad.Sean X1 , X2 , ... ,Xn n variables aleatorias continuas independientes tal que Xi = N (0,1) con i = 1, ..., n (i.i.d.). Definamos la variable aleatoria:
n
iniXY
1
22
0,
22
)(2
21
2
xn
eyyf n
yn
YSu densidad de probabilidadserá:
la función gamma es:
0
1 dyey y
nYE nYVar 2
Distribución Muestral de SDistribución Muestral de S22
Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma de una población normal que tiene la varianza entonces el estadístico:
tiene una distribución ji cuadrada con n -1 grados de libertad.
n
i
i XXSn
12
2
2
22 )1(
Distribución Muestral deDistribución Muestral de
Probability Density Function
y=chi2(x,10)
0.000
0.044
0.087
0.131
0.175
0.00 6.25 12.50 18.75 25.00
2
2*)1(
sn
22
2
1 como distribuye se
)1,0( como distribuye se
),( como distribuyese Si
xx
Nxx
NX
2*
11
2* s)1(
1
1s 22
nxxxxn
n
i
n
i
212 como distribuye se
)1( 2*
nsn
n
iniX
1
22
Tipificando
TABLA DE 2
2n
0.99 0.975 0.025 0.01n1
2
3
4
5
grados de libertadvalores acumulados de 2
n
orden percentílico
p
Usos de la Ji-Cuadrado
a) Para hacer inferencias acerca de la varianza poblacional. Es decir, para calcular Intervalos de Confianza y Prueba de hipótesis para la varianza poblacional.
b) Para hacer pruebas de Bondad de Ajuste. O sea, para probar si un conjunto de datos sigue una distribución pre-determinada.
c) Para hacer análisis de tablas de contingencia.
Student era el seudónimo de W.S. Gosset, un pionero estadista que trabajó en la Cervecería Guiness de Dublín.
Sea X v.a.c. tal que X ~ N (0,1)Y v.a.c. tal que Y ~ 2
n
nY
Xtn
tn
n
ntn
tf
n
T ,
2
12
1
)(
2
12
Con función de densidad de probabilidad:
Distribución t de Student
Distribución t de Student
Supongamos que la población es normal con media y varianza desconocida y que se desea hacer inferencias acerca de , basada en una muestra pequeña (n < 30) tomada de la población. En este caso la distribución de la media muestral ya no es normal, sino que sigue la distribución t de Student.
X
Si de una población Normal con media y desviación estándar se extrae una muestra de tamaño n, entonces el estadístico:
n
sx
t
se distribuye como una t de Student con n-1 grados de libertad.
Distribución t de Student
La distribución t de Student es bastante similar a la Normal Estándar, con la diferencia que se aproxima más lentamente al eje horizontal.
El parámetro de esta distribución son los grados de libertad.
-4 -3 -2 -1 0 1 2 3 4
0.0
0.1
0.2
0.3
0.4
x
C2
Curva Normal Estandar y T con 5 grados de libertad
Hecho por Edgar Acuna
Curva NormalEstandar
t con 5gl.
0tE 2
n
ntVar
Cuando la distribución de la población de la que obtenemos las medias muestrales no es normal, el estadístico anterior, se distribuye como una normal tipificada para valores de n > 30.
n
sx
t
TABLA DE LA DISTRIBUCION t DE STUDENT
t.55 t.60 t.99 t.995n1
2
3
4
5
orden percentílico
grados de libertad valores acumulados de tp
tp
Distribución F de Fisher o F-Snedecor
Definamos ),( mnF
mYnX
Z
0,)(
22
2)( 2
12
2/2/
zmnz
mn
mnmn
zfmnn
nn
Z
Sea X v.a.c. tal que X ~ 2n
Y v.a.c. tal que Y ~ 2m independientes
2
m
mZE
)()()(42
222
2
mmnmnm
ZV
(m,n)
Distribución muestral del estimador
Cuando las distribuciones de la que obtenemos las varianzas muestrales son normales:
y extraemos dos muestras de tamaño n y m respectivamente. El estadístico anterior se distribuye según la distribución F de Fisher con n - 1 grados de libertad en el numerador y m -1 grados de libertad en el denominador, Fn-1, m-1.
22*
22*
/
/
yy
xx
s
s
),(),( yyxx NyN