unidad v: estimación de parámetros. propósito de la inferencia de estadística estimación de...

21
Unidad V: Estimación de Parámetros

Upload: pastora-quevedo

Post on 22-Jan-2016

354 views

Category:

Documents


3 download

TRANSCRIPT

Unidad V: Estimación de

Parámetros

Propósito de la Inferencia de estadística

Estimación de parámetros Pruebas de Hipótesis

Puntual Intervalar

Métodos de Estimación

Momentos

Máximo Verosímil

Propiedades

Método del Pivote

Nivel de Confianza

Pruebas de Hipótesis Concepto

Tipos de erroresHipótesis NulaHipótesis alternativa

UnilateralBilateral

Nivel de Confianza

Valor-p

Región Crítica

Decisión

5.7 Propiedades de los estimadores puntuales

Es interesante establecer algunos criterios bajo los cuales la calidad de un estimador puede ser evaluada. Estos criterios definen, en general, propiedades deseables de los estimadores que nos sirven para compararlos.

sesgado. es que dice

se contrario caso En . todo para si. sólo y si insesgado

es que dice Se . parámetro un de puntual estimador un Sea

ˆ)ˆ(

ˆˆ

E

Sesgo:

)ˆ(

ˆ

EB

B expresión la por dado está puntual estimador un de sesgo El

Estimadores Insesgados:

.

ˆ,1

)(1

ˆ

22

22

2

2

2

2

de

sesgado estimador un sería tanto por y es media su que

sencontramo varianza la de estimador como usamos Si

.insesgados serán estos , lpoblaciona varianza

la y lpoblaciona media la de sestimadore como y utilizamos Si

n

n

XXn

SX

i

:que tiene se de insesgado

estimador otro cualquier si ,estimador un es que Decimos . de insesgado estimador un Sea

*

,)()ˆ(

ˆˆ

*VarVar

θ para varianza mínima de insesgado

Por lo tanto, dados dos estimadores para el parámetro θ, y siendo todo el resto de las condiciones equivalentes para ambos, se elegirá siempre aquel de menor varianza.

Ejemplo

ones?distribuci estas para varianza, mínima y ntoinsesgamie de términos en ,

de distinto , para mejor estimador otro encontrar ¿Podríamos , tamaño de fija muestra una en basándonos :es formular de natural pregunta Una

crece. cuando mejora de estimador como de calidad la varianza, mínima de

criterio un en basándose que, entonces claro Es aumenta. cuando decrece pero ; de depende no que crece. cuando mejora de

calidad la si averiguar interesa Nos Bernoulli. óndistribuci una de parámetro de y )( Poisson óndistribuci una de media la de Normal; óndistribuci unade parámetro , de insesgado estimador un es tanto, lo Por l.poblaciona

media la de insesgado estimador un es muestral media la que Sabemos

Xn

nXn

nXVnXEnX

p

XX

/)()( 2

La respuesta está en la desigualdad de Cramer-Rao que proporciona una cota inferior para la varianza de cualquier estimador insesgado del parámetro de una distribución de probabilidades, bajo condiciones de regularidad que incluyen:

i. El espacio de valores de la variable aleatoria involucrada debe ser independiente del parámetro.

ii. La función de densidad (o función de probabilidad) debe ser una función continua y diferenciable del parámetro.

Teorema 5.7 (Cramer-Rao). Sea X1,…,Xn una muestra

aleatoria de tamaño n de una población X con función de densidad (o función de probabilidad) f(x,θ), que depende de un parámetro θ desconocido, y satisface las condiciones de regularidad.

2

1

),(ln

1)ˆ(

),,(ˆ

xfnE

Var

XXT n

Entonces . para insesgado estimador un Sea

)(

))ˆ(1(

));(ln(

))ˆ(1(

ˆ

2

2

2

ˆ

I

B

xfnE

B

2

expresión. la por dada está Rao-Cramerde cota la que probar puede se , de insesgado estimador un es no Si

La cantidad I(θ) es conocida como cantidad de información o Información de Fisher. De aquí que la CCR también se conoce con el nombre de Desigualdad de Información.

En la clase de estimadores insesgados, la cota inferior en la desigualdad de información es 1/I(θ), independientemente del estimador que estemos considerando.

La desigualdad de Cramer-Rao se puede escribir como:

}/);(ln{

1)ˆ(

22

XfnE

Var

La CCR puede extenderse fácilmente para ciertas transformaciones del parámetro. Específicamente, si φ = g(θ) es una transformación uno a uno y diferenciable, entonces:

de insesgado estimador un es donde

para para

ˆ

)ˆ()(

)ˆ(2

VarCCRd

dgVarCCR

.ˆ llama se a,su varianz a Rao-Cramer de

cotasu derazón la , de ˆ insesgadoestimador un Dado

θ de eficiencia

2)ˆ()ˆ(

ˆ

ECME

:por define

se puntual estimador un de (CME) error del Medio Cuadrado El

)ˆ()ˆ(

ˆ

VarCME

entonces , parámetro del insesgado estimador un es Si

Ejemplo

Sea X1, X2 una muestra aleatoria de tamaño 2 de X con

distribución Exponencial de parámetro desconocido.

mejor? es dos los de ¿cuál medio, cuadrático error del

términos En de sestimadore a y a osConsiderem ./1ˆˆ2121 XXX

)()()((

)((ˆ(

2/(1ˆ(ˆ(

212121

221212

211

XEXEXXEXXVar

XXEXXVarCME

XVarCME

)

donde de

))

Ahora,

. de insesgado estimador un ser por ),)) El

22

4

2

442

21

2

2222

21

2/12/10

2/1

)ˆ(

ˆ

)/1)/)(4/1(()(

16

16)16/(/1)(

2/)/()2/3(

)(

)(

2

2

por dado está de Medio Cuadrático Error el aquí, De

y

tanto lo Por

. parámetro de lexponencia con Calculemos

CME

XXB

XXVar

dxexXE

XXE

x

0)ˆ(lim

1)ˆ(lim

ˆ

nn

nn

n

P

P

ementeequivalent o

:que tiene se

0, cualquier para si, para econsistent dice se estimador El

Teorema 5.8

0)ˆ(lim

ˆ

nn

n

Var

si econsistent es de insesgado estimador Un

Ejemplo

Sea X1,…,Xn una muestra aleatoria de una población con

distribución de probabilidades con media y varianza 2 < .

. la como conocido también es hecho

Este . a adprobabilid en converge que decir puede se ementeEquivalent

te.directamen aplica se

anterior teorema el crece, cuando , como y , para insesgado

estimador un es que Dado . y que Sabemos

Números Grandes los de Ley

X

nXVar

XnXVarXE

0)(

/)()( 2

. de econsistent estimador un es que osVerifiquem X

Sea X1,…,Xn una muestra aleatoria de una distribución de

probabilidades con parámetro desconocido θ. T = T(X1,

…,Xn) es un estadístico suficiente para θ, si y sólo si, la

distribución condicional de (X1,…,Xn) dado T = t, para todo

valor de t, es independiente de θ.

Ejemplo

Consideremos los resultados observados de n ensayos Bernoulli independientes X1,…,Xn donde Xi = 1 con

probabilidad p y es 0 con probabilidad 1 – p.

? de funciones

otras observando , de acerca adicional ninformació ganar ¿Podemos

, de valor el conocemos Si ensayos. los en éxitos de Nº Sea

n

n

ii

XX

p

TnXT

,,1

1

Una manera de responder es observar la distribución condicional de X1,…,Xn dado T = t; esto es:

t

ntnptpt

n

tnptpnn tTxXxXP 1

)1(

)1(11 ),...,(

. de función es no y , y de sólo función una es donde

forma la de tivas,

-nega no funciones dos en afactorizad ser puede ), tudverosimili

de función (la de conjunta densidad la si, sólo y si para suficiente

oestadístic un es . aleatoria muestra la en basado

oestadístic un Sea

hTg

XhxTgxL

xL

X

XTXXX

XT

n

)()),((),(

),(

)(),...,(

),(

1

Fisher) de iónFactorizac (de 5.9 Teorema

Ejemplo

Sea X1,…,Xn una muestra aleatoria de una población con

distribución exponencial con media ; esto es, Xi posee

función de densidad.

nixxxf iii ,1,0)/exp(/1),( ,

La función de verosimilitud de la muestra es la densidad conjunta

nn xnxxfL /)]/[exp(),...,,( 1

. para suficiente oestadístic otro es que también Notemos

. para suficiente estimador un es que concluir podemos

) y con iónfactorizac de teorema

el aplicando , y de sólo depende que función una es Como

j

n

X

X

xhxnxg

xL

,1(/)]/[exp(),(

Ejemplo Sea X1,…,Xn una muestra aleatoria de una distribución uniforme en

(0,θ) y determinemos un estadístico suficiente para θ.

La función de verosimilitud de la muestra aleatoria es

nixxL in ,,1),0()/1(),( todo para ,

lo que es equivalente a escribir

),,,(;)/1(),( 21)()( nnnn xxxmáxxxxL donde para ,

Así, tenemos la factorización

),)()(),0( ,()()/1(),( nnn XgxIxL

donde

Ax

AxxIA

si

si

0

1)(

es la función indicadora de un conjunto A.

Prob.: Se registraron los siguientes datos, en días, que representan el tiempo de fabricación de un determinado producto con dos procesos distintos.

Proceso 1 34 17 2.5Proceso 2 56 19 1.8a) Encuentre un I. de C del 95% para el tiempo promedio de fabricación

del proceso 1.b) Se cree que la persona que tomó los datos en el proceso 1 no lo hizo

correctamente, ya que experiencias anteriores indican que la varianza es de 12,9683. Para demostrar que S obtenida anteriormente estaba errada, se considera una nueva muestra aleatoria de 10 tiempos. ¿Cuál es la probabilidad que la varianza muestral de esta nueva muestra, supere el valor obtenido anteriormente?.

Ejemplos:

Prob.: Se registraron los tiempos utilizados en la compra para 64 clientes seleccionados al azar en un supermercado local. La media y la varianza de los 64 tiempos de compra fueron 33 minutos y 256, respectivamente. Encuentre un I. de C. del 95 % para el verdadero tiempo promedio.

Ejemplos: