jaimevázquez lizbethnaranjo ruthfuentes...

42
Estimación por intervalo Jaime Vázquez Lizbeth Naranjo Ruth Fuentes Margarita Chávez Proyecto PAPIME UNAM PE107117 “Estadística para estudiantes de ciencias”

Upload: others

Post on 03-Aug-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por intervalo

Jaime Vázquez • Lizbeth Naranjo • Ruth Fuentes • Margarita Chávez

Proyecto PAPIME UNAM PE107117“Estadística para estudiantes de ciencias”

Page 2: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Índice general

Índice general 1

Introducción 2

1. Estimación por intervalo 31.1. Intervalos de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.1.1. Método pivotal para encontrar intervalos de confianza . . . . . . . . . 81.1.2. El método de la cantidad pivotal para funciones de distribución continuas 12

1.2. Intervalos de confianza para los parámetros de po-blaciones normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.2.1. Intervalos para la media . . . . . . . . . . . . . . . . . . . . . . . . . 171.2.2. Intervalo para la varianza . . . . . . . . . . . . . . . . . . . . . . . . 191.2.3. Intervalo para la diferencia de medias de poblaciones inde-

pendientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.2.4. Intervalo para el cociente de varianzas de poblaciones inde-

pendientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241.3. Intervalos de confianza para muestras grandes . . . . . . . . . . . . . . . . . 26

1.3.1. Intervalo de confianza para el parámetro p de una distribución Binomial 281.4. Enfoque Bayesiano en la estimación por intervalo . . . . . . . . . . . . . . . 311.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Bibliografía 41

1

Page 3: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Introducción

La estadística inferencial es una disciplina que se basa en gran medida en la probabilidad yque ayuda a resolver problemas mediante inferencias de alguna característica de la poblaciónusando datos muestrales de la misma.

La estadística involucra conceptos y resultados que pueden resumirse en grandes temas:análisis exploratorio de datos, distribuciones muestrales, estimación puntual, estimación porintervalo y pruebas de hipótesis, los cuales son fundamentales en el estudio y la aplicaciónde esta disciplina. En esta parte se abordarán los tópicos relacionados con la estimación porintervalo.

Se inicia con la exposición del concepto de intervalo de confianza y el método pivotal, paracontinuar con la deducción de los intervalos correspondientes a los parámetros de poblacionesnormales. Se concluye con la teoría para hallar intervalos en el caso de muestras grandes ycon una introducción al enfoque Bayesiano.

Para la lectura de este documento es importante contar con conocimientos de teoríade la probabilidad, así como de cálculo diferencial e integral en una y varias variables. Serecomienda la lectura previa de las notas introducción a la estadística y estimación puntualde los mismos autores.

2

Page 4: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

CAPÍTULO 1

Estimación por intervalo

Es usual iniciar el estudio de la inferencia estadística con el planteamiento de estimaciónpuntual para el parámetro (o los parámetros) de una distribución. En esta parte, se abordaráotro enfoque: el tema relacionado con la búsqueda de un margen de variación para el valorque el parámetro puede tomar, es decir, el planteamiento de estimación por intervalo.

Desde esta perspectiva, para inferir respecto a una característica de la población, seprocede a su estimación a partir de los datos encontrados en la muestra y se prefiere ahoraproponer un rango de valores que tenga la posibilidad de contener al parámetro. Esto se logrageneralmente mediante un intervalo que es entendido como un conjunto de valores (calculadoa partir de los datos de una muestra) en el cual puede encontrarse el verdadero valor delparámetro con un determinado nivel de certeza o confianza. Se comenzará introduciendo elconcepto de intervalo de confianza.

1.1. Intervalos de confianza

Es común que en los medios de comunicación como radio, televisión, revistas o periódi-cos, así como en redes sociales, se presenten resultados de estudios estadísticos de los temasmás diversos. Las conclusiones suelen presentarse con frases como la siguiente: “El estudiomuestra que en el 75% de los casos se experimenta una mejoría (de cierta enfermedad),siendo el margen de error del 6% y el nivel de confianza del 95%”. El cálculo de intervalosde confianza para la estimación de parámetros permite hacer declaraciones sobre qué valoresse pueden esperar para una característica que se esté estudiando; aunque, a diferencia de laestimación puntual, se habla de un nivel de confianza que tendrá una influencia en el intervalo

3

Page 5: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

calculado: intuitivamente la confianza se refiere a la certeza con la que el método dará unarespuesta correcta, y por lo tanto se pedirá que ese nivel de confianza sea alto.

Replanteando el problema de encontrar un rango de valores para θ, se tiene lo siguiente:si θ ∈ Θ (el espacio paramétrico) y se quiere disminuir el grado de desconocimiento de θen f (x; θ), se debe seleccionar un subconjunto Θ1 de Θ en el cual pueda afirmarse, con unmargen de error pequeño, que se encuentra el valor de θ que caracteriza la distribución dela población. Por ejemplo, suponga que se tiene una muestra aleatoria X1, . . . , Xn de unapoblación con distribución N(µ, σ2), con σ2 conocida y µ desconocida y se desea estimar elparámetro µ. La estadística T (X) = X tiene distribución N(µ, σ2/n), entonces,

Z :=X − µ

σ/√n∼ N(0, 1).

Note que

P[−1.96 < Z < 1.96] = φ(1.96)− φ(−1.96) = φ(1.96)− (1− φ(1.96))

= 2φ(1.96)− 1 = 2(0.9725)− 1 = 0.95.

A partir de que se sabe que P[−1.96 < Z < 1.96] = 0.95, se obtiene lo siguiente:

−1.96 < X − µ

σ/√n

< 1.96,

si y sólo si

−1.96 σ√n

< X − µ < 1.96σ√n,

si y sólo si

X − 1.96 σ√n< µ < X + 1.96

σ√n,

de donde

P

[X − 1.96 σ√

n< µ < X + 1.96

σ√n

]= 0.95.

Lo que indica la expresión

P

[X − 1.96 σ√

n< µ < X + 1.96

σ√n

]= 0.95,

es que hay una probabilidad de 0.95 de obtener una muestra tal que el intervalo(X − 1.96 σ√

n, X + 1.96

σ√n

),

incluya al valor de µ. Esto motiva la definición 1.1 de intervalo aleatorio, aunque en estemomento, y haciendo referencia al ejemplo anterior, se puede adelantar que un intervalo enel que al menos uno de los extremos es una variable aleatoria se llama intervalo aleatorio.

4

Page 6: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

Una vez usada la distribución de X para establecer la conclusión anterior, se obtiene unvalor particular de x, con base en una muestra, y se determina el intervalo numérico

(x− 1.96 σ√

n, x+ 1.96

σ√n

). (1.1)

En este caso no tiene sentido hablar de la probabilidad de que el intervalo aleatorio contengaal parámetro, ya que no hay ninguna variable aleatoria. Ahora, el 0.95 expresa el margen deconfianza con el que se puede afirmar que el valor desconocido de µ está entre los extremos delintervalo, en el sentido de que repitiendo el muestreo un gran número de veces, se obtendríanintervalos distintos, entre los cuales aproximadamente el 95% de estos intervalos contienenel valor correcto de µ.

Por lo tanto, el intervalo numérico(x− 1.96 σ√

n, x+ 1.96 σ√

n

)se llama intervalo de con-

fianza para µ con un nivel del 95%.

Observación 1.1 Un ejercicio para analizar el concepto de intervalo de confianza consisteen simular algunas muestras de una determinada población normal, calcular los intervaloscorrespondientes a un cierto nivel de confianza y observar la proporción de estos intervalosque contienen al verdadero valor de la media.

El resultado de un ejercicio de simulación se muestra resumido en las gráficas de lafigura 1.1, en donde se ha utilizado la expresión (1.1) para el cálculo de los intervalos.

- Cada una de las gráficas representa intervalos correspondientes a 100 muestras paradiferentes tamaños de muestra, todas con µ = 100 y diferentes valores de σ.

- El ejercicio se hizo utilizando el software estadístico R.- Las líneas en negro representan los intervalos que no contienen al verdadero valor de la

media µ en cada uno de los casos considerados.- Se usó un nivel de confianza del 95%.Así, la primera gráfica representa los intervalos correspondientes a 100 muestras de tamaño

10 de una distribución normal con media igual a 100 y σ = 10.

5

Page 7: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

85 90 95 100 110

020

40

60

80

10

0

85 90 95 100 110

02

040

60

80

100

85 90 95 100 110

02

040

60

80

100

Figura 1.1: Intervalos correspondientes a 100 muestras para diferentes tamaños de muestra,todas con µ = 100 y diferentes valores de σ.

Si se desea un intervalo del 99% de confianza en este caso de la distribución normal,primero se debe observar que:

P[−2.576 < Z < 2.576] = 0.99.

Entonces, a partir de la expresión anterior, se obtiene que(x− 2.576 σ√

n, x+ 2.576

σ√n

)

es un intervalo del 99% de confianza para µ. Note que a mayor nivel de confianza, mayores la longitud del intervalo. Usualmente se fija un nivel de confianza y entonces se genera elintervalo.

Observe también que en el primer ejemplo(x− 1.96 σ√

n, x+ 1.96 σ√

n

)no es el único inter-

valo del 95% de confianza para µ, pues P[−1.74 < Z < 2.37)] = φ(2.37) − φ(−1.74) =φ(2.37) − 1 + φ(1.74) = 0.95. Sin embargo, el de longitud mínima es el originado porP[−1.96 < Z < 1.96] = 0.95.

En general, si para este caso de la distribución N (µ, σ2) , se tiene que:

P

[a <

X − µ

σ/√n

< b

]= γ,

6

Page 8: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

entonces,

a <X − µ

σ/√n

< b⇔ aσ√n

< X − µ < bσ√n⇔ X − b

σ√n

< µ < X − aσ√n.

Suponga que se desea minimizar la longitud del intervalo dada por (b−a) σ√n, con la restricción

de que P[a < Z < b] = 0.95, es decir, FZ(b) − FZ(a) = 0.95, donde FZ (z) es la función dedistribución de una población N (0, 1) . Para este problema de optimización, se define lafunción

L = b− a− λ(FZ(b)− FZ(a)− 0.95).Entonces,

∂L∂a

= 0⇔ −1 + λfZ(a) = 0⇔ λfZ(a) = 1 y también

∂L∂b

= 0⇔ 1− λfZ(b) = 0⇔ λfZ(b) = 1.

De donde, fZ(a) = fZ(b); por lo tanto, a = −b debido a la simetría de fZ . Es decir, ladistancia b− a será minimizada (para un área fija) cuando fZ(a) = fZ(b).

Definición 1.1 Sea X1, . . . , Xn una muestra aleatoria de la densidad f(x; θ) y τ (θ) unafunción de θ. Sean T1(X) y T2(X) de forma que T1 ≤ T2 y P(T1 < τ (θ) < T2) = γ (γ nodepende de θ). Entonces a (T1, T2) se le llama un intervalo aleatorio y a un valor del intervaloaleatorio (t1, t2), se le llama intervalo de confianza o un intervalo del γ(100%) de confianzapara τ(θ).

Como ilustración, considere a X1, . . . ,Xn una muestra aleatoria de la población con dis-tribución N(θ, 9). Suponga que T1(X) = X − 6√

ny T2(X) = X + 6√

ny que (T1, T2) forma un

intervalo para τ(θ) = θ. En este caso,

P

[X − 6√

n< θ < X +

6√n

]= P

[−2 < X − θ

3/√n

< 2

]= φ(2)− φ(−2)

= 2φ(2)− 1 = 2(0.9972)− 1 = 0.9544,

siendo 0.9544 el nivel de confianza. Por ejemplo, si se tiene una muestra aleatoria de 25 ob-

servaciones, con una media muestral de 17.5, entonces se dice que(17.5− 6√

25, 17.5 + 6√

25

)

es un intervalo del 95.44% de confianza para θ.

Note que alguna de las dos estadísticas (pero no ambas) T1(X) ó T2(X) puede ser cons-tante; es decir, alguno de los dos extremos del intervalo aleatorio (T1, T2) puede ser constante.

7

Page 9: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

Definición 1.2 Sea X1, . . . , Xn una muestra aleatoria de la densidad f(x; θ). Sean T1(X)una estadística para la cual P(T1 < τ(θ)) = γ; entonces T1 induce el intervalo de confianzaunilateral inferior (t1(x),∞) con un nivel de confianza γ. De manera análoga, si T2(X) esuna estadística para la cual P(τ (θ) < T2) = γ; entonces T2 induce el intervalo de confianzaunilateral superior (−∞, t2(x)) con un nivel de confianza γ (γ no depende de θ).

Observación 1.2 Si ya se ha determinado un intervalo de confianza para θ, entonces, sepuede determinar una familia de intervalos de confianza. De manera más específica, para unnivel de confianza del γ(100%) dado; si se tiene un intervalo de confianza para θ al γ(100%)de confianza, entonces se puede obtener un intervalo con el mismo nivel de confianza paraτ(θ) donde τ es una función creciente (estricta). Por ejemplo, si τ es una función crecientey (T1, T2) es un intervalo de confianza para θ, entonces (τ(T1), τ (T2)) es un intervalo deconfianza para τ (θ) pues

γ = P[T1(X) < θ < T2(X)] = P[τ(T1(X)) < τ (θ) < τ (T2(X))].

A continuación se describirá un método para encontrar intervalos de confianza, el cual seconoce como el método de la cantidad pivotal o simplemente método pivotal.

1.1.1. Método pivotal para encontrar intervalos de confianza

Definición 1.3 Sea X1, . . . , Xn una muestra aleatoria de la densidad f(x; θ). Sea Q =q(X1,X2, ..., Xn; θ), es decir Q es una función de la muestra aleatoria y de θ. Si la dis-tribución de Q no depende de θ, entonces a Q se le llama cantidad pivotal.

Ejemplo 1.1 Sea X1, . . . ,Xn una muestra aleatoria de la población con distribución N(θ, 1)

y sea τ(θ) = θ. En este caso, X ∼ N(θ, 1n), entonces Q1 :=

(X−θ)1/√

n∼ N(0, 1) por lo que Q1 es

una cantidad pivotal. También Q2 := X − θ es una cantidad pivotal pues Q2 ∼ N(0, 1n) (su

distribución no depende de θ). Pero Q3 :=Xθno es una cantidad pivotal, pues Q3 ∼ N(1, 1

θ2n).

Definición 1.4 Método pivotal para intervalos de confianza. Sea Q = q(x1, . . . , xn; θ)una cantidad pivotal. Entonces, para cualquier γ ∈ (0, 1), existirán q1 y q2 que dependen deγ tal que

P [q1 < Q < q2] = γ.

Si para cada posible muestra (x1, . . . , xn) se cumple que

q1 < q(x1, . . . , xn; θ) < q2,

si y sólo sit1 (x1, . . . , xn) < τ (θ) < t2 (x1, . . . , xn) ,

para funciones t1 y t2 que no dependen de θ, entonces (t1, t2) es un intervalo del γ(100)% deconfianza para τ (θ).

8

Page 10: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

En este método, la desigualdad q1 < Q < q2 se reescribe, invierte o pivotea como t1(x) <τ(θ) < t2(x).

Como se vió antes en el ejemplo de la distribución normal, puede haber distintos interva-los que proporcionen el mismo nivel de confianza, por lo que se busca el que tenga longitudmínima. Desde una perspectiva más general, el siguiente resultado será de utilidad para en-contrar el intervalo de confianza más corto cuando la cantidad pivotal tenga una distribucióncon una densidad unimodal.

Proposición 1.1 Sea f (x) una densidad unimodal y F (x) su función de distribución aso-ciada. Sea [a, b] un intervalo que satisface que

F (b)− F (a) = 1− α, (1.2)

para α tal que 0 < α < 1. Entonces de entre todos los intervalos que cumplen (1.2), [a0, b0]tiene la longitud mínima si f (a0) = f (b0) > 0 y a0 ≤ x∗ ≤ b0, donde x∗ es la moda de f (x) .Si además f (x) es simétrica, entonces a0 = F−1 (α

2

)y b0 = F−1 (1− α

2

).

Demostración:Se trata de minimizar la longitud b− a sujeta a F (b)− F (a) = 1− α. Usando multipli-

cadores de Lagrange, se define:

L (a, b, λ) = b− a+ λ(1− α− F (b) + F (a)),

de donde:∂L∂a

= 1− λf(a) = 0,

∂L∂b

= 1− λf(b) = 0

y1− α− F (b) + F (a) = 0.

De las primeras dos ecuaciones se obtiene que f(a) = f(b) > 0. Si x∗ /∈ [a, b] y f(a) = f(b),entonces b− a > b0 − a0, pues f (x) es unimodal y F (b)− F (a) = F (b0)− F (a0) .

Así por ejemplo, si la cantidad pivotal tiene una distribución Ji cuadrada, los cuantilesde orden α/2 y 1 − α/2 de esta distribución contendrán a la moda de la distribución paraα pequeño y, de acuerdo a la proposición anterior, proporcionarán el intervalo más corto detamaño 1− α.

9

Page 11: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

Algunos ejemplos

Ejemplo 1.2 Suponga que se tiene una variable aleatoria con una distribución exponencialcon parámetro λ = 1

θ. Obtenga un intervalo del 90% de confianza para θ.

Como X ∼exponencial, sus funciones de densidad y de distribución son, respectivamente,

f(x; θ) =1

θe−x/θ,

FX(x) = 1− e−x/θ,

con x > 0 y θ > 0. Sea Y = Xθ, entonces

FY (y) = P [Y ≤ y]

= P

[X

θ≤ y

]

= P [X ≤ θy]

= FX(θy),

que implica que Y ∼exponencial(1). Por lo tanto Y = Xθpuede ser una cantidad pivotal ya

que es una función de la muestra X y del parámetro θ, y su distribución no depende de θ.Así que el intervalo del 90% de confianza para θ puede determinarse a partir de

P

[a <

X

θ< b

]= 0.90,

donde

P

[X

θ< a

]= P [X < aθ]

= 1− e−a = 0.05

lo que implica que

e−a = 0.95

a = − log(0.95) = 0.051,

y por otro lado,

P

[X

θ> b

]= P [X > bθ]

= e−b = 0.05

lo que implica queb = − log(0.05) = 2.996,

10

Page 12: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

entonces (0.051 <

X

θ< 2.996

),

(X

2.996< θ <

X

0.051

).

Por lo tanto,(

X2.996

, X0.051

)es el intervalo del 90% de confianza para θ.

Ejemplo 1.3 Sea X una variable aleatoria con distribución uniforme en el intervalo (0, θ).Obtener un intervalo del 95% de confianza para θ.

Se sabe que

fX (x) =1

θI(x)(0,θ),

FX (x) =

∫ x

0

1

θdt =

x

θ.

Sea Y una variable aleatoria definida como Y = Xθ, entonces

FY (y) = P (Y ≤ y)

= P

(X

θ≤ y

)

= P (X ≤ θy)

= FX (θy)

=θy

θ= y.

Por lo tanto, la variable aleatoria Y = Xθtiene una distribución uniforme en el intervalo

(0, 1). Así, Q = Xθes una cantidad pivotal ya que Q es una función de la muestra X y del

parámetro θ y la distribución de Q no depende de θ porque Q ∼ Uniforme (0, 1).Para obtener un intervalo del 95% de confianza para θ puede usarse la cantidad pivotal

de la siguiente manera:P [a < Q < b] = 0.95.

Como Q ∼ Uniforme (0, 1), se pueden tomar cualesquiera cantidades a y b pertene-cientes al intervalo (0, 1) tal que b− a = 0.95. Esto implica que se podría tomar a ∈ (0, 0.05)y b = 0.95 + a. Entonces, el intervalo del 95% confianza para θ estaría determinado por losiguiente:

P

[a <

X

θ< b

]= 0.95

P

[X

b< θ <

X

a

]= 0.95.

11

Page 13: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

Por lo tanto(

Xb, X

a

)es un intervalo del 95% de confianza para θ. O de manera equivalente,(

X0.95+a

, Xa

)es un intervalo del 95% de confianza para θ.

La longitud del intervalo es

L =X

a− X

0.95 + a,

y la longitud esperada del intervalo es

E [L] =

(1

a− 1

0.95 + a

)E [X] .

Si se buscara un intervalo de confianza con menor longitud esperada, se buscaría minimizarE [L], lo que equivale a encontrar el valor de a tal que E [L] alcance su mínimo, y este valores cuando a = 0.05, lo que implica que b = 1. Por lo tanto, el intervalo del 95% para θ conlongitud esperada mínima es

(X, 1

0.05X).

Ejemplo 1.4 Suponga queX1, X2, . . . , Xn es una muestra aleatoria de una población con dis-tribución exponencial(θ).

∑ni=1Xi es una estadística suficiente y tiene distribución Gama(n, θ),

además2∑ni=1 Xi

θ∼ χ2(2n). Entonces la variable Q =

2∑n

i=1 Xi

θpuede ser la cantidad pivotal para

obtener un intervalo del 100(1− α)% de confianza para θ. Así que

P

[qα/2 <

2∑n

i=1Xi

θ< q1−α/2

]= 1− α,

donde qα/2 y q1−α/2 son los cuantiles α/2 y 1 − α/2 de una distribución χ2(2n). El intervalopara θ que se deduce de esta última expresión es

(2∑n

i=1Xi

q1−α/2,2∑n

i=1Xi

qα/2

).

La distribución χ2 es unimodal y como (qα/2, q1−α/2) contiene a la moda de la distribución paraα razonablemente pequeño, la proposición 1.1 establece que (qα/2, q1−α/2) tiene un intervalo

de menor longitud que contiene a2∑ni=1 Xi

θcon probabilidad 1− α. Por lo tanto, el intervalo(

2∑n

i=1 Xi

q1−α/2,2∑ni=1 Xi

qα/2

)es el de menor longitud.

1.1.2. El método de la cantidad pivotal para funciones de distribu-ción continuas

Cuando se tiene una muestra aleatoria de una población cuya función de distribuciónes continua en x, es posible construir una cantidad pivotal como lo muestra el siguienteresultado.

12

Page 14: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

Proposición 1.2 Sea X1, ...,Xn una muestra aleatoria de la población con función de den-sidad f (x; θ) , tal que la función de distribución correspondiente F (x; θ) es continua en x.

Entonces −∑n

i=1 lnF (Xi; θ) o alternativamenten∏

i=1

F (Xi; θ), es una cantidad pivotal para

estimar θ.

Demostración:F (Xi; θ) tiene distribución uniforme en el intervalo (0, 1) , pues si U = F (X; θ) , se tiene

que

P (U ≤ u) = P [F (X; θ) ≤ u]

= P[X ≤ F−1(u)

]

= F(F−1 (u)

)

= u,

para 0 < u < 1. Por lo tanto, − lnF (Xi; θ) tiene distribución exponencial con parámetro 1,debido a lo siguiente:

P [− lnF (Xi; θ) ≥ u] = P [lnF (Xi; θ) ≤ −u]= P

[F (Xi; θ) ≤ e−u

]

= e−u,

para u > 0, es decir,P [− lnF (Xi; θ) ≤ u] = 1− e−u,

expresión que corresponde a la función de distribución de una variable aleatoria exponencial(1) .

Así que puede concluirse que

−n∑

i=1

lnF (Xi; θ) (1.3)

tiene distribución Gama con parámetros n y 1, al ser la suma de variables aleatorias inde-pendientes con distribución exponencial (1) .

Ahora (1.3) puede usarse como una cantidad pivotal de la siguiente manera:

13

Page 15: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

P

[q1 < −

n∑

i=1

lnF (Xi; θ) < q2

]= P

[−q2 <

n∑

i=1

lnF (Xi; θ) < −q1

]

= P

[−q2 < ln

n∏

i=1

F (Xi; θ) < −q1

]

= P

[e−q2 <

n∏

i=1

F (Xi; θ) < e−q1

]

= P

[a <

n∏

i=1

F (Xi; θ) < b

],

donde q1 y q2 son los cuantiles de la distribución Gama (n, 1) que corresponderán al nivel deconfianza deseado y con 0 < a < b < 1. La expresión anterior es equivalente a

P

[− ln b < −

n∑

i=1

lnF (Xi; θ) < − ln a].

Por ejemplo, si se tiene una muestra aleatoria de tamaño n de la población con densidad

f (x; θ) = θxθ−1, 0 < x < 1,

cuya función de distribución está dada por

F (x; θ) =

∫ x

0

θuθ−1du

= θuθ

θ

∣∣∣∣x

u=0

= xθ,

para 0 < x < 1. Si se seleccionan a y b tales que:

P

[a <

n∏

i=1

F (Xi; θ) < b

]= 1− α

o

P

[q1 < −

n∑

i=1

lnF (Xi; θ) < q2

]= 1− α,

14

Page 16: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

donde q1 = − ln b y q2 = − ln a son los cuantiles de una distribución Gama (n, 1) seleccionadosde tal manera que la probabilidad sea de 1−α. Para este caso particular,

n∏i=1

F (Xi; θ) =n∏

i=1

Xθi ,

por lo que

1− α = P

[a <

n∏

i=1

F (Xi; θ) < b

]

= P

[a <

n∏

i=1

Xθi < b

]

= P

[ln a < ln

n∏

i=1

Xθi < ln b

]

= P

[ln a <

n∑

i=1

lnXθi < ln b

]

= P

[ln a < θ

n∑

i=1

lnXi < ln b

]

= P

[ln a < θ ln

n∏

i=1

Xi < ln b

]

= P

ln b

lnn∏

i=1

Xi

< θ <ln a

lnn∏

i=1

Xi

,

donde la última desigualdad se sigue del hecho de que lnn∏

i=1

Xi es negativo. Entonces puede

concluirse que

ln b

lnn∏

i=1

xi

,ln a

lnn∏

i=1

xi

es un intervalo del 100(1− α) % de confianza para θ.

1.2. Intervalos de confianza para los parámetros de po-blaciones normales

Primero se recordarán algunos resultados técnicos para facilitar la construcción de di-chos intervalos. La demostración de dichos resultados se omitirá en virtud de que ya se han

15

Page 17: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

estudiado.

(a) Si X ∼ N(0, 1), entonces X2 ∼ χ2(1).

(b) Si X1, X2, . . . , Xn son variables aleatorias independientes tales que para cualquier j ∈{1, . . . , n} Xj ∼ χ2(mj)

, entonces X1 +X2, · · ·+Xn ∼ χ2(m1+···+mn).

(c) Si X1, X2, . . . , Xn son variables aleatorias independientes tales que para cualquier j ∈{1, . . . , n}, Xj ∼ N(µ, σ2); entonces

n∑

j=1

(Xj − µ)2

σ2∼ χ2(n).

(d) Si X1, X2, . . . , Xn son variables aleatorias independientes tales que para cualquier j ∈{1, . . . , n}, Xj ∼ N(µ, σ2); entonces

n− 1σ2

S2 ∼ χ2(n−1).

(e) Si X y Y son variables aleatorias independientes tales que X ∼ N(0, 1) y Y ∼ χ2(k),entonces

X√Y/k

∼ t(k).

(f) Si X1, X2, . . . , Xn es una muestra aleatoria de una población con distribución N(µ, σ2),entonces

X − µ

S/√n∼ t(n−1).

(g) Si U y V son variables aleatorias independientes tales que U ∼ χ2(n) y V ∼ χ2(m),entonces

U/n

V/m∼ F(n,m).

Ahora, se encontrarán intervalos de confianza para algunas cantidades relacionadas conpoblaciones Gaussianas.

16

Page 18: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

1.2.1. Intervalos para la media

Caso 1: σ2 conocida.

Sea X1, . . . , Xn es una muestra aleatoria de una población con distribución N(µ, σ2), conσ2 conocida.

Se sabe que X ∼ N(µ, σ2/n), entonces X−µσ/√

n∼ N(0, 1).

La cantidad pivotal es Q = X−µσ/√

n. De aquí que Q ∼ N(0, 1).

Sean zα/2, z1−α/2 ∈ R tales que P(Q ≤ zα/2) = α/2 y P(Q ≤ z1−α/2) = 1− α/2.

Note que

P(zα/2 < Q < z1−α/2) = P(Q ≤ z1−α/2)− P(Q ≤ zα/2)

= (1− α/2)− α/2 = 1− α.

También observe que por simetría de la densidad normal estándar zα/2 = −z1−α/2.

Por ejemplo, si 1− α = 0.95, entonces α = 0.05, 1− α/2 = 0.975 y z0.975 = 1.96.

Así,

P(−z1−α/2 < Q < z1−α/2) = 1− α,

si y sólo si

P

(−z1−α/2 <

X − µ

σ/√n

< z1−α/2

)= 1− α,

si y sólo si

P

(−z1−α/2

σ√n

< X − µ < z1−α/2σ√n

)= 1− α,

si y sólo si

P

(−z1−α/2

σ√n− X < −µ < z1−α/2

σ√n− X

)= 1− α,

si y sólo si

P

(X − z1−α/2

σ√n

< µ < X + z1−α/2σ√n

)= 1− α.

Por lo tanto, un intervalo del 100(1 − α)% de confianza para µ cuando σ2 es conocidaestá dado por (

X − z1−α/2σ√n, X + z1−α/2

σ√n

).

17

Page 19: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

Caso 2: σ2 desconocida.

SeaX1, . . . ,Xn es una muestra aleatoria de una población con distribuciónN(µ, σ2) dondeµ y σ2 son desconocidos.

Se sabe que X−µσ/√

n∼ N(0, 1) y (n−1)S2

σ2∼ χ2(n−1). Entonces,

X−µσ/√

n√(n−1)S2

σ2

n−1

∼ t(n−1).

Pero,

X−µσ/√

n√(n−1)S2

σ2

n−1

=

X−µσ/√

n√S2

σ2

=

√n(X−µ)

σSσ

=

√n(X − µ)

S=

X − µ

S/√n,

donde S :=√S2.

∴X − µ

S/√n∼ t(n−1).

Es decir, la cantidad pivotal es Q = X−µS/√

n.

Sea t1−α/2n−1 ∈ R, tal que P

(Y ≤ t

1−α/2n−1

)= 1− α/2, donde Y ∼ t(n−1). Entonces,

P

(−t1−α/2

n−1 < Q < t1−α/2n−1

)= 1− α,

si y sólo si

P

(−t1−α/2

n−1 <X − µ

S/√n

< t1−α/2n−1

)= 1− α,

si y sólo si

P

(−t1−α/2

n−1S√n

< X − µ < t1−α/2n−1

S√n

)= 1− α,

si y sólo si

P

(−X − t

1−α/2n−1

S√n

< −µ < −X + t1−α/2n−1

S√n

)= 1− α,

si y sólo si

P

(X − t

1−α/2n−1

S√n

< µ < X + t1−α/2n−1

S√n

)= 1− α.

18

Page 20: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

∴ Un intervalo del 100(1−α)% de confianza para µ cuando σ2 es desconocida está dadopor (

X − t1−α/2n−1 · S√

n, X + t

1−α/2n−1 · S√

n

).

1.2.2. Intervalo para la varianza

Sea X1, X2, . . . , Xn es una muestra aleatoria de una población con distribución N(µ, σ2)con µ y σ2 desconocidos.

Se sabe que (n−1)S2σ2

∼ χ2(n− 1).

Por tanto, la cantidad pivotal es Q = (n−1)S2σ2

.

Se necesitan determinar los cuantiles χα/2n−1, χ

1−α/2n−1 ∈ R tales que

P(χα/2n−1 < Q < χ

1−α/2n−1 ) = 1− α.

Es decir, P(Q ≤ χ1−α/2n−1 )− P(Q ≤ χ

α/2n−1) = (1− α/2)− (α/2) = 1− α.

Ahora,P(χ

α/2n−1 < Q < χ

1−α/2n−1 ) = 1− α,

si y sólo si

P(χα/2n−1 <

(n− 1)S2σ2

< χ1−α/2n−1 ) = 1− α,

si y sólo si

P

(1

χα/2n−1

>σ2

(n− 1)S2 >1

χ1−α/2n−1

)= 1− α,

si y sólo si

P

((n− 1)S2

χ1−α/2n−1

< σ2 <(n− 1)S2

χα/2n−1

)= 1− α.

∴ Un intervalo del 100(1− α)% de confianza para σ2 está dado por

((n− 1)S2

χ1−α/2n−1

,(n− 1)S2

χα/2n−1

).

Por ejemplo, si n = 12 y 1 − α = 0.99, entonces α = 0.01. Por lo tanto α/2 = 0.005 y1− α/2 = 0.995. Así, χ0.99511 = 26.8 y χ0.00511 = 2.60.

19

Page 21: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

1.2.3. Intervalo para la diferencia de medias de poblaciones inde-pendientes

Sean X1, . . . , Xn una muestra aleatoria de la distribución N(µx, σ2x) y Y1, . . . , Ym una

muestra aleatoria de la distribución N(µy, σ2y) donde Yj y Xi son independientes.

Caso 1: σ2x y σ2y conocidas.

Se sabe que X ∼ N(µx, σ2x/n) y Y ∼ N(µy, σ

2y/m), entonces

X − Y ∼ N

(µx − µy,

σ2xn+

σ2ym

).

Por tanto,X − Y − (µx − µy)√

σ2xn+

σ2ym

∼ N(0, 1).

Entonces, la cantidad pivotal está dada por

Q =X − Y − (µx − µy)√

σ2xn+

σ2ym

.

De aquí que

P(−z1−α/2 < Q < z1−α/2

)= 1− α,

si y sólo si

P

−z1−α/2 <

X − Y − (µx − µy)√σ2xn+

σ2ym

< z1−α/2

= 1− α,

si y sólo si

P

(−z1−α/2

√σ2xn+

σ2ym

< X − Y − (µx − µy) < z1−α/2

√σ2xn+

σ2ym

)= 1− α,

si y sólo si

P

[−(X − Y )− z1−α/2

√σ2xn+

σ2ym

< −(µx − µy) <

< −(X − Y ) + z1−α/2

√σ2xn+

σ2ym

]= 1− α,

20

Page 22: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

si y sólo si

P

[(X − Y )− z1−α/2

√σ2xn+

σ2ym

< µx − µy < (X − Y ) + z1−α/2

√σ2xn+

σ2ym

]= 1− α.

∴ Un intervalo del 100(1−α)% de confianza para µx−µy, cuando σ2x y σ2y son conocidas,está dado por

((X − Y )− z1−α/2

√σ2xn+

σ2ym

, (X − Y ) + z1−α/2

√σ2xn+

σ2ym

).

Caso 2: σ2x y σ2y desconocidas pero σ2x = σ2y = σ2.

Se sabe que (n−1)S2xσ2

∼ χ2(n−1) y(m−1)S2y

σ2∼ χ2(m−1), entonces

(n− 1)S2xσ2

+(m− 1)S2y

σ2∼ χ2(n+m−2).

∴1

σ2((n− 1)S2x + (m− 1)S2y) ∼ χ2(n+m−2). (1.4)

Y también se sabe que

X − Y − (µx − µy)√σ2(1n+ 1

m

) ∼ N(0, 1). (1.5)

Como se hace el supuesto de que las muestras son independientes, se tiene que (1.4) y(1.5) son independientes, por lo que

X−Y−(µx−µy)√σ2( 1n+

1m)√

(n−1)S2x+(m−1)S2yσ2(n+m−2)

∼ t(m+n−2).

Pero,

X−Y−(µx−µy)√σ2( 1n+

1m)√

(n−1)S2x+(m−1)S2yσ2(n+m−2)

=X − Y − (µx − µy)√(1n+ 1

m

) (n−1)S2x+(m−1)S2yn+m−2

=X − Y − (µx − µy)√(

1n+ 1

m

)S2p

,

21

Page 23: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

donde S2p =(n−1)S2x+(m−1)S2y

n+m−2 .

Entonces,

X − Y − (µx − µy)√(1n+ 1

m

)S2p

∼ t(m+n−2).

De aquí que Q =X−Y−(µx−µy)√( 1n+

1m)S2p

sea una cantidad pivotal tal que Q ∼ t(m+n−2).

Ahora, si t1−α/2n+m−2 representa el cuantil 1−α/2 de una distribución t de student con n+m−2

grados de libertad,

P

(−t1−α/2

n+m−2 < Q < t1−α/2n+m−2

)= 1− α,

si y sólo si

P

−t1−α/2

n+m−2 <X − Y − (µx − µy)√(

1n+ 1

m

)S2p

< t1−α/2n+m−2

= 1− α,

si y sólo si

P

[−(X − Y )− t1−α/2

n+m−2

√(1

n+1

m

)S2p < −(µx − µy) <

< −(X − Y ) + t1−α/2n+m−2

√(1

n+1

m

)S2p

]= 1− α,

si y sólo si

P

[(X − Y )− t

1−α/2n+m−2

√(1

n+1

m

)S2p < µx − µy <

< (X − Y ) + t1−α/2n+m−2

√(1

n+1

m

)S2p

]= 1− α.

∴ Un intervalo del 100(1−α)% de confianza para µx−µy, cuando σ2x y σ

2y son desconocidas

pero σ2x = σ2y = σ2, está dado por

((X − Y )− t1−α/2

n+m−2

√(1

n+1

m

)S2p , (X − Y ) + t1−α/2

n+m−2

√(1

n+1

m

)S2p

).

22

Page 24: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

Ejemplo 1.5 Una operación de ensamble en una planta manufacturadora requiere aproxi-madamente de un mes de periodo de entrenamiento para que un empleado nuevo alcance sueficiencia máxima. Se sugirió un nuevo método de entrenamiento y se hizo una prueba paracomparar el método nuevo con el procedimiento estándar. Se entrenaron a dos grupos de nueveempleados nuevos por un periodo de tres semanas, un grupo usando el nuevo método (Y ) yel otro siguiendo el procedimiento de entrenamiento estándar (X). Se registró la duraciónde tiempo (en minutos) requerido por cada empleado para ensamblar el aparato al final delperiodo de tres semanas.

Suponiendo que los tiempos de ensamblado se distribuyen aproximadamente normal yque las varianzas de los tiempos de ensamblado son aproximadamente iguales para los dosmétodos, obtener un intervalo del 95% de confianza para µx − µy.

Procedimiento MedidasEstándar X 32 37 35 28 41 44 35 31 34Nuevo Y 35 31 29 25 34 40 27 32 31

A partir de los datos se obtienen los siguientes valores:

x = 35.22, y = 31.56,9∑

i=1

(xi − x)2 = 195.56,9∑

i=1

(yi − y)2 = 160.22,

S2p =1

n+m− 2

[9∑

i=1

(xi − x)2 +9∑

i=1

(yi − y)2

]= 22.24.

El cuantil 0.975 de una distribución t con n+m−2 = 16 grados de libertad es t0.975(16) = 2.120.

El intervalo del 100(1− α)% de confianza para µx − µy es

((X − Y )− t

1−α/2n+m−2

√(1

n+1

m

)S2p , (X − Y ) + t

1−α/2n+m−2

√(1

n+1

m

)S2p

).

Por lo tanto, el intervalo del 95% de confianza para µx − µy es

((35.22− 31.56)− (2.120)

√18

81(22.24), (35.22− 31.56) + (2.120)

√18

81(22.24)

),

que aproximadamente es (−1.05, 8.37).Observe que el intevalo para µx − µy contiene al 0 con un nivel de confianza del 95%.

23

Page 25: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

1.2.4. Intervalo para el cociente de varianzas de poblaciones inde-pendientes

Sean X1, . . . , Xn una muestra aleatoria de la distribución N(µx, σ2x) y Y1, . . . , Ym una

muestra aleatoria de la distribución N(µy, σ2y) donde Yj y Xi son independientes.

Se sabe que (n−1)S2xσ2x

∼ χ2(n−1) y(m−1)S2y

σ2y∼ χ2(m−1), entonces

(n−1)S2xσ2x(n−1)(m−1)S2yσ2y(m−1)

∼ F(n−1,m−1).

Pero

S2xσ2xS2yσ2y

=S2xS2y

σ2yσ2x

.

De aquí que Q = S2xS2y

σ2yσ2xsea una cantidad pivotal tal que Q ∼ F(n−1,m−1).

Es necesario determinar los cuantiles fα/2n−1,m−1 f

1−α/2n−1,m−1, tales que:

P

(f

α/2n−1,m−1 < Q < f

1−α/2n−1,m−1

)= 1− α,

si y sólo si

P

(f

α/2n−1,m−1 <

S2xS2y

σ2yσ2x

< f1−α/2n−1,m−1

)= 1− α,

si y sólo si

P

(f

α/2n−1,m−1

S2yS2x

<σ2yσ2x

< f1−α/2n−1,m−1

S2yS2x

)= 1− α,

o

P

(1

f1−α/2n−1,m−1

S2xS2y

<σ2xσ2y

<1

fα/2n−1,m−1

S2xS2y

)= 1− α.

∴ Un intervalo del 100(1− α)% de confianza para σ2xσ2yestá dado por

(1

f1−α/2n−1,m−1

S2xS2y

,1

fα/2n−1,m−1

S2xS2y

). (1.6)

Observación 1.3 Los valores de la distribución F(n,m) están tabulados para valores altos de1− α (o equivalentemente valores bajos de α). Debido a que

P[Q < fα/2

n,m

]=

α

2,

24

Page 26: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

con Q ∼ F(n,m), y

P

[Q <

1

f1−α/2m,n

]= P

[1

Q> f 1−α/2

m,n

]

= 1− P

[1

Q< f 1−α/2

m,n

](1.7)

= 1−(1− α

2

)=

α

2,

se tiene que

fα/2n,m =

1

f1−α/2m,n

.

(Note que en (1.7) se ha utilizado el hecho de que si Q ∼ F(n,m), entonces1Q∼ F(m,n)).

Por lo anterior, el intervalo (1.6) puede reescribirse de la siguiente manera:(

1

f 1−α/2n−1,m−1

S2xS2y

, f1−α/2m−1,n−1

S2xS2y

).

En general, para obtener intervalos para los parámetros de un población Normal, sepueden usar las expresiones que acaban de deducirse, sustituyendo los correspondientes valo-res de los datos. A manera de ilustración, suponga que el diámetro de una cisterna en lamayoría de los casos es cercano a 3 metros. Se tiene un conjunto de mediciones de 12 cis-ternas salidas de la fábrica y se desea obtener un intervalo de confianza para la varianzaσ2, suponiendo que el diámetro es una variable aleatoria normalmente distribuida. Los datoscorrespondientes a los diámetros de las 12 cisternas a las que se hace referencia son:

3.01, 3.05, 2.99, 2.99, 3.0, 3.02, 2.98, 2.99, 2.97, 2.97, 2.02, 3.01.

Se dedujo que: ((n− 1)S2

χ1−α/2n−1

,(n− 1)S2

χα/2n−1

)

es un intervalo del 100(1 − α)% de confianza para σ2. En este caso n = 12, 1 − α = 0.99,α = 0.01 y

S2 =

∑nn=1 (xi − x)2

n− 1 = 0.0005455.

Además:χ0.99511 = 26.8, χ0.00511 = 2.60,

de esta manera el intervalo final queda como

(0.0002246, 0.00230791) .

25

Page 27: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

1.3. Intervalos de confianza para muestras grandes

En esta sección se usará la propiedad asintótica de los estimadores máximo verosímiles,la cual establece que si θMV es el estimador máximo verosímil de θ, en f (x; θ) que cumplelas condiciones de regularidad, entonces cuando n→∞,

θMV ∼ N

(θ,

1

IX (θ)

)

y, de manera más general,

τ (θ)MV = τ(θMV

)∼ N (τ (θ) , CICR) ,

donde CICR representa la Cota Inferior de Cramer y Rao para estimadores insesgados deτ (θ) . A partir de estos resultados, puede construirse una cantidad pivotal para el parámetrode interés.

Ejemplo 1.6 Sea X1, ..., Xn una muestra aleatoria de la distribución exponencial (θ) . En-contrar un intervalo del 100(1− α) % de confianza para θ.

El estimador máximo verosímil de θ está dado por θMV =1X, mientras que la información

esperada de Fisher es IX (θ) =nθ2. Entonces por la propiedad asintótica de los estimadores

máximo verosímiles, se tiene que1

X∼ N

(θ,

θ2

n

)

por lo que1X− θ√

θ2

n

∼ N (0, 1) ,

que puede reescribirse como

Q =

√n(1X− θ)

θ∼ N (0, 1) .

Así,

P

[−z1−α

2≤√n(1X− θ)

θ≤ z1−α

2

]= 1− α

si y sólo si

P

[−z1−α

2√n

≤1X− θ

θ≤

z1−α2√n

]= 1− α,

26

Page 28: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

si y sólo si

P

(−z1−α/2√n

+ 1 ≤ 1

θX≤

z1−α/2√n+ 1

)= 1− α,

o

P

([−z1−α/2√n

+ 1

]X ≤ 1

θ≤[z1−α/2√

n+ 1

]X

)= 1− α,

de donde: ( √n

x(√

n+ z1−α/2

) ,√n

x(√

n− z1−α/2

))

,

es un intervalo del (1− α) % de confianza para θ.

Ejemplo 1.7 Sea X la media muestral de una muestra aleatoria de tamaño n = 25 de unadistribución Gama(α, λ) con α = 4 y λ = 1

β> 0. Use el teorema del límite central para

obtener un intervalo de confianza para la media de la distribución Gama con un coeficientede confianza de 0.954.

Por el teorema del límite central se sabe que

X − E[X]

√V ar(X) ∼ Normal(0, 1),

donde

E[X]=

1

nnE [X] = αβ = 4β,

V ar(X)=

1

n2nV ar (X) =

1

nαβ2 =

1

n4β2,

entonces se desea encontrar un intervalo del 95.4% de confianza para 4β.Por el teorema del límite central se sabe que

X − 4β√1n4β2

∼ Normal(0, 1),

que implica queX − 4β√

1n2β

=

√nX

2β− 2√n ∼ Normal(0, 1),

27

Page 29: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

y además los cuantiles (1−0.954)/2 y 1− (1−0.954)/2 de una distribución Normal(0, 1) son−1.995393 y 1.995393, los cuales se aproximarán a −2 y 2, entonces,

0.954 = P

[−2 <

√nX

2β− 2√n < 2

]

= P

[−2 + 2

√n <

√nX

2β< 2 + 2

√n

]

= P

[ √nX

2 + 2√n

< 2β <

√nX

−2 + 2√n

]

= P

[2√nX

2 + 2√n

< 4β <2√nX

−2 + 2√n

]

= P

[2(5)X

2 + 2(5)< 4β <

2(5)X

−2 + 2(5)

]

= P

[5X

6< 4β <

5X

4

].

Por lo tanto, un intervalo del 95.4% de confianza para 4β es(5X6, 5X4

).

1.3.1. Intervalo de confianza para el parámetro p de una distribu-ción Binomial

Sea X1, . . . ,Xm una muestra aleatoria de la distribución Binomial (n, p) , es decir, Xi ∼

Bin(n, p), ∀i = 1, . . . ,m. Se procederá a encontrar el estimador máximo verosímil de p y laexpresión para la cota de Crámer y Rao para estimadores insesgados de p, en este caso:

f(x;n, p) =

(n

x

)px (1− p)n−x , con x = 0, . . . , n.

La función de verosimilitud para p está dada por:

L (p) =m∏

i=1

f(xi;n, p) =m∏

i=1

(n

xi

)pxi (1− p)n−xi

= px1+···+xm (1− p)nm−(x1+···+xm)m∏

i=1

(n

xi

)I(xi){0,...,n},

︸ ︷︷ ︸α

por lo que

l (p) = lnL (p) = (x1 + · · ·+ xm)ln(p) + (mn− (x1 + · · ·+ xm))ln(1− p) + ln(α)

28

Page 30: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

y∂l

∂p

∣∣∣∣p

=x1 + · · ·+ xm

p− nm− (x1 + · · ·+ xm)

1− p= 0.

De donde,

p =

m∑

i=1

Xi

nm=

X

n.

Por otra parte, la información esperada de Fisher está dada por:

IX = −mE[∂2

∂p2ln(f(x;n, p))

],

así:

ln(f(x;n, p)) = x ln(p) + (n− x) ln(1− p) + ln(

(n

x

)),

tomando la derivada con respecto a p:

∂pln(f(x;n, p)) =

x

p− n− x

1− p,

y la segunda derivada es∂2

∂p2ln(fX(x)) =

−xp2− n− x

(1− p)2.

Tomando esperanza:

E

(−xp2− n− x

(1− p)2

)= −np

p2−(

n

(1− p)2− np

(1− p)2

),

lo cual implica que

IX = −m(−np

p2−(n(1− p)

(1− p)2

))

=mn

p+

mn

1− p=

mn

p(1− p).

De esta manera, se obtiene que la Cota Inferior de Crámer y Rao para estimadores insesgadosde p está dada por:

CICR =p(1− p)

mn.

29

Page 31: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

Sea Q una cantidad pivotal definida por

Q =p− p√CICR

=Xn− p√

p(1−p)mn

=

√mn(X − np)√p(1− p)n

.

A partir de esta expresión se puede proceder como en el caso de la distribución exponencialexpuesto antes, es decir, suponiendo que esta cantidad pivotal tiene una distribución Normalestándar y utilizando el método pivotal para despejar p. Si se toma el caso particular en elque m = 1, la cantidad pivotal anterior se reduce a:

Q =Xn− p√

p(1−p)n

, (1.8)

donde X tiene distribución Binomial (n, p) , lo cual también se puede ver como el resultadode considerar una muestra aleatoria de tamaño n de una distribución Bernoulli(p) , dondeX representaría la suma de las variables de dicha muestra. Aún en este caso es complicadoobtener el intervalo para p a partir de esta expresión, pues el parámetro aparece tanto enel numerador como en el denominador. Un resultado de la teoría asintótica establece que lacantidad

Xn− p√

p(1−p)n

, (1.9)

también tiene distribución N (0, 1) . Para revisar la justificación de este tema, ver Casella(2002), sección 10.1. Note que para este caso, p = X

n, por lo que usando (1.9) como cantidad

pivotal, se obtiene que

P

−z1−α

2<

Xn− p√

Xn(1−X

n)

n

< z1−α2

= 1− α,

que es equivalente a

P

Xn− z1−α

2

√Xn(1− X

n)

n< p <

X

n+ z1−α

2

√Xn(1− X

n)

n

= 1− α,

por lo que (x

n− z1−α

2

√xn(1− x

n)

n,x

n+ z1−α

2

√xn(1− x

n)

n

).

es un intervalo del 100 (1− α) % de confianza para p.

30

Page 32: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

1.4. Enfoque Bayesiano en la estimación por intervalo

En el enfoque Bayesiano la estimación por intervalo para el (los) parámetro(s) descono-cidos, θ, de un modelo se basa en la distribución posterior de los mismos π(θ|x).

Un intervalo del 100(1 − α)% de credibilidad es cualquier intervalo (L,U) que satisfaceque

∫ U

L

π(θ|x)dθ = 1− α.

Estos intervalos de probabilidad no son únicos. Se puede adoptar por ejemplo un intervalode colas iguales donde ∫ L

−∞π(θ|x)dθ =

∫ ∞

U

π(θ|x)dθ = α/2,

o uno unilateral donde L = −∞ o U = ∞. En los casos donde la distribución posterior delparámetro de interés es unimodal, también es posible adoptar un intervalo de alta densidadposterior, (HPD) por sus siglas en inglés, donde π(L|x) = π(U |x). En este caso, este intervaloes el de menor longitud.

Ejemplo 1.8 Sean X ∼ Bin(n, θ) y θ ∼ Beta(g, h) , entonces

π(θ|x) ∝ f(x|θ)π(θ)∝ θx(1− θ)n−xθ1−g(1− θ)h−1

= θg+x(1− θ)h+n−x.

De esta expresión se concluye que las constantes de normalización corresponden a aquellasde una distribución Beta(g + x, h+ n− x), que es la distribución posterior para θ bajo estadistribución inicial conjugada. Si ahora se considera el escenario con n = 10 y x = 4 éxitosobservados en el experimento de interés, para una distribución inicial Be(2, 2); se tiene quela distribución posterior π(θ|x) es una Beta(6, 8). Los intervalos del 99% de confiabilidad semuestran en la figura 1.2.

31

Page 33: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

2.5

3.0

Colas Iguales

HPD

Cola Inferior

Cola Superior

Figura 1.2: Intervalos del 99% de confiabilidad para el ejemplo 1.8.

32

Page 34: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

1.5. Ejercicios

1. (Construcción del concepto de intervalo de confianza mediante simulación en R). Revisecuidadosamente las siguientes gráficas obtenidas por simulación en R.

80 100 120

040

80

n= 10 Sigma= 5

80 100 120

040

80

n= 10 Sigma= 10

80 100 120

040

80

n= 10 Sigma= 15

80 100 120

040

80

n= 30 Sigma= 5

80 100 120

040

80

n= 30 Sigma= 10

80 100 120

040

80

n= 30 Sigma= 15

80 100 120

040

80

n= 50 Sigma= 5

80 100 120

040

80

n= 50 Sigma= 10

80 100 120

040

80

n= 50 Sigma= 15

Figura 1.3: Intervalos obtenidos por simulación para diferentes valores de σ y distintostamaños de muestra.

Ahí se presentan 100 intervalos de confianza variando el tamaño de muestra según tresposibilidades (10, 30 y 50) y la desviación estándar según 3 opciones (5, 10 y 15). Así,finalmente se tienen 9 combinaciones según varía el tamaño de muestra y la desviación

33

Page 35: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

estándar, siendo los escenarios posibles: n = 10 y σ = 5 hasta n = 50 y σ = 15. Cuandoun intervalo de confianza no contiene el verdadero promedio se ilustra con una líneanegra (el punto medio de cada intervalo es de color gris oscuro). Conteste lo siguiente:

(a) Determine mediante observación: ¿cuántos intervalos aproximadamente no con-tienen el verdadero valor de la media en cada una de las simulaciones?, ¿coincidecon lo que se espera si la confianza es del 95%?.

(b) ¿Se espera que la cantidad de intervalos de confianza que no contiene al verdaderovalor poblacional sea el mismo para cada uno de los nueve casos?.

(c) Si observa únicamente la primera fila de las simulaciones, explique: ¿cuál es elimpacto de la desviación estándar sobre los intervalos mostrados en la grafica?,¿se aplica también para la segunda fila y tercera fila de simulaciones?.

(d) Si observa únicamente la primera columna de las simulaciones, explique: ¿cuál es elimpacto del tamaño de muestra sobre los intervalos hallados?, ¿se aplica tambiénpara la segunda y tercera columnas de simulaciones?.

2. Genere una muestra aleatoria X1, . . . , Xn, de tamaño n = 30, de una población condistribución N(µx, σ

2) con µx = 5 y σ2 = 4. Genere otra muestra aleatoria Y1, . . . , Ym,de tamaño m = 50, de una población con distribución N(µy, σ

2) con µy = 2 y σ2 = 4.Obtenga los intervalos de confianza para µx − µy bajo las condiciones y supuestos delos siguientes incisos, y grafíquelos.

(a) Intervalo del 80% de confianza para µx − µy, suponiendo que σ2 es conocida.

(b) Intervalo del 80% de confianza para µx − µy, suponiendo que σ2 es desconocidacomún.

(c) Intervalo del 95% de confianza para µx − µy, suponiendo que σ2 es conocida.

(d) Intervalo del 95% de confianza para µx − µy, suponiendo que σ2 es desconocidacomún.

Repita el proceso generando cada una de estas muestras 100 veces. ¿Cómo son losintervalos? Identifique los intervalos con mayor longitud y con menor longitud. Comparey explique los resultados.

3. Suponga que X es una variable aleatoria de la población con función de densidad dadapor

fX(x; θ) =2(θ − x)

θ2I(0,θ)(x),

donde θ > 0 es un parámetro desconocido. Sea α ∈ (0, 1). Construya un intervalo del100(1− α)% de confianza para θ, utilizando como cantidad pivotal Q = X

θ.

34

Page 36: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

4. Sea X una variable aleatoria de la población con función de densidad fX(x; θ) =θxθ−1

I(0,1)(x), donde θ > 0 es un parámetro desconocido.

(a) Encuentre una cantidad pivotal y utilícela para encontrar un intervalo de confian-za para θ.

(b) Demuestre que(

Y2, Y)es un intervalo de confianza para θ, donde Y = − 1

log(X).

Encuentre su nivel de confianza.

5. SeaX una variable aleatoria de una población con función de densidad fX(x; θ) = θe−θx,donde x > 0 y θ > 0.

(a) Sea (X, 2X) un intervalo de confianza para 1/θ. ¿Cuál es su nivel de confianza?

(b) Encuentre otro intervalo de confianza para 1/θ que tenga el mismo nivel de con-fianza que el intervalo de (a), pero con menor longitud esperada.

6. Considere una sola observación X de las siguientes distribuciones. Dado α ∈ (0, 1),encuentre un intervalo del 100(1− α)% de confianza para θ.

(a) Laplace-localización

fX(x; θ) =1

2e−|x−θ|

IR (x) , θ ∈ R.

(b) Cauchy

fX(x; θ) =1

π

1

1 + (x− θ)2IR (x) , θ ∈ R.

(c) Laplace-escala

fX(x; θ) =1

2θe−|x|/θ

IR (x) , θ ∈ R+.

7. SeaX1,X2,X3, X4 una muestra aleatoria de tamaño 4 de una población con distribuciónU(0, θ). Sea Y(4) la máxima estadística de orden. Sean 0 < κ1 < κ2 ≤ 1 constantes talesque

P(κ1θ < Y(4) < κ2θ) = 0.95.

Verifique que κ1 =4√0.05 y κ2 = 1 satisfacen estas condiciones. ¿Cuál es entonces un

intervalo del 95% de confianza para θ?

8. Sea X1, . . . , Xn una muestra aleatoria de la población con distribución U(0, θ). SeaY = maxi=1,...,n{Xi}. Pruebe que Y/θ es una cantidad pivotal, y muestre que el intervalo(Y, Y α−1/n) es el intervalo del (1− α)100% de confianza para θ con menor longitud.

35

Page 37: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

9. Sea X1, . . . , Xn una muestra aleatoria de la población con función de densidad

f(x; θ, σ) =1

σe−(x−θ)/σ

I(θ,∞)(x),

donde θ ∈ R y σ ∈ R+. Sea α ∈ (0, 1).

(a) Si θ es conocido, encuentre un intervalo del 100(1 − α)% de confianza para σ.[Sugerencia: Quizá le sirva

∑ni=1(Xi− θ), o una pequeña modificación del mismo.]

(b) Si θ es desconocido, encuentre un intervalo del 100(1 − α)% de confianza paraσ. [Sugerencia: Quizá le sirva

∑ni=1(Xi − X(n)), o una pequeña modificación del

mismo.]

10. Sea X1, . . . , Xn una muestra aleatoria de una población con distribución Exp(θ), cuyafunción de densidad es

fXi(x) = θe−θxI(0,∞)(x).

(a) Encuentre un intervalo del 100(1−α)% de confianza para la media de la población.

(b) Encuentre un intervalo del 100(1 − α)% de confianza para la varianza de lapoblación.

(c) Encuentre una cantidad pivotal basada únicamente en Y1, donde

Y1 = mın{X1, . . . , Xn},

y úsela para encontrar un estimador de intervalo para θ.

11. Sea Y1, . . . , Yn una muestra aleatoria de tamaño n de una población con distribuciónuniforme en el intervalo (0, 1/θ). Encuentre un intervalo del 95% de confianza para θ.

12. SeaX1, . . . , Xn una muestra aleatoria de la población con distribuciónGamma(α, β). Siα es una constante conocida, obtenga un intervalo de confianza para la media µ = αβ.

13. Sea X1, . . . , Xn una muestra aleatoria de una población con distribución U(θ− 12, θ+ 1

2),

cuya función de densidad es fX(x; θ) = 1 para θ − 12< x < θ + 1

2. Sean Y1 ≤ · · · ≤ Yn

sus correspondientes estadísticas de orden.

(a) Muestre que [Y1, Yn] es un intervalo de confianza para θ.

(b) Calcule su longitud esperada, es decir, E[Yn − Y1].

(c) Encuentre su nivel de confianza.

36

Page 38: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

14. Sea X1, . . . , Xn una muestra aleatoria de una población con función de densidad

fXi(xi; θ) = eiθ−xi ,

donde xi > iθ.

(a) Obtenga una estadística T que sea suficiente para θ.

(b) Obtenga una cantidad pivotal Q que sea función de T .

(c) Encuentre un intervalo del (1−α)100% de confianza para θ de la forma [T+a, T+b]tal que tenga menor longitud.

15. Sea X1, . . . , Xn una muestra aleatoria de la población con función de densidad

fX(x; θ) =kxk−1

θkI(0,θ)(x)

donde θ > 0 y k es un entero positivo. Encuentre un intervalo del (1 − α)100% deconfianza para θ.

16. ¿Qué tan grande debe ser una muestra si se desea construir un intervalo de confianza del99% para la desviación estándar de una población normal si se desea que la desviaciónestándar muestral no difiera en más del 2% de la desviación poblacional?

17. Sea X1, . . . , Xn una muestra aleatoria de una población con distribución N(µ, σ2).

(a) Si σ2 es conocida. Encuentre el valor mínimo de n que garantice que el intervalodel 95% de confianza para µ tendrá longitud no mayor que σ/4.

(b) Si σ2 es desconocida. Encuentre el valor mínimo de n que garantice que, conprobabilidad 0.90, el intervalo del 95% de confianza para µ tendrá longitud nomayor que σ/4.

18. Sea X1, . . . ,Xn una muestra aleatoria de la población con distribución N(µ, σ2). Sean0 < a < b. Demuestre que la esperanza de la longitud del intervalo

(∑ni=1(Xi − µ)2

b,

∑ni=1(Xi − µ)2

a

)

es (b− a)nσ2

ab.

19. Sean X y Y las medias de dos muestras aleatorias independientes entre sí, cada unade tamaño n, de las distribuciones N(µx, σ

2) y N(µy, σ2), respectivamente, donde la

varianza común es conocida. Encuentre n tal que

P

(X − Y − σ

5< µx − µy < X − Y +

σ

5

)= 0.9.

37

Page 39: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

20. Considere X una variable aleatoria tal que X ∼ N(0, σ2), donde σ > 0 es un parámetrodesconocido. Considere el siguiente intervalo de confianza (|X|, 10|X|) para σ.

(a) Calcule P(|X| ≤ σ ≤ 10|X|).(b) ¿Cuál es la longitud esperada de dicho intervalo?

21. Se desea hacer una comparación entre dos tratamientos para el SIDA. Se mide el tiempode falla (en años) de cada uno de estos tratamientos en siete pacientes seleccionadosaleatoriamente. La información se detalla en la siguiente tabla.

Paciente 1 2 3 4 5 6 7Tratamiento 1 3.1 3.3 1.7 1.2 0.7 2.3 2.9Tratamiento 2 1.8 2.3 2.2 3.5 1.7 1.6 1.4

Construya un intervalo del 80% de confianza para la diferencia de medias. ¿Se necesitahacer alguna suposición adicional?

22. Sea realizó un estudio para determinar si la variabilidad en la presión arterial de hom-bres y mujeres es la misma o no. Se seleccionó aleatoriamente a 13 mujeres y a 16hombres, se les midió la presión arterial (en milímetros de mercurio) y los resultadosfueron los siguientes:

Hombres 120 120 118 112 120 114 130 114124 125 130 100 120 108 112 122

Mujeres 122 102 118 126 108 130 104 116102 122 120 118 130

¿Se puede concluir con un 95% de confianza que la variabilidad de la presión arterialde hombres y mujeres es la misma? ¿Se necesitan hacer suposiciones adicionales?

23. Sean X y Y las medias muestrales, y S2x y S2y los estimadores insesgados de la varianza,obtenidos de dos muestras independientes cada una de tamaño 7 de dos poblacionesnormales con varianza común σ2 y media desconocida. Encuentre k ∈ R, tal que

P

(max

{S2xS2y

,S2yS2x

}> κ

)= 0.05.

24. Se miden los tiempos de compra de 61 compradores seleccionados aleatoriamente. Siestos tiempos tienen una distribución normal, encuentre un intervalo del 95% de con-fianza para µ si x = 33 y s2 = 256.

25. Se cuenta con dos grupos similares de pacientes, A y B, que consisten de 50 y 100individuos, respectivamente. Al grupo A se le administró una nueva pastilla para dormiry a la segunda una pastilla para dormir ya existente. En el grupo A, el número promedio

38

Page 40: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

de horas de sueño fué de 7.82 con una desviación estándar de 15 minutos. En el grupoB, el número promedio de horas de sueño fué de 6.75 con una desviación estándar de18 minutos. Construya intervalos del 95% y 99% de confianza para la diferencia de lashoras promedio dormidas.

26. Los siguientes datos representan el tiempo de vida útil de un artículo, medido en días:29.1, 207.6, 81.8, 0.8, 76.1, 108.9, 48.4, 108.1, 52.2, 272.8, 150.5, 80.3, 97.4, 11.5, 46.2,144.1, 62.5, 262.9, 247.6, 4.1. Este tiempo se supone distribuído como una exponencialcon media θ, Exp(1/θ).

(a) Encuentre un intervalo de confianza exacto al 95% para la media de esta expo-nencial.

(b) Encuentre un intervalo de confianza aproximado al 95% para esta media utilizandoteoría asintótica.

(c) Encuentre un intervalo de confianza aproximado al 95% para esta media utilizandolos resultados de distribución asintótica del estimador máximo verosímil.

(d) Comente los resultados obtenidos y las diferencias (si las hubo) entre los tresprocedimientos.

27. Se lanza una moneda 500 veces, y se obtienen 275 águilas y 225 soles. Obtenga unintervalo de confianza para la probabilidad de obtener águila. Obtenga también unintervalo del 99% de confianza. ¿Está bien construida la moneda?

28. Una urna contiene una proporción desconocida de cánicas rojas y blancas. De unamuestra aleatoria con reemplazo de 60 cánicas se obtuvo un 70% de cánicas rojas.Encuentre intervalos del 95% y 99.73% de confianza para la proporción de cánicasrojas en la urna.

29. Para estimar la proporción de desempleados en Panamá, un economista seleccionaaleatoriamente a 400 individuos de la población (clase trabajadora o económicamenteactiva en algún momento). De los entrevistados 25 no tienen empleo. Estime un intervalodel 95% de confianza para la proporción de desempleados.

30. De una lista electoral de opinión pública se invita a 100 personas de entre 10,000 adultosa expresar su preferencia por los candidatos A y B. Treinta personas prefirieron a A.De esto se concluyó que entre 2100 y 3900 de la población prefieren a A. ¿Qué nivel deconfianza se usó en este informe?. Nótese que n = 100 y Y = 30 es el número de éxitos(las personas que prefirieron a A) y que el intervalo está dado para la media np.

31. Sea X1, . . . , Xn una muestra aleatoria de una población con distribución Poisson(λ).Suponga que el tamaño de la muestra es lo suficientemente grande y por lo tanto se

39

Page 41: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Estimación por Intervalo Vázquez-Naranjo-Fuentes-Chávez

cumplen las propiedades del estimador máximo verosímil de λ. Construya un intervalodel (1− α)100% de confianza para λ.

32. Encuentra una cantidad pivotal basada en una muestra aleatoria de una distribuciónN(θ, θ) con θ > 0. Usa la cantidad pivotal para encontrar un intervalo del (1−α)% deconfianza para θ.

33. Considere una muestra aleatoria X1, . . . ,Xn de un modelo N(µ, τ) donde τ = 1/σ2.Suponiendo que las distribuciones iniciales corresponden al modelo conjugado, obtengaun intervalo de credibilidad de 95%, de colas iguales para cada parámetro. Obtengapara µ el intervalo HDP del 90%.

40

Page 42: JaimeVázquez LizbethNaranjo RuthFuentes MargaritaChávezjaimevazquezalamilla.com/wp-content/uploads/2018/... · de confianza, entonces se puede obtener un intervalo con el mismo

Bibliografía

[1] Casella, G. y Berger, R. L. (2002). Statistical Inference. Duxbury Advanced Series. 2nd.ed.

[2] Canavos, G. C. (2003). Probabilidad y Estadística, aplicaciones y métodos. Mc Graw Hill.

[3] Hogg, R.V., McKean, J. W., Craig, A. T. (2014). Introduction to Mathematical Statistics.Pearson Education International. 7th. ed.

[4] Kapadia, A.S., Chan, W. y Moyé, L. (2005). Mathematical Statistics with Applications.Chapman & Hall, Inc./CRC Press.

[5] Lindgren, B.W. (1993). Statistical Theory. Chapman & Hall, Inc. 4th ed.

[6] Mood, A. M., Graybill, F. A. y Boes, D. C. (1974). Introduction to the theory of stastistics.Mc Graw-Hill, Inc. 3rd. ed.

[7] Stuart, A., Ord, J. K. y Arnold, S. (1999). Advanced Theory of Statistics, 2A: ClasicalInference and the Linear Model. London: Oxford University Press, 6th ed.

41