Ignacio Cascos Depto. Estadística, Universidad Carlos III 1
Inferencia EstadísticaTema 7
Ignacio Cascos Depto. Estadística, Universidad Carlos III 2
Descripción breve del tema1. Introducción
2. Intervalos de Confianza Determinación del tamaño muestral
3. Contrastes de hipótesis Generalidades de los contrastes Metodología del contraste Región de rechazo y p-valor Relación entre ICs y contrastes de hipótesis Algunos contrastes particulares
Ignacio Cascos Depto. Estadística, Universidad Carlos III 3
Objetivos
Estudio de la estimación mediante conjuntos, los Intervalos de Confianza.
Realización de contrastes de hipótesis estadísticas con niveles de significación fijados de antemano y mediante p-valores.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 4
Descripción breve del tema1. Introducción
2. Intervalos de Confianza Determinación del tamaño muestral
3. Contrastes de hipótesis Generalidades de los contrastes Metodología del contraste Región de rechazo y p-valor Relación entre ICs y contrastes de hipótesis Algunos contrastes particulares
Ignacio Cascos Depto. Estadística, Universidad Carlos III 5
IntroducciónUna hipótesis es cualquier afirmación con la que
expresamos una creencia sobre una distribución
poblacional. Un contraste de hipótesis es una prueba
estadística que nos indica si debemos rechazar (o no)
tales afirmaciones a partir de las observaciones de una
muestra.
A partir de una muestra, construiremos también
estimadores que toman como valor un intervalo.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 6
Descripción breve del tema1. Introducción
2. Intervalos de Confianza Determinación del tamaño muestral
3. Contrastes de hipótesis Generalidades de los contrastes Metodología del contraste Región de rechazo y p-valor Relación entre ICs y contrastes de hipótesis Algunos contrastes particulares
Ignacio Cascos Depto. Estadística, Universidad Carlos III 7
Intervalos de Confianza Dada una probabilidad fijada de antemano
podemos construir un intervalo a partir de la información que nos proporciona una muestra aleatoria X1,X2,…,Xn y que contiene un parámetro con probabilidad .
Obtenemos un Intervalo de Confianza con nivel
de confianza sustituyendo los estimadores
de por su estimación.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 8
Intervalos de Confianza Construcción de un IC, método del pivote.
El objetivo es buscar dos estadísticos, tales que
Partimos de un estimador de con distribución
conocida, si es Normal, tenemos
1),,,(ˆ),,,(ˆ212211 nn XXXXXXP
),(~ˆ si 1ˆˆˆ2/ˆ2/ˆ NzzP
Ignacio Cascos Depto. Estadística, Universidad Carlos III 9
Intervalos de Confianza Un IC para el parámetro al nivel de
confianza construido a partir de un estadístico con distribución normal tendrá la forma
donde P(Z > z/2) = /2 para Z~N(0,1).
2/ˆ2/ˆˆ,ˆ
zz
Ignacio Cascos Depto. Estadística, Universidad Carlos III 10
Intervalos de Confianza Determinación del tamaño muestral. En
general, un IC para puede escribirse como
donde a y b dependen de1. El nivel de confianza ;
2. La varianza del estimador de ;
3. El tamaño muestral .
El tamaño muestral afecta a la varianza del estimador.
ba ˆ,ˆ
Ignacio Cascos Depto. Estadística, Universidad Carlos III 11
Intervalos de Confianza Determinación del tamaño muestral.
Fijado un nivel de error en la estimación del
parámetro (equiv. la amplitud del IC), podemos
calcular el tamaño muestral.
Basta resolver la ecuación
a+b = A ,
donde A es la amplitud deseada del IC.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 12
Descripción breve del tema1. Introducción
2. Intervalos de Confianza Determinación del tamaño muestral
3. Contrastes de hipótesis Generalidades de los contrastes Metodología del contraste Región de rechazo y p-valor Relación entre ICs y contrastes de hipótesis Algunos contrastes particulares
Ignacio Cascos Depto. Estadística, Universidad Carlos III 13
Contrastes de HipótesisMediante un contraste de hipótesis, contrastamosuna afirmación sobre la población a partir de unamuestra. La afirmación que queremos contrastar recibe
el nombre de hipótesis nula (H0) “la duración media de un analgésico es0”, H0: 0
No rechazamos la hipótesis nula, salvo que haya una fuerte evidencia en contra suya.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 14
Contrastes de Hipótesis La hipótesis alternativa (H1) es lo que ocurre
cuando no ocurre H0
H1: 0
H1: 0
Para rechazar la hipótesis nula (y quedarnos con
la alternativa), los datos han de mostrar una gran
evidencia a favor de H1.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 15
Contrastes de Hipótesis Tipos de hipótesis
Simples: especifican un valor único del parámetro
H0: = 0
Compuestas: el parámetro puede tomar varios valores
H0: 0
Tipos de contrastes Bilaterales: nos interesan valores a dcha. e izq. de uno fijo
H0: = 0 ; H1: 0
Unilaterales: sólo nos interesan los valores a un lado
H0: = 0 ; H1: 0 equiv. a H0: 0 ; H1: 0
Ignacio Cascos Depto. Estadística, Universidad Carlos III 16
Contrastes de Hipótesis Si deseamos garantizar algo, debemos ponerlo en la
hipótesis alternativa. Ante un enunciado del tipo “¿Podemos afirmar que la media
poblacional es superior a 0?” planteamos:
H0: = 0 ; H1: 0
Si nos planteamos el refutar algo, debemos ponerlo en la hipótesis nula (su contrario en la alternativa). Ante un enunciado del tipo “El fabricante afirma que la media
es 0, ¿podemos refutar esa afirmación?” planteamos:
H0: = 0 ; H1: 0
Ignacio Cascos Depto. Estadística, Universidad Carlos III 17
Contrastes de Hipótesis Tipos de errores
Error de Tipo I: Se rechaza la hipótesis nula (H0) cuando es cierta,
= P(Error Tipo I) = P(rechazo H0|H0) es el error más grave.
Error de Tipo II: No se rechaza la hipótesis nula (H0) cuando es falsa,
= P(Error Tipo II) = P(no rechazo H0|H1)este error es menos importante.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 18
Metodología del contraste Etapas de un contraste de hipótesis:
Antes de tomar la muestra
1. Definir la hipótesis nula y la alternativa. Expresar en términos estadísticos nuestro problema.
2. Definir una medida de discrepancia entre las datos de la muestra y la hipótesis nula. Decidir cómo medir la distancia entre nuestra estimación y el valor del parámetro según H0.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 19
Metodología del contraste3. Decidir qué discrepancias consideramos
inadmisibles. Decidir qué distancias entre la estimación y el parámetro (según H0) son demasiado grandes.
Una vez tomada la muestra4. Calcular la estimación del parámetro y su
discrepancia. Si la distancia de la estimación al valor del parámetro (según H0) es grande, rechazamos H0. Si es pequeña, no la rechazamos.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 20
Medida de la discrepancia La discrepancia es una medida de la distancia
del valor que toma el parámetro según la hipótesis nula a su estimador.
La construcción de la discrepancia (cómo medimos la distancia) depende de la hipótesis alternativa del contraste.
),ˆ( medimos entonces :H si 000 d
Ignacio Cascos Depto. Estadística, Universidad Carlos III 21
Medida de la discrepancia En el contraste
El signo de la discrepancia es irrelevante. En el contraste
La discrepancia será mayor cuanto mayor sea
01
00
:H
:H
01
00
:H
:H
01
00
:H
:H
importa. sí signo el ˆ0
Ignacio Cascos Depto. Estadística, Universidad Carlos III 22
Región de rechazo Calculamos qué discrepancias resultan
inadmisibles, qué distancias entre el parámetro (según H0) y su estimación son demasiado grandes. Estas distancias vienen determinadas por el nivel de significación .
Este nivel de significación es la máxima
probabilidad de error de tipo I que estamos
dispuestos a asumir. Habitualmente =0’01 ó 0’05
Ignacio Cascos Depto. Estadística, Universidad Carlos III 23
Región de rechazo Fijado , tenemos P(rechazo H0|H0) = Conocemos la distribución del estimador de (bajo H0)
Dado el contraste H0: = 0 ; H1: 0
Rechazamos H0 si
El valor c es el que
determina la región de
rechazo.
cd 00ˆ),ˆ(
-4 -2 0 2 4
-0.1
0.0
0.1
0.2
0.3
0.4
0.5
Distribución del estimador
-c c
Ignacio Cascos Depto. Estadística, Universidad Carlos III 24
Región de rechazoDado el contraste H0: = 0 ; H1: 0
Rechazamos H0 si
-4 -2 0 2 4
-0.1
0.0
0.1
0.2
0.3
0.4
0.5
Distribución del estimador
c
cd 00ˆ),ˆ(
Ignacio Cascos Depto. Estadística, Universidad Carlos III 25
Resolución del contraste Para resolver el contraste, calculamos la estimación del
parámetro , calculamos su discrepancia respecto de 0 y la comparamos con el valor crítico obtenido para el nivel de significación fijado de antemano.
Si la estimación de está dentro de la región de rechazo, hay evidencia suficiente para rechazar H0
Si la estimación de está fuera de la región de rechazo, no hay evidencia suficiente para rechazar H0
Un contraste es estadísticamente significativo si el resultado experimental discrepa más de lo tolerado a priori.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 26
p-valorEl p-valor es el mayor nivel de significación para
el que no se rechaza la hipótesis nula, o equiv., el
nivel crítico que se corresponde con un valor
crítico igual a la discrepancia observada
p-valor = P(discrepancia mayor que observada|H0)
Es la probabilidad de tener una muestra peor que
la que tenemos, supuesta cierta la hipótesis nula.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 27
p-valorCuanto menor sea el p-valor, mayor grado de evidencia tenemos en contra de la hipótesis nula.
Si el p-valor es 0’05 ó menor suele rechazarse H0
-4 -2 0 2 4
-0.1
0.0
0.1
0.2
0.3
0.4
0.5
Distribución del estimador
c
Dado el contraste H0: = 0 ; H1: 0
Buscamos el valor de cuando c toma el valor de la estimación en la muestra que tenemos.
Ignacio Cascos Depto. Estadística, Universidad Carlos III 28
p-valorDado el contraste H0: = 0 ; H1: 0
Buscamos el valor de cuando c (ó c) toma el valor de la estimación en la muestra que tenemos
-4 -2 0 2 4
-0.1
0.0
0.1
0.2
0.3
0.4
0.5
Distribución del estimador
-c c
Ignacio Cascos Depto. Estadística, Universidad Carlos III 29
Relación entre ICs y Contrastes Dado un contraste bilateral
H0: = 0 ; H1: 0
con nivel de significación , se rechaza la hipótesis nula si 0 no pertenece al Intervalo de Confianza con nivel de confianza obtenido para
Ignacio Cascos Depto. Estadística, Universidad Carlos III 30
Contrastes particulares Contraste para la media de una población normal
o muestra grande con varianza conocida Hipótesis nula. H0: = 0
Hipótesis alternativa. H1: 0 Rechazo H0 cuando
Hipótesis alternativa. H1: 0 Rechazo H0 cuando
Hipótesis alternativa. H1: 0 Rechazo H0 cuando
zn
x
0
zn
x
0
2/0
zn
x
Ignacio Cascos Depto. Estadística, Universidad Carlos III 31
Intervalos de Confianza particulares Intervalo de Confianza para la media de una
población normal o a partir de una muestra grande con varianza conocida.
con un nivel de confianza ,donde P(Z > z) = si Z~
nzxnzx 2/2/ ,
Ignacio Cascos Depto. Estadística, Universidad Carlos III 32
Contrastes particulares Contraste para proporción
Hipótesis nula. H0: p= p0
Hipótesis alternativa. H1: pp0
Rechazo H0 cuando
Hipótesis alternativa. H1: pp0
Rechazo H0 cuando
Hipótesis alternativa. H1: pp0
Rechazo H0 cuando
znpp
pp
)1(
ˆ
00
0
znpp
pp
)1(
ˆ
00
0
2/
00
0
)1(
ˆz
npp
pp
Ignacio Cascos Depto. Estadística, Universidad Carlos III 33
Intervalos de Confianza particulares Intervalo de Confianza para una proporción.
con un nivel de confianza ,donde P(Z > z) = si Z~
n
ppzp
n
ppzpp
)ˆ1(ˆˆ,
)ˆ1(ˆˆ 2/2/
Ignacio Cascos Depto. Estadística, Universidad Carlos III 34
Contrastes particulares Contraste para la media de una población normal
con varianza desconocida Hipótesis nula. H0: = 0
Hipótesis alternativa. H1: 0 Rechazo H0 cuando
Hipótesis alternativa. H1: 0 Rechazo H0 cuando
Hipótesis alternativa. H1: 0 Rechazo H0 cuando
,10
1
ntns
x
,10
1
ntns
x
2/,10
1
ntns
x
Ignacio Cascos Depto. Estadística, Universidad Carlos III 35
Intervalos de Confianza particulares Intervalo de Confianza para la media de una
población normal con varianza desconocida.
con un nivel de confianza ,donde P(X > tn,) = si X~tn
1
,1
2/,12/,1n
stx
n
stx nn
Ignacio Cascos Depto. Estadística, Universidad Carlos III 36
Contrastes particulares Contraste para la varianza de una población
normal Hipótesis nula. H0: 2= 0
2
Hipótesis alternativa. H1: 202
Rechazo H0 cuando
Hipótesis alternativa. H1: 202
Rechazo H0 cuando
Hipótesis alternativa. H1: 202
Rechazo H0 cuando
21,12
0
2
n
ns
2,12
0
2
n
ns
22/,12
0
22
2/1,120
2
ó
nn
nsns
Ignacio Cascos Depto. Estadística, Universidad Carlos III 37
Intervalos de Confianza particulares Intervalo de Confianza para la varianza de una
población normal.
con un nivel de confianza ,donde P(X > 2
n,) = si X~2n
2
2/1,1
2
22/,1
22 ,
nn
nsns
Ignacio Cascos Depto. Estadística, Universidad Carlos III 38
Contrastes particulares Contraste para la igualdad de medias de dos
poblaciones normales con varianzas conocidas Hipótesis nula. H0: 1= 2
Hipótesis alternativa. H1: 12 Rechazo H0 cuando
Hipótesis alternativa. H1: 12 Rechazo H0 cuando
Hipótesis alternativa. H1: 12 Rechazo H0 cuando
znn
xx
2221
21
21
znn
xx
2221
21
21
2/
2221
21
21
z
nn
xx
Ignacio Cascos Depto. Estadística, Universidad Carlos III 39
Intervalos de Confianza particulares Intervalo de Confianza para la diferencia de
medias de dos poblaciones normales con varianzas conocidas.
con un nivel de confianza ,donde P(Z > z) = si Z~
2
22
1
21
2/212
22
1
21
2/2121 ,nn
zxxnn
zxx
Ignacio Cascos Depto. Estadística, Universidad Carlos III 40
Contrastes particulares Contraste para la igualdad de proporciones de
dos poblaciones (muestras independientes) Hipótesis nula. H0: p1= p2
Hipótesis alternativa. H1: p1p2 Rechazo H0 cuando
Hipótesis alternativa. H1: p1p2 Rechazo H0 cuando
Hipótesis alternativa. H1: p1p2 Rechazo H0 cuando
znnpp
pp
)11)(ˆ1(ˆ
ˆˆ
2100
21
znnpp
pp
)11)(ˆ1(ˆ
ˆˆ
2100
21
2/
2100
21
)11)(ˆ1(ˆ
ˆˆz
nnpp
pp
21
22110
ˆˆˆ
nn
pnpnp
Ignacio Cascos Depto. Estadística, Universidad Carlos III 41
Intervalos de Confianza particulares Intervalo de Confianza para la diferencia de
proporciones de dos poblaciones (muestras independientes).
con un nivel de confianza ,donde P(Z > z) = si Z~
2
22
1
112/21
2
22
1
112/2121
)ˆ1(ˆ)ˆ1(ˆˆˆ,
)ˆ1(ˆ)ˆ1(ˆˆˆ
n
pp
n
ppzpp
n
pp
n
ppzpppp
Ignacio Cascos Depto. Estadística, Universidad Carlos III 42
Contrastes particulares Contraste para la igualdad de medias de dos
poblaciones normales con varianzas desconocidas y distintas (muestras independientes) Hipótesis nula. H0: 1= 2
Hipótesis alternativa. H1: 12 Rechazo H0 cuando
Hipótesis alternativa. H1: 12 Rechazo H0 cuando
Hipótesis alternativa. H1: 12 Rechazo H0 cuando
znsns
xx
2221
21
21
ˆˆ
znsns
xx
2221
21
21
ˆˆ
2/
2221
21
21
ˆˆz
nsns
xx
Ignacio Cascos Depto. Estadística, Universidad Carlos III 43
Intervalos de Confianza particulares Intervalo de Confianza para la diferencia de
medias de dos poblaciones normales con varianzas desconocidas y distintas.
con un nivel de confianza ,donde P(Z > z) = si Z~
2
22
1
21
2/212
22
1
21
2/2121
ˆˆ,
ˆˆ
n
s
n
szxx
n
s
n
szxx
Ignacio Cascos Depto. Estadística, Universidad Carlos III 44
Contrastes particulares Contraste para la igualdad de medias de dos poblaciones
normales con varianzas desconocidas pero iguales Hipótesis nula. H0: 1= 2
Hipótesis alternativa. H1: 12 Rechazo H0 cuando
Hipótesis alternativa. H1: 12 Rechazo H0 cuando
Hipótesis alternativa. H1: 12 Rechazo H0 cuando
,2
21
212111ˆ
nn
T
tnns
xx
,2
21
212111ˆ
nn
T
tnns
xx
2/,2
21
212111ˆ
nn
T
tnns
xx
2
ˆ)1(ˆ)1(ˆ
21
222
2112
nn
snsnsT
Ignacio Cascos Depto. Estadística, Universidad Carlos III 45
Intervalos de Confianza particulares Intervalo de Confianza para la diferencia de
medias de dos poblaciones normales con varianzas desconocidas pero iguales.
con un nivel de confianza ,donde P(X > tn,) = si X~tn
212/,221
212/,22121
11ˆ,
11ˆ
2121 nnstxx
nnstxx TnnTnn
Ignacio Cascos Depto. Estadística, Universidad Carlos III 46
Contrastes particulares Contraste para la igualdad de medias en dos
poblaciones normales con varianza desconocida (muestras relacionadas), d = x1x2
Hipótesis nula. H0: d= 0 Hipótesis alternativa. H1: d0
Rechazo H0 cuando
Hipótesis alternativa. H1: d0 Rechazo H0 cuando
Hipótesis alternativa. H1: d0 Rechazo H0 cuando
,1ˆ n
d
tns
d
,1ˆ n
d
tns
d
2/,1ˆ n
d
tns
d
1
)(ˆ 1
22
n
dds
n
i id
Ignacio Cascos Depto. Estadística, Universidad Carlos III 47
Intervalos de Confianza particulares Intervalo de Confianza para la diferencia de
medias de dos poblaciones normales con varianza desconocida (muestras relacionadas).
con un nivel de confianza ,donde P(X > tn,) = si X~tn
n
std
n
std d
nd
n
ˆ,
ˆ2/,12/,121
Ignacio Cascos Depto. Estadística, Universidad Carlos III 48
Contrastes particulares Contraste para la igualdad de varianzas de dos
poblaciones normales Hipótesis nula. H0: 1
2= 22
Hipótesis alternativa. H1: 122
2
Rechazo H0 cuando
Hipótesis alternativa. H1: 122
2
Rechazo H0 cuando
Hipótesis alternativa. H1: 122
2
Rechazo H0 cuando
1,1,122
21
21F
ˆ
ˆnns
s
,1,122
21
21F
ˆ
ˆ nns
s
2/,1,122
21
2/1,1,122
21
2121F
ˆ
ˆ ó F
ˆ
ˆ nnnn s
s
s
s
Ignacio Cascos Depto. Estadística, Universidad Carlos III 49
Intervalos de Confianza particulares Intervalo de Confianza para el cociente de
varianzas de dos poblaciones normales.
con un nivel de confianza ,donde P(X > Fn11,n21,) = si X~ Fn11,n21
Fn21,n11,1 = 1/Fn11,n21,
2/,1,12
2
21
2/1,1,122
21
22
21
1212F
ˆ
ˆ,F
ˆ
ˆ
nnnn s
s
s
s
Ignacio Cascos Depto. Estadística, Universidad Carlos III 50
Contrastes particulares Contraste aproximado para el EMV
Hipótesis nula. H0: = 0
Hipótesis alternativa. H1: 0
Rechazo H0 cuando
Hipótesis alternativa. H1: 0
Rechazo H0 cuando
Hipótesis alternativa. H1: 0
Rechazo H0 cuando
zMV
ˆ
0ˆ
zMV
ˆ
0ˆ
2/ˆ
0ˆ
zMV
1
2
22ˆ
)ˆ(
MVLMV
Ignacio Cascos Depto. Estadística, Universidad Carlos III 51
Intervalos de Confianza particulares Intervalo de Confianza aproximado para un
EMV.
con un nivel de confianza ,donde P(Z > z) = si Z~
ˆ2/ˆ2/
ˆ,ˆ zz MVMV
Ignacio Cascos Depto. Estadística, Universidad Carlos III 52
Contrastes particulares Contraste para la Poisson (basado en EMV)
Hipótesis nula. H0: = 0
Hipótesis alternativa. H1: 0
Rechazo H0 cuando
Hipótesis alternativa. H1: 0
Rechazo H0 cuando
Hipótesis alternativa. H1: 0
Rechazo H0 cuando
znx
x
0
znx
x
0
2/0
znx
x
nxxMV
MV 2 ; ˆˆˆ
Ignacio Cascos Depto. Estadística, Universidad Carlos III 53
Intervalos de Confianza particulares Intervalo de Confianza aproximado para la
de una Poisson (basado en EMV).
con un nivel de confianza ,donde P(Z > z) = si Z~
nxzxnxzx 2/2/ ,