ine7002 - testes de hipóteses: diferença entre 2 médias...
TRANSCRIPT
Inferência Estatística
Testes de Hipóteses: testes de diferença entre 2 médias, conceitos, grupos pareados, grupos independentes com variâncias conhecidas e
desconhecidas
1
Introdução
Considere o problema de comparar 2 materiais
(A e B), para sola de tênis, pelo grau de
desgaste após um período de uso. Seguem dois
projetos de experimentos alternativos:
2
Introdução
Projeto I – Um grupo de indivíduos usa tênis com solas feitas com o material A; e outro grupo usa tênis com solas feitas com o material B.
Projeto II – Fabricam-se, para a realização do experimento, pares de tênis com os dois tipos de sola, isto é, um dos pés com o material A e o outro pé com o material B. Em cada par, o material usado em cada pé (direito ou esquerdo) é decidido por sorteio 3
Amostras independentes – Projeto I
Material B Material A divisão aleatória
Mensuração do grau de desgaste Mensuração do grau de desgaste
4
Amostras pareadas – Projeto II
Mensuração do grau de desgaste
B A B A A B B A A B
alocação aleatória de A e B em cada par
5
Amostras pareadas
Importância de considerar os pares na análise:
criança
1 2 3 4 5 ...
desgaste
material A
material B
desgaste
6
Teste de Diferença entre 2 médias populacionais
Duas populações, com variáveis quantitativas observáveis.
Médias dos valores de uma variável quantitativa nas 2 populações (1 e 2).
H0: μ1 - μ2 = d0
H1: μ1 - μ2 > d0 μ1 - μ2 < d0 μ1 - μ2 ≠ d0
Teste t.
7
Teste t
8
William Sealy Gossett
Desenvolveu o teste t para
comparar pequenas amostras
na produção de cerveja stout.
9
SIM
NÃO SIM
NÃO SIM
NÃO
Duas
amostrasRelacionadas?
Teste t para 2
amostras
pareadas
Avaliar variâncias
populacionaisConhecidas?
Teste Z para 2
amostras
independentes
Teste F de
diferença entre 2
variâncias
Usar Z como
variável de teste
Variância
semelhantes?
Teste t para 2
amostras
independentes
Teste t para 2
amostras
independentes
Variável de
interesse
quantitativa:
distribuição
normal em
ambas as
populações Usar t com
n1+n2 -2
graus de
liberdade
Usar t com
graus de
liberdade
Teste de Diferença entre 2 médias populacionais: grupos relacionados
Variável normal em ambas as populações.
Populações relacionadas (tamanhos de amostra têm que ser iguais).
Muito comum em situações do tipo antes-depois => PAREAMENTO.
10
Teste de Diferença entre 2 médias populacionais: grupos pareados
H0: μantes - μdepois = d0 => μD = d0
H1: μD > d0 μD < d0 μD ≠ d0
Distribuição da variável nas situações antes e depois: normal
Distribuição amostral da diferença média: t com n- 1 graus de liberdade.
n é o número de pares.
11
Teste de Diferença entre 2 médias populacionais: grupos pareados
12
ns
ddt
D
n/
01
Se H1: D > d0 => Rejeitar H0 se valor-p = P(tn-1 > tn-1,calculado)
Se H1: D < d0 => Rejeitar H0 se P(tn-1 < tn-1,calculado)
Se H1: D ≠ d0 => Rejeitar H0 se 2 × P(tn-1 > |tn-1,calculado|)
Exemplo 1
O gerente de uma loja de carros está testando duas marcas (1 e 2) de pneus radiais. Coloca ao acaso um pneu de cada marca nas duas rodas traseiras de 8 carros e anda com os carros até que os pneus se desgastem, sendo registrada a quilometragem. Para 1% de significância há evidência de diferença entre as vidas médias dos pneus?
13
Exemplo 1
Pareamento: duas marcas no mesmo carro.
H0: μ1 – μ2 = d0 => μD = d0
H1: μD ≠ d0
d0 = 0
H0: μ1 – μ2 = 0 => μD = 0
H1: μD ≠ 0
14
Exemplo 1
15
Carro Marca 1 Marca 2 Diferença
1 36925 34318 2607
2 45300 42280 3020
3 36240 35500 740
4 32100 31950 150
5 37210 38015 -805
6 48360 47800 560
7 38200 37810 390
8 33500 33215 285
375,868d
033,1290ds
Exemplo 1
16
904,18/033,1290
0375,868
/818
01
tt
ns
dt
D
n
Valor-p = 2 × P(t8 > |1,904|) = 2 × 0,049 = 0,098
Valor-p > 0,01 => Rejeitar H0 => Não há evidência de diferença
Teste de Diferença entre 2 médias populacionais: grupos independentes,
variâncias conhecidas
Variável normal em ambas as populações.
Populações independentes (tamanhos de amostra podem ser diferentes).
Variâncias populacionais da variável nas duas populações sejam conhecidas.
17
Teste de Diferença entre 2 médias populacionais: grupos independentes,
variâncias conhecidas H0: µ1 - µ2 = d0
H1: µ1 - µ2 > d0 H1: µ1 - µ2 < d0 H1: µ1 - µ2 ≠ d0
Estatística de teste: z.
Distribuição da estatística de teste: normal
18
D
dxxZ
021
2
2
2
1
2
1D
nn
Teste de Diferença entre 2 médias populacionais: grupos independentes,
variâncias desconhecidas
Variável normal em ambas as populações.
Populações sejam independentes (tamanhos de amostra podem ser diferentes).
E, as variâncias populacionais da variável nas duas populações são DESCONHECIDAS.
19
Teste de Diferença entre 2 médias populacionais: grupos independentes,
variâncias desconhecidas Estatística de teste t com gl:
Variâncias populacionais semelhantes, n1+n2 -2.
Variâncias populacionais diferentes, .
Como descobrir se são semelhantes?
Teste F de diferença entre 2 variâncias.
20
Teste F de diferença entre variâncias
21
• H0: σ12 = σ2
2 H1: σ12 σ2
2
• Estatística de teste F.
2
2
2
11,1 21 s
sF nn
Distribuição F de Fisher com n1-1 e n2-1 graus de liberdade
Rejeitar H0 se: Fn-1,n2-1 < Fn-1,n2-1;α/2 OU Fn-1,n2-1 > Fn-1,n2-1;1-α/2
22
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4
f(x)
Estatística F
Distribuição F de Fisher (dois exemplos)
F com 14,14 graus de liberdade F com 6,7 graus de liberdade
23
Fn-1,n2-1;α/2
α/2
Fn-1,n2-1;1-α/2
α/2
24
Teste de Diferença entre 2 médias populacionais: grupos independentes,
variâncias desconhecidas e semelhantes
• Estatística de teste: t.
• Distribuição da estatística de teste: t com n1 + n2 – 2
graus de liberdade.
d
_
2
_
12nn
s
xxt
21
2nn
n
1
n
1s)1n(s)1n(
s21
21
2
22
2
11
d
25
Teste de Diferença entre 2 médias populacionais: grupos independentes, variâncias desconhecidas e diferentes
d
_
2
_
1
s
xxt
2
2
2
1
2
1d
n
s
n
ss
1n
n/s
1n
n/s
n/sn/s
2
2
2
2
2
1
2
1
2
1
2
2
2
21
2
1
• Estatística de teste: t.
• Distribuição da estatística de teste: t com graus de
liberdade.
Exemplo 2
A Jabyl Circuits está avaliando o tempo de montagem de um novo modelo de circuito em 2 de suas unidades. Suspeita-se que o desempenho da fábrica 1 seja pior do que o da fábrica 2 (aquela seria mais lenta). Supõe-se que as distribuições dos tempos podem ser consideradas normais. Foram coletadas duas amostras de tempos de montagem: 8 na fábrica 1, resultando em média de 3,52 minutos, variância de 1,5 minutos2 e 10 na fábrica 2, resultando em média de 1,85 minutos e variância de 1,7 minutos2. A suspeita é procedente a 5% de significância?
26
Exemplo 2
H0: μ1 - µ2 = 0
H1: μ1 - µ2 > 0
Nível de significância: = 0,05; 1- = 0,95
Grupos independentes, variâncias populacionais desconhecidas: aplicar teste F de diferença entre variâncias.
27
Exemplo 2
H0: σ2
1 = σ22 (admite-se que não haja diferença)
H1: σ2
1 ≠ σ22
Nível de significância: = 0,05; 1- = 0,95
s21 = 1,5 min2 n1=8 s2
2 = 1,7 min2 n2=10
28
882,07,1
5,19,71,1 2
2
21
21 FF
s
s
nn
29
F7,9;0,925 = 4,2
F7,9;0,025 = 0,21
F7,9 = 0,882
Aceitar H0: 12 2
2
Exemplo 2
As variâncias populacionais podem ser consideradas semelhantes.
A variável t terá n1 + n2 – 2 graus de liberdade.
tn1+n2-2 = t8+10-2 = t16.
30
6023,0
2108
10
1
8
17,1)110(5,1)18(
2nn
n
1
n
1s)1n(s)1n(
s21
21
2
22
2
11
d
Exemplo 2
31
Valor-p = P(t16 > 2,772) = 0,0068
Como valor-p = 0,0068 < α = 0,05
REJEITAR H0 a 5% de Significância (há 5% de chance de erro)
Assim, concluímos com 95% de confiança (ou chance de erro de 5%) que a suspeita é procedente.
772,26023,0
85,152,3 =>
016
2116
t
s
xxt
d
32
α = 0,05
Valor - p = 0,0068
tcalculado = 2,772 tcrítico = 1,746
Exemplo 2
E se as variâncias fossem diferentes...
A variável t teria graus de liberdade.
33
13
18
8/5,3
110
10/6,0
8/5,310/6,0
1n
n/s
1n
n/s
n/sn/s22
2
2
2
2
2
2
1
2
1
2
1
2
2
2
21
2
1
6519,010
5,3
8
6,0
2
2
2
1
2
1 dd sn
s
n
ss
Exemplo 2
34
562,26519,0
85,152,3 =>
013
2113
t
s
xxt
d
Valor-p = P(t16 > 2,562) = 0,0118
Como valor-p = 0,0118 < α = 0,05
REJEITAR H0 a 5% de Significância (há 5% de chance de erro)
Assim, concluímos com 95% de confiança (ou chance de erro de 5%) que a suspeita é procedente.