EstatísticaEstatísticaAula 23Aula 23
Universidade Federal de AlagoasUniversidade Federal de AlagoasCentro de Tecnologia
Prof. Marllus Gustavo Ferreira Passos das NevesProf. Marllus Gustavo Ferreira Passos das Neves
Aula 23Aula 23
Teste de Hipóteses para 3 ou mais médias: Teste de Hipóteses para 3 ou mais médias: ANOVA fator únicoANOVA fator único
Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias
Objetivo: dadas 3 ou mais amostras, verificar a hipótese de igualdade de 3 ou mais médias populacionais
Suponha que a equipe de engenheiros de uma fábrica de papel desconfia que a porcentagem (concentração) de madeira de lei na fabricação aumenta a resistência à tensão.
Eles resolvem fazer experimentos com 4 níveis de concentração: 5%, 10%, 15% e 20%, fabricando 6 corpos de prova para cada nível, totalizando 24 corpos de prova
Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médiasO quadro abaixo o experimento com os resultados
Observações
Concentração de madeira de lei
5% 10% 15% 20%
1 7 12 14 19
2 8 17 18 253 15 13 19 224 11 18 17 235 9 19 16 186 10 15 18 20
Médias 10,00 15,67 17,00 21,17
Neste tipo deexperimento, há um único fator concentração de madeira de Lei.
O fator no nosso exemplo possui 4 níveis chamados de tratamentos
Cada tratamento teve 6 observações 6 replicatas
Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias
A pergunta a ser respondida: o nível do fator ou os diferentes tratamentos fazem melhorar a resistência à tensão do papel?
Outro Exemplo: testar a hipótese de que o CRs acumulados médios dos alunos de engenharia são diferentes para 3 diferentes populações: iniciantes, intermediários e concluintes.
Os dados estão a seguir amostras de tamanhos iguais a 30
Quem é o fator? Quem são os tratamentos?
Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias
Hipóteses:
H0: 1 = 2 = 3 = ...
H1: pelo menos uma é diferente das demais
População/estatística
Iniciantes
Intermediários
Concluintes
n 30 30 30
Média amostral 6,564 6,736 7,105
s 1,739 1,148 1,041
Usaremos a chamada análise de variância (ANOVA) médias muito diferentes ocasionam variância entre elas alta
Ideia geral do teste: como se supõe que as populações têm variâncias iguais, ou seja,1
2 = 22 = 3
2 = ... = 2, estimamos 2 com 2 abordagens diferentes. Com a estatística F descobriremos se estas 2 abordagens possuem estimativas muito direfentes F alto ou parecidas F próximo de 1. O 1º caso será evidência em favor de H1 e o 2º caso em favor de H0
Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias
Quais são as Quais são as 2 2 abordagens?abordagens?
Variância entre amostras (variância devido ao tratamento)
Variância dentro das amostras (variância devido ao erro)
Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias
amostras das dentro variânciaamostras entre variância
F
Médias muito diferentes ocasionam variância entre elas alta (variância entre amostras) F alto Região de rejeição rejeitamos H0 evidência contra a igualdade de médias Médias parecidas ocasionam variância entre elas baixa (variância entre amostras) F baixo Região de não rejeição não rejeitamos H0 evidência a favor da igualdade de médias
População/estatística
Iniciantes
Intermediários
Concluintes
n 30 30 30
Média amostral 6,564 6,736 7,105
s 1,739 1,148 1,041
numeradordenominad
or
Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias
Suposições:
1)As amostras são independentes umas das outras;2)As populações têm distribuições que são aproximadamente normais3)As populações têm a mesma variância (exigência leve tamanhos de amostras iguais podem ter variâncias bem diferentes: a maior ser até 9 vezes a menor os resultados ainda são confiáveis)4)Amostras aleatórias5)As amostras são de populações que são categorizadas de uma só maneira
Exemplo (continuação): testar a hipótese de que o CRs acumulados médios dos alunos de engenharia são diferentes para 3 diferentes populações: iniciantes, intermediários e concluintes. População/estatística
Iniciantes
Intermediários
Concluintes
n 30 30 30
Média amostral 6,564 6,736 7,105
s 1,739 1,148 1,041
numeradordenominad
or
2,2920,076430ns2X
1,8083
(1,041)(1,148)(1,739)s
2222p
AplicaçõesAplicações
AplicaçõesAplicações
1,2681,8082,292
s
nsF 2
p
2X
Como sempre achar o valor crítico de F da tabela
Para = 0,05 e graus de liberdade:
glnumerador = k – 1 = 3 – 1 = 2gldenominador = k.(n – 1) = 3.(30 – 1) = 87
onde k é o no de amostras e n o tamanho das amostras (por enquanto o mesmo para todas elas)
AplicaçõesAplicações
A tabela não possui 87, mas sim 60 e 120, cujos valores são 3,1504 e 3,0718. Tomando o valor médio, temos
Fc = 3,111
Como F = 1,268 < Fc = 3,111
não há evidência estatística suficiente, ao nível de significância de 5%, para afirmar que as 3 médias sejam diferentes
Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias
Esse foi o caso da aplicação da ANOVA de um critério ou ANOVA de fator único, pois usamos uma única característica ou propriedade para categorizar populações. Essa característica é, algumas vezes chamada de tratamento ou fator.
Outra observação: os tamanhos das amostras foram iguais, o que facilitou bastante o cálculo e o entendimento
A seguir veremos como fica o caso de amostras A seguir veremos como fica o caso de amostras com tamanhos diferentescom tamanhos diferentes
ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentesPara o caso de amostras com tamanhos diferentes, também usamos a estatística F como a razão entre duas estimativas diferentes da variância populacional comum 2, mas agora elas envolvem medidas ponderadas
Variação dentro das amostras (erro)
1)(n
1)s(n
1-k
x-xn
F
i
2ii
ii
2
Variação entre as médias das amostras (tratamento)
ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes
k
1)(n
1)s(n
1-k
x-xn
F
i
2ii
ii
2
Média de todos os valores amostrais combinados
x
No de médias populacionais sendo comparadas
ni
ix
2is
Média dos valores da i-ésima amostra
Variância dos valores da i-ésima amostra
No de valores da i-ésima amostra
ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes
k = 3 3 médias populacionais sendo comparadas: 1, 2 e 3
x
Amostra 1
Amostra 2 Amostra 3
a1 b1 c1
a2 b2 c2
b3
Suponhamos 3 amostras (tabela abaixo)
n1 = 2
n2 = 3n3 =
2
321
2132121
nnnccbbbaa
x
média de todosos valores amostraiscombinados
1x
21s
2x
22s
3x
23s
médias amostrais
variâncias amostrais
= 7
ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes
x
Amostra 1
Amostra 2 Amostra 3
a1 b1 c1
a2 b2 c2
b3
Suponhamos 3 amostras (tabela abaixo)
n1 = 2
n2 = 3n3 =
2
7ccaa
x 3221
...
1x 21s2x 2
2s3x 23s
2222
x-xnx-xnx-xnx-xn 332211ii 233
222
211
2ii 1)s(n1)s(n1)s(n1)s(n
e
1)(n1)(n1)(n1)(n 321i
1)(n
1)s(n
1-k
x-xn
F
i
2ii
ii
2
ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentesHá uma nomenclatura para estes somatórios
onde SQ = Soma dos quadrados
SQ(erro)1)s(n1)s(n1)s(n1)s(n 233
222
211
2ii
ou SQ(dentro das amostras)
nto)SQ(tratamex-xnx-xnx-xnx-xn 332211ii 2222
ou SQ(entre amostras) ou SQ(entre grupos) ou SQ(fator)
Dividindo SQ(tratamento) e SQ(erro) por seus respectivos graus de liberdade MQ(tratamento) e MQ(erro)
onde MQ = Média quadrática
ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes
1knto)SQ(tratame
nto)MQ(tratame
k-NSQ(erro)
MQ(erro)
onde N = n1 + n2 + n3 no total de valores em todas as amostras combinadas
3 - N 1)(n1)(n1)(n1)(n 321i k do nosso exemplo
Então para testarmos a hipótese de diferenças de 3 ou mais médias
H0: 1 = 2 = 3 = ...H1: pelo menos uma é diferente das demais
ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes
MQ(erro)nto)MQ(tratame
F Estatística de teste:
amostras) das MQ(dentroamostras) MQ(entre
F gl = k - 1 gl = N - k
Este tipo de teste costuma ser feito com o auxílio da tabela ANOVA
ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes
Col 1 Col 2 Col 3 Col 4 Col 5
Fonte de variação
Soma dos Quadrados
(SQ)
Graus de liberdad
e
Média Quadrática (MQ)
Estatística de teste F
Tratamento
k - 1 Num = Col 2/Col 3 Num / Den
Erro N - k Den = Col 2/Col 3
TotalN - 1
2
x-xn ii
2ii 1)s(n
AplicaçõesAplicações
Um engenheiro ambiental está analisando o efeito da vazão de um efluente contaminado com chumbo na concentração de saída do chumbo em um sistema de tratamento. A tabela abaixo apresenta o resultado dos ensaios realizados com 5 vazões diferentes.
a) Há qualquer diferença na concentração de saída do chumbo devido à variação na vazão? Use = 0,05
AplicaçõesAplicações
Uso do Statdisk
AplicaçõesAplicações
AplicaçõesAplicações
Revisitando o teste dos CRs acumulados
EstatísticaEstatísticaAula 23Aula 23
Universidade Federal de AlagoasUniversidade Federal de AlagoasCentro de Tecnologia
Prof. Marllus Gustavo Ferreira Passos das NevesProf. Marllus Gustavo Ferreira Passos das Neves