apresentação cqe2010-est-ii-sp
DESCRIPTION
Aula para curso preparatório para o CQETRANSCRIPT
![Page 1: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/1.jpg)
Curso preparatório para a prova de Certificação
CQE ASQ
Módulo: Estatística II Instrutor: Paulo Simas Tecnologia da Informação - UMSA Maio/2010
![Page 2: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/2.jpg)
Disciplina: Estatística II
Paulo Afonso Lourenço SimasEngenheiro Mecânico - PUC-BH (1985)
Engº de Qualidade Certificado - CQE-ASQ (2003)
MBA Gestão Empresarial (2007)
paulo.simas@usiminasmecânica.com.br3829-3766 8395-9961
![Page 3: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/3.jpg)
Escopo Stat:VI. Quantitative Methods and Tools (43 Questions)
D. Statistical Decision-Making
Point estimates and confidence intervalsHypothesis testing Paired-comparison testsGoodness-of-fit testsAnalysis of variance (ANOVA)Contingency tables
E. Relationships Between Variables
Linear regressionSimple linear correlationTime-series analysis
![Page 4: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/4.jpg)
Agenda
Primeiro Dia: 27/05/2010– 8:00: Introdução– 8:30: Estimativas (medias e
proporções)– 10:00: Intervalo– 10:30: Estimativa (desvio
Padrão/variância)– 12:00: Almoço– 13:30: Exercícios– 14:30 Correção– 15:30: Intervalo– 16:00: Testes de hipóteses
para a média e a proporção
Segundo Dia: 28/05/2010– 8:00: Testes de hipóteses
para 2 médias/proporções– 10:00: Intervalo– 10:30: Testes de hipóteses
para a variância e Testes de aderência e independência
– 12:00: Almoço– 13:30:Exercícios– 14:30: Correção– 15:30: Intervalo– 16:00: Regressão Linear
Simples
![Page 5: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/5.jpg)
Agenda
Terceiro Dia: 11/06/2009– 8:00: Regressão Linear Múltipla– 10:00: Intervalo– 10:30: Séries Temporais– 12:00: Almoço– 13:30: Exercícios– 15:30: Intervalo– 16:00 Correção
![Page 6: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/6.jpg)
1) If an answer is obvious it must be a trick question.FACT: Just because an answer is obvious to you doesn’t mean it is obvious toeveryone.
2) Guessing wrong can hurt your score more than leaving an answer blank.FACT: There is no penalty for guessing, and you have a 25% chance of getting it right.
3) The passing score for all ASQ exams is 70%.FACT: The passing score for each ASQ exam is established as a minimum performancestandard during the cut-score process.
4) Taking a section refresher course or buying ASQ exam prep material is a sureway to pass.FACT: Section refresher courses and the self-directed products are excellent ways toprepare for the examinations, but using them does not guarantee that you will pass.
5) If you do poorly on one area of the body of knowledge, you automatically fail thetest.FACT: Your total score on the examination determines whether you pass or fail, not yourscore on any one portion of the test.
6) ASQ limits the number of people who pass.FACT: Anyone who meets or exceeds the passing score (cut point) passes theexamination. ASQ does not set a passing rate.
Top 10 Myths of Certification
![Page 7: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/7.jpg)
7) The grading of the constructed response portion of the certified quality managerexam is very subjective.FACT: The constructed response portion of the exam is designed to test the candidate’sability to respond to realworld situations.
8) It takes a long time to receive exam results.FACT: ASQ works very hard to provide exam results as quickly as possible and is veryaware that the examinees are anxious to learn whether they have passed or failed.
9) Test questions are deliberately tricky.FACT: ASQ goes through an extensive process to ensure that examination questionsare as accurate, clear, and concise as possible.
10) I can’t learn from my mistakes if I don’t get my scored test back.FACT: Because of its policy to reuse examination questions, ASQ cannot release copiesof the examinations.
Top 10 Myths of Certification
![Page 8: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/8.jpg)
InglêsVeja como é o seu inglês e qual a modalidade mais fácil de usar agora. Eu optei pelo seguinte:
Eu lia o texto escrito em Inglês e pronunciava em Português. Uma espécie de tradução simultânea. Durante os dias que estudamos junto, eu lia o texto dos livros e os outros escutavam. Não quiseram ler, pois ficaram receosos de retardar o processo. Eu achei bom, pois assim aperfeiçoei mais rápido.
Tempo de estudoCada um tem necessidade de uma quantidade de estudo. eu precisei de muito. Após as aulas,
eu passava os Sábados e Domingos reescrevendo as questões e resolvendo-as, conferindo-as em seguida. Eu precisava sedimentar novamente os conceitos básicos de cada disciplina. Fiz 80% dos exercícios do Stevenson (copiados e resolvidos). Busquei na Internet tudo que dizia respeito ao CQE. Encontrei outros materiais e usei-os para estudo também.
RelaxÉ importante que vocês vejam o limite de cada um. Eu não conseguia estudar após o
expediente. Então ia para casa, verificava a situação por lá (tenho uma filha que estava com 15 anos e um filho de 10 anos.), rezava o terço com eles, ia para a ginástica, e depois que tudo se acalmava, por volta das 9:00 horas da noite, eu voltava a estudar um pouco, se achasse que iria render alguma coisa. Não se esforcem demasiadamente, pois o cansaço da mente e do estado emocional podem prejudicar muito. O resultado do estudo, a vida familiar, seu humor e mais.
Sala de estudosNós pedimos uma sala reservada para nós a partir de Setembro, sendo que tínhamos esta sala
exclusiva, aonde deixamos a maior parte do material, e vínhamos de segunda a sábado estudar nela. Aos Sábados, às vezes era necessário pegar as chaves e informar à vigilância, pois ficávamos sozinhos aqui. Nosso tempo de estudo variou. Eu tirei férias a partir de 27 de Outubro e misturei com os dias de aula, ficando até a segunda-feira após a prova por conta. Outros obtiveram 1 mês de liberação da chefia. Outros conseguiram férias de 15 dias antes da prova. E outros nada.
Estudos para o CQE
![Page 9: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/9.jpg)
SimuladosDevem ser feitos no dia marcado, no horário marcado. Não fiquem adiando. Não busquem os
simulados dos anos anteriores. Como isto é trabalho voluntário, em horários extras, os simulados têm muitas questões repetidas de um ano para outro. Venham para o simulado, para usá-lo como experiência. Vocês terão que ler as questões, entendê-las, resolvê-las e marcar o gabarito. Se vocês já tiverem os resultados ou resolvidos esses simulados, eles não expressarão a condição real da prova, e vocês terão resultados menos realistas. Após os simulados não existe condições psicológicas de se continuar a estudar, o ideal é ir descansar.
Simulados ExtrasEles preparam 3 simulados. Nós fizemos 5. Os dois extras foram feitos buscando-se mais
informações, questões que outras turmas haviam preparado, e simulado da ABCQ. O problema foi no simulado de outra turma, anterior à nossa, que baixaram da internet as questões do site da ASQ, sendo que tinham questões de CRE, CQM, CQA e CQE. Com isto, tivemos um tempo de preocupação (desespero) quando vimos questões tão difíceis para os estudos que estávamos fazendo. Tragam o material para os simulados, pois vocês devem aprender a usá-lo e o que eles contém.
GabaritoMinha turma foi quase unânime em marcar o gabarito enquanto resolvia a prova. Foi uma
experiência válida, porém este sistema foi adotado deste os simulados.
Estudos para o CQE
![Page 10: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/10.jpg)
MaterialResumos, livros, dicionários. Após os estudos, por volta de Outubro, comecem a fazer seus
resumos. Podem utilizar-se de resumos de outros, mas é importante que vocês façam os próprios. Cada um tem sua dificuldade ou facilidade. O resumo de um pode parecer bobagem para uns e não ser entendido por outros. Se forem fazer o dicionário, façam os próprios dicionários. Existem palavras que a gente lê 2 ou 3 vezes e aprende, existem palavras que a gente lê uma infinidade de vezes e depois se desespera escreve para todo lado e acaba aprendendo e existem palavras que por mais que a gente se desespera, jamais aprende. Volto a repetir, cada um tem a sua dificuldade ou facilidade.(Nós tínhamos: Foundations, Pizdek, Primer, Questões da ABCQ, Stevenson)
CalculadoraTenham uma calculadora boa em mãos. Não é necessário nada sofisticado. Precisa ser
Científica e ter funções Estatísticas. O uso na prova é pouco, porém de grande valia se ela tiver as funções para acelerar/facilitar os resultados. Não é permitido uso de calculadora programável. Vejam com o Paulo Rogério sobre o uso de tais calculadoras com antecedência. É muito importante que vocês arrumem a calculadora com bastante antecedência, pois precisam estar acostumados com ela para usá-la no dia.
Estudos para o CQE
![Page 11: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/11.jpg)
Bibliografia
•ASQ’s FOUNDATIONS IN QUALITY
•JURAN’S QUALITY HANDBOOK
![Page 12: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/12.jpg)
1ª Parte:
– Introdução
– Estimativas (Médias e Proporções)
– Estimativas (Desvio Padrão/Variância)
Slide 12
![Page 13: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/13.jpg)
Cálculo das Probabilidades
Grandes Áreas da Estatística
Coleta de Dados
Estatística Descritiva
EstatísticaInferencial
•Organização•Apresentação•Sintetização
Métodos paratomada de decisões
AmostragemPlanejamento deExperimentos
![Page 14: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/14.jpg)
QUESTÕES
• Até que ponto, podemos confiar nos resultados ou estimativas de
estatísticas amostrais?
• Qual é o tamanho ideal ou mínimo para uma amostra representativa?
Precisamos de mecanismos para quantificar em quanto podemos acreditar Precisamos de mecanismos para quantificar em quanto podemos acreditar
no resultados de uma amostra! no resultados de uma amostra!
• Grau de confiança • Tamanho da amostra
• Estimativa • Precisão
Distribuição Amostral da Média:
![Page 15: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/15.jpg)
Média1 1 2 2 4 2,252 5 3 3 6 4,253 2 4 4 3 3,254 9 8 5 9 7,755 4 0 1 0 1,256 2 3 4 2 2,757 4 5 6 7 5,58 5 6 8 9 79 8 6 6 5 6,2510 9 6 7 8 7,511 0 2 8 0 2,512 8 8 4 8 713 9 9 7 8 8,2514 8 7 4 5 615 9 6 4 2 5,2516 3 7 9 4 5,7517 3 1 2 2 218 2 4 4 6 419 8 9 3 4 620 2 7 9 7 6,2521 3 3 4 5 3,7522 3 6 7 8 623 9 8 9 6 824 3 0 1 2 1,525 7 9 6 8 7,5
Amostras aleatórias
0 1 2 3 4 5 6 7
freq
uên
cia
8 9
Distribuição dos 100 dados
f(x) 1
XDistribuição amostral das 25 médias
TEOREMA CENTRAL DO LIMITE
![Page 16: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/16.jpg)
Na medida em que o tamanho da amostra aumenta, a distribuição amostral das médias amostrais tende para uma distribuição normal;
População original
Médias amostraisn=5
Médias amostraisn=30
![Page 17: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/17.jpg)
Compreendendo o Teorema Central do Limite...
Uma variável “x” pode
possuir uma distribuição
normal ou não, com média
() e desvio-padrão ().
Se amostras de tamanho (n)
são extraídas aleatoriamente
dessa população.
Na medida em que o tamanho
da amostra aumenta, a
distribuição das médias
amostrais tende para uma
distribuição normal.nx
Neste caso, a média das
médias amostrais será a
média da população E
o desvio-padrão das médias
amostrais é chamado de
erro padrão, dado por:
X
![Page 18: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/18.jpg)
O Teorema Central do Limite em projeto de elevadores
Em projetos de elevadores é fundamental considerar o
peso das pessoas para que não haja sobrecarga e
futuras falhas. Dado que a população brasileira tem
peso distribuído normalmente entre 72 kg e d.p. 12 kg,
determine a probabilidade de que:
a) uma pessoa escolhida aleatoriamente pese mais de
78 kg.
6915,0
50,012
7278Xz
z
Logo, a probabilidade de uma pessoa pesar mais de 78 kg é de 30,85%.
![Page 19: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/19.jpg)
b) Levando em consideração que uma empresa desenvolveu
um elevador de grande porte (25 pessoas) e a capacidade
máxima de carga é de 1950Kg. Qual a probabilidade de que
25 pessoas que entrem aleatoriamente no elevador, ao
mesmo tempo, propiciem um peso médio maior que 78kg?
Agora estamos lidando com a média para um grupo de 25 valores, e não
mais com um valor individual.
kgX
72
4,225
12
nX
50,24,2
7278
x
Xx
Z
99379,0z
Logo, a probabilidade será de 0,62%.
![Page 20: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/20.jpg)
Conclusões sobre o Teorema Central do Limite.
• O Teorema Central do Limite demonstra que se n é grande (n>30) a
distribuição amostral das médias será aproximadamente normal,
qualquer que seja a variável x;
• Se a própria distribuição original tem distribuição normal, então as
médias amostrais terão distribuição normal para qualquer tamanho
amostral (n).
• No caso de amostragem sem reposição ou quando o tamanho “n” da
amostra é superior a 5% do tamanho N da população finita, ajustamos o
erro-padrão da média amostral para:
1.
N
nN
nX
![Page 21: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/21.jpg)
• Um estimadorestimador é uma estatística amostral utilizada para obter uma
aproximação de um parâmetro populacional. Uma estimativaestimativa é um valor
específico, ou um intervalo de valores, usado para aproximar um
parâmetro populacional.Estimadores
Estimativa pontual Estimativa intervalar
É um valor único (número) usado para aproximar um parâmetro populacional
Intervalo que tem uma probabilidade de conter o verdadeiro valor da população.
Intervalo de Confiança para Média:
ESTIMADOR
![Page 22: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/22.jpg)
ESTIMATIVA INTERVALAR (Intervalo de confiança)
• Fornece uma faixa de possíveis valores que o parâmetro de interesse () pode
assumir, com um grau de confiança conhecido.
O grau de confiança é a probabilidade (1-) expressa em valor percentual do intervalo de confiança conter o verdadeiro valor do parâmetro
populacional.
X
0 Z-1,96 -1,96
/2=0,025 /2=0,025
Grau de confiança de 95%
Para um grau de confiança 95%, o valor crítico de é igual a 1,96 2
Z
• Um Intervalo de confiança é uma amplitude de valores que tem a probabilidade de
conter o verdadeiro valor da população.
![Page 23: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/23.jpg)
Interpretação do conceito de intervalo de confiança para uma
X5050403020 807060
Número da amostra
1
2
3
4...
454647
...
98
99100 =50
Se em um estudo, forem retiradas várias amostras aleatórias de tamanho n da população e que, para cada amostra, seja construído um intervalo de 100(1-) de confiança para .
Os intervalos obtidos serão diferentes, mas 100(1-)% destes intervalos conterão entre os seus intervalos o valor verdadeiro do parâmetro.
![Page 24: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/24.jpg)
Intervalo de Confiança de uma Média populacional (Grandes amostras n>30 ou quando é conhecido)
1) Colete uma amostra aleatória de tamanho n>30 da população ou
uma amostra de qualquer tamanho se é conhecido;
2) Calcule os valores de e (s).
3) Determine o valor do coeficiente de confiança (1 - );
4) Encontre o valor de crítico de
5) Calcule a margem de erro (E)
6) Calcule os limites do intervalo de confiança
7) Interprete o resultado obtido.
X
2
Z
nZx
.2
ExEx
nZE
.2
![Page 25: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/25.jpg)
• É a diferença ou erro máximo provável (1-) entre a média amostral
observada e a verdadeira média populacional . A margem de erro “E”
é também chamada de “erro máximo da estimativa” e pode ser
calculada por: n
ZE
.2
Obs.: a fórmula da margem de erro exige o conhecimento do desvio-padrão
populacional . Sendo praticamente impossível termos o valor do sem ter o valor
da Média populacional, podemos substituir o valor de pelo desvio-padrão amostral
s.
n
sZE .
2
Intervalo inferior Intervalo superiorX
XE
“Margem de erro - Precisão do Intervalo”
![Page 26: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/26.jpg)
Um dos principais produtos de uma indústria siderúrgica é a folha
de flandres. Havia uma preocupação com a possibilidade de
haver um número de folhas fora da faixa de especificação de
dureza (LIE = 58,0 HR e LSE = 64,0 HR). A partir desta
informação a empresa decidiu estimar a dureza média das folhas
de flandres () coletando uma amostra aleatória de 50 folhas.
61,0 60,2 60,3 60,3 60,0 61,0 60,360,0 60,0 60,9 61,0 61,2 59,2 60,960,0 60,5 59,8 59,3 61,0 59,6 59,859,6 60,1 58,0 59,8 58,9 57,6 58,060,5 60,1 61,6 61,1 59,7 58,3 61,659,5 59,0 60,3 58,7 59,6 54,2 60,361,0 59,7 59,9 59,9 60,0 58,6 59,9
Medidas de dureza (HR) das folhas-de-flandres fabricadas pela siderúrgica
61,0
21,60
s
X
Para um grau de confiança de 95%, determine a margem de erro (E) e o intervalo
de confiança para média populacional ().
![Page 27: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/27.jpg)
61,0
21,60
s
X
Resolução:
n = 50
n
sxZE
2
Margem de erro:
17,0169,050
61,0.96,1 E
Grau de confiança de 95% implica em:1 - = 95% = 5% = 0,05 96,1025,0
2
ZZ
Dados:
ExEx
Intervalo de confiança
17,021,6017,021,60
[60,04 ; 60,38]HR
Interpretação:
Se fôssemos selecionar muitas amostras (n=50) da produção de folhas e construíssemos um intervalo de 95% de confiança para cada amostra, 95% desses intervalos conteriam a média populacional .
![Page 28: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/28.jpg)
(Pequenas amostras n 30 e desvio padrão da população desconhecida)
1) Colete uma amostra aleatória de tamanho n < 30 da população;
2) Calcule os valores de e s.
3) Determine o valor do coeficiente de confiança (1 - );
4) Encontre o valor de crítico de
5) Calcule a margem de erro (E)
6) Calcule os limites do intervalo de confiança
7) Interprete o resultado obtido.
X
1;2
nt
ntx
n
.
1;2
ExEx
ntE
n
.
1;2
INTERVALO DE CONFIANÇA DE MÉDIA POPULACIONAL
![Page 29: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/29.jpg)
• O conceito de nível de confiança pode ser utilizado para o cálculo do
tamanho da amostra, necessário para fazermos inferências confiáveis.
• Se a amostra empregada for muito pequena, a
margem de erro será grande, o que
impossibilita ou inviabiliza a tomada de decisão.
• Por outro lado, se a amostra for muito grande,
o intervalo obtido pode ser mais estreito do que
o necessário. (gastos desnecessários);
Como o tamanho
da amostra afeta o
erro de
amostragem?
2
2/ .
E
sZn
n
sZE .
2
CÁLCULO DO TAMANHO DA AMOSTRA:
![Page 30: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/30.jpg)
500 1000 1500 2000 2500 3000Tamanho da amostra
Mar
gem
de
erro
(E
)
0,5
1
1,5
3
2
2,5Tamanho de amostra e margens de erromantendo fixos (S=10 e 95% de confiança)
• Os ganhos em precisão conseguidos com aumentos fixos dos tamanhos das
amostras não são constantes;
• Tamanho de amostra 5.000 podem ser um perda de tempo e dinheiro porque
elas fornecem pouca precisão adicional;
![Page 31: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/31.jpg)
Em um estudo para a determinação do perfil dos veteranos de uma Faculdade, a
característica de maior interesse tem s=0,3. Qual deve ser o tamanho da amostra
para que tenhamos 95% de confiança em que o erro da estimativa da
correspondente a esta característica não supere 0,05?
2
2/ .
E
sZn
13905,0
)3,0).(96,1(.22
2/
E
sZn
E = 0,05s = 0,3 =0,05
Refaça o cálculo supondo que se deseja ter 98% de confiança.
![Page 32: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/32.jpg)
PROPORÇÃO
• A estimativa de proporções populacionais é muito semelhante à de
médias populacionais;Estimadores
Estimativa pontual de uma proporção
Estimativa intervalar de uma proporção
• 21% das peças é defeituosa;• 45% dos eleitores votariam novamente no Presidente Lula
• Entre 18 e 23% das peças são defeituosas;• A proporção de votos para reeleição do Presidente está entre 15 a 25%.
• A média de uma distribuição amostral de proporções amostrais
é sempre igual a verdadeira proporção da população.
Intervalo de Confiança para Proporção:
![Page 33: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/33.jpg)
Estimativa pontual
n
Xp ˆ
O estimador da proporção amostral:
Sendo X o número de elementos da amostra (n) que apresenta a característica de estudo;
O erro-padrão da estimativa:
n
qppEP
ˆ.ˆ)ˆ( pq ˆ1ˆ Sendo:
Suposição: A proporção populacional é igual a proporção amostral!
![Page 34: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/34.jpg)
Estimativa intervalar
n
qpZp
n
qpZp
ˆ.ˆ.ˆ;
ˆ.ˆ.ˆ
22
• intervalo de 100(1-)% de confiança;• supondo amostras grandes (n>40) [aproximação da Binomial para Normal];
• Se amostra finita e n > 5% de N:
1
.ˆ.ˆ
.ˆ2 N
nN
n
qpZp
![Page 35: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/35.jpg)
Tamanho da amostra
2
2
2
ˆ.ˆ
E
qpZn
Para o cálculo do tamanho da amostra:
•Se não tivermos noção do número de defeituosos, isto é, p desconhecido:Devemos perceber que p varia de 0 a 1 (de nenhum defeituoso até 100% defeituoso)
21,0q.p3,0p
16,0q.p2,0p
09,0q.p1,0p
0q.p0p
:para
)p1.(pq.p
21,0q.p7,0p
24,0q.p6,0p
25,0q.p5,0p
24,0q.p4,0p
Assim, consideramos P = 0,5 por nos garantir a maior relação para o tamanho da amostra
![Page 36: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/36.jpg)
Exemplo:
Nos Estados Unidos, os pesquisadores de opinião são
atormentados por uma diversidade de fatores de confusão, como
secretárias eletrônicas. Em uma pesquisa junto a 1068 americanos,
673 informaram ter secretária eletrônica. Com base nesses
resultados amostrais determine:
a) A estimativa pontual da população p:
b) a estimativa intervalar de 95% da proporção populacional
630,01068
673ˆ
n
Xp
0290,01068
)370,0).(630,0(.96,1
ˆ.ˆ
2
n
qpZE
659,0601,0
0290,0630,00290,0630,0
ˆˆ
p
p
EppEp Intervalo de confiança
Entre os americanos, a
percentagem daqueles
que possuem secretária
eletrônica é estimada em
63%, com uma margem
de erro de + 2,9 pontos
percentuais.
![Page 37: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/37.jpg)
Conclusões• Intervalos de confiança são muito mais informativos do que as
estimativas pontuais;
• Toda estimativa intervalar está associada a um grau de confiança;
Referência Bibliográfica
Triola.; - Introdução a Estatística
• Quando se tem n<30 e não se conhece o desvio-padrão da população
usamos a distribuição t.
![Page 38: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/38.jpg)
1. Uma máquina automática de suco industrial é regulada de modo que
a quantidade suprida de cada vez, tenha distribuição aproximadamente
normal com desvio-padrão de 35ml. Determine um intervalo de 96% de
confiança para a quantidade média de toda produção, sabendo que uma
amostra de 30 embalagens teve um conteúdo médio de 290 ml.
Exercícios:
2. Uma amostra aleatória de 40 empregados é tomada de uma linha de
produção de 500. A média de horas-extras trabalhadas por semana é
cinco horas com desvio-padrão de uma hora. Construa um intervalo de
99% de confiança para a média das horas extras trabalhadas para a
toda a linha de produção.
![Page 39: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/39.jpg)
3. Um fabricante de cintos de segurança deseja estimar a probabilidade
dos cintos resistirem a um esforço. Como o teste é destrutível , ele deseja
manter o tamanho da amostra o menor possível. Determine o número de
observações que devem ser feitas para estimar a probabilidade a menos
de 0,04 com 95% de confiança, se ele crê (baseando-se em experimentos
anteriores) que a percentagem de defeituosos não supere a 6%.
4. Especifique quais são e como influenciam as 3 variáveis que
determinam a margem de erro de um intervalo de confiança.
![Page 40: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/40.jpg)
5. Qual o tamanho da amostra necessária para estimar o tempo médio que
um vendedor de uma loja de móveis gasta com cada cliente, a menos de 2
minutos do verdadeiro valor, para obter um nível de confiança de 99% de
confiança? Suponha o desvio da população igual a 12 minutos. (obs.:
sempre arredondamos a resposta para o próximo número inteiro superior.)
6. A Polícia Rodoviária faz mensalmente uma pesquisa para avaliar a
velocidade desenvolvida nas rodovias durante o período de 2 às 4 horas
da madrugada. Num período de observação e em um trecho específico,
100 carros passaram por um aparelho de radar a uma velocidade média
de 115 Km/h, com desvio padrão de 10 Km/h.
a) Estime a verdadeira média (estimativa pontual) da população;
b) Construa um intervalo de 98% de confiança para a média da população.
![Page 41: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/41.jpg)
7. Uma amostra aleatória de 40 contas não-comerciais na filial de um
banco acusou saldo médio de R$140,00 com desvio-padrão de R$30,00.
a) Construa um intervalo de 95% confiança para a verdadeira média.
b) Construa um intervalo de 99% confiança para a verdadeira média.
c) A que conclusão podemos chegar com os resultados das letras
anteriores?
8. Um grupo de pesquisa de mercado constatou que 25% dos 200
fregueses recentemente entrevistados num grande shopping center de
Belo Horizonte residem a mais de 5 Km deste local.
a) Construa um intervalo de 95% de confiança para a percentagem efetiva
de fregueses que moram a mais de 5 km do Shopping Center;
b) Qual é o erro provável máximo associado ao intervalo?
![Page 42: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/42.jpg)
9. A Biblioteca da faculdade deseja estimar a percentagem de livros de
seu acervo que são publicados até 1995. Qual deve ser o tamanho da
amostra aleatória para se ter 90% de confiança de ficar menos de 5% da
verdadeira proporção?
10. Uma amostra aleatória de 40 homens trabalhando num grande projeto
de construção revelou que 6 homens não estavam usando capacetes
protetores. Construa um intervalo de 98% confiança dos que não estão
usando capacetes nesse projeto.
![Page 43: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/43.jpg)
INTERVALO DE TOLERÂNCIA
Limites de Tolerância são similares a Capabilidade de
Processo, isto é, eles mostram os limites práticos de
variabilidade do processo e portanto podem ser valiosas
informações na determinação dos limites de tolerância na
engenharia.
Existem dois tipos de determinação dos limites de tolerância:
-Os que assumem a distribuição Normal
-Os que não requerem qualquer distribuição.
Intervalo de Tolerância:
![Page 44: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/44.jpg)
Intervalo de Tolerância:
Método Distribuição Fórmula dos limites
Amostra de n elementos sabendo-se a média e o desvio padrão
Normal
Amostra de n elementos sabendo-se a média e o range
Normal
N amostras de n elementos cada uma e sabendo-se a média das médias e o range
Normal
Definida a proporção da população, e amostra de n observando o maior e o menor valores
Nenhuma A probabilidade é que ao menos P% da população estará entre os extremos amostrais
RKx 1
Ksx
RKx 2
![Page 45: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/45.jpg)
• Identificação de K, K1 e K2:
•Fazer uso das tabelas de “Fatores de Tolerância para
Distribuição Normal” (Juran, Apêndice II, Tabelas U, V e W)
Intervalo de Tolerância:
![Page 46: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/46.jpg)
INTERVALO DE TOLERÂNCIA
• Alguns valores de K (proporção populacional 95% e nível de
confiança 95%)n One Sided K Two Sided K
3 9.916 7.655
4 6.370 5.145
5 5.079 4.202
6 4.414 3.707
7 4.007 3.399
8 3.732 3.188
9 3.532 3.031
10 3.379 2.911
11 3.259 2.815
12 3.162 2.736
13 3.081 2.670
14 3.012 2.614
15 2.954 2.566
![Page 47: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/47.jpg)
INTERVALO DE CONFIANÇA PARA A VARIÂNCIA
• A variância amostral s2 é a melhor estimativa pontual da variância
populacional 2 (população normal).
• Embora s2 seja a melhor estimativa pontual de 2, não há indicação
de quão bom realmente seja. Para compensar esta deficiência,
estabelecemos uma estimativa intervalar mais “reveladora”:
•Lembrete: a distribuição Qui-Quadrado não é simétrica!!!!
2
22
2
2 )1()1(
ED
snsn
![Page 48: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/48.jpg)
INTERVALO DE CONFIANÇA PARA O DESVIO PADRÃO
• O intervalo de confiança para o desvio padrão é dado pela raiz
quadrada de cada componente do intervalo de confiança da variância.
2E
2
2D
2 s)1n(s)1n(
![Page 49: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/49.jpg)
Exemplo:
A variância amostral para um conjunto de 25
amostras foi calculado ser 36. Calcule o
intervalo de 90% de confiança para a variância
populacional.
Slide 49
38,6272,23
85,13
36)125(
42,36
36)125(
s)1n(s)1n(
2
2
2
22
2
2
1n,2/11n,2/
95,02/1
05,02/
25n
36s2
![Page 50: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/50.jpg)
Exercícios: Folha 1
Slide 50
![Page 51: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/51.jpg)
2ª Parte:
– Testes de hipóteses para a média e a proporção
Slide 51
![Page 52: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/52.jpg)
TESTE DE HIPÓTESE
Hipótese, em estatística, é uma afirmação sobre uma propriedade
(parâmetro) de uma população.
O objetivo da estimação é
estimar (calcular) algum
parâmetro populacional.
O objetivo do teste de hipótese
é decidir se determinada
afirmação sobre um parâmetro
populacional é verdadeira.
Inferência estatística
Inspeciona-se uma amostra de 142 peças de uma grande remessa,
encontrando-se 8% de peças defeituosas. O fornecedor garante que
não haverá mais de 6% de peças defeituosas em cada remessa. O
que devemos responder com o auxílio do teste de hipótese é se a
afirmação do fornecedor é verdadeira !
O problema:O problema:
Teste de Hipótese:
![Page 53: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/53.jpg)
Estabelecer a hipótese nula ( pressupõem-
se que não há diferença entre o que se
afirma e que realmente acontece).
Hipótese NulaoH Hipótese Alternativa 1H
É a afirmação que deve ser verdadeira
se a hipótese nula é falsa.
A forma simbólica de uma hipótese nula pode ser:
:
:
:
o
o
o
H
H
H Algum valor
Algum valor
Algum valor
A forma simbólica de uma hipótese alternativa pode ser:
:
:
:
1
1
1
H
H
H Algum valor
Algum valor
Algum valor
ESTABELECENDO HIPÓTESES:
![Page 54: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/54.jpg)
Se o leitor ou consumidor está fazendo a
pesquisa e deseja usar o teste de hipótese
para apoiar sua afirmação, então essa
afirmação deve ser formulada de maneira
que se torne a hipótese alternativa, não
podendo assim, conter a situação de
igualdade!
A Hipótese alternativaA Hipótese alternativa Hipótese de pesquisaHipótese de pesquisa
![Page 55: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/55.jpg)
3: oH
3:1 H
A Telemar afirma que pelo menos 88%
dos telefones públicos em Belo Horizonte
estão em bom estado.
88,0: pHo
Um fabricante de pneu alega que seus
pneus suportam 64 mil Km no mínimo.
000.64: oH
000.64:1 H
88,0:1 pH
O tempo médio para fazer um teste é
crítico para a gestão de custos de um
grande laboratório. Supõem-se que um
certo tipo de teste pode ser feito em três
minutos.
Hipóteses
EXEMPLOS DE HIPÓTESES NULAS E ALTERNATIVAS
![Page 56: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/56.jpg)
• O teste consiste em verificar se uma estatística amostral observada
pode razoavelmente provirrazoavelmente provir de uma população com um parâmetro
alegado;
X
0 Z
Estatísticas amostrais como esta são bastante prováveis se
Ho é verdadeira;
Estatísticas amostrais como esta são bastante improváveis se Ho é verdadeira;
CARACTERÍSTICAS DE UM TESTE DE HIPÓTESE:
![Page 57: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/57.jpg)
Inspeciona-se uma amostra de 142 peças de uma grande remessa,
encontrando-se 8% de peças defeituosas. O fornecedor garante que
não haverá mais de 6% de peças defeituosas em cada remessa. O
que devemos responder com o auxílio do teste de hipótese é se a
afirmação do fornecedor é verdadeira !
O problema:O problema:
n
qppEP
.)( 02,0
142
)94,0).(06,0()( pEP
%6: pHo
%6:1 pH
0,102,0
06,008,0
.
ˆ
nqp
ppZ
0,1587
f(x)
X0,08
0 1 Z
• A probabilidade de obter uma discrepância
superior a 8% com uma amostra de 142 de
uma população com 6% é de cerca de 16%;
ENTENDENDO A BASE DO TESTE DE HIPÓTESE:
![Page 58: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/58.jpg)
Assim podemos dizer:
Isto pode sugerir que a discrepância pode ser devida apenas ao acaso, mas não
podemos afirmar, em definitivo, que a população tenha realmente uma
percentagem de 6% de defeituosos. Em vista da distribuição amostral de tal
população e da estatística observada, podemos afirmar que a afirmativa parece
verdadeira.• Suponhamos agora que tivéssemos
encontrado uma proporção amostral,
digamos de 19%.
5,602,0
06,019,0ˆ
x
ppZ
f(x)
X
0 6,5Z
• A probabilidade é pequena. Assim, parece
pouco provável que tal estatística amostral
provenha de uma população com um
parâmetro com população alegada de 6%.
![Page 59: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/59.jpg)
Procedimentos para o teste de hipótese de uma e p:
1- Formular as hipóteses nula e alternativa colocando-as na forma simbólica;
Obs.:Das duas expressões, a hipótese nula (Ho) é a que contém a condição
de igualdade. A hipótese alternativa (H1) e a outra afirmação;
2- Escolher o nível de significância () com base na gravidade do erro tipo 1.
Tomar um valor de () pequeno se as consequências da rejeição de uma Ho
verdadeira são sérias. (valores comuns para : 0,05 e 0,01);
4- Determinar a estatística de teste. Incluir a estatística de teste no gráfico;
5- Rejeitar Ho se a estatística de teste esta na região crítica. Não rejeitar Ho se a
estatística de teste não está na região crítica;
6- Formule a decisão estatística em termos do problema original.
3- Determinar os valores críticos e a região crítica. Esboçar um gráfico e incluir os
valores críticos e a região crítica;
![Page 60: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/60.jpg)
Conceitos importante para o Teste de Hipótese:
• Estatística de teste = é uma estatística amostral da média ou da
proporção;
• Região Crítica = é o conjunto de todos os valores da estatística
de teste que levam à rejeição da hipótese nula;
• Valor Crítico = O valor crítico e o valor ou valores que separa(m)
a região crítica dos valores da estatística de teste que não levam a
rejeição da hipótese nula;
![Page 61: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/61.jpg)
Região Crítica e o nível de significância num teste bilateral
Não rejeitamos Ho
Rejeitamos HoRejeitamos Ho
Região Crítica Região Crítica
/2 /20
![Page 62: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/62.jpg)
Decidimos rejeitar a hipótese nula
Não rejeitamos a hipótese nula
A hipótese nula é verdadeira
A hipótese nula é falsa
Erro tipo I ()
Erro tipo II ()
Ok
Ok
Erros do tipo: I e II
O valor é verdadeiro na realidade
• A probabilidade de um erro tipo I acontecer é igual ao nível de significância () de
um teste de hipótese. Valores comuns predeterminados: (=0,05 e =0,01)
() nível de significância ou a
probabilidade do erro tipo I
() nível de significância ou a
probabilidade do erro tipo II
![Page 63: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/63.jpg)
Erro Tipo I: Risco do Produtor
• Teste Bilateral = quando a região crítica está situada nas duas regiões
extremas (caudas) sob a curva;/2/2
• Teste Unilateral a esquerda =
quando a região crítica está situada na
extrema esquerda sob a curva;
• Teste Unilateral a direita =
quando a região crítica está situada na
extrema direita sob a curva;
![Page 64: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/64.jpg)
Erro Tipo II: Risco do Consumidor
![Page 65: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/65.jpg)
Exemplo de um Teste de Hipótese Para Média
Um fabricante de pneu americano alega que seus pneus suportam
uma quilometragem de 40.000 milhas no mínimo. Suponhamos que
os resultados de um teste tenham sido: amostra n=49, média
amostral 38.000 milhas. Sabe-se que quilometragem de todos os
pneus tem desvio-padrão de 3.500 milhas. Realize o teste de
hipótese para testar a afirmação do fabricante.
000.40:1 H
000.40: oH500
49
500.3
nX
0,4500
000.40000.38
x
Xx
Z
Adotando: (=0,05) temos que Z = - 1,65
Portanto a Ho deve ser rejeitada se:
Z < Z0,05
Single Sample Test
![Page 66: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/66.jpg)
X
0-4,0 Z-1,65
1- O valor de Z = - 4,0 é menor que
-1,65 , o que rejeitaria a hipótese nula;
CONCLUSÕESCONCLUSÕES
2- A evidências suficientes para garantir
a rejeição da afirmação que a média é
maior ou igual à 40 mil Milhas
3- Poderemos, estar correndo um erro
tipo I. Não há maneiras de se estar
absolutamente certo se Ho é verdadeiro
ou não.
Qual a verdadeira média dos pneus?
- Uma forma de responder a
esta pergunta é usar os dados
amostrais para estimar a média
da quilometragem. Usando um
nível de confiança de 95%,
temos:
38.000+1,96.(500)
nX x.96,1
(38.000+980) milhas
![Page 67: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/67.jpg)
Exemplo para o teste de uma afirmação de uma proporção:
Um estudo sobre a eficácia do air-bag em automóveis, constatou
que, em 821 colisões com carros de tamanho médio equipados
com air-bag, 46 resultaram na hospitalização do motorista. Ao
nível de significância de 0,01, teste a afirmação de que a taxa de
hospitalização nos casos de air-bag é inferior à taxa de 7,8%.
078,0: pHo
078,0:1 pH
35,2
821)922,0).(078,0(
078,005603,0
.
ˆ
nqp
ppZ
922,0078,011 pq05603,0821
46ˆ p
078,0p
01,0
Implica num valor crítico de Z= -2,33
A estatística de teste está dentro da região crítica.
Rejeitamos Ho. Assim temos evidências suficientes para
afirmar que a taxa de hospitalização é inferior a 7,8%.
Portanto a Ho deve ser rejeitada se:
01,0ZZ
![Page 68: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/68.jpg)
Exemplo para o teste de uma afirmação de uma proporção:
Em um teste de gosto de consumidores, 100 bebedores regulares de
Pepsi recebem amostras cegas de Coca e Pepsi; 48 deles preferiram a
Coca-cola no teste. Se os diretores da Coca-cola afirmam que seu
refrigerante é preferido por 50% dos bebedores de Pepsi, teste esta
afirmação ao nível de significância de 0,05.
50,0: pHo
50,0:1 pH
40,0
100)5,0).(5,0(
5,048,0
.
ˆ
nqp
ppZ025,0
2
Implica num valor crítico de Z0,025=+1,96 Não há evidencia
suficiente para
rejeitar a afirmação
de que 50 % dos
bebedores de Pepsi
preferem coca
Conclusão
Portanto a Ho deve ser rejeitada se:
025,0ZZ 025,0ZZ ouZ=0
Dados amostrais indicamZ= - 0,4
p=0,5
-1,96 +1,96
48,0100
48ˆ p 5,05,01p1q 50,0p
![Page 69: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/69.jpg)
Pontos importantes e conclusões:
• Para o teste de hipótese da Média, o tamanho da amostra (n) sempre deve ser > que
30;
• Para o teste de hipótese da Média de pequenas amostras, a distribuição t de
student deve ser usada;
• Nos testes bilaterais, o nível de significância () é dividido igualmente entre as duas
caudas que constituem regiões críticas;
• Quando a hipótese alternativa (H1) é de algum valor, temos um teste bilaterais.
Quando H1 tem sinal (>) temos um teste unilateral a direita e quando H1 recebe sinal
(<) temos um teste unilateral a esquerda ;
• A interpretação do texto é bastante importante na realização dos experimentos de teste
de hipótese. Se mencionar igual trata-se de uma afirmação nula, se não mencionar,
a afirmação será a hipótese alternativa;
![Page 70: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/70.jpg)
Exercícios:
1. Um fabricante de fio de arame alega que seu produto tem uma resistência
média à ruptura superior a 10 Kg, com desvio padrão de 0,5 kg. O INMETRO
resolve testar essa afirmativa, extraindo uma amostra de 50 peças de arame, a
qual acusou resistência média de 10,4 kg. Que conclusão o INMETRO pode
chegar?
2. Uma rede de pizzaria compra as peças de salame utilizadas na produção de
pizzas de uma grande indústria produtora de alimentos derivados de carne. Pizzas
de boa qualidade exigem um teor médio de gordura nas peças de salame igual a
40%. Experiências anteriores com este fornecedor revelam que o teor médio de
gordura tem variabilidade igual a um d.p. de 2,0%. Um teste com 36 peças de
salame um teor médio de gordura de 41%. Faça o teste de hipótese adotando nível
de significância 0,05.
![Page 71: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/71.jpg)
3. O tempo médio necessário para paradas de manutenção de uma certa
máquina copiadora é igual a 93 minutos. Uma companhia alega que o seu novo
modelo foi projetado para ter uma manutenção mais fácil e consequentemente
mais rápida. Um teste com 73 máquinas de um novo modelo resultou num tempo
de reparo médio de 88,8 minutos. Sabendo-se que os arquivos de manutenção
registram um desvio-padrão de 26,6 minutos, utilize o nível de significância de
(=0,025) para testar a alegação da companhia.
4. Em uma certa indústria, cerca de 15% dos trabalhadores possuíam doenças
provocadas pela radiação. A companhia afirmou ao sindicato que faria a
medicação de seus trabalhadores e depois do tratamento cerca de 140
trabalhadores foram novamente avaliados. Constatou-se cerca de 19
trabalhadores com altos índices de radiação. Utilize (=0,025) para checar a
alegação da companhia de que o tratamento teve sucesso.
![Page 72: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/72.jpg)
5. Uma empresa fornece uma grande variedade de parafusos à montadora Fiat.
Um dos tipos de parafusos mais importantes utilizados na montagem dos
automóveis é o de comprimento igual à 3,5 polegadas. Para este tipo, o
fornecedor alega que um lote enviado contém parafusos com tamanho médio
igual à 3,5 polegadas e desvio-padrão de 0,01 polegada. Você é o diretor
responsável pelo controle de qualidade de peças de terceiros da FIAT e determina
aos seus estagiários que tirem uma amostra aleatória de 40 parafusos para
verificar o comprimento. O resultado encontrado no teste foi uma média de 3,49
polegadas. Utilize um nível de significância igual (=0,05).
6. Um engenheiro de produção recém contratado pela “Cera Inglesa” deseja
estimar a percentagem do estoque de todos os tipos de produtos que chegaram
na central de distribuição de Belo Horizonte no início do ano passado e que ainda
não foi distribuída. Qual deve ser o tamanho da amostra aleatória a ser tomada
para se ter 99% de confiança de ficar menos de 3% da verdadeira proporção?
![Page 73: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/73.jpg)
7. Uma amostra aleatória com 69 compradores de novos veículos GOLF mostrou
que a quilometragem média percorrida durante o primeiro ano de utilização do
veículo foi de 7.500 km com desvio-padrão de 1150 km.
A) Construa um intervalo de 90% confiança para a verdadeira quilometragem
média.
B) Construa um intervalo de 99% confiança para a verdadeira quilometragem
média.
C) A que conclusão podemos chegar com os resultados das letras anteriores?
8. O tempo médio, por operário para executar uma tarefa tem sido igual a 100
minutos, com um desvio padrão de 15 minutos. Introduziu-se uma modificação para
diminuir esse tempo, e, após certo período, sorteou-se uma amostra de 36
operários, medindo-se o tempo de execução de cada um. O tempo médio da
amostra foi de 85 minutos. Estes resultados trazem evidências estatísticas da
melhora desejada?
![Page 74: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/74.jpg)
Exemplos: soluções
Slide 74
![Page 75: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/75.jpg)
3ª Parte:
– Testes de hipóteses para 2 médias / proporções
– Testes de hipóteses para a variância e Testes de aderência e independência
Slide 75
![Page 76: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/76.jpg)
Exemplos de Comparações
Técnicos de uma indústria que opera com duas linhas de produção desejam avaliar a similaridade de produção das linhas a fim de identificar possíveis pontos de melhoria em uma delas;
A área de marketing de uma empresa prestadora de serviços deseja fazer uma nova peça publicitária comparando o serviço prestado ao das concorrentes.
Teste de Hipótese sobre 2 Médias Amostrais:
Two Sample Test
![Page 77: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/77.jpg)
Tipos de Amostras
Independentes
se a amostra extraída de uma das populações não tem qualquer relação com a amostra extraída da outra população; como por exemplo o peso de Homens e de Mulheres.
H1 M1H2 M2H3 M3
Dependentes ou Emparelhadas
quando uma amostra possui alguma relação com a outra; como por exemplo o peso do indivíduo antes e após um tratamento para emagrecimento.
H1a H1dH2a H2d
H3a H3d
![Page 78: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/78.jpg)
Comparação de Duas MédiasDados Emparelhados
Dez cobaias (porcos) foram submetidas a um tratamento com um novo tipo de ração, por um mês. Deseja-se saber se a nova ração foi efetiva para o aumento de peso dos animais.
Trata-se de dados emparelhados, pois o que se pretende medir é o peso atual – peso anterior de um mesmo indivíduo da população
![Page 79: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/79.jpg)
depois - antes =
H0: 0
H1: < 0
O teste a ser usado será “t de Student”:
t = d. -
sd/nPorque ?
A distribuição t-Student assemelha-se a distribuição normal em relação à forma, sendo menos alta na região próxima a média e mais alta nas extremidades, sendo aplicável para n < 30. A medida que n sobe t tende para z.
![Page 80: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/80.jpg)
Comparação de Duas MédiasDados Emparelhados
H0: 0
H1: < 0
d. = 4.3
Sd = 4.9
tcalc= (d.- ) / (Sd/ n)
tcalc= (4.3- 0) / (4.9/ 10)
tcalc= 2.77
Considerando = 0,05 e t(n-1) tem-se
tcrítico = -1.833
Sendo tcalc > tcrítico, não há evidência para rejeitar H0
Antes Após Diferença300 315 15310 312 2315 320 5320 320 0310 313 3312 315 3325 330 5310 307 -3315 319 4311 320 9
Média 312,8 317,1 4,3D.P. 6,7 6,2 4,9
![Page 81: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/81.jpg)
Escolha dos Testes
Comparação de2 médias
Dados Emparelhados
H0: = 0H1: 0
Calcula-set de Student
Não
Desconhecidos 1 = 2
Conhecidos 1 = 2
Z = (X1-X2) (1/n1+1/n2)
2
)1()1( 22
212
nm
smsns
mns
YX
11.2
Calcula-set como sendo...
Calcula-se t de StudentUsando Aspin-Welch
Sim
Desconhecidos 1 2
![Page 82: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/82.jpg)
Comparação de Duas MédiasDados Não Emparelhados
Dois diferentes métodos de execução de uma tarefa foram testados, resultando nos dados abaixo, expressos em minutos. Deseja-se saber se o método 2 é mais rápido que o método 1.
Trata-se de dados não emparelhados, e é razoável supor que as variâncias sejam iguais.
![Page 83: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/83.jpg)
Comparação de Duas MédiasDados Não Emparelhados
H0: 1 = 2
H1: 1 > 2
X1 = 55, S1 = 2,7 e n1 = 5
Y2 = 53, S2 = 2,2 e m2 = 5
S = 2.5
tcalc = 1.26
Considerando = 0,05 e t(n1+m2-2);0,05
tem-se tcrítico = 1.86
Sendo tcalc < tcrítico, não há evidência para rejeitar H0
Método 1 Método 254 5055 5458 5651 5257 53
Média 55 53D.P. 2,7 2,2
2
)1()1( 22
212
nm
smsns
m1
n1
.s
YXt
2
calc
![Page 84: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/84.jpg)
Escolha de t crítico = f(H1)
• A região crítica para um teste
com nível de significância (),
depende da hipótese
alternativa;
mns
YXTo
11.2
211 : H 2;0 mntT
211 : H 2;0 mntT
211 : H2;2/0 mntT
Hipótese alternativa Região Crítica
2;2/0 mntT
![Page 85: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/85.jpg)
Características do teste de comparação para proporções:
Proporção populacional
Tamanho da amostra
Número de sucessos na amostraproporção amostral
Para a população 1Para a população 1
1p
1n
1x
1
11ˆ
n
xp
Proporção populacional
Tamanho da amostra
número de sucessos na amostraproporção amostral
Para a população 2Para a população 2
2p
2n
2x
2
22ˆ
n
xp
• Têm-se dois conjuntos de dados amostrais independentes
escolhidos de maneira aleatória;
• Em ambas as amostras verificam-se as condições de:
(Condição para uso da Distribuição Normal) 5ˆ.
5ˆ.
qn
pn
Teste de hipótese s/ 2 proporções amostrais:
![Page 86: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/86.jpg)
Características do teste de comparação para proporções:
• O teste de hipótese feito para duas proporções populacionais
utiliza a seguinte estimativa combinada do valor comum a p1 e p2 :
21
21
nn
xxp
pq 1Para pPara p1 =1 = p p2 2 têm-se a seguinte têm-se a seguinte
estimativa combinadaestimativa combinada
• A estatística de teste para duas proporções será igual :
21
21
..
ˆˆ
nqp
nqp
ppZo
![Page 87: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/87.jpg)
“Exemplo da aplicação do teste de hipótese para comparação de duas proporções”
Uma empresa nacional de linha branca deseja comparar o
desempenho dos motores fabricados pelo seu fornecedor (1) com o
desempenho dos motores vendidos por um outro fornecedor (2) ao seu
concorrente. A variável escolhida para a realização da comparação foi a
proporção de motores que funcionam sem a necessidade de reparos por
um período de um mês, quando submetidos a condições específicas de
“stress”. No estudo foram tomados 100 motores de cada fornecedor,
sendo encontrados: X1=66 e X2=73 motores que funcionaram sem a
necessidade de reparos. A equipe da empresa realizará o teste de
hipótese adotando o nível de significância = 0,05.
![Page 88: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/88.jpg)
1- Estabelecer as Hipóteses nula e alternativa:
21: ppHo
211 : ppH
A empresa quer comparar o desempenho dos motores dos dois fornecedores;
Os parâmetros de interesse são as proporções de motores dos
fornecedores: p1 e p2 que funcionam sem a necessidade de reparo
2- Determinação do nível de significância e da região crítica:
A partir da tabela de distribuição normal padronizada
96,1025,0
2
ZZZcrítico
Portanto, a Ho deve ser rejeitada se Zteste >1,96
ou Zteste <-1,96
![Page 89: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/89.jpg)
3- Verificação se o teste baseado em Z é válido (pré requisito):
4- Determinação da estimativa combinada de p1 e p2:
Amostra 15ˆ.
5ˆ.
qn
pn
5100
34.100
5100
66.100
Amostra 25ˆ.
5ˆ.
qn
pn
5100
27.100
5100
73.100
Okkk !!!Okkk !!!
695,0100100
7366
21
21
nn
xxp
305,0695,011 pq
![Page 90: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/90.jpg)
5- Determinação da estatística de teste apropriada:
08,1
100)305,0).(695,0(
100)305,0).(695,0(
10073
10066
..
ˆˆ
21
21
nqp
nqp
ppZ teste
6- Decidir se a hipótese nula deve ser rejeitada ou não:
Como Zteste = -1,08 não está na região crítica, não há
evidência para rejeitar a hipótese nula ao nível de
significância de 5%.
Não há evidências para concluir que o desempenho
dos motores produzidos pelo fornecedor 1 é diferente
do desempenho do motor produzido pelo fornecedor 2.
![Page 91: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/91.jpg)
Os Engenheiros de Produto da Cervejaria Schincariol querem realizar um
teste para avaliar se os consumidores da Nova Schin do interior de Minas
Gerais e de Belo Horizonte, diferem ou não na proporção de aprovação
da nova cerveja. Para isto, tomou-se uma amostra aleatória de 50
consumidores na capital e 50 consumidores no interior do estado. Na
capital, 18 aprovaram a nova cerveja e no interior apenas 25 aprovaram.
Realize o teste ao nível de 0,01 de significância.
1- Estabelecer as Hipóteses nula e alternativa:
21: ppHo
211 : ppH
A empresa quer comparar se existe diferença na proporção de aprovação da nova cerveja.
TESTE DE HIPÓTESE PARA DUAS PROPORÇÕES
![Page 92: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/92.jpg)
2- Determinação do nível de significância e da região crítica:
A partir da tabela de distribuição normal padronizada
58,2005,0
2
ZZZcrítico
Portanto, a Ho deve ser rejeitada se Zteste >+2,58 ou Zteste<-2,58.
3- Verificação se o teste baseado em Z é válido (pré requisito):
Amostra 15ˆ.
5ˆ.
qn
pn
550
32.50
550
18.50
Amostra 25ˆ.
5ˆ.
qn
pn
550
25.50
550
25.50
Okkk !!!Okkk !!!
![Page 93: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/93.jpg)
4- Determinação da estimativa combinada de p1 e p2:
43,05050
2518
21
21
nn
xxp
57,043,011 pq
5- Determinação da estatística de teste apropriada:
41,1
50)57,0).(43,0(
50)57,0).(43,0(
5025
5018
..
ˆˆ
21
21
nqp
nqp
ppZ teste
![Page 94: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/94.jpg)
6- Decidir se a hipótese nula deve ser rejeitada ou não:
Como Zteste = -1,41 não está na região crítica, não há
evidência para rejeitar a hipótese nula ao nível de
significância de 1%.
Não há evidências para concluir que haja diferença na
proporção dos consumidores que aprovam a Nova
Schin na capital e no interior.
![Page 95: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/95.jpg)
Testes de Hipóteses para a variância amostral
• Estatística de teste:
• Lembrete: A distribuição Qui-Quadrado não é simétrica!!!!
2
22 )1(
sn
Graus de liberdade = n-1
Suposição:
• População distribuída normalmente
Testes de hipóteses para a variância :
![Page 96: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/96.jpg)
Exemplo:
• O departamento de desenvolvimento de aço da R&D tentou
desenvolver uma nova liga de aço com menor variabilidade da
tensão elástica. O departamento da R&D declara que o novo material
terá uma variação de tensão dentro de 4 Sigmas menor ou igual a 60
psi 95% das vezes. Uma amostra de 8 elementos foi testada e
rendeu um desvio padrão de 8 psi. Pode uma redução na variação
da tensão elástica ser validada com 95% de confiança?
Testes de hipóteses para a variância :
![Page 97: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/97.jpg)
20
200
20
200
:H
:H
O melhor range de variação esperado é 60 psi. Isto nos leva a ter
um sigma de 15 psi (uma aproximação de 4 sigma de largura
acobertado por 95,44% das ocorrências).
A hipótese nula é:
A hipótese alternativa:
A hipótese nula é:
A hipótese alternativa:
Testes de hipóteses para a variância :
2200
2200
15:H
15:H
![Page 98: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/98.jpg)
99,115
8)18(s)1n(X
2
2
20
2x2
Da tabela de Qui-quadrado: porque a hipótese alternativa é “<“
este é um teste unilateral. Usando gl = n-1 = 7, o valor crítico
para qui-quadrado com 95% de confiança é 2,17.
A estatística de teste calculada é:
Testes de hipóteses para a variância :
Uma vez que 1,99 é menor que 2,17, ela cai na região crítica e a
hipótese nula deve ser rejeitada.
Existe evidência suficiente para rejeitarmos a Hipótese nula.
A declaração do departamento da R&D foi suportada.
![Page 99: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/99.jpg)
Comparação de duas variâncias amostrais
• Estatística de teste:
• Lembrete: A distribuição F não é simétrica!!!!
22
21
s
sF
Graus de liberdade do numerador = n1-1
Suposições:
• Populações independentes;
•:Ambas distribuídas normalmente
Graus de liberdade do denominador = n2-1
![Page 100: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/100.jpg)
Exemplo:
Um laboratório de materiais está estudando o efeito de
envelhecimento de um determinado produto. Eles querem saber se
existe melhoria na consistência de concentração após o
envelhecimento por um ano (assuma um nível de confiança de 95%).
Os dados obtidos são listados abaixo:
No Início 1 ano depois
Numero de testes 9 7
Desvio Padrão (psi) 900 300
![Page 101: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/101.jpg)
Hipótese Nula:
Hipótese Alternativa:
6v
8v
:H
:H
2
1
22
211
22
210
A hipótese alternativa é relativa à melhoria na variação, portanto
temos um teste unilateral. A partir da distribuição F, ovalor
crítico de F é 4,15.
A região de rejeição da hipótese nula é maior ou igual a 4,15.
![Page 102: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/102.jpg)
9300
900
s
sF
2
2
22
21
Fazendo o cálculo da estatística de teste:
Uma vez que o valor calculado de F está na região crítica, a
hipótese nula deve ser rejeitada.
Existe evidência suficiente para indicar a redução da variância e
aumento da consistência da concentração após o
envelhecimento por um ano.
![Page 103: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/103.jpg)
TESTE DE ADERÊNCIA
• No teste de aderência, a hipótese testada refere-se à forma da
distribuição da população.
• Este teste baseia-se na estatística:
2
2 2
11
( )O E
E
O
Eni i
i
i
ii
k
i
k
onde:2
a estatística do teste, com graus de liberdade;Oi a frequência observada de uma determinada classe;Ei a frequência esperada desta classe, segundo o modelo testado = nipi;n o número de elementos da amostra;k número de classes ou valores considerados;pi probabilidade de se obter um valor da variável na classe esperada, segundo o modelo.
Testes de Ajuste – Goodness of Fit:
![Page 104: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/104.jpg)
•Passos para conduzir um teste de aderência:
1- Formule as hipóteses nula e a alternativa.
2- Se o parâmetro da distribuição dada nas hipóteses nula e
alternativa não for conhecido, então deve ser calculado.
3- Calcular a freqüência esperada para cada uma das categorias “k”
como a distribuição hipotética fosse a distribuição verdadeira.
4- Calcular a estatística de teste.
5- Rejeite H0 se o valor calculado for maior que o valor tabelado (ou
seja, não adere ao modelo).
= k-1-m, onde “m” é o número de parâmetros do modelo estimados
independentemente a partir da amostra.
; ; ;calc2 2
![Page 105: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/105.jpg)
• Exemplo:
É um dado de jogar honesto e balanceado, fornecidos o número de
vezes que cada um dos lados saiu?
Um dado foi jogado 48 vezes com os seguintes resultados:
Face Número Saídas Face Número Saídas
1 12 2 7
3 2 4 7
5 12 6 8
Quando o dado é jogado, a expectativa é que cada um dos lados
deveria sair um número igual de vezes.
É óbvio que existirão saídas aleatórias desta expectativa teórica uma
vez que o dado seja honesto.
![Page 106: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/106.jpg)
H0: as saídas do dado seguem uma distribuição uniforme
H1: as saídas do dados não seguem uma distribuição uniforme.
Faces fe f0 (fe – f0)2 / fe
1 8 12 2,000
2 8 7 0,125
3 8 2 4,500
4 8 7 0,125
5 8 12 2,000
6 8 8 0,000
Total 48 48 8,750
k
1i e
2e02 750,8
f
)ff(
![Page 107: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/107.jpg)
O valor do qui-quadrao calculado é 8,75. O valor de qui-
quadrado crítico é 11,07.
O qui-quadrado calculado não excede o qui-quadrado crítico.
Portanto, a hipótese de um dado honesto seguindo uma
distribuição uniforme não pode ser rejeitada.
As saídas aleatórias a partir de uma expectativa teórica
podem tranquilamente ser explicadas pela causa comum.
![Page 108: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/108.jpg)
TESTE DE INDEPENDÊNCIA
• Os testes de independência são realizados através de Tabelas de
Contingência.
• Tabela de contingência é a representação tabular das freqüências
observadas.
Exemplo: 100 pessoas foram entrevistadas sobre um projetode lei; o resultado é colocado em forma de uma tabela decontingência:
OpiniãoSexo Favorável Desfavorável Indiferente Totais
Homens 33 12 15 60Mulheres 7 20 13 40
Totais 40 32 28 100
![Page 109: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/109.jpg)
TESTE DE INDEPENDÊNCIA
• O teste de independência:H0: as variáveis são independentes;H1: as variáveis não são independentes.
O teste será feito usando 2, semelhante ao teste de aderência.
2 = a estatística do teste, com graus de liberdade;
r = número de linhas;s = número de colunas;Oij = frequência observada na interseção da linha i com a coluna j;Eij = frequência esperada na interseção da linha i com a coluna j;n = número de elementos da amostra.
2
2
11
( )O E
Eij ij
ijj
s
i
r
![Page 110: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/110.jpg)
TESTE DE INDEPENDÊNCIA
• Rejeita-se H0 se 2calc > 2
crít.
= (L-1).(c-1)
•“macete” para cálculo do : na tabela anterior, risque uma
linha e uma coluna, conte o que sobrou
![Page 111: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/111.jpg)
– Exercícios: Folha 2
Slide 111
![Page 112: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/112.jpg)
4ª Parte:
– Regressão Linear Simples
Slide 112
![Page 113: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/113.jpg)
CORRELAÇÃO ENTRE DUAS VARIÁVEIS
Problema: O diretor de vendas de varejo nacional
necessita analisar se há relação entre o investimento em
propaganda e as vendas da empresa. O departamento de
vendas preparou uma tabela com as vendas (em milhões)
e os investimentos em propaganda (em milhões) dos
últimos dez anos.
480400270195210470490520335430Vendas
2535178203742352130Propagandas
Objetivo: analisar a possibilidade de definir um modelo que represente a
relação entre as duas variáveis.
$
Correlação e regressão linear entre 2 variáveis :
![Page 114: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/114.jpg)
EXEMPLOS DE CORRELAÇÃO ENTRE DUAS VARIÁVEIS
• A temperatura na cidade pode influenciar as taxas de criminalidade?
• Correlação entre a quantidade de acidentes de trabalho numa
construtora e o tempo de experiência do trabalhador!
• A Correlação entre a tensão na rede elétrica (volts) e a variação no
corte (mm);
• A correlação entre o nº. de horas de treinamento em ferramentas da
qualidade e o nº. de peças defeituosas produzidas por um trabalhador;
![Page 115: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/115.jpg)
A correlação é uma técnica estatística que tem por objetivo investigar
se há ou não correlação linear entre duas ou mais variáveis;
Existe correlação entre duas variáveis quando uma delas está, de
alguma forma, relacionada com a outra;
Os dados analisados num teste de correlação são emparelhados e
aleatórios;
Para estudar o comportamento conjunto de duas variáveis X e Y,
serão apresentadas duas técnicas: o Diagrama de Dispersão e o
Coeficiente de Correlação de Pearson.
CORRELAÇÃO:
![Page 116: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/116.jpg)
Consiste de um método gráfico que ajuda a avaliar se existe ou não
alguma associação (relação) entre as variáveis em estudo, mas não nos
fornece o valor numérico dessa relação.
OBJETIVO: Alguma correlação ou relação entre duas variáveis
significa: “qual alteração devemos esperar em uma das variáveis, como
consequência de alterações sofridas pela outra variável”;.
y
x
...... .
Não há correlação entre x e y
. .. .
.
..
. ..y
x
..Correlação não linear entre x e y
........
..... . ..... .
DIAGRAMA DE DISPERSÃO
![Page 117: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/117.jpg)
INTERPRETAÇÃO DO DIAGRAMA DE DISPERSÃO:
y
x
... ......
.....
.
Correlação positiva entre x e y
y
x
... ......
........ . . .
.
.
Forte Correlação positiva entre x e y
y
xCorrelação positiva perfeita entre x e y
. ........
...
.
![Page 118: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/118.jpg)
y
x
..
Correlação negativa entre x e y
. .. .. .. ...
y
x
..
Forte Correlação negativa entre x e y
.. .. ... . ...
..
.
y
xCorrelação negativa perfeita entre x e y
.. .......
.
...
.
INTERPRETAÇÃO DO DIAGRAMA DE DISPERSÃO:
![Page 119: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/119.jpg)
Diagrama de Dispersão:
Gráfico 1- Diagrama de dispersão das notas de Estatística versus
Matemática
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Notas de Matemática
No
tas d
e E
sta
tísti
ca
Pode-se notar que as variáveis
Notas em Estatística e Notas
em Matemática estão
correlacionadas positivamente,
isto é, à medida que aumenta-
se a nota em Matemática,
aumenta-se também a nota em
Estatística.
36593291067Estatística (Y)
26784310956Matemática (X)
Exemplo 1: Suponha que dez alunos foram submetidos a um teste de
Estatística e de Matemática, obtendo-se as seguintes notas :
![Page 120: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/120.jpg)
EXEMPLO DE DIAGRAMA DE DISPERSÃO
Exemplo 2: A tabela seguinte fornece o Peso (Kg) de alunos e a
respectiva Altura alcançada no teste de salto em altura (Cm).
515248545550Altura (Y)
494751464550Peso (X)
O gráfico indica que as
variáveis Peso e Altura obtida
no teste de salto em altura
encontram-se correlacionadas
negativamente, isto é, à
medida que o peso aumenta, o
valor obtido para o teste de
salto em altura diminui.
Gráfico 2- Diagrama de dispersão do peso versus resultado do teste de salto
em altura
47484950515253545556
44 46 48 50 52
Peso (Kg)
Alt
ura
(C
m)
![Page 121: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/121.jpg)
Observações importantes e conclusões sobre diagramas:
As conclusões tiradas de diagramas de dispersão tendem a ser
subjetivas, o cálculo do coeficiente de correlação linear pode propiciar
uma melhor avaliação do tipo de relacionamento;
OUTLIER - observação extrema, que não é condizente com o
restante da massa de dados. Pode ser fruto de um registro incorreto.
Deve ser analisado detalhadamente e eliminado do conjunto;
A existência de uma correlação entre as variáveis consideradas não
implica necessariamente na existência de uma relação de causa-efeito
entre X e Y;
Construindo diagramas de dispersão no software Excel;
![Page 122: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/122.jpg)
O coeficiente de correlação linear r mede o grau (intensidade)
da relacionamento (linear) entre as variáveis X e Y em uma
amostra;
Cálculo do coeficiente de correlação:
2222 )()()()(
))((
yynxxn
yxxynr
número de pares de dados analisados
soma de todos os valores de x e soma de todos os valores de y
elevar cada valor de x ao quadrado e somar os resultados
somamos os valores de x e elevamos o resultado ao quadrado;
multiplicamos cada valor x pelo valor correspondente de y e somamos
os produtos
xy
x
x
yx
n
2
2
,
COEFICIENTE DE CORRELAÇÃO
![Page 123: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/123.jpg)
O valor de r está sempre entre –1 e 1;
r mede a intensidade, ou o grau de um relacionamento linear. Não
serve para medir a intensidade de um relacionamento não linear.
Se o valor de r estiver próximo de 0, concluímos que não há
correlação linear significativa entre x e y.
Se o valor de r estiver próximo de +1 ou –1, concluímos que há
correlação linear.
PROPRIEDADES DO COEFICIENTE DE CORRELAÇÃO
![Page 124: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/124.jpg)
Os pesquisadores tem estudado os ursos,
anestesiando-os a fim de obterem medidas
vitais como idade, peso, comprimento e etc.
Como os usos são bastante pesados e difíceis
de serem levantados, os pesquisadores tem
dificuldade em pesar o urso na selva. Será
que é possível medirmos o peso de um urso a
partir do outras medidas mais fáceis?
53 67,5 72 72 73,5 68,5 73 3780 344 416 348 262 360 332 34peso (lbs)
Comprimento (in)Comprimento e pesos de ursos
![Page 125: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/125.jpg)
Resolução:
2222 )()()()(
))((
yynxxn
yxxynr
número de pares de dados analisados
soma de todos os valores de x e soma de todos os valores de y
elevar cada valor de x ao quadrado e somar os resultados
somamos os valores de x e elevamos o resultado ao quadrado;
multiplicamos cada valor x pelo valor correspondente de y e somamos
os produtos
xy
x
x
yx
n
2
2
,
22 )176.2()520.728(8)5,516()75,525.34(8
)2176).(5,516()879.151(8
r
897,0184.093.175,9433
128.91r
![Page 126: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/126.jpg)
Interpretação do coeficiente de correlação linear:
Se o valor de r estiver próximo
de 0, concluímos que não há
correlação linear significativa entre
x e y.
obs.: o valor de r deve estar sempre entre –1 e +1, inclusive.
Se o valor de r estiver
próximo de +1 ou –1,
concluímos que há correlação
linear.
Como r=0,897 (e está próximo de 1), dizemos que
existe correlação entre a altura do urso e o seu peso!
![Page 127: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/127.jpg)
Interpretação do coeficiente de correlação linear:
Com os dados abaixo sobre crimes violentos e a temperatura média
entre 21 e 2 horas das noites de sábado de uma comunidade, avalie se
há correlação entre as variáveis.
Crimes violentos/1000 residentes
52,24,15,42,83
3,62,52
Temperatura ºC
221819242320212017
![Page 128: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/128.jpg)
Regressão linear Simples
Proposição: A análise de regressão é uma técnica estatística que
tem por objetivo investigar e modelar o relacionamento entre duas
variáveis (regressão simples) ou mais variáveis (regressão
múltipla).
Iniciaremos estudando a relação entre duas variáveis (regressão
simples).
Objetivo: Descrever, utilizando dados amostrais, a relação entre
duas variáveis, quando verificamos que existe correlação linear
significativa entre elas:
• traçando seu gráfico e,
determinando a equação da reta que representa aquela
relação (reta de regressão).
![Page 129: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/129.jpg)
Método dos Mínimos Quadrados
Definição: Dada uma coleção de dados amostrais emparelhados
(duas variáveis), a reta de regressão tem sua equação de
regressão dada por:
Esta definição expressa uma relação entre x (variável
independente ou preditora) e (variável dependente ou resposta).
baxy ˆ
yyy
A partir dos dados amostrais, não podemos achar os parâmetros
populacionais, mas estimá-los como a e b:
e 22
xxn
yxxyna
n
xayb
![Page 130: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/130.jpg)
Exemplo 1: O diretor de vendas de uma rede de varejo nacional precisa
analisar a relação entre o investimento em propaganda e as vendas da
empresa. Os dados estão na tabela abaixo:
Variável explicativa(x) : Investimento em propagandas;Variável resposta (y) : Vendas da empresa.
Propagandas (X) 30 21 35 42 37 20 8 17 35 25
Vendas (Y) 430 335 520 490 470 210 195 270 400 480
Regressão Linear Simples
![Page 131: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/131.jpg)
Na resolução de problemas de regressão o primeiro passo é traçar o diagrama de dispersão
correspondente.
Diagrama de Dispersão
0
100
200
300
400
500
600
0 10 20 30 40 50
Investimento em Propagandas
Ve
nd
as
da
Em
pre
sa
Regressão Linear Simples
![Page 132: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/132.jpg)
O objetivo da regressão linear é colocar no diagrama de dispersão uma
linha que melhor se ajuste ou que melhor represente a relação entre as
duas variáveis.
Diagrama de Dispersão
0
100
200
300
400
500
600
0 10 20 30 40 50
Investimento em Propagandas
Ve
nd
as
da
Em
pre
sa
Regressão Linear Simples
![Page 133: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/133.jpg)
Interpretação dos Parâmetros do Modelo de Regressão
• Obtida uma reta de regressão, o primeiro passo na sua interpretação é verificar o sinal de a. Se for positivo, indica que, quanto maior o valor de x, maior o valor de y; se for negativo, indica que quanto maior o valor de x, menor o valor de y.
• a é a inclinação da reta de regressão. Ele indica a mudança na média de y para cada aumento de uma unidade em x.
• b é o intercepto do modelo. Se o domínio do modelo inclui x=0, b fornece a média de y quando x=0. Caso contrário, b não possui interpretação.
• A reta de regressão para o Exemplo 1 é:
• a = 9,74 indica que para cada aumento de uma unidade no investimento em propagandas há um aumento de 9,74 unidades na média de vendas da empresa.
xy 74,907,117
![Page 134: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/134.jpg)
Exemplo 2: Abaixo estão mostrados os comprimentos e os pesos de
oito ursos cinzentos:
Comprimento x (in.) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0 Peso y (lb) 80 344 416 348 262 360 332 34
Com base nestes dados, parece haver alguma relação entre o
comprimento de um urso e o seu peso? Em caso afirmativo, qual
é esta relação?
Regressão Linear Simples
![Page 135: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/135.jpg)
Com os dados da tabela anterior, determine a equação de
regressão da reta que relaciona comprimentos e pesos dos ursos
dessa espécie.x y x . y x2 y2
53,0 80 4.240 2809,00 6.40067,5 344 23.220 4556,25 118.33672,0 416 29.952 5184,00 173.05672,0 348 25.056 5184,00 121.10473,5 262 19.257 5402,25 68.64468,5 306 24.660 4692,25 129.60073,0 332 24.236 5329,00 110.22437,0 34 1.258 1369,00 1.156
Total 516,5 2176 151.879 34.525,75 728.520
x y xy 2x 2y
Regressão Linear Simples
![Page 136: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/136.jpg)
Regressão Linear
Definições:
Desvio total: distância vertical yy
Desvio explicado: distância vertical yy ˆ
Desvio não-explicado: distância vertical , também chamado de resíduoyy ˆ
y = valor observado
y = média dos valores observados
y = valor predito pela equação de regressão
Regressão Linear Simples:
![Page 137: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/137.jpg)
140
220
300
380
460
540
0 9 18 27 36 45
Investimento
Ve
nd
as
a: Desvio Total: Valor Real – Média
a
c
c: Desvio Não Explicado: Valor Real – PreditoChamado RESÍDUO ou ERRO.
b
b: Desvio Explicado: Valor Predito – Média
![Page 138: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/138.jpg)
Regressão Linear
Definições:Variação total: soma dos quadrados dos desvios totais
2)( yy Variação explicada: soma dos quadrados dos desvios explicados
2)ˆ( yy
2)ˆ( yy
Variação não-explicada: soma dos quadrados dos desvios não-explicados
![Page 139: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/139.jpg)
Relações entre os desvios
(desvio total) = (desvio explicado) + (desvio não-explicado)
yy = yy ˆ + yy ˆ
(variação total) = (variação explicada) + (variação não-explicada)
De maneira análoga:
2)( yy = 2)ˆ( yy +2)ˆ( yy
![Page 140: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/140.jpg)
Definição: Valor da variação de y que é explicado pela reta de regressão.
Coeficiente de Determinação
totalvariação
explicada variação2 r
2
22
)(
)ˆ(
yy
yyr
Obs. Podemos calcular r2 tanto pela definição acima, como simplesmente elevando ao quadrado o coeficiente de correlação linear r
r2 sempre assumirá valores entre 0 e 1
ou
![Page 141: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/141.jpg)
Exemplo:
Coeficiente de Determinação
Diagrama de dispersão: média no 2o grau e índice na universidade - reta ajustada
80 82 84 86 88 90 92 94 96 98 1000.90
1.22
1.54
1.86
2.18
2.50
2.82
3.14
3.46
3.78
4.10
Y = -13.520 + (.180 * X)
Médias dos estudantes no 2o grau
Índ
ice
do
s e
stu
da
nte
s n
a u
niv
ers
ida
de
r2 = 0,92 = 0,81 Ou seja 81% da variação pode ser explicada pela reta
![Page 142: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/142.jpg)
Erro padrão da estimativa
É uma medida das diferenças entre os valores observados e os valores preditos obtidos através da reta de regressão
2
)ˆ( 2
n
yyse 2
2
n
xyaybyse
ou
Intervalo de predição para um y individual
Dado um valor fixo x0, o intervalo de predição para um determinado y é:
EyyEy ˆˆ
22
20
2 )((
)(11
xxn
xxn
nstE e
![Page 143: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/143.jpg)
Análise de Resíduos
Os resíduos são as diferenças entre os valores observados da variável dependente e os valores preditos da variável dependente, através do modelo de regressão, para um determinado valor da variável independente. Para tornar a análise mais confiável, sem que as grandezas dos resíduos venham a prejudicá-la recomenda-se padronizar os resíduos: calcula-se o desvio padrão dos resíduos e divide-se cada um deles pelo desvio padrão.Para fazer a análise de resíduos precisamos construir pelo menos dois diagramas de dispersão:- um que relacione os resíduos padronizados com os próprios valores preditos da variável independente;- outro que relacione os resíduos padronizados com os valores da variável independente
![Page 144: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/144.jpg)
Análise de Resíduos
Se o modelo de regressão é adequado os resíduos padronizados não podem apresentar quaisquer padrões, eles devem distribuir-se de forma aleatória nos dois diagramas, atendendo os seguintes critérios:- a quantidade de resíduos padronizados positivos deve ser aproximadamente igual à quantidade de negativos.- a grandeza dos resíduos padronizados positivos deve ser aproximadamente igual a dos negativos, para todos os valores preditos da variável dependente, e para todos os valores da variável independente.- não pode haver padrões não aleatórios (tendências crescentes ou decrescentes, curvas, etc.) em nenhum dos diagramas.
![Page 145: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/145.jpg)
Somente se todas estas condições forem satisfeitas é que podemos considerar o modelo de regressão apropriado. Se houver dois ou mais modelos apropriados escolhemos o mais simples, ou aquele que apresentar o mais alto coeficiente de determinação. Os diagramas deveriam ser como a figura abaixo:
Análise de Resíduos
Resíduos padronizados
Valorespreditosou X
![Page 146: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/146.jpg)
0.700 1.050 1.400 1.750 2.100 2.450 2.800 3.150 3.500 3.850-3.0
-2.4
-1.8
-1.2
-0.6
0.0
0.6
1.2
1.8
2.4
Resíduos de Índice (Y)
Valores preditos
Re
síd
uo
s P
ad
ron
iza
do
s
Análise de Resíduos
Exemplo:
Resíduos padronizados: média no 2o grau e índice na universidade
![Page 147: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/147.jpg)
Questão: as variáveis são relacionadas? Não coeficiente angular = 0. Sim coeficiente angular 0. Teste de hipóteses: H0: = 0 H1: 0 Como o desvio padrão da população é desconhecido, usamos “t”
de Student,com (n-2) graus de liberdade.
sb desvio padrão da distribuição amostral do coeficiente angular.
Teste de hipóteses para o Coeficiente Angular
tb
s
b
sb b
(
~valor amostral) - (valor esperado)
desvio padrao
0
nxxss eb /)(
1.
22
bstb .t.s-b
t.sb : para confiança de intervalo
b
b
![Page 148: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/148.jpg)
Questão: as variáveis são relacionadas? Não coeficiente de correlação = 0. Sim coeficiente de correlação 0. H0: = 0 H1: 0 ou > 0 ou < 0. O teste é feito com “t” de Student:
Intervalo de confiança para o coeficiente de correlação:
Teste de hipóteses para o Coeficiente de Correlação
( ) .t rn
rn calc
2 2
2
1t t
tcrit n
n
. ;
; /
2
2 2
para < 0 ou > 0
t para 0crit.
3r1
r1ln
2
1tanh
3r1
r1ln
2
1tanh 2/2/
n
Z
n
Z
![Page 149: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/149.jpg)
Exercícios: Folha 3
Slide 149
![Page 150: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/150.jpg)
5ª Parte:
– Regressão Linear Múltipla
– Séries Temporais
Slide 150
![Page 151: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/151.jpg)
Para y = b1x1 + b2x2
Onde está a reta de regressão ?
Regressão Linear Múltipla:
![Page 152: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/152.jpg)
Os cálculos necessários à regressão múltipla são complexos e envolvem a resolução de sistemas lineares ou matrizes
Basicamente os softwares apresentam 3 componentes para a regressão múltipla:– A Equação de Regressão;– R2 Ajustado e– Significância Global da Equação.
CONCEITOS E DEFINIÇÕES
![Page 153: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/153.jpg)
Equação de Regressão MúltiplaEquação de Regressão Múltipla: expressa um
relacionamento linear entre uma variável
dependente Y e duas ou mais variáveis
independentes (x1, x2, x3, ..., xk).
Modelo MatemáticoModelo Matemático:
Y = b0 + b1x1 + b2x2 + ... + bkxk
Valor Predito de Y
K = número de variáveis independentes
Intecepto
Xi= variáveis independentes
bi= Coeficientes
CONCEITOS E DEFINIÇÕES
![Page 154: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/154.jpg)
Coeficiente de Determinação Múltipla (RCoeficiente de Determinação Múltipla (R22):): é a medida de ajustamento da equação de regressão múltipla aos dados amostrais.
Limitação de RLimitação de R22: : na medida em que se incluem novas variáveis R2 aumenta, ou seja, a simples inclusão de todas as variáveis disponíveis levará R2 para próximo de 1. Entretanto a melhor equação nem sempre inclue todas as variáveis.
Como contornar este Como contornar este problema ?problema ?
CONCEITOS E DEFINIÇÕES
![Page 155: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/155.jpg)
Coeficiente de Determinação AjustadoCoeficiente de Determinação Ajustado: é o coeficiente de determinação R2 modificado de modo a levar em conta o número de variáveis e o tamanho da amostra. É o melhor número para comparar diferentes equações.
Modelo MatemáticoModelo Matemático:R2 Ajustado= 1 - (n –1 ) (1 – R2)
[n – (k+1)]
Número de dados Número de Variáveis Independentes
CONCEITOS E DEFINIÇÕES
![Page 156: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/156.jpg)
Significância Global: O valor PSignificância Global: O valor P.– Os Softwares, via de regra, apresentam o valor P,
que é uma medida da significância global da equação de regressão.
– Assim como R2, P é uma medida da aderência da equação aos dados amostrais.
– Quanto menor o valor de P, melhor a aderência da equação, ou seja, melhor o modelo.
P indica a probabilidade de se estar rejeitando H0 de forma indevida.
CONCEITOS E DEFINIÇÕES
![Page 157: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/157.jpg)
Já calculamos o coeficiente de correlação entre a altura do urso e seu peso (r = 0.897), daí r2=0.8046.
O que fazer para melhorar O que fazer para melhorar a estimativa do peso, sem a estimativa do peso, sem o uso de uma balança ?o uso de uma balança ?
NOSSO AMIGO URSO
![Page 158: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/158.jpg)
Os biólogos resolveram testar mais variáveis, além da altura. Foram escolhidas as seguintes variáveis:– Altura (já avaliada) [ H ]– Tórax [ T ]– Comprimento da Cabeça [ CC ]– Largura da Cabeça [ LC ]– Idade [ I ]– Diâmetro do Pescoço [ DP ]
Utilizando-se um Software apropriado, foram obtidos os dados a seguir:
NOSSO AMIGO URSO
![Page 159: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/159.jpg)
Como variável única, Tórax é melhor que a altura para predizer o peso dos ursos.
Quanto mais variáveis consideradas, maior o valor de R2
A melhor equação de regressão é definida por I, DP, H e T, porque:– Maior R2;– Menor P;– Além de ser mais simples.
Variáveis > H T CC e H I e DP e H e T I e CC e LC e DP e H e TR2 0,805 0,983 0,828 0,999 0,999
R2 Ajustado 0,773 0,980 0,759 0,997 0,996Significância Global0,002 0,000 0,012 0,000 0,046
NOSSO AMIGO URSO
![Page 160: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/160.jpg)
Sabe-se que o nível de resistência de um aço é correlacionado com seu teor de Carbono, conforme demonstrado no diagrama de dispersão.
82,8% da variação da resistência é explicada pela equação de regressão.
y = 1170x + 315,3R2 = 0,8285
340
350
360
370
380
390
400
410
420
0,000 0,020 0,040 0,060 0,080 0,100
Teor de C (%)
Re
sis
tên
cia
(M
Pa)
O que pode O que pode ser feito para ser feito para melhorar a melhorar a estimativa estimativa da da Resistência ?Resistência ?
UM CASO PRÁTICO
![Page 161: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/161.jpg)
O conhecimento técnico determina que o Manganês tem efeito semelhante ao Carbono.
Os mesmos dados foram submetidos a regressão múltipla tendo C como X1 e Mn como X2.
O “O “poder de poder de explicaçãoexplicação” ” da regressão da regressão subiu de subiu de 82,8% para 82,8% para 96,2%.96,2%.
y = 1188,9x + 268,59R2 = 0,9624
340
350
360
370
380
390
400
410
420
0,00 0,05 0,10 0,15
C+Mn/6
Re
sis
tên
cia
(MP
a)
UM CASO PRÁTICO
![Page 162: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/162.jpg)
A partir deste conhecimento, o projetista vai poder determinar qual a combinação necessária entre C e Mn, que reflita em menor custo, mas que atenda às exigências mínimas de Resistência, com maior nível de precisão.
UM CASO PRÁTICO
![Page 163: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/163.jpg)
1. Use o bom senso e considerações de ordem prática para incluir ou excluir variáveis.
2. Inclua um número relativamente pequeno de variáveis independentes (x).
3. Escolha uma equação em que a inclusão de uma nova variável provoque pequeno incremento em R2.
4. Para um mesmo número de variáveis independentes (x) escolha aquela que tenha o R2 maior.
5. Escolha a equação cujo valor de Significância Global (P) seja o menor.
ESCOLHA DE VARIÁVEIS
![Page 164: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/164.jpg)
Série temporal: conjunto de observações ordenadas no tempo.Exemplos:
a.Consumo mensal de energia em uma residência
b.Preço semanal de um produto
c.Valor anual de um índice de produção industrial
Idéia básica: observações passadas da série contêm informações sobre o seu padrão de comportamento futuro.
CONCEITO
Séries Temporais:
![Page 165: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/165.jpg)
Definição: tipo mais simples de série temporal, em que os
valores da série flutuam aleatoriamente em torno de um
valor fixo (nível da série), sem apresentar qualquer
tendência. Vendas das Fábricas da GM (em milhões de unidades)
4
5
6
7
8
9
10
Ano
SÉRIES GLOBALMENTE CONSTANTES
![Page 166: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/166.jpg)
Suavização Exponencial
Forma de modelar a série temporal
Supõe que a série é constante
Cada valor é uma média ponderada dos valores
anteriores da série
Pesos decaem à medida que o tempo de observação
fica mais distante do presente
SÉRIES GLOBALMENTE CONSTANTES
![Page 167: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/167.jpg)
Vendas Líquidas da Xerox Corp. (em bilhões de dólares)
0
2
4
6
8
10
12
14
16
18
20
Ano
Rec
eita
A série é composta por dois fatores: o nível (como na
série globalmente constante) e a tendência.
SÉRIES COM TENDÊNCIA LINEAR
![Page 168: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/168.jpg)
SÉRIES COM TENDÊNCIA LINEAR
MÉTODOS PARA ISOLAR A TENDÊNCIA: TREND ANALYSIS:
É o melhor processo. A tendência dos dados é dada pela curva de regressão.
MOVING AVERAGE: "Este processo, que objetiva suavizar as variações na variável estudada
tem a grande vantagem de não exigir a determinação de nenhuma curva a qual a tendência deva se adaptar.
Limitação: é quase impossível remover completamente variações cíclicas e irregulares.
Ideal: médias com períodos de tempo longo.
Problema: quanto mais dados, menos sensível a média se torna a observações recentes (às vezes é necessário ponderação)
![Page 169: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/169.jpg)
Além do nível e da tendência, algumas séries possuem um
fator sazonal. Este fator capta características da série que
se repetem a intervalos regulares de tempo.
Exemplo: A venda de um artigo em uma loja é função não
somente da venda no mês anterior e de uma expectativa
de aumento ou decréscimo (tendência da procura), mas
também da venda desse produto na mesma época, em
anos anteriores.
SÉRIES SAZONAIS
![Page 170: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/170.jpg)
Tipos de Efeito Sazonal
1. Efeito aditivo: a amplitude do fator sazonal independe do nível
local da série.
SÉRIES SAZONAIS
![Page 171: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/171.jpg)
2. Efeito Multiplicativo: a amplitude do fator sazonal varia
proporcionalmente ao nível da série.
Tipos de Efeito Sazonal
SÉRIES SAZONAIS
![Page 172: Apresentação CQE2010-EST-II-SP](https://reader031.vdocuments.mx/reader031/viewer/2022020110/557202b64979599169a3f921/html5/thumbnails/172.jpg)
Exercícios: Folha 4
Slide 174