estatística - texto bom

189
i  UNIVERSIDADE FEDERAL FLUMINENSE INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Ana Maria Lima de Farias Outubro 2008 

Upload: lucila-andrade

Post on 07-Apr-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 1/189

i

UNIVERSIDADE FEDERAL FLUMINENSEINSTITUTO DE MATEMÁTICA

DEPARTAMENTO DE ESTATÍSTICA

INFERÊNCIA ESTATÍSTICA

Ana Maria Lima de Farias

Outubro 2008

Page 2: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 2/189

Conteúdo

1 Inferência Estatística - Conceitos Básicos 11.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.1.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 População . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Amostra aleatória simples . . . . . . . . . . . . . . . . . . . . . . . . . . 31.4 Estatísticas e Parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.5 Distribuições Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.6 Propriedades de estimadores . . . . . . . . . . . . . . . . . . . . . . . . . 101.7 Alguns Métodos de Obtenção de Estimadores . . . . . . . . . . . . . . . 12

1.7.1 Método dos momentos . . . . . . . . . . . . . . . . . . . . . . . . 121.7.2 Método da máxima verossimilhança . . . . . . . . . . . . . . . . . 14

1.8 Resumo do Capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.9 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.10 Solução dos Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2 Distribuição Amostral da Média 272.1 Média e variância da distribuição amostral da média . . . . . . . . . . . 272.2 Distribuição amostral da média para populações normais . . . . . . . . . 282.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.3.1 Lista de Exercícios 1 . . . . . . . . . . . . . . . . . . . . . . . . . 342.4 Teorema Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.4.1 Lista de Exercícios 2 . . . . . . . . . . . . . . . . . . . . . . . . . 372.5 Distribuição amostral da variância amostral . . . . . . . . . . . . . . . . 372.6 Resumo do Capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.8 Solução das Listas de Exercícios . . . . . . . . . . . . . . . . . . . . . . . 412.9 Solução dos Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3 Distribuição Amostral da Proporção 483.1 Aproximação normal da distribuição binomial . . . . . . . . . . . . . . . 48

3.1.1 Lista de Exercícios 1 . . . . . . . . . . . . . . . . . . . . . . . . . 513.2 A distribuição amostral da proporção . . . . . . . . . . . . . . . . . . . . 53

3.2.1 Lista de Exercícios 2 . . . . . . . . . . . . . . . . . . . . . . . . . 543.3 Resumo do Capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

ii

Page 3: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 3/189

CONTEÚDO iii

3.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553.5 Solução das Listas de Exercícios . . . . . . . . . . . . . . . . . . . . . . . 563.6 Solução dos Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4 Intervalos de Con ança 61

4.1 Idéias básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614.2 Intervalo de con ança: média daN (μ; σ2), σ2 conhecida . . . . . . . . . 644.2.1 Notação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644.2.2 Interpretação do intervalo de con ança para μ . . . . . . . . . . . 664.2.3 Lista de Exercícios 1 . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.3 Margem de erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684.3.1 Lista de Exercícios 2 . . . . . . . . . . . . . . . . . . . . . . . . . 71

4.4 Resumo do Capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 714.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 724.6 Solução das Listas de Exercícios . . . . . . . . . . . . . . . . . . . . . . . 734.7 Solução dos Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

5 Intervalos de Con ança: Proporções - Amostra Grande 785.1 Estimação de uma proporção populacional . . . . . . . . . . . . . . . . . 785.2 Intervalo de con ança para a proporção populacional . . . . . . . . . . . 795.3 Determinação do tamanho da amostra . . . . . . . . . . . . . . . . . . . 825.4 Resumo do Capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 865.6 Solução dos Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

6 Intervalo de Con ança: Média da N (μ; σ2), σ2 Desconhecida 89

6.1 Idéias básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 896.2 Intervalo de con ança para a média de uma população normal com var-iância desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

6.3 Margem de erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 926.4 Amostras grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 926.5 Resumo comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

6.5.1 IC para a média de populações normais . . . . . . . . . . . . . . . 956.5.2 IC para uma proporção . . . . . . . . . . . . . . . . . . . . . . . . 956.5.3 Intervalo de con ança para a média de populações não-normais -

amostra grande . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

6.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 966.7 Solução dos Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

7 Intervalo de Con ança: Variância da N (μ; σ2) 1017.1 Idéias básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1017.2 Intervalo de con ança para a variância de uma população normal . . . . 1017.3 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1057.4 Solução dos Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

Page 4: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 4/189

CONTEÚDO iv

8 Testes de Hipóteses 1078.1 Noções básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

8.1.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1078.1.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1098.1.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1118.1.4 Exemplo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1128.1.5 Exemplo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1138.1.6 Exemplo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1148.1.7 Lista de Exercícios 1 . . . . . . . . . . . . . . . . . . . . . . . . . 114

8.2 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1158.2.1 Hipótese nula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1158.2.2 Hipótese alternativa . . . . . . . . . . . . . . . . . . . . . . . . . 1168.2.3 Estatística de teste, erros e regra de decisão . . . . . . . . . . . . 1168.2.4 Região crítica e nível de signi cância . . . . . . . . . . . . . . . . 1168.2.5 Função característica de operação e poder do teste . . . . . . . . . 117

8.3 Exemplo 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1188.4 Exemplo 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1198.4.1 Lista de Exercícios 2 . . . . . . . . . . . . . . . . . . . . . . . . . 120

8.5 Resumo do Capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1218.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1228.7 Solução das Listas de Exercícios . . . . . . . . . . . . . . . . . . . . . . . 1238.8 Solução dos Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

9 Teste de Hipótese: Média da N (μ; σ2) - σ2 Conhecida 1319.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

9.1.1 Hipóteses nula e alternativa . . . . . . . . . . . . . . . . . . . . . 1329.1.2 Estatística de teste . . . . . . . . . . . . . . . . . . . . . . . . . . 1329.1.3 Nível de signi cância e região crítica . . . . . . . . . . . . . . . . 1329.1.4 Determinação da região crítica . . . . . . . . . . . . . . . . . . . . 1349.1.5 Poder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

9.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1359.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1379.4 Procedimento geral para construção do teste de hipótese sobre a média

de umaN (μ; σ2) - σ2 conhecida . . . . . . . . . . . . . . . . . . . . . . . 1399.4.1 Teste bilateral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1409.4.2 Teste unilateral à direita . . . . . . . . . . . . . . . . . . . . . . . 142

9.4.3 Teste unilateral à esquerda . . . . . . . . . . . . . . . . . . . . . . 1429.4.4 Teste de hipóteseversus intervalo de con ança . . . . . . . . . . . 1439.5 ValorP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

9.5.1 Teste bilateral - ValorP para o Exemplo 1 . . . . . . . . . . . . . 1449.5.2 Teste unilateral à direita - Exemplo 2 . . . . . . . . . . . . . . . . 1459.5.3 Teste unilateral à esquerda - Exemplo 3 . . . . . . . . . . . . . . . 145

9.6 Exemplo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1469.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1489.8 Solução dos Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

Page 5: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 5/189

Page 6: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 6/189

Capítulo 1

Inferência Estatística - ConceitosBásicos

No estudo de métodos estatísticos, já foi visto como resumir um conjunto de dadosatravés de tabelas de freqüências, grá cos e medidas de posição e dispersão. Depois,foram estudados modelos probabilísticos, discretos ou contínuos, para descrever determi-nados fenômenos. Agora, essas ferramentas serão utilizadas no estudo de um importanteramo da Estatística, conhecido como Inferência Estatística, que busca métodos de fazera rmações sobre características de uma população, conhecendo-se apenas resultados deuma amostra.

Neste capítulo você estudará os seguintes conceitos:• população e amostra

• amostra aleatória simples

• estatísticas e parâmetros

• estimador

• distribuição amostral de um estimador

• método dos momentos

• método da máxima verossimilhança

1.1 IntroduçãoNo estudo da estatística descritiva, vimos que população é o conjunto de elementos paraos quais se deseja estudar determinada(s) característica(s). Vimos também que umaamostra é um subconjunto da população. No estudo da inferência estatística, o objetivoprincipal é obter informações sobre uma população a partir das informações de umaamostra e aqui vamos precisar de de nições mais formais de população e amostra. Parafacilitar a compreensão destes conceitos, iremos apresentar alguns exemplos a título deilustração.

1

Page 7: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 7/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 2

1.1.1 Exemplo 1Em um estudo antropométrico em nível nacional, uma amostra de 5000 adultos é sele-cionada dentre os adultos brasileiros e uma das variáveis de estudo é a altura.

Neste exemplo, a população é o conjunto de todos os brasileiros adultos. No en-tanto, o interesse (um deles, pelo menos) está na altura dos brasileiros. Assim, nesseestudo, a cada sujeito da população associamos um número correspondente à sua altura.Se determinado sujeito é sorteado para entrar na amostra, o que nos interessa é essenúmero, ou seja, sua altura. Como vimos, essa é a de nição de variável aleatória: umafunção que associa a cada ponto do espaço amostral um número real. Dessa forma, anossa população pode ser representada pela variável aleatóriaX = “altura do adultobrasileiro”. Como essa é uma variável aleatória contínua, a ela está associada umafunção de densidade de probabilidadef e da literatura, sabemos que é razoável suporque essa densidade seja a densidade normal. Assim, nossa população, nesse caso, é rep-resentada por uma variável aleatóriaX

∼N (μ; σ2). Conhecendo os valores deμ e σ

teremos informações completas sobre a nossa população.Uma forma de obtermos os valores deμ e σ é medindo as alturas de todos os

brasileiros adultos. Mas esse seria um procedimento caro e demorado. Uma solução,então, é retirar uma amostra (subonjunto) da população e estudar essa amostra. Su-ponhamos que essa amostra seja retirada com reposição e que os sorteios sejam feitosde forma independente, isto é, o resultado de cada extração não altera o resultado dasdemais extrações. Ao sortearmos o primeiro elemento, estamos realizando um experi-mento que dá origem à variável aleatóriaX 1 = “altura do primeiro elemento”; o segundoelemento dá origem à variável aleatóriaX 2 = “altura do segundo elemento” e assimpor diante. Como as extrações são feitas com reposição, todas as variável aleatóriaX 1, X 2, . . . têm a mesma distribuição, que re ete a distribuição da altura de todos os

brasileiros adultos. Para uma amostra especí ca, temos os valores observadosx1, x2, . . .dessas variáveis aleatórias.

1.1.2 Exemplo 2Consideremos, agora, um exemplo baseado em pesquisas eleitorais, em que estamosinteressados no resultado do segundo turno de uma eleição presidencial brasileira. Maisuma vez, nossos sujeitos de pesquisa são pessoas com 16 anos ou mais, aptas a votar. Ointeresse nal é saber a proporção de votos de um e outro candidato. Vamos consideraruma situação simpli cada em que não estamos considerando votos nulos, indecisos, etc.Então, cada sujeito de pesquisa dá origem a uma variável aleatória binária, isto é, umavariável aleatória que assume apenas dois valores. Como visto, podemos representaresses valores por 1 (candidato A) e 0 (candidato B), o que de ne uma variável aleatóriade Bernoulli, ou seja, essa população pode ser representada pela variável aleatóriaX

∼Bern ( p). O parâmetrop representa a probabilidade de um sujeito dessa população votarno candidato A. Uma outra interpretação é quep representa a proporção populacionalde votantes no candidato A.

Para obtermos informação sobrep, retira-se uma amostra da população e, comoantes, vamos supor que essa amostra seja retirada com reposição. Ao sortearmos

Page 8: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 8/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 3

o primeiro elemento, estamos realizando um experimento que dá origem à variávelaleatória X 1 = “voto do primeiro elemento”; o segundo elemento dá origem à variávelaleatória X 2 = “voto do segundo elemento” e assim por diante. Como as extrações sãofeitas com reposição, todas as variável aleatóriaX 1, X 2, . . . têm a mesma distribuiçãode Bernoulli populacional, isto é,X i

Bern ( p), i = 1 , 2, . . . .

1.2 PopulaçãoA inferência estatística trata do problema de se obter informação sobre uma populaçãoa partir de uma amostra. Embora a população real possa ser constituída de pessoas,empresas, animais, etc., as pesquisas estatísticas buscam informações sobre determi-nadas características dos sujeitos, características essas que podem ser representadas pornúmeros. Sendo assim, a cada sujeito da população está associado um número, o quenos permite apresentar a seguinte de nição.

De nição 1.1 A população de uma pesquisa estatística pode ser representada por uma variável aleatória X que descreve a característica de interesse.

Os métodos de inferência nos permitirão obter estimativas dos parâmetros da dis-tribuição de probabilidade de tal variável aleatória, que pode ser contínua ou discreta.

1.3 Amostra aleatória simples

Como já dito, é bastante comum o emprego da amostragem em pesquisas estatísticas.Nas pesquisas por amostragem, uma amostra é selecionada da população de interesse etodas as conclusões serão baseadas apenas nessa amostra. Para que seja possível inferirresultados para a população a partir da amostra, é necessário que esta seja “represen-tativa” da população.

Embora existam vários métodos de seleção de amostras, vamos nos concentrar aquino caso mais simples, que é aamostragem aleatória simples . Segundo tal método, todaamostra de mesmo tamanhon tem igual chance (probabilidade) de ser sorteada. Épossível extrair amostras aleatórias simples com e sem reposição. Quando estudamos asdistribuições binomial e hipergeométrica, vimos que a distribuição binomial correspon-

dia a extrações com reposição e a distribuição hipergeométrica correspondia a extraçõessem reposição. No entanto, para populações grandes - ou in nitas - extrações com esem reposição não levam a resultados muito diferentes. Assim, no estudo da InferênciaEstatística, lidaremos sempre com amostragem aleatória simplescom reposição. Estemétodo de seleção atribui a cada elemento da população a mesma probabilidade de serselecionado e esta probabilidade se mantém constante ao longo do processo de seleçãoda amostra (se as extrações fossem sem reposição isso não aconteceria). No restantedesse curso omitiremos a expressão “com reposição”, ou seja, o termo amostragem (ou

Page 9: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 9/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 4

amostra) aleatória simples sempre se referirá à amostragem com reposição. Por sim-plicidade, muitas vezes abreviaremos o termo amostra aleatória simples por amostraaleatória simples.

Uma forma de se obter uma amostra aleatória simples é escrever os números ounomes dos elementos da população em cartões iguais, colocar estes cartões em uma urnamisturando-os bem e fazer os sorteios necessários, tendo o cuidado de colocar cada cartãosorteado na urna antes do próximo sorteio. Na prática, em geral são usados programasde computador, uma vez que as populações tendem a ser muito grandes.

Agora vamos formalizar o processo de seleção de uma amostra aleatória simples, deforma a relacioná-lo com os problemas de inferência estatística que iremos estudar.

Seja uma população representada por uma variável aleatóriaX. De tal populaçãoserá sorteada uma amostra aleatória simples com reposição de tamanhon. Como vistonos exemplos anteriores, cada sorteio dá origem a uma variável aleatóriaX i e, como ossorteios são com reposição, todas essas variáveis têm a mesma distribuição deX. Issonos leva à seguinte de nição.

De nição 1.2 Uma (aas) de tamanho n de uma var-iável aleatória X (população) é um conjunto de n variáveis aleatórias X 1, X 2,...,X nindependentes e identicamente distribuídas (i.i.d.).

É interessante notar a convenção usual: o valor observado de uma variável aleatóriaX é representado pela letra minúscula correspondente. Assim, depois do sorteio de umaamostra aleatória simples de tamanhon, temos valores observadosx1, x2, . . . , x n dasrespectivas variáveis aleatórias.

1.4 Estatísticas e ParâmetrosObtida uma amostra aleatória simples, é possível calcular diversas características destaamostra, como, por exemplo, a média, a mediana, a variância, etc. Qualquer umadestas características é uma função deX 1, X 2,...,X n e, portanto, o seu valor dependeda amostra sorteada. Sendo assim, cada uma dessas características ou funções é tambémuma variável aleatória. Por exemplo, a média amostral é a variável aleatória de nidapor

X =X 1 + X 2 + · · · + X n

nTemos, então, a seguinte de nição:

De nição 1.3 Uma ou T é qualquer função da amostra X 1, X 2,...,X n , isto é,

T = g(X 1, X 2,...,X n )

onde g é uma função qualquer.

Page 10: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 10/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 5

As estatísticas amostrais que consideraremos neste curso são

• média amostralX =

X 1 + X 2 + · · · + X nn

(1.1)

• variância amostralS 2 =

1n −1

n

Pi=1 ¡X i −X ¢2 (1.2)

Para uma amostra especí ca, o valor obido para o estimador será denominadoes-timativa e, em geral, será representada por letras minúsculas. Por exemplo, temos asseguintes notações correspondentes à média amostral e à variância:x e s2.

Outras estatísticas possíveis são o mínimo amostral, o máximo amostral, a amplitudeamostral, etc.

De forma análoga, temos as características de interesse da população. No entanto,para diferenciar entre as duas situações (população e amostra), atribuimos nomes difer-entes.

De nição 1.4 Um é uma característica da população.

Assim, se a população é representada pela variável aleatóriaX , alguns parâmetrossão a esperançaE (X ) e a variânciaV ar(X ) de X .

Com relação às características mais usuais, vamos usar a seguinte notação:

Característica Parâmetro Estatística(população) (amostra)

Média μ X Variância σ2 S 2Número de elementos N n

Lembre-se que, para uma variável aleatória discreta ( nita) uniforme,

μ = E (X ) =1N

N

Pi=1X i

V ar(X ) = 1N

N

Pi=1[X i −E (X )]2 = 1N

N

Pi=1[X i −μ]2 = 1N

N

Pi=1X 2i −μ2

1.5 Distribuições AmostraisNos problemas de inferência, estamos interessados em estimar um parâmetroθ da pop-ulação (por exemplo, a média populacional) através de uma amostra aleatória simplesX 1, X 2,...,X n . Para isso, usamos uma estatísticaT (por exemplo, a média amostral) e,com base no valor obtido paraT a partir de uma particular amostra, iremos tomar as

Page 11: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 11/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 6

decisões que o problema exige. Já foi dito queT é uma variável aleatória, uma vez quedepende da amostra sorteada; amostras diferentes fornecerão diferentes valores paraT .

Consideremos o seguinte exemplo, onde nossa população é o conjunto{1, 3, 6, 8}, istoé, este é o conjunto dos valores da característica de interesse da população em estudo.Assim, para esta população, ou seja, para essa variável aleatóriaX temos

E (X ) = μ =14

(1 + 3 + 6 + 8) = 4 , 5

V ar(X ) = σ2 =14£(1 −4, 5)2 + (3 −4, 5)2 + (6 −4, 5)2 + (8 −4, 5)2¤= 7 , 25

Suponha que dessa população iremos extrair uma amostra aleatória simples detamanho 2 e a estatística que iremos calcular é a média amostral. Algumas possibili-dades de amostra são {1,1}, {1,3}, {6,8}, para as quais os valores da média amostral são1, 2 e 7, respectivamente. Podemos ver, então, que há uma variabilidade nos valores daestatística e, assim, seria interessante que conhecêssemos tal variabilidade. Conhecendotal variabilidade, temos condições de saber “quão infelizes” podemos ser no sorteio daamostra. No exemplo acima, as amostras {1,1} e {8,8} são as que têm média amostralmais afastada da verdadeira média populacional. Se esses valores tiverem chance muitomais alta do que os valores mais próximos deE (X ), podemos ter sérios problemas.

Para conhecer o comportamento da média amostral, teríamos que conhecer todosos possíveis valores deX , o que equivaleria a conhecer todas as possíveis amostras detamanho 2 de tal população. Nesse exemplo, como só temos 4 elementos na população,a obtenção de todas as amostras aleatórias simples de tamanho 2 não é difícil.

Lembre-se do nosso estudo de análise combinatória: como o sorteio é feito comreposição, em cada um dos sorteios temos 4 possibilidades. Logo, o número total deamostras aleatórias simples é4 × 4 = 16. Por outro lado, em cada sorteio, cada ele-mento da população tem a mesma chance de ser sorteado; como são 4 elementos, cadaelemento tem probabilidade1/ 4 de ser sorteado. Finalmente, como os sorteios são in-dependentes, para obter a probabilidade de um par de elementos pertencer à amostrabasta multiplicar as probabilidades (lembre-se quePr( A ∩B) = Pr( A)Pr( B) quandoAe B são independentes). NaTabela 1.1 a seguir listamos todas as possíveis amostras,com suas respectivas probabilidades e para cada uma delas, apresentamos o valor damédia amostral.

Analisando esta tabela, podemos ver que os possíveis valores deX são 1; 2; 3; 3,5; 4,5;5,5; 6; 7; 8 e podemos construir a sua função de distribuição de probabilidade, notando,por exemplo, que o valor 2 pode ser obtido através de duas amostras: (1,3) ou (3,1).Como essas amostras correspondem a eventos mutuamente exclusivos, a probabilidadede se obter uma média amostral igual a 2 é

Pr( X = 2) = Pr( {1, 3}∪

{3, 1})= Pr( {1, 3}) + Pr( {3, 1})

=116

+116

=216

Page 12: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 12/189

Page 13: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 13/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 8

X é igual à média da população e que sua variância é igual à variância da populaçãodividida pelo tamanho da amostra. NaFigura 1.1 temos os grá cos da função dedistribuição de probabilidade deX (população) na parte (a) e deX (amostra) na parte(b). Podemos ver que a média de ambas é 4,5 (ambas são simétricas em torno de 4,5)e que a distribuição deX tem menor dispersão em torno dessa média. Note que essamédia e essa variância são calculadas ao longo de todas as possíveis amostra aleatóriasimples de tamanho 2.

(a)

(b)

0

0,1

0,2

0,3

0,4

0 1 2 3 4 5 6 7 8 9

0

0,1

0,2

0,3

0,4

0 1 2 3 4 5 6 7 8 9

Figura 1.1: Função de distribuição de probabilidade deX e deX para aas de tamanho2 tirada da população{1, 3, 6, 8}

Consideremos, agora, a mesma situação, só que, em vez de estudarmos a médiaamostral, uma medida de posição, vamos estudar a dispersão. Como visto, a variânciapopulacal28ae

Page 14: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 14/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 9

Amostra x (x1 −x)2 (x2 −x)22

Pi=1(xi −x)2 S 2 bσ

2

(1, 1) 1 (1−1)2 (1 −1)2 0 0 0(1, 3) 2 (1−2)2 (3 −2)2 2 2 1(1, 6) 3, 5 (1

−3, 5)2 (6

−3, 5)2 12, 5 12, 5 6, 25

(1, 8) 4, 5 (1 −4, 5)2 (8 −4, 5)2 24, 5 24, 5 12, 25(3, 1) 2 (3−2)2 (1 −2)2 2 2 1(3, 3) 3 (3−3)2 (3 −3)2 0 0 0(3, 6) 4, 5 (3 −4, 5)2 (6 −4, 5)2 4, 5 4, 5 2, 25(3, 8) 5, 5 (3 −5, 5)2 (8 −5, 5)2 12, 5 12, 5 6, 25(6, 1) 3, 5 (6 −3, 5)2 (1 −3, 5)2 12, 5 12, 5 6, 25(6, 3) 4, 5 (6 −4, 5)2 (3 −4, 5)2 4, 5 4, 5 2, 25(6, 6) 6 (6−6)2 (6 −6)2 0 0 0(6, 8) 7 (6−7)2 (8 −7)2 2 2 1(8, 1) 4, 5 (8 −4, 5)2 (1 −4, 5)2 24, 5 24, 5 12, 25

(8, 3) 5, 5 (8 −5, 5)2

(3 −5, 5)2

12, 5 12, 5 6, 25(8, 6) 7 (8−7)2 (6 −7)2 2 2 1(8, 8) 8 (8−8)2 (8 −8)2 0 0 0

Tabela 1.2: Distribuição amostral de 2 estimadores da variância

Podemos ver que a função de distribuição de probabilidade deS 2 é

s2 0 2 4, 5 12, 5 24, 5Pr( S 2 = s2) 4/ 16 4/ 16 2/ 16 4/ 16 2/ 16

e a função de distribuição de probabilidade debσ2 é

k 0 1 2, 25 6, 25 12, 25Pr( bσ

2 = k) 4/ 16 4/ 16 2/ 16 4/ 16 2/ 16

Para essas distribuições temos:

E (S 2) = 0 ×4

16+ 2 ×

416

+ 4 , 5 ×216

+ 12 , 5 ×416

+ 24 , 5 ×2

16

=11616

= 7 , 25 = σ2 = V ar(X )

e

E ( bσ2) = 0 ×

416

+ 1 ×416

+ 2 , 25 ×216

+ 6 , 25 ×416

+ 12 , 25 ×216

=5816

= 3 , 625

Vemos que, em média,S 2 é igual à variância populacional, o que não ocorre combσ2.

Estes dois exemplos ilustram o fato de que qualquer estatística amostralT é umavariável aleatória, que assume diferentes valores para cada uma das diferentes amostras e

Page 15: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 15/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 10

tais valores, juntamente com a probabilidade de cada amostra, nos forneceriam a funçãode distribuição de probabilidades deT , caso fosse possível obter todas as amostraaleatória simples de tamanhon da população. Isso nos leva à seguinte de nição, que éum conceito central na Inferência Estatística.

De nição 1.5 A de uma estatística T é a funçãode distribuição de probabilidades de T ao longo de todas as possíveis amostras de tamanhon.

Podemos ver que a obtenção da distribuição amostral de qualquer estatísticaT é umprocesso tão ou mais complicado do que trabalhar com a população inteira. Na prática,o que temos é uma única amostra e é com essa única amostra que temos que tomar asdecisões pertinentes ao problema em estudo. Esta tomada de decisão, no entanto, seráfacilitada se conhecermos resultados teóricos sobre o comportamento da distribuiçãoamostral.

1.6 Propriedades de estimadoresNo exemplo anterior, relativo à variância amostral, vimos queE (S 2) = σ2 e E ( bσ

2) 6=σ2. Analogamente, vimos também queE (X ) = μ. Vamos entender direito o que essesresultados signi cam, antes de passar a uma de nição formal da propriedade envolvida.

Dada uma população, existem muitas e muitas amostra aleatória simples de tamanhon que podem ser sorteadas. Cada uma dessas amostras resulta em um valor diferente daestatística de interesse (X e S 2, por exemplo). O que esses resultados estão mostrando écomo esses diferentes valores se comportam em relação ao verdadeiro (mas desconhecido)valor do parâmetro.

Considere aFigura 1.2 , onde o alvo representa o valor do parâmetro e os “tiros”,indicados pelos símbolo x, representam os diferentes valores amostrais da estatística deinteresse.

Nas partes (a) e (b) da gura, os tiros estão em torno do alvo, enquanto nas partes(c) e (d) isso não acontece. Comparando as partes (a) e (b), podemos ver que na parte(a) os tiros estão mais concentrados em torno do alvo, isto é, têm menor dispersão. Issore ete uma pontaria mais certeira do atirador em (a). Analogamente, nas partes (c) e(d), embora ambos os atiradores estejam com a mira deslocada, os tiros do atirador (c)estão mais concentrados em torno de um alvo; o deslocamento poderia até ser resultadode um desalinhamento da arma. Já o atirador (d), além de estar com o alvo deslocado,ele tem os tiros mais espalhados, o que re ete menor precisão.

Traduzindo esta situação para o contexto de estimadores e suas propriedades, temos oseguinte: nas partes (a) e (b), temos dois estimadores que fornecem estimativas centradasem torno do verdadeiro valor do parâmetro, ou seja, as diferentes amostras fornecemvalores distribuídos em torno do verdadeiro valor do parâmetro. A diferença é queem (b) esses valores estão mais dispersos e, assim, temos mais chance de obter umaamostra “infeliz”, ou seja, uma amostra que forneça um resultado muito afastado do

Page 16: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 16/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 11

Figura 1.2: Propriedades de estimadores

valor do parâmetro. Essas duas propriedades estão associadas à esperança e à variânciado estimador, que são medidas de centro e dispersão, respectivamente. Nas partes (c)e (d), as estimativas estão centradas em torno de um valor diferente do parâmetro de

interesse e na parte (d), a dispersão é maior.Temos, assim, ilustrados os seguintes conceitos.

De nição 1.6 Um estimador T é dito um do parâmetro θse E (T ) = θ.

Como nos exemplos vistos, essa esperança é calculada ao longo de todas as possíveisamostras, ou seja, é a esperança da distribuição amostral deT. Nas partes (a) e (b) daFigura 1.2 os estimadores são não-viesados e nas partes (c) e (d), os estimadores sãoviesados.

Com relação aos estimadoresX, S 2 ebσ2, veremos formalmente que os dois primeiros

são não-viesados para estimar a média e a variância populacionais, respectivamente,enquantobσ

2 é viesado para estimar a variância populacional. Essa é a razão para seusar S 2, e nãobσ

2.

De nição 1.7 Se T 1 e T 2 são dois estimadores não-viesados do parâmetro θ, diz-se que T 1 é que T 2 se V ar(T 1) < V ar (T 2).

Page 17: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 17/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 12

Na Figura 1.2 , o estimador da parte (a) é mais e ciente que o estimador da parte(b).

Uma outra propriedade dos estimadores está relacionada à idéia bastante intuitivade que à medida que se aumenta o tamanho da amostra, mais perto devemos car doverdadeiro valor do parâmetro.

De nição 1.8 Uma seqüência {T n } de estimadores de um prâmetro θ é consistente se,para todo ε > 0

limn→∞

Pr {|T n −θ| > ε } = 0

Uma maneira alternativa de veri car se uma seqüência de estimadores é consistenteé dada a seguir.

Teorema 1.1 Uma seqüência {T n } de estimadores de um prâmetro θ é consistente se

limn→∞

E (T n ) = θ

limn→∞

V ar(T n ) = 0

1.7 Alguns Métodos de Obtenção de EstimadoresDe nidas as propriedades desejáveis de um estimador, a questão que se coloca é: comoconseguir estimadores? Neste curso vamos ver 2 métodos, que, no entanto, não esgotamas possibilidades. Por exemplo, no estudo dos modelos de regressão é usado o métododos mínimos quadrados, que não será abordado aqui.

O contexto geral é o seguinte: de uma população representada pela variável aleatóriaX extrai-se uma amostra aleatória simplesX 1, X 2, . . . , X n com o objetivo de se estimarum parâmetro θ = ( θ1, θ2, . . . , θ r ) . A distribuição de probabilidadef da variávelX depende de tal parâmetro, o que representaremos porf (x; θ ).

1.7.1 Método dos momentosA idéia geral do método dos momentos é a seguinte: o estimadorbθ será obtido comosolução das equações que igualam os momentos populacionais aos momentos amostrais.

De nição 1.9 O momento μk de ordem k de uma variável aleatória X é de nido como

μk = E (X k )

Se X é contínua, temos que

μk = Z xkf (x; θ )dx

e para o caso discretoμk = Px xkf (x; θ )

Page 18: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 18/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 13

De nição 1.10 Dada uma amostra aleatória simples X 1, X 2, . . . , X n de uma populaçãoX, o momento amostral mk de ordem k é de nido como

mk =1n

n

Pi=1

X ki

De nição 1.11 bθ é o estimador para θ obtido pelo método dos momentos se ele for solução das equações

mk = μk k = 1 , 2, . . . , r

Exemplo: Distribuição de Poisson

Seja X ∼

P oi(λ). Vamos obter o estimador pelo métodos dos momentos paraλ. Adistribuição de probabilidade deX é

Pr( X = x) =λx

x!e−λ

e foi visto queE (X ) = λ = μ1. Igualando

μ1 = m1 =⇒ bλ = X

Exemplo: Distribuição Exponencial

SejaX ∼

exp(β ). Entãof (x; β ) =

e−x/β

e E (X ) = β. Como na Poisson, o estimador pelo método dos momentos serábβ = X.Com a outra parametrização

f (x; λ) = λe−λx

temos queE (X ) =1λ

e o estimador pelo método dos momentos deλ ébλ =1X

.

Exemplo: Distribuição Normal

Se X ∼

N (μ; σ2), temos que

E (X ) = μ =⇒

μ1

= μV ar(X ) = σ2 =

⇒E (X 2) −[E (X )]2 = σ2 =

⇒μ2 −(μ1)2 = σ2

Resulta que os estimadores pelo método dos momentos são

bμ = X

bσ2 = m2 −m2

1 =1n PX 2i −X 2 =

1n P¡X i −X ¢2

Page 19: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 19/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 14

1.7.2 Método da máxima verossimilhançaSe X 1, X 2, . . . , X n é uma amostra aleatória simples retirada de uma populaçãoX

∼f X (x; θ ), então X 1, X 2, . . . , X n são variáveis aleatórias (porque dependem da amostra aser sorteada) independentes e identicamente distribuídas e sua distribuição conjunta é

f X 1 ,...,X n (x1, x2, . . . , x n ; θ ) =n

Qi=1f X (xi ; θ )

pela hipótese de independência das variáveis aleatórias. O parâmetroθ é desconhecido,mas xo, ou seja,f X (x; θ ) depende deste único parâmetro. Depois de sorteada aamostra, os valores observados deX 1, X 2, . . . , X n estão xos. O método da máximaverossimilhança consiste em estimar o parâmetroθ pelo valorbθ que maximiza a prob-abilidade de se observar esses valores da amostra.

A título de ilustração deste conceito, vamos considerar uma amostra aleatória simplesde tamanho 1 retirada de uma populaçãoN (μ; 1). Nosso objetivo é estimar a média apartir desta amostra de tamanho 1. Suponhamos que a amostra sorteada resulte na

observaçãox = 2 . Essa observação poderia ter vindo de qualquer distribuição normalcom variância 1. NaFigura 1.3 temos 3 dessas possíveis distribuições: todas têmvariância 1 mas suas médias são diferentes. Os pontos coloridos correspondem ao valorda respectiva função de densidade no ponto observadox = 2 . O método de máximaverossimilhança fornece o estimadorbμ como sendo aquele que maximizaf μ (2). Noteque agora quem está variando é o parâmetroμ, ou seja, estamos escolhendo o “melhor”μ, que é aquele que maximizaf (2). Podemos ver que o máximo ocorre quandoμ = 2(curva do meio - em azul).

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

-6 -4 -2 0 2 4 6 8

Figura 1.3: Exemplo da máxima verossimilhança - amostra de tamanho 1 daN (μ; 1)

Vamos, agora, formalizar esse procedimento.

Page 20: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 20/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 15

De nição 1.12 Sejam x1, x2, . . . , x n os valores observados de uma amostra aleatória simples X 1, X 2, . . . , X n retirada de uma população X

∼f X (x; θ ). A função de verossim-

ilhança é de nida por

L(θ | x ) = L(θ |x1, x2, . . . , x n ) =n

Qi=1

f (xi |θ )

Note que a função de verossimilhança é uma função de θ ; os valores xi estão xos,correspondendo à amostra observada.

O estimador de máxima verossimilhança de θ é o valor bθ que maximiza L(θ | x ).

O processo para encontrar o estimador de máxima verossimilhança consiste, então,em maximizar a função de verossimilhança. Muitas vezes esse processo de maximização cará mais simples se trabalharmos com o logaritmo natural deL(θ | x ). Como a funçãologarítmica é crescente, os máximos deL(θ | x ) e lnL(θ | x ) ocorrerão no mesmo ponto.Vamos denotar por (θ | x ) o logaritmo natural de afunção de verossimilhança, isto é:

(θ | x ) = ln L(θ | x )

Essa função é chamada função log-verossimilhança.

Exemplo: Distribuição de Poisson

SejaX 1, X 2, . . . , X n uma amostra aleatória simples da populaçãoX ∼

Poi(λ). Então, afunção de distribuição de probabilidade conjunta é

Pr( X 1 = x1, . . . , X n = xn |λ) =n

Qi=1

µλx i

xi!e−λ

¶e a função de verossimilhança é

L(λ| x ) = L(λ|x1, x2, . . . , x n ) =n

Qi=1 µλx i

xi!e−λ¶

Tomando o logaritmo natural da função de verossimilhança obtém-se

(λ| x ) = ln L(λ| x ) = lnn

Qi=1 µλx i

xi!e−λ¶=

n

Pi=1lnµλx i

xi!e−λ¶

=n

Pi=1

£ln(λx i ) + ln e−λ

−ln xi!

¤=n

Pi=1(xi ln λ) +

n

Pi=1[(−λ) ln e]−

n

Pi=1(ln xi!)

= ln λn

Pi=1xi −nλ −

n

Pi=1(ln xi!)

Para achar o máximo de(λ| x ) temos que derivar em relação aλ :e igualar essa derivadaa zero:

d (λ| x )dλ

= 0⇐⇒

1

n

Pi=1xi −n = 0

⇐⇒ bλ = Pni=1 xi

n ⇐⇒ bλ = X

Page 21: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 21/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 16

A derivada segunda éd2 (λ| x )

dλ2 = −1λ2

n

Pi=1xi < 0

e, portanto,

bλ = X corresponde a um ponto de máximo global, uma vez quelimλ→∞L(λ| x ) =

0.Exemplo: Distribuição normal

Se a populaçãoX ∼

N (μ; σ2) , a função de verossimilhança é

L(μ; σ2| x ) =n

Qi=1

1√ 2πσ 2

exp ·−(xi −μ)2

2σ2 ¸e

(μ; σ2

|x

) = ln L(μ; σ2

|x

) =

n

Xi=1 ln½1

√ 2πσ 2 exp ·−(xi

−μ)2

2σ2

¸¾=n

Xi=1

ln1

√ 2πσ 2+

n

Xi=1

ln½exp ·−(xi −μ)2

2σ2 ¸¾= n ln¡2πσ 2¢−1/ 2

−n

Xi=1·(xi −μ)2

2σ2 ¸= −

n2

ln 2π −n2

ln σ2 −12

n

Xi=1

(xi −μ)2

σ2

∂∂μ

= 0⇐⇒

1σ2

n

Pi=1(xi −μ) = 0

⇐⇒ bμ = x

∂∂σ 2 = 0

⇐⇒−n

2σ2 +12

n

Pi=1

(xi − bμ)2

(σ2)2 = 0⇐⇒ bσ

2 =1n

n

Pi=1(xi −x)2

Pode-se mostrar que esse realmente é um ponto de máximo global e, portantox e bσ2

são os estimadoresde máxima verossimilhança da média e da variância da normal.Os estimadores de máxima verossimilhança gozam de propriedades importantes que,

no entanto, não serão estudadas nesse curso.

1.8 Resumo do CapítuloAo nal deste capítulo, você deverá ser capaz de compreender perfeitamente os seguintesconceitos:

• A população de uma pesquisa estatística é descrita por uma variável aleatóriaX,que descreve a característica de interesse. Essa variável aleatória pode ser discretaou contínua.

Page 22: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 22/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 17

• O método de amostragem aleatória simples atribui, a cada amostra de tamanhon, igual probabilidade de ser sorteada. Se os sorteios dos elementos da amostrasão feitos com reposição, cada sujeito da população tem a mesma probabilidadede ser sorteado e essa probabilidade se mantém constante. Dessa forma, umaamostra aleatória simples com reposição de uma populaçãoX é um conjuntoX 1, X 2, . . . , X n de variáveis aleatórias independentes e identicamente distribuídas,todas com a mesma distribuição da populaçãoX.

• Uma estatística ou estimadorT é qualquer função deX 1, X 2, . . . , X n , isto é,T =g(X 1, X 2, . . . , X n ). Como o estimador depende da amostra sorteada, ele é tambémuma variável aleatória. Os estimadores descrevem características da amostra.

• Um parâmetro é uma característica da população.

• As características que iremos estudar são a média(μ e X ) e a variância(σ2 e S 2).

• Como cada estimadoré uma variável aleatória, ele pode ser descrito pela sua funçãode distribuição, que é chamada distribuição amostral do estimador. A distribuiçãoamostral de um estimador é a distribuição ao longo de todas as possíveis amostrasde mesmo tamanhon.

• Como sempre, a média e a variância de uma distribuição de probabilidades sãoparâmetros de posição e dispersão. No caso da distribuição amostral de um esti-mador, esses parâmetros referem-se à distribuição ao longo de todas as possíveisamostras. Assim, a média de uma distribuição amostral refere-se à média dos pos-síveis valores do estimador ao longo de todas as possíveis amostras e a variânciare ete a dispersão desses valores em torno dessa média.

• Um estimador é não-viesado se a sua média é igual ao parâmetro que ele pretendeestimar. Isso signi ca que os valores do estimador ao longo de todas as possíveisamostras estão centrados no parâmetro populacional.

• Dados dois estimadores não-viesados de um mesmo parâmetro,T 1 e T 2, diz-seque T 1 é mais e ciente queT 2 se sua variância for menor, ou seja, seV ar(T 1) >V ar(T 2).

• Uma seqüência{T n } de estimadores de um parâmetroθ é consistente se, para todo

ε > 0, limn→∞

Pr {|T n−

θ| > ε } = 0 ou se

(lim

n→∞E (T n ) = θ

limn→∞V ar(T n ) = 0

• Métodos de estimação: métodos dos momentos e da máxima verossimilhança.

1.9 Exercícios1. Obtenha o estimador de máxima verossimilhança para o parâmetroβ da dis-

tribuição exponencial.

Page 23: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 23/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 18

2. Para xar as idéias sobre os conceitos apresentados neste capítulo, você irá tra-balhar com amostras aleatórias simples de tamanho 3 retiradas da população{1, 2, 4, 6, 8}. Pelo princípio da multiplicação, o número total de amostras é5 ×5× 5 = 125 e cada uma dessas amostras tem probabilidade1

5 × 15 × 1

5 = 1125 . Iremos

considerar os seguintes estimadores para a média da população:média amostral:

X =X 1 + X 2 + X 3

3média amostral ponderada:

X p =X 1 + 2 X 2 + X 3

4

ponto médio∆ =

min(X 1, X 2, X 3) + max( X 1, X 2, X 3)2

O que você irá mostrar é que (i)X e X p são não-viesados e queX é mais e cienteque X p; (ii) ∆ é viesado, mas sua variância é menor que a variância deX e deX p. Para isso, você irá seguir os seguintes passos:

(a) Calcule a médiaμ e a variânciaσ2 da população.(b) Nas cinco tabelas a seguir, você tem listadas as 125 amostras. Para cada

uma das amostras, calcule os valores dos estimadores. Para as 6 primeirasamostras os cálculos já estão feitos, a título de ilustração. Você não precisaindicar todas as contas; apenas use a máquina de calcular e anote o resultadoobtido.

(c) Obtenha a função de distribuição de probabilidade, explicitando os diferentesvalores de cada um dos estimadores e suas respectivas probabilidades

(d) Calcule a esperança e a variância de cada um dos estimadores.(e) Veri que as a rmativas feitas no enunciado do problema.

Page 24: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 24/189

Page 25: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 25/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 20

Amostra EstimadorX 1 X 2 X 3 X X p ∆

2 1 12 1 22 1 42 1 62 1 82 2 12 2 22 2 42 2 62 2 82 4 12 4 22 4 42 4 62 4 82 6 12 6 22 6 42 6 62 6 82 8 12 8 22 8 42 8 62 8 8

Page 26: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 26/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 21

Amostra EstimadorX 1 X 2 X 3 X X p ∆

4 1 14 1 24 1 44 1 64 1 84 2 14 2 24 2 44 2 64 2 84 4 14 4 24 4 44 4 64 4 84 6 14 6 24 6 44 6 64 6 84 8 14 8 24 8 44 8 64 8 8

Page 27: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 27/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 22

Amostra EstimadorX 1 X 2 X 3 X X p ∆

6 1 16 1 26 1 46 1 66 1 86 2 16 2 26 2 46 2 66 2 86 4 16 4 26 4 46 4 66 4 86 6 16 6 26 6 46 6 66 6 86 8 16 8 26 8 46 8 66 8 8

Page 28: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 28/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 23

Amostra EstimadorX 1 X 2 X 3 X X p ∆

8 1 18 1 28 1 48 1 68 1 88 2 18 2 28 2 48 2 68 2 88 4 18 4 28 4 48 4 68 4 88 6 18 6 28 6 48 6 68 6 88 8 18 8 28 8 48 8 68 8 8

Page 29: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 29/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 24

1.10 Solução dos Exercícios1. A função de verossimilhança é

L(β | x ) =1β

e−x 1 /β × · · · ×1β

e−x n /β =1

β nexp

µ−

Pxi

¶A log-verossimilhança é

(β | x ) = −n ln β −1β Pxi

Derivando e igualando a 0:d (β | x )

dβ = 0⇐⇒−

+1

β 2 Pxi = 0⇐⇒ bβ =

1n Pxi = x

2. Para a população temos que

μ =1 + 2 + 4 + 6 + 8

5 = 4 , 2

σ2 =12 + 2 2 + 4 2 + 6 2 + 8 2

5 −(4, 2)2 = 6 , 56

Completando-se as tabelas dadas, chegamos às seguintes funções de distribuição deprobabilidade dos estimadores:

X Pr( X = x) Cálculo deE (X ) Cálculo deV ar(X )x p px E (X 2)

3/ 3 1/ 125 3/ 375 (3/ 3)2 (1/ 125)

4/ 3 3/ 125 12/ 375 (4/ 3)(3/ 125)5/ 3 3/ 125 15/ 375 (5/ 3)(3/ 125)6/ 3 4/ 125 24/ 375 (6/ 3)2 (4/ 125)7/ 3 6/ 125 42/ 375 (7/ 3)2 (6/ 125)8/ 3 6/ 125 48/ 375 (8/ 3)2 (6/ 125)9/ 3 9/ 125 81/ 375 (9/ 3)2 (9/ 125)10/ 3 9/ 125 90/ 375 (10/ 3)2 (9/ 125)11/ 3 12/ 125 132/ 375 (11/ 3)2 (12/ 125)12/ 3 10/ 125 120/ 375 (12/ 3)2 (10/ 125)13/ 3 9/ 125 117/ 375 (13/ 3)2 (9/ 125)

14/ 3 12/ 125 168/ 375 (14/ 3)2

(12/ 125)15/ 3 6/ 125 90/ 375 (15/ 3)2 (6/ 125)16/ 3 12/ 125 192/ 375 (16/ 3)2 (12/ 125)17/ 3 3/ 125 51/ 375 (17/ 3)2 (3/ 125)18/ 3 10/ 125 180/ 375 (18/ 3)2 (10/ 125)20/ 3 6/ 125 120/ 375 (20/ 3)2 (6/ 125)22/ 3 3/ 125 66/ 375 (22/ 3)2 (3/ 125)24/ 3 1/ 125 24/ 375 (24/ 3)2 (1/ 125)

Soma 1575/ 375 22305/ (9 × 125)

Page 30: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 30/189

Page 31: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 31/189

CAPÍTULO 1. INFERÊNCIA ESTATÍSTICA - CONCEITOS BÁSICOS 26

∆ Pr( ∆ = x) Cálculo deE (∆ ) Cálculo deV ar(∆ )x p p · x E (∆ 2)

2/ 2 1/ 125 2/ 250 (2/ 2)2 (1/ 125)3/ 2 6/ 125 18/ 250 (3/ 2)2 (6/ 125)

4/ 2 1/ 125 4/ 250 (4/ 2)2

(1/ 125)5/ 2 12/ 125 60/ 250 (5/ 2)2 (12/ 125)6/ 2 6/ 125 36/ 250 (6/ 2)2 (6/ 125)7/ 2 18/ 125 126/ 250 (7/ 2)2 (18/ 125)8/ 8 13/ 125 104/ 250 (8/ 2)2 (13/ 125)9/ 2 24/ 125 216/ 250 (9/ 2)2 (24/ 125)10/ 2 24/ 125 240/ 250 (10/ 2)2 (24/ 125)12/ 2 13/ 125 156/ 250 (12/ 2)2 (13/ 125)14/ 2 6/ 125 84/ 250 (14/ 2)2 (6/ 125)16/ 2 1/ 125 16/ 250 (16/ 2)2 (1/ 125)

Soma 1062/ 250 9952/ (4 × 125)Logo,

E (∆ ) =1062250

= 4 , 248

eV ar(∆ ) =

99524 × 125 −(4, 248)2 = 1 , 858496

Na tabela a seguir apresentamos o resumo dos resultados obtidos.

Parâmetro Estimador

populacional X X p ∆Média μ = 4 , 2 4, 2000 4, 2000 4, 2480Variância σ2 = 6 , 56 2, 1867 2, 4600 1, 8585

Conclui-se queX e X p são estimadores não-viesados deμ e queX é mais e cienteque X p, uma vez queV ar(X ) < V ar (X p).

O estimador∆ é viesado, poisE (∆ ) 6= μ. No entanto, a variância desse estimador émenor que as variâncias dos dois estimadores não-viesados. À vezes, na prática, podemostrabalhar com estimadores viesados com variância pequena, desde que o viés não sejamuito grande.

Page 32: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 32/189

Capítulo 2

Distribuição Amostral da Média

Neste capítulo você irá aprofundar seus conhecimentos sobre a distribuição amostral damédia amostral. No capítulo anterior analisamos, através de alguns exemplos, o com-portamento da média amostral; mas naqueles exemplos, a população era pequena e foipossível obter todas as amostras, ou seja, foi possível obter a distribuição amostral ex-ata. Veremos agora resultados teóricos sobre a distribuição amostral da média amostral,que nos permitirão fazer análises sem ter que listar todas as amostras.

Os principais resultados que estudaremos são:

• média e variância da distribuição amostral da média

• distribuição amostral da média para populações normais

• Teorema Limite Central

• distribuição amostral da variância amostral

2.1 Média e variância da distribuição amostral damédia

No capítulo anterior, vimos, através de exemplos, que a média amostralX é um esti-mador não-viesado da média populacionalμ. Na verdade, temos o seguinte resultadogeral.

Teorema 2.1 Seja X 1, X 2, . . . , X n uma amostra aleatória simples de tamanho n de uma população representada pela variável aleatória X com média μ e variância σ2. Então,

E (X ) = μ (2.1)

V ar(X ) =σ2

n(2.2)

27

Page 33: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 33/189

Page 34: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 34/189

Page 35: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 35/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 30

então, X 1, . . . , X 7 uma amostra aleatória simples de tamanhon = 7 . Se o peso máximoé 500, para que 7 pessoas ultrapassem o limite de segurança temos que ter

7

Pi=1

X i > 500⇒

17

7

Pi=1

X i >5007 ⇒

X > 71, 729

Mas, pelo Teorema 2.2, sabemos que

X ∼

N µ70;1007 ¶

Logo,

Pr( X > 71, 729) = Pr ⎛⎝

X −70

q 100

7

>71, 729 −70

q 100

7

⎞⎠

= Pr( Z > 0, 46) = 0 , 5 −tab(0, 46) = 0, 5 −0, 17724 = 0, 32276Com 6 pessoas teríamos que ter

Pr µX >5006 ¶= Pr ⎛

⎝Z >

83.333−70

q 1006

⎞⎠

= Pr( Z > 3, 27) = 0 , 5 −tab(3, 27)= 0 .5 −0.49946 = 0, 00054

Podemos ver que existe uma probabilidade alta (0,32 ou 32% de chance) de 7 pessoasultrapassarem o limite de segurança. Já com 6 pessoas, essa probabilidade é bastantepequena. Assim, o número máximo de pessoas no elevador deve ser estabelecido como6 ou menos.

Exemplo 2.2 Uma variável aleatória X tem distribuição normal com média 100 e desvio padrão 10.

1. Calcule Pr(90 < X < 110)

2. Se X é a média de uma amostra aleatória simples de 16 elementos retirados dessa

população, calcule Pr(90 < X < 110).3. Construa, num único sistema de coordenadas, os grá cos das distribuições de X e

X.

4. Que tamanho deveria ter a amostra para que Pr(90 < X < 110) = 0 , 95?

Solução

Page 36: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 36/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 31

1.

Pr(90 < X < 110) = Pr µ90 −10010

< Z <110 −100

10 ¶= Pr( −1 < Z < 1)

= 2 × Pr(0 < Z < 1)= 2 × tab(1, 0) = 0 , 68268

2. Comn = 16 , resulta queX ∼

N ¡100; 10016 ¢

Pr(90 < X < 110) = Pr ⎛⎝

90 −100

q 10016

< Z <110 −100

q 10016

⎞⎠

= Pr( −4 < Z < 4)= 2 × Pr(0 < Z < 4)= 2 × tab(4, 0) ≈1, 00

3. Veja a Figura 2.2 . Como visto, a distribuição amostral comn = 16 é menosdispersa que a distribuição populacional e aí podemos ver que, entre 90 e 110,temos concentrada praticamente toda a distribuição deX.

0,00

0,02

0,04

0,06

0,08

0,10

0,12

0,14

0,16

0,18

60 70 80 90 100 110 120 130 140

N(100,100)

N(100,100/16)

Figura 2.2: Distribuição amostral deX com base em amostras de tamanhon = 16 deuma populaçãoN (100; 100)

Page 37: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 37/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 32

4. Queremos quePr(90 < X < 110) = 0 , 95, ou seja

Pr(90 < X < 110) = 0 , 95⇐⇒

Pr⎛

90 −100

q 100n

< Z <110 −100

q 100n

= 0 , 95

⇐⇒Pr( −√ n < Z < √ n) = 0 , 95

⇐⇒2 × Pr(0 < Z < √ n) = 0 , 95

⇐⇒2 × tab(√ n) = 0 , 95

⇐⇒tab(√ n) = 0 , 475

⇐⇒√ n = 1 , 96⇐⇒

n ≈4

A título de ilustração, apresentam-se naFigura 2.3 as distribuições amostrais deX para n = 16 e n = 4 .

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0,18

60 70 80 90 100 110 120 130 140

N(100;100/4)

N(100;100/16)

Figura 2.3: Distribuição amostral deX com base em amostras de tamanhosn = 16 en = 4 de uma populaçãoN (100; 100)

Exemplo 2.3 A máquina de empacotar um determinado produto o faz segundo uma distribuição normal, com média μ e desvio padrão 10 g.

1. Em quanto deve ser regulado o peso médio μ para que apenas 10% dos pacotes tenham menos do que 500 g?

2. Com a máquina assim regulada, qual a probabilidade de que o peso total de 4pacotes escolhidos ao acaso seja inferior a 2 kg?

Page 38: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 38/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 33

Solução

1. SejaX a variável aleatória que representa o peso dos pacotes. Sabemos, então,que X

∼N (μ; 100). Queremos que

Pr( X < 500) = 0, 10⇒Pr µX −μ

10<

500−μ10 ¶= 0 , 10

Pr µZ <500−μ

10 ¶= 0 , 10

Então, na densidade normal padrão, à esquerda da abscissa500−μ10 temos que ter

uma área (probabilidade) de 0,10. Logo, essa abscissa tem que ser negativa. U-sando a simetria da densidade normal temos as seguintes equivalências:

Pr µZ <500

−μ

10 ¶= 0 , 10⇐⇒Pr µZ > −

500−μ10 ¶= 0 , 10

⇐⇒

Pr µZ >μ −500

10 ¶= 0 , 10⇐⇒

Pr µ0 ≤Z ≤μ −500

10 ¶= 0 , 40⇐⇒

tabµμ −50010 ¶= 0 , 40

⇐⇒

μ −50010

= 1 , 28⇐⇒

μ = 512, 8 g

Veja a Figura 2.4 onde são ilustradas essas equivalências.

2. SejamX 1,X 2, X 3, X 4 os pesos dos 4 pacotes da amostra. Queremos que4

Pi=1X i <

2000g. Isso é equivalente aX < 500. Logo,

Pr( X < 500) = Pr⎛⎝

X

−512, 8

q 1004

<500

−512, 8

q 1004 ⎞⎠

= Pr( Z < −2, 56)= Pr( Z > 2, 56)= 0 , 5 −Pr(0 ≤Z ≤2, 56)= 0 , 5 −tab(2, 56)= 0 , 5 −0, 49477= 0 , 00523

Page 39: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 39/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 34

Figura 2.4: Solução do Exemplo 3

Com a máquina regulada para 512,8g, há uma probabilidade de 0,00523 de queuma amostra de 4 pacotes apresente peso médio inferior a 500g. Note que comum pacote apenas, essa probabilidade é de 10%. Por isso, as inspeções de controlede qualidade são sempre feitas com base em amostras de tamanhon > 1.

2.3.1 Lista de Exercícios 11. Os comprimentos das peças produzidas por determinada máquina têm distribuiçãonormal com uma média de 172 mm e desvio padrão de 5 mm. Calcule a probabi-lidade de uma amostra aleatória simples de 16 peças ter comprimento médio

(a) entre 169 mm e 175 mm;(b) maior que 178 mm;(c) menor que 165 mm.

2. Qual deverá ser o tamanho de uma amostra aleatória simples a ser retirada deuma populaçãoN (150; 132) para quePr(¯̄X −μ¯̄< 6, 5) = 0 , 95?

2.4 Teorema Limite CentralOs resultados vistos anteriormente são válidos para populações normais, isto é, se umapopulação é normal com médiaμ e variânciaσ2, então a distribuição amostral deX é também normal com médiaμ e variânciaσ2/n , onden é o tamanho da amostra. O

Page 40: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 40/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 35

teorema limite central que veremos a seguir nos fornece um resultado análogo para qual-quer distribuição populacional, desde que o tamanho da amostra seja su cientementegrande.

Teorema 2.3Seja X 1, X 2, . . . , X n uma amostra aleatória simples de uma população X tal que

E (X ) = μ e V ar(X ) = σ2. Então, a distribuição de X converge para a distribuiçãonormal com média μ e variância σ2/n quando n → ∞. Equivalentemente,

X −μσ

√ n −→N (0, 1)

A interpretação prática do teorema limite central é a seguinte: para amostras “grandes”de qualquer população, podemos aproximar a distribuição amostral deX por uma dis-tribuição normal com a mesma média populacional e variância igual à variância popu-lacional dividida pelo tamanho da amostra.Quão grande deve ser a amostra para se obter uma boa aproximação depende das ca-racterísticas da distribuição populacional. Se a distribuição populacional não se afastarmuito de uma distribuição normal, a aproximação será boa, mesmo para tamanhos pe-quenos de amostra. NaFigura 2.5 ilustra-se esse teorema para a distribuição exponen-cial, ou seja, para uma população distribuída segundo uma exponencial com parâmetroλ = 1 . O grá co superior representa a distribuição populacional e os histogramas repre-sentam a distribuição amostral deX ao longo de 5000 amostras de tamanhos 10, 50, 100e 250. Assim, podemos ver que, embora a população seja completamente diferente danormal, a distribuição amostral deX vai se tornando cada vez mais próxima da normal

à medida quen aumenta.Em termos práticos, esse teorema é de extrema importância, daí ser chamado deteorema central e, em geral, amostras de tamanhon > 30 já fornecem uma aproximaçãorazoável.

Exemplo 2.4 Uma moeda é lançada 50 vezes, com o objetivo de se veri car sua ho-nes-tidade. Se ocorrem 36 caras nos 50 lançamentos, o que podemos concluir?

SoluçãoNeste caso, a população pode ser representada por uma variável de BernoulliX

com parâmetrop, isto é, X assume o valor 1 com probabilidadep na ocorrência de

cara e assume o valor 0 com probabilidade1 − p na ocorrência de coroa. Para umavariável Bernoulli, temos queE (X ) = p e V ar(X ) = p(1 − p). Como são feitos 50lançamentos, o tamanho da amostra é 50 (n grande!) e, pelo teorema limite central,X é aproximadamente normal com médiaE (X ) = p e variânciaV ar(X ) = p(1− p)

50 .Suponhamos que a moeda seja honesta, isto é, quep = 1 / 2. Nestas condições,

qual é a probabilidade de obtermos 36 caras em 50 lançamentos? Com a hipótese dehonestidade da moeda, o teorema limite central nos diz que

X ≈N µ12

;12 × 1

2

50 ¶

Page 41: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 41/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 36

n=10

0

200

400

600

800

1000

1200

1400

1600

1800

0,261 0,761 1,261 1,761 2,261

F r e q u e n c y

n=50

0

200

400

600

800

1000

1200

1400

1600

0,604 0,804 1,004 1,204 1,404 1,604

F r e q u e n c y

n=100

0

200

400

600

800

1000

1200

1400

0,690 0,790 0,890 0,990 1,090 1,190 1,290

F r e q u e n c y

n=250

0

200

400

600

800

1000

1200

1400

1600

0 ,8 04 0 ,8 54 0 ,9 04 0 ,9 54 1 ,0 04 1 ,0 54 1 ,1 04 1 ,1 54 1 ,2 04

F r e q u e n c y

Distribuição exponencial com média 1

0,0

0,2

0,4

0,6

0,8

1,0

1,2

0 1 2 3 4 5 6 7

Figura 2.5: Ilustração do Teorema Limite Central para uma populaçãoX ∼

exp(1)

Page 42: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 42/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 37

A probabilidade de se obter 36 ou mais caras em 50 lançamentos é equivalente àprobabilidade deX ser maior ou igual a36

50 = 0 , 72 e essa probabilidade é

Pr( X ≥ 0, 72) = Pr ⎛

X −0, 5√ 200 ≥

0, 72 −0, 5

q 1

200

⎠= Pr( Z ≥3, 11) = 0 , 5 −Pr(0 ≤Z < 3, 11) == 0 , 5 −tab(3, 11) = 0 , 5 −0, 49906 = 0, 00094

Note que essa probabilidade é bastante pequena, ou seja, há uma pequena probabilidadede obtermos 36 ou mais caras em um lançamento de uma moeda honesta. Isso pode noslevar a suspeitar sobre a honestidade da moeda!

2.4.1 Lista de Exercícios 21. O fabricante de uma lâmpada especial a rma que o seu produto tem vida média

de 1600 horas, com desvio padrão de 250 horas. O dono de uma empresa compra100 lâmpadas desse fabricante. Qual é a probabilidade de que a vida média dessaslâmpadas ultrapasse 1650 horas?

2.5 Distribuição amostral da variância amostralNo capítulo anterior, consideramos dois estimadores para a variância:S 2 e

bσ2. Através

de um exemplo, vimos quebσ2 é um estimador viesado. Vamos demonstrar agora queS 2é não-viesado para estimar a variância de uma população qualquer.

Teorema 2.4 Seja X 1, X 2, . . . , X n uma amostra aleatória simples extraída de uma pop-ulação com N elementos e variância populacional

σ2 =1N

N

Pi=1(X i −μ)2

onde μ = 1N

N

Pi=1

X i é a média (esperança) populacional. Então S 2 = 1n−1

n

Pi=1

(X i −X )2 é

um estimador não viesado para estimar σ2.

Page 43: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 43/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 38

n

Pi=1(X i −X )2 =

n

Pi=1(X i −μ + μ −X )2 =

n

Pi=1 £(X i −μ) −¡X −μ¢¤2

=n

Pi=1

(X i

−μ)2 +

n

Pi=1

¡X

−μ

¢2

−2

n

Pi=1

(X i

−μ)

¡X

−μ

¢=n

Pi=1(X i −μ)2 + n¡X −μ¢2

−2¡X −μ¢n

Pi=1(X i −μ)

=n

Pi=1(X i −μ)2 + n¡X −μ¢2

−2¡X −μ¢µn

Pi=1X i −nμ¶

=n

Pi=1(X i −μ)2 + n¡X −μ¢2

−2¡X −μ¢¡nX −nμ¢=

n

Pi=1(X i −μ)2

−n¡X −μ¢2

Daí segue que

E (S 2) = E · 1n −1

n

Pi=1(X i −X )2¸=

1n −1

E · n

Pi=1(X i −μ)2

−n¡X −μ¢2¸=

1n −1 ·

n

Pi=1E (X i −μ)2

−nE ¡X −μ¢2¸Mas como μ = E (X i) = E (X ) e E (X i −μ)2 = V ar(X i) = σ2 e E ¡X −μ¢2

= V ar(X )resulta que

E (S 2

) =1

n −1 ·n

Pi=1 V ar(X i) −nV ar (X )¸=1

n −1µn

Pi=1σ2 −n

σ2

n ¶=

1n −1¡nσ 2 −σ2¢= σ2

e isso completa a prova.

Teorema 2.5 Se X 1, X 2, . . . , X n é uma amostra aleatória simples extraída de uma po-pulação X ∼N (μ; σ2) então

V ar(S 2) =2σ4

n −1

2.6 Resumo do CapítuloNeste capítulo, foram estudadas propriedades da média amostralX e da variânciaamostral S 2. Ao nal, você deverá ser capaz de compreender perfeitamente os seguintesresultados:

Page 44: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 44/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 39

• Dada uma amostra aleatória simples com reposiçãoX 1, X 2, . . . , X n de uma pop-ulaçãoX com médiaμ e variânciaσ2, a média amostralX é um estimador não-viesado deμ com variância igual à variância populacional dividida pelo tamanhoamostral n, isto é:

E (X ) = μV ar(X ) =

σ2

n

e a variância amostralS 2 é um estimador não viesado para estimarσ2, isto é

E (S 2) = σ2

• O desvio padrão da distribuição amostral de qualquer estatística é usualmentechamado deerro padrão . Então, o erro padrão da média amostral éEP (X ) = σ

√ n

• Nas condições anteriores e com a hipótese adicional de a populaçãoX ser normal,a distribuição amostral deX também é normal, isto é:

X ∼

N ¡μ; σ2¢=⇒

X ∼

N µμ;σ2

n ¶e

V ar(S 2) =2σ4

n −1

• O teorema limite central é um dos mais importantes teoremas da teoria inferencial.Ele nos dá informações sobre a dsitribuição amostral deX para amostrasgrandes de qualquer população. Mais precisamente, seX 1, X 2, . . . , X n é uma amostraaleatória simples de uma populaçãoX tal que E (X ) = μ e V ar(X ) = σ2, entãoa distribuição deX converge para a distribuição normal com médiaμ e variânciaσ2/n quando n → ∞. Equivalentemente,

X −μσ

√ n −→N (0, 1)

ou√ n X −μ

σ −→N (0, 1)

2.7 Exercícios1. Uma amostra de tamanhon = 18 é extraída de uma população normal com média

15 e desvio padrão 2,5. Calcule a probabilidade de que a média amostral

(a) esteja entre 14,5 e 16,0;(b) seja maior que 16,1.

Page 45: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 45/189

Page 46: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 46/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 41

(c) Se a máquina se desregulou de modo que o comprimento médio passou a ser9,5 cm, qual é a probabilidade de se continuar o processo de produção forados padrões desejados?

6. A divisão de inspeção do Departamento de Pesos e Medidas de uma determinada

cidade está interessada em calcular a real quantidade de refrigerante que é colocadaem garrafas de 2 litros, no setor de engarrafamento de uma grande empresa derefrigerantes. O gerente do setor de engarrafamento informou à divisão de inspeçãoque o desvio padrão para garrafas de 2 litros é de 0,05 litro. Uma amostra aleatóriade 100 garrafas de 2 litros, obtida deste setor de engarrafamento, indica uma médiade 1,985 litro. Qual é a probabilidade de se obter uma média amostral de 1,985ou menos, caso a a rmativa do gerente esteja certa? O que se pode concluir?

2.8 Solução das Listas de Exercícios

Lista de Exercícios 1

1. SejaX = comprimento das peças; entãoX ∼

N (172; 25) e n = 16

(a)

Pr(169 ≤ X ≤175) = Pr ⎛⎝

169 −172

q 2516

≤X −172

q 2516

≤175−172

q 2516

⎞⎠

= Pr( −2, 4 ≤Z ≤2, 4) = 2 × Pr(0 ≤Z ≤2, 4)

= 2 × tab(2, 4) = 2 × 0, 4918 = 0, 9836

(b)

Pr( X > 178) = Pr ⎛⎝

Z >178 −172

q 2516

⎞⎠

= Pr( Z > 4, 8) ≈0

(c)

Pr( X < 165) = Pr ⎛⎝

Z <165 −172

q 2516

⎞⎠

= Pr( Z < −5, 6) ≈0

Page 47: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 47/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 42

2. Temos queX ∼

N (150; 132) e queremos determinarn para que Pr(¯̄X −μ¯̄<6, 5) = 0 , 95.

Pr(¯¯X −150¯

¯< 6, 5) = 0 , 95

⇐⇒Pr(

−6, 5 < X

−150 < 6, 5) = 0 , 95

⇐⇒Pr Ã−6, 5

13√ n

<X −150

13√ n

<6, 5

13√ n != 0 , 95

⇐⇒

Pr( −0, 5√ n < Z < 0, 5√ n) = 0 , 95⇐⇒

2 × Pr(0 < Z < 0, 5√ n) = 0 , 95⇐⇒

Pr(0 < Z < 0, 5√ n) = 0 , 475⇐⇒

tab(0, 5√ n) = 0 , 475⇐⇒

0, 5√ n = 1 , 96⇐⇒

√ n =1, 96

0, 5= 3 , 92

⇐⇒n = (3 , 92)2 ≈16

Lista de Exercícios 2

1. Podemos aceitar que as 100 lâmpadas compradas sejam uma amostra aleatóriasimples da população referente às lâmpadas produzidas por esse fabricante. Comon = 100 é um tamanho su cientemente grande de amostra, podemos usar o teo-rema limite central , que nos diz queX ≈N ³1600; 2502

100 ´. Logo

Pr( X > 1650) = Pr ⎛⎝

X −1600

q 2502

100

>1650 −1600

q 2502

100⎞⎠

= Pr( Z > 2, 0)= 0 , 5 −Pr(0 ≤Z ≤2)= 0 , 5 −tab(2, 0)= 0 , 5 −0, 47725 = 0, 02275

2.9 Solução dos Exercícios

1. X ∼

N ³15; 2,52

18 ´

Page 48: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 48/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 43

(a)

Pr(14 , 5 ≤X ≤16) = Pr ⎛⎝

14, 5 −15

q 2,52

18≤Z ≤

16 −15

q 2,52

18

⎞⎠

= Pr( −0, 85 ≤Z ≤1, 70)= Pr( −0, 85 ≤Z ≤0) + Pr(0 < Z ≤1, 70)= Pr(0 ≤Z ≤0, 85) + Pr(0 ≤Z ≤1, 70)= tab(0, 85) + tab(1, 70) = 0, 75777

(b)

Pr( X > 16, 1) = Pr ⎛

Z >16, 1 −15

q 2,52

18

⎠= Pr( Z > 1, 87)= 0 , 5 −Pr(0 ≤Z ≤1, 87)= 0 , 5 −tab(1, 87) = 0, 03074

2. X ∼

N (512, 8;100)

(a) Parada desnecessária: amostra indica que o processo está fora de controle(X < 497 ou X > 520), quando, na verdade, o processo está ajustado (μ =512, 8). Neste caso, podemos usar a notação de probabilidade condicional

para auxiliar na solução do exercício. Queremos calcularPr £¡X < 497¢∪¡X > 520¢| X

∼N ¡512, 8; 100

4 ¢¤== Pr £X < 497 | X

∼N (512, 8; 25)¤+ Pr £X > 520 | X

∼N (512, 8;25)¤

= Pr µZ <497−512, 8

5 ¶+ Pr µZ >520−512, 8

5 ¶= Pr( Z < −3, 16) + Pr( Z > 1, 44)= Pr( Z > 3, 16) + Pr( Z > 1, 44)= [0, 5 −Pr(0 ≤Z ≤3, 16)] + [0, 5 −Pr(0 ≤Z ≤1, 44)]= 0 , 5

−tab(3, 16) + 0 , 5

−tab(1, 44)

= 1 , 0 −0, 49921−0, 42507= 0 , 07572

Page 49: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 49/189

Page 50: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 50/189

Page 51: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 51/189

Page 52: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 52/189

CAPÍTULO 2. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 47

quando, na verdade, o processo está sob controle (μ = 10, 14).

Pr ·X < 9 | X ∼

N µ10, 14;14¶¸

= Pr µZ <

9

−10, 14

0, 5 ¶= Pr( Z < −2, 28)= Pr( Z > 2, 28)= 0 , 5 −Pr(0 ≤Z ≤2, 28)= 0 , 5 −tab(2, 28)= 0 , 5 −0, 4887 = 0, 0113

(c) Máquina desregulada:X > 9; processo operando sem ajuste:X ∼

N (9, 5;1)

Pr ·X > 9 | X ∼N µ9, 5;14¶¸= Pr µZ >

9 −9, 50, 5 ¶

= Pr( Z > −1)= Pr( −1 < Z < 0) + Pr( Z ≥0)= Pr(0 < Z < 1) + Pr( Z ≥0)= tab(1, 0) + 0 , 5= 0 , 841314

6. A rmativa do gerente:μ = 2 e σ = 0 , 05. Comon = 100, podemos usar o teoremalimite central . Logo,X ≈N ³2; 0,052

100 ´.

Pr( X ≤ 1, 985) = Pr ÃZ ≤1, 985−2

0,0510

!= Pr( Z ≤ −3, 0)= Pr( Z ≥3, 0)= 0 , 5 −tab(3, 0)

= 0 , 5 −0, 49865 = 0, 00135A probabilidade de se obter esse valor nas condições dadas pelo gerente é muitopequena, o que pode nos fazer suspeitar da veracidade das a rmativas. É provávelque, ou a média não seja 2 (e, sim, menor que 2), ou o desvio padrão não seja 0,05(e, sim, maior que 0,05). Esboce grá cos da normal para compreender melhor essecomentário!

Page 53: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 53/189

Capítulo 3

Distribuição Amostral da Proporção

Neste capítulo você verá uma importante aplicação do Teorema Limite Central: iremosestudar a distribuição amostral de proporções. Assim, você verá os resultados referentesà aproximação da distribuição binomial pela distribuição normal, que nos permitirá fazerinferência sobre proporções.

Você verá os seguintes resultados:

• aproximação da binomial pela normal

• correção de continuidade

• distribuição amostral da proporção amostral

3.1 Aproximação normal da distribuição binomialNo capítulo anterior, vimos o Teorema Limite Central, que trata da distribuição damédia amostralX quando n → ∞. Esse teorema nos diz que, seX é uma populaçãocom médiaμ e variânciaσ2, então a distribuição amostral da média de uma amostraaleatória simples de tamanhon se aproxima de uma distribuição normal com médiaμe variânciaσ 2

n quando n → ∞.Usando as propriedades da média e da variância, podemos estabelecer esse teoremaem termos deS n =

n

Pi=1

X i , em vez deX. Como S n = nX, então E (S n ) = nE (X ) e

V ar(S n ) = n2V ar(X ) e isso nos dá o seguinte resultado.

Teorema 3.1Seja X 1, X 2, . . . , X n uma amostra aleatória simples de uma população X tal que

E (X ) = μ e V ar(X ) = σ2. Então, a distribuição de S n =n

Pi=1X i converge para a

distribuição normal com média nμ e variância nσ 2 quando n → ∞.

48

Page 54: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 54/189

CAPÍTULO 3. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 49

A variável aleatória binomial foi de nida como “número de sucessos emn repetiçõesindependentes de um experimento de Bernoulli com parâmetrop”. Então, uma variávelbinomial é a soma den variáveis independentesBern ( p). Pelo teorema acima e usandoo fato de que seX

∼Bern ( p) então E (X ) = p e V ar(X ) = p(1− p), podemos dizer que

a distribuição binomial com parâmetrosn e p se aproxima de uma normal com médianp e variâncianp(1 − p) quando n → ∞.Alguns cuidados devem ser tomados na aproximação da binomial pela normal. Umfato importante a observar é que a distribuição binomial é discreta, enquanto a var-iável normal é contínua. Veja aFigura 3.1 . Aí o histograma representa uma variávelaleatóriaX com distribuição binomial comn = 12 e p = 0 , 5. OS retângulos, centradosnos possíveis valores deX, têm base 1 e altura igual aPr( X = k), de modo que a área decada retângulo é igual aPr( X = k). A curva normal aí representada é de uma variávelaleatóriaY com médiaμ = 12 × 0, 5 = 6 e variânciaσ2 = 12 × 0, 5 × 0, 5 = 3.

0,00

0,05

0,10

0,15

0,20

0,25

0 1 2 3 4 5 6 7 8 9 10 11 12

Figura 3.1: Aproximação normal da distribuição binomial

Suponha que queiramos calcularPr( X ≥ 8). Isso equivale a somar as áreas dos 4últimos retângulos superiores. Pela aproximação normal, no entanto, temos que calculara área (probabilidade) acima do ponto 7,5, de modo a incluir os 4 retângulos. Assim,

Pr( X ≥8) ≈Pr( Y ≥7, 5) = Pr µY −6√ 3 ≥ 7, 5 −6√ 3 ¶= Pr( Z ≥0, 87)= 0 , 5 −tab(0, 87)= 0 , 5 −0, 30785= 0 , 19215

O valor exato, calculado pela distribuição binomial, éPr( X ≥8) = 0 , 1938.

Page 55: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 55/189

CAPÍTULO 3. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 50

Vamos, agora, calcularPr( X > 10). Isso equivale à área dos 2 retângulos superiores,centrados em 11 e 12 (este último não é visível, poisPr( X = 12) = 0 , 000244); logo,pela distribuição normal temos que calcularPr( Y ≥10, 5) :

Pr( X > 10)

≈Pr( Y

≥10, 5) = Pr

µY −6

√ 3 ≥10 −6

√ 3 ¶= Pr( Z ≥2, 31)= 0 , 5 −tab(2, 31)= 0 , 5 −0, 48956= 0 , 01044

Se queremosPr( X < 5), isso equivale às áreas dos 4 retângulos inferiores e, portanto

Pr( X < 5) ≈Pr( Y ≤4, 5) = Pr µY −6√ 3 ≥

5 −6√ 3 ¶

= Pr( Z ≥ −0, 58)= Pr( Z ≥0, 58)= 0 , 5 −tab(0, 58)= 0 , 5 −0, 21904= 0 , 28096

Se queremosPr(4 ≤X < 8), temos a seguinte aproximação:

Pr(4 ≤ X < 8) ≈Pr(3 , 5 ≤Y ≤7, 5)

= Pr µ3, 5

−6

√ 3 ≤Z ≤7, 5

−6

√ 3 ¶= Pr( −1, 44 ≤Z ≤0, 87)= Pr( −1, 44 ≤Z ≤0) + Pr(0 ≤Z ≤0, 87)= Pr(0 ≤Z ≤1, 44) + Pr(0 ≤Z ≤0, 87)= tab(1, 44) + tab(0, 87)= 0 , 42507 + 0, 30785= 0 , 73292

É interessante observar que para uma variável binomial faz sentido calcularPr( X =k); no caso da normal, essa probabilidade é nula, qualquer que sejak. Para usar aaproximação normal para calcular, por exemplo,Pr( X = 5) , devemos notar que essaprobabilidade equivale à área do retângulo centrado em 5 e, em termos da curva normal,

Page 56: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 56/189

CAPÍTULO 3. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 51

temos que calcular a área compreendida entre 4,5 e 5,5:

Pr( X = 5) ≈Pr(4 , 5 ≤Y ≤5, 5)

= Pr

µ4, 5 −6

√ 3 ≤Z ≤5, 5 −6

√ 3

¶= Pr( −0, 87 ≤Z ≤ −0, 29)= Pr(0 , 29 ≤Z ≤0, 87)= tab(0, 87) −tab(0, 29)= 0 , 30785 −0, 11409= 0 , 19376

e o valor exato é 0,193359.Esses procedimentos são chamados decorreção de continuidade e na Figura 3.2

ilustra-se o procedimento geral; lembre-se que o centro de cada retângulo é o valor davariável binomial.

A aproximação dada pelo teorema limite central é melhor para valores grandes den.Existe a seguinte regra empírica para nos ajudar a decidir o que é “grande”:

A distribuição binomial com parâmetros n e p pode ser aproximada por uma dis-tribuição normal com média μ = np e variância σ2 = np(1 − p) se são satisfeitas as seguintes condições:

1. np ≥5

2. n(1 − p)≥5

3.1.1 Lista de Exercícios 1Em cada um dos exercícios abaixo, veri que que as condições para aproximação da bino-mial pela normal são satisfeitas e calcule a probabilidade pedida usando a aproximaçãonormal.

1. X ∼

bin(18;0, 4); Pr( X ≥15) e Pr( X < 2)

2. X ∼bin(40;0, 3); Pr( X < 10) e Pr(25 < X < 28)3. X ∼

bin(65;0, 9); Pr( X = 58) e Pr(60 < X ≤63)

4. X ∼

bin(100; 0, 2); Pr(25 ≤X ≤35)

5. X ∼

bin(50;0, 2); Pr( X > 26) e Pr(5 ≤X < 10)

Page 57: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 57/189

CAPÍTULO 3. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 52

Figura 3.2: Correção de continuidade para a aproximação normal da binomial(a) Pr( X = k) (b) Pr( X ≤k) (c) Pr( X < k ) (d) Pr( X ≥k) (e) Pr( X > k )

Page 58: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 58/189

CAPÍTULO 3. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 53

3.2 A distribuição amostral da proporçãoConsidere uma população em que cada elemento é classi cado de acordo com a presençaou ausência de determinada característica. Por exemplo, podemos pensar em eleitoresescolhendo entre 2 candidatos, pessoas classi cadas de acordo com o sexo, trabalhadores

classi cados como trabalhador com carteira assinada ou não, e assim por diante. Emtermos de variável aleatória, essa população é representada por uma variável aleatóriade Bernoulli, isto é:

X = ½1 se elemento possui a característica de interesse0 se elemento não possui a caracaterística de interesse

Vamos denotar porp a proporção de elementos da população que possuem a carac-terística de interesse. Então,Pr( X = 1) = p, E (X ) = p e V ar(X ) = p(1 − p). Em geral,esse parâmetro é desconhecido e precisamos estimá-lo a partir de uma amostra.

Suponha, então, que dessa população seja extraída uma amostra aleatória simples

X 1, X 2, . . . , X n com reposição. Essasn extrações correspondem an variáveis aleatóriasde Bernoulli independentes e, como visto,S n =

n

Pi=1X i tem distribuição binomial com

parâmetros n e p. Note queS n dá o número total de “sucessos” nasn repetições, onde“sucesso”, neste caso, representa a presença da característica de interesse. Os valorespossíveis deS n são 0, 1, 2, . . . , n . Com relação à proporçãobP de elementos na amostraque possuem a característica de interesse, temos que

bP =S nn

=X 1 + X 2 + · · · + X n

n(3.1)

e os valores possíveis de

bP são 0, 1

n, 2

n, . . . , n−1

n, 1 com

Pr µ bP =kn¶= Pr( S n = k) (3.2)

Analisando a expressão (3.1), podemos ver quebP nada mais é que a média amostraldeX i∼Bern ( p), i = 1 , . . . , n . Logo, o Teorema 2.1 se aplica comE (X ) = p e V ar(X ) = p(1 − p),ou seja:

E (

bP ) = p

V ar(

bP ) =

p(1 − p)

nVemos, então, que a proporção amostral é um estimador não-viesado da proporçãopopulacionalp. A distribuição exata é dada pela expressão (3.2).

Como a proporção amostral é uma média de uma amostra aleatória simples de umapopulação com distribuição de Bernoulli com parâmetrop, o Teorema Limite Centralnos diz, então, que a distribuição da proporção amostral se aproxima de uma nornalcom médiap e variânciap(1− p)

n . Como essa aproximação é uma conseqüência direta daaproximação normal da binomial, as mesmas regras continuam valendo: a aproximaçãodeve ser feita senp ≥5 e n(1 − p) ≥5.

Page 59: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 59/189

CAPÍTULO 3. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 54

Exemplo 3.1 De um lote de produtos manufaturados, extrai-se uma amostra aleatória simples de 100 itens. Se 10% dos itens do lote são defeituosos, calcule a probabilidade de serem sorteados no máximo 12 itens defeituosos.

SoluçãoAs condições para utilização da aproximação normal são válidas: comn = 100 e

p = 0 , 1 temos que100 × 0, 1 = 10 > 5100 × 0, 9 = 9 > 5

Seja X = “número de itens defeituosos na amostra”. Então,X ∼

bin(100; 0, 1) eX ≈ N (10;9). Queremos calcularPr( X ≤ 12). Usando a correção de continuidade edenotando porY uma variável aleatóriaN (10;9), temos que

Pr( X ≤ 12) ≈Pr( Y ≤12, 5)

= Pr µZ ≤12, 5

−10

√ 9 ¶= Pr( Z ≤0, 83)= 0 , 5 + tab(0, 83)= 0 , 79673

O valor exato éPr( X ≤12) = 0 , 802.

3.2.1 Lista de Exercícios 2Acon abilidade de um componente é a probabilidade de que ele funcione sob as condiçõesdesejadas. Uma amostra aleatória simples de 1000 desses componentes é extraída e cadacomponente testado. Calcule a probabilidade de obtermos pelo menos 30 itens defeitu-osos supondo que a con abilidade do item seja

1. 0,995

2. 0,85

3.3 Resumo do Capítulo

Neste capítulo estudamos dois resultados básicos sobre a distribuiçãobinomial; o primeiroenvolve a aproximação normal e o segundo, a distribuição amostral de proporçõesamostrais. Ao nal, você deve compreender os seguintes resultados.

• Se X ∼

bin(n; p), então probabilidades desta variável podem ser aproximadaspelas probabilidades da distribuiçãoN [np; np(1 − p)] , desde que sejam satisfeitasas seguintes condições:

np ≥ 5n(1 − p) ≥ 5

Page 60: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 60/189

CAPÍTULO 3. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 55

• Na aproximação da binomial pela normal, deve ser usada a correção de con-tinuidade, conforme resumido na tabela a seguir, ondeX

∼bin(n; p) e Y

∼N [np; np(1 − p)] (veja também aFigura 3.2 ):

Binomial Aproximação Normal

Pr( X = k) Pr( k −0, 5 ≤Y ≤k + 0 , 5)Pr( X ≤k) Pr( Y ≤k + 0 , 5)Pr( X < k ) Pr( Y < k + 0 , 5)Pr( X ≥k) Pr( Y ≥k −0, 5)Pr( X > k ) Pr( Y ≥k + 0 , 5)

• Seja uma população descrita pela variável aleatóriaX ∼

Bern ( p). Então, Pr( X =1) = p, Pr( X = 0) = 1 − p, E (X ) = p e V ar(X ) = p(1 − p). Seja X 1, X 2, . . . , X numa amostra aleatória simples desta população. De nindo a proporção amostral

bP =X 1 + X 2 + . . . + X n

n

resulta que

bP ≈N µ p;p(1 − p)

n ¶e essa aproximação pode ser usada senp ≥5 e n(1 − p) ≥5.

3.4 Exercícios

1. Use a aproximação normal para calcular as probabilidades pedidas, tendo o cuidadode veri car que as condições para essa aproximação são realmente satisfeitas.

(a) Pr( X ≤25) se X ∼

bin(50;0, 7)(b) Pr(42 < X ≤56) se X

∼bin(100; 0, 5)

(c) Pr( X > 60) se X ∼

bin(100; 0, 5)(d) Pr( X = 5) se X

∼bin(20;0, 4)

(e) Pr( X ≥12) se X ∼

bin(30;0, 3)(f) Pr(9 < X < 11) se X

∼bin(80;0, 1)

(g) Pr(12 ≤X ≤16) se X ∼bin(30; 0, 2)(h) Pr( X > 18) se X

∼bin(50; 0, 3)

(i) Pr( X = 6) se X ∼

bin(28;0, 2)(j) Pr(30 ≤X < 48) se X

∼bin(95;0, 4)

2. Em uma sondagem, perguntou-se a 1002 membros de determinado sindicato se eleshaviam votado na última eleição para a direção do sindicato e 701 responderama rmativamente. Os registros o ciais obtidos depois da eleição mostram que 61%

Page 61: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 61/189

CAPÍTULO 3. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 56

dos membros aptos a votar de fato votaram. Calcule a probabilidade de que,dentre 1002 membros selecionados aleaoriamente, no mínimo 701 tenham votado,considerando que a verdadeira taxa de votantes seja de 61%. O que o resultadosugere?

3. Supondo que meninos e meninas sejam igualmente prováveis, qual é a probabili-dade de nascerem 36 meninas em 64 partos? Em geral, um resultado é consideradonão-usual se a sua probabilidade de ocorrência é pequena, digamos, menor que0,05. É não-usual nascerem 36 meninas em 64 partos?

4. Com base em dados históricos, uma companhia aérea estima em 15% a taxa dedesistência entre seus clientes, isto é, 15% dos passageiros com reserva não apare-cem na hora do vôo. Para otimizar a ocupação de suas aeronaves, essa companhiadecide aceitar 400 reservas para os vôos em aeronaves que comportam apenas 350passageiros. Calcule a probabilidade de que essa companhia não tenha assen-tos su cientes em um desses vôos. Essa probabilidade é alta o su ciente para acompanhia rever sua política de reserva?

5. No controle de qualidade de produtos, uma técnica comumente utilizada é aamostragem de aceitação . Segundo essa técnica, um lote inteiro é rejeitado secontiver mais do que um número determinado de itens defeituosos. A compan-hia X compra parafusos de uma fábrica em lotes de 5000 e rejeita o lote se umaamostra aleatória simples de 20 parafusos contiver pelo menos 2 defeituosos. Se oprocesso de fabricação tem uma taxa de 10% de defeituosos, qual é a probabilidadede um lote ser rejeitado pela companhia X?

3.5 Solução das Listas de ExercíciosLista de Exercícios 1

1. 18 × 0, 4 = 7, 2 > 518 × 0, 6 = 10, 8 > 5X ≈N (7, 2; 4, 32)

Pr( X ≥ 15) ≈Pr

µZ ≥

14, 5 −7, 2√ 4, 32

¶= Pr( Z ≥3, 51) = 0, 5 −0, 49978 = 0, 00022

Pr( X < 2) ≈Pr µZ ≤1, 5 −7, 2√ 4, 32 ¶

= Pr( Z ≤ −2, 74) = Pr( Z ≥2, 74)= 0 , 5 −0, 49693 = 0, 00307

Page 62: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 62/189

CAPÍTULO 3. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 57

2. 40 × 0, 3 = 12 > 540 × 0, 7 = 28 > 5X ≈N (12; 8. 4)

Pr( X < 10) = Pr

µZ

≤9, 5

−12

√ 8, 4 ¶= Pr( Z ≤ −0, 86) = Pr( Z ≥0, 86)= 0 , 5 −0, 30511 = 0, 19489

Pr(25 < X < 28) = Pr µ25, 5 −12√ 8, 4 ≤Z ≤

27, 5 −12√ 8, 4 ¶

= Pr(4 , 66 ≤Z ≤5, 35) ≈0

3. 65 × 0, 9 = 58, 5 > 565 × 0, 1 = 6, 5 > 5X ≈N (58, 5; 5, 85)

Pr( X = 58) = Pr µ57, 5 −58, 5√ 5, 85 ≤Z ≤

58, 5 −58, 5√ 5, 85 ¶

= Pr( −0, 41 ≤Z ≤0) = Pr(0 ≤Z ≤0, 41) = 0 , 15910

Pr(60 < X ≤63) = Pr µ60, 5 −58, 5√ 5, 85 ≤Z ≤

63, 5 −58, 5√ 5, 85 ¶

= Pr(0 , 83 ≤Z ≤2, 07) = 0 , 48077−0, 29673 = 0, 18404

4. 100 × 0, 2 = 20, 0 > 5100 × 0, 8 = 80, 0 > 5X ≈N (20; 16)

Pr(25 ≤ X ≤35) = Pr µ24, 5 −204 ≤Z ≤

35, 5 −204 ¶

= Pr(1 , 13 ≤Z ≤3, 88) = 0, 49995−0, 37076 = 0, 12919

5. 50 × 0, 2 = 10, 0 > 550 × 0, 8 = 40, 0 > 5

X ≈N (10; 8)

Pr( X > 26) = Pr µZ ≥26, 5 −10

√ 8 ¶= Pr( Z ≥5, 83) ≈0

Pr(5 ≤ X < 10) = Pr µ4, 5 −10√ 8 ≤Z ≤

9, 5 −10√ 8 ¶

= Pr( −1, 94 ≤Z ≤ −0, 18) = Pr(0 , 18 ≤Z ≤1, 94)= 0 , 47381−0, 07142 = 0, 40239

Page 63: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 63/189

Page 64: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 64/189

Page 65: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 65/189

CAPÍTULO 3. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 60

3. X = “número de meninas em 64 partos”;X ∼

bin(64;0, 5) e X ≈N (32; 16)

Pr( X > 36) ≈Pr µZ ≥36.5 −32

4 ¶= Pr( Z

≥1.13) = 0 .5

−0.37076 = 0.12924

Esse é um resultado que pode ocorrer por mero acaso, ou seja, não é um resultadonão-usual.

4. X = “número de passageiros que se apresentam para o vôo em questão”.X ∼bin(400;0, 85) e X ≈N (340; 51).

Pr( X > 350) = Pr µZ ≥350, 5 −340

√ 51 ¶= Pr( Z ≥1, 47) = 0, 5 −0, 42922 = 0, 070 78

Essa é uma probabilidade um pouco alta; talvez valha a pena a companhia revera política de reservas e aceitar menos que 400 reservas.

5. X = “número de defeituosos na amostra”;X ∼

bin(20;0.1). Note que aqui nãopodemos usar a aproximação normal. uma vez que20 × 0.1 = 2 < 5. Queremos

Pr( X ≥ 2) = 1 −Pr( X < 2) = 1 −[Pr(X = 0) + Pr( X = 1)]

= 1 −µ200¶(0, 1)0(0, 9)20 −µ20

1¶(0, 1)(0, 9)19 =

= 1 −0, 39175 = 0, 60825

Page 66: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 66/189

Capítulo 4

Intervalos de Con ança

Neste capítulo você aprenderá um método muito importante de estimação de parâmet-ros. Vimos anteriormente que a média amostralX é um bom estimador da médiapopulacionalμ. Mas vimos, também, que existe uma variabilidade nos valores deX,ou seja, cada amostra dá origem a um valor diferente do estimador. Uma maneira deinformar sobre esta variabilidade é através daestimação por intervalos . Sendo assim,neste capítulo você aprenderá os seguintes conceitos e métodos:

• intervalo de con ança

• margem de erro

• nível de con ança

• nível de seigni cância

• intervalo de con ança para a média de uma populaçãoN (μ; σ2) com variânciaconhecida

4.1 Idéias básicasO objetivo central da Inferência Estatística é obter informações para uma população apartir do conhecimento de uma única amostra. Em geral, a população é representadapor uma variável aleatóriaX, com função de distribuição ou densidade de probabilidadef X . Dessa população, então, extrai-se uma amostra aleatória simples com reposição,que dá origem a um conjuntoX 1, X 2, . . . , X n de n variáveis aleatórias independentese identicamente distribuídas, todas com a mesma distribuiçãof X . Se f X depende deum ou mais parâmetros, temos que usar a informação obtida a partir da amostra paraestimar esses parâmetros, de forma a conhecermos a distribuição. Vimos, por exemplo,que a média amostralX é um bom estimador da média populacionalμ, no sentidode que ela tende a “acertar o alvo” da verdadeira média populacional, isto é, a médiaamostral é um estimador não-viesado da média populacional. Mas vimos, também, queexiste uma variabilidade nos valores deX, ou seja, cada amostra dá origem a um valor

61

Page 67: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 67/189

Page 68: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 68/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 63

θ

Figura 4.1: Interpretação dos Intervalos de Con ança

Page 69: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 69/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 64

4.2 Intervalo de con ança: média da N (μ; σ2), σ2 con-hecida

Vamos agora introduzir os métodos para obtenção do intervalo de con ança para a médiade uma população. Como visto, a média populacional é um parâmetro importante quepode ser muito bem estimado pela média amostralX. Para apresentar as idéias básicas,vamos considerar um contexto que é pouco freqüente na prática. O motivo para isso éque, em termos didáticos, a apresentação é bastante simples. Como o fundamento é omesmo para contextos mais gerais, essa abordagem se justi ca.

Consideremos uma população descrita por uma variável aleatória normal com médiaμ e variânciaσ2 : X

∼N (μ; σ2). Vamos supor que o valor deσ2 seja conhecido e

que nosso interesse seja estimar a médiaμ a partir de uma amostra aleatória simplesX 1, X 2, . . . , X n . Como visto anteriormente, a distribuição amostral deX é normal commédiaμ e variânciaσ 2

n , ou seja

X ∼

N ¡μ; σ2

¢=⇒

X ∼

N µμ; σ2

n ¶Da de nição de distribuição amostral, isso signi ca que os diferentes valores deX obtidosa partir das diferentes possíveis amostras se distribuem normalmente em torno deμ comvariância σ 2

n .Das propriedades da distribuição normal, resulta que

Z =X −μ

q σ 2

n∼

N (0; 1)

ou equivalentemente,

Z = √ n X −μσ ∼

N (0; 1) (4.2)

4.2.1 NotaçãoVamos estabelecer a seguinte notação: vamos indicar porzα a abscissa da curva normalpadrão que deixa probabilidade (área) igual aα acima dela. Veja aFigura 4.2. Temos,então, quePr( Z > z α ) = α . Essa abscissazα é normalmente chamada devalor crítico.

Consideremos, agora, o valor críticozα/ 2;veja aFigura 4.3 . Daí podemos ver que,se Z ∼

N (0;1), entãoPr ¡−zα/ 2 ≤Z ≤zα/ 2¢= 1 −α (4.3)

Note que isso vale para a distribuição normal padrão, em geral. Então, usando osresultados (4.2) e (4.3), obtemos que

Pr µ−zα/ 2 ≤√ n X −μσ ≤zα/ 2¶= 1 −α

Page 70: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 70/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 65

Figura 4.2: Ilustração do valor críticozα

Figura 4.3: De nição do valor críticozα/ 2

Page 71: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 71/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 66

Mas isso é equivalente a

Pr µ−zα/ 2σ√ n ≤X −μ ≤ zα/ 2

σ√ n¶= 1 −α

⇐⇒

Pr

µ−X

−zα/ 2

σ

√ n ≤ −μ

≤ −X + zα/ 2

σ

√ n¶= 1

−α

⇐⇒Pr µX −zα/ 2

σ√ n ≤μ ≤X + zα/ 2

σ√ n¶= 1 −α (4.4)

Note a última expressão; ela nos diz que

Pr µμ∈·X −zα/ 2

σ√ n ; X + zα/ 2

σ√ n¸¶= 1 −α

Mas essa é exatamente a forma geral de um intervalo de con ança, conforme explicitadona equação (4.1). Temos, então, a seguinte conclusão:

De nição 4.1

Seja X ∼

N (μ; σ2) uma população normal com variância σ2 conhecida. Se X 1, X 2, . . . , X né uma amostra aleatória simples dessa população, então o intervalo de con ança de nível de con ança 1 −α para a média populacional μ é dado por

·X −zα/ 2σ√ n ; X + zα/ 2

σ√ n¸

4.2.2 Interpretação do intervalo de con ança para μO intervalo de con ança paraμ pode ser escrito na forma[X − ; X + ] onde = zα/ 2

σ√ n

é a margem de erro. Como visto, essa margem de erro está associada ao fato de quediferentes amostras fornecem diferentes valores deX cuja média é igual aμ. As diferentesamostras fornecem diferentes intervalos de con ança, mas uma proporção de100× (1 −α)% desses intervalos irá conter o verdadeiro valor deμ. Note que aqui é fundamentala interpretação de probabilidade como freqüência relativa: estamos considerando osdiferentes intervalos que seriam obtidos, caso sorteássemos todas as possíveis amostras.Assim, o nível de con ança está associado à con abilidade do processo de obtenção do

intervalo: esse processo é tal que acertamos (isto é, o intervalo contémμ) em100× (1 −α)% das vezes.Na prática, temos apenasuma amostra e o intervalo obtido com essa amostra es-

pecí ca, ou contém ou não contém o verdadeiro valor deμ. A a rmativa

Pr µμ∈·X −zα/ 2

σ√ n ; X + zα/ 2

σ√ n¸¶= 1 −α

é válida porque ela envolve a variável aleatóriaX, que tem diferentes valores para asdiferentes amostras. Quando substituímos o estimadorX por uma estimativa especí ca

Page 72: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 72/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 67

x obtida a partir de uma amostra particular, temos apenas um intervalo e não faz maissentido falar em probabilidade.

Para ajudar na interpretação do intervalo de con ança, suponha que, com umaamostra de tamanho 25, tenha sido obtido o seguinte intervalo de con ança com nívelde con ança de 0,95:

·5 −1, 96 ×2

√ 25; 5 + 1, 96 ×

2√ 25¸= [4, 216;5, 784]

Esse intervalo especí co contém ou não contém o verdadeiro valor deμ. O que esta-mos dizendo é que, se repetíssemos o mesmo procedimento de sorteio de uma amostraaleatória simples da população e conseqüente construção do intervalo de con ança, 95%dos intervalos construídos conteriam o verdadeiro valor deμ.

Sendo assim, éerrado dizer que há uma probabilidade de 0,95 de o intervalo especí co[4, 216; 5, 784] conter o verdadeiro valor deμ. Mas é certo dizer que com probabilidade0,95 o intervalo

·X −1, 96 × 2√ 25; X + 1 , 96 × 2√ 25¸contémμ. Note a variável aleatóriaX no limite do intervalo.

Exemplo 4.1 Em determinada população, o peso dos homens adultos é distribuído nor-malmente com um desvio padrão de 16 kg. Uma amostra aleatória simples de 36 homens adultos é sorteada desta população, obtendo-se um peso médio de 78,2 kg. Construa um intervalo de con ança de nível de con ança 0,95 para o peso médio de todos os homens adultos dessa população.

SoluçãoVamos incialmente determinar o valor crítico associado ao nível de con ança de 0,95.

Como1 −α = 0 , 95, resulta queα = 0 , 05 e α/ 2 = 0, 025.Analisando aFigura 4.3 , vemos que nas duas caudas da distribuição normal padrão

temos que ter 5% da área(α = 0 , 05); logo, em cada cauda temos que ter 2,5%(α/ 2 = 0, 025) da área total. Em termos da nossa tabela da distribuição normal padrão(apresentada novamente ao nal da apostila como Tabela 1), isso signi ca que entre0e z0,025 temos que ter(50 −2, 5)% = 47, 5% e, assim, temos que procurar no corpo databela o valor de 0,475 para determinar a abscissaz0,025 . Veja a Figura 4.4 .

Procurando no corpo da tabela da distribuição normal padrão, vemos que o valor

0,475 corresponde à abscissaz0,025 = 1 , 96. Logo, nosso intervalo de con ança é

·78, 2 −1, 96 ×16

√ 36; 78, 2 + 1, 96 ×

16√ 36¸= [72, 9733; 83, 4267]

Esse intervalo contém ou não o verdadeiro valor deμ, mas o procedimento utilizadopara sua obtenção nos garante que há 95% de chance de estarmos certos.

Page 73: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 73/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 68

Figura 4.4: Valor crítico associado ao nível de con ança 1 −α = 0 , 95

4.2.3 Lista de Exercícios 11. Encontre os valores críticos da normal padrão correspondentes aos seguintes níveis

de con ança 1 −α = 0 , 90;0, 99;0, 80.

2. Encontre o nível de con ança correspondente aos seguintes valores críticoszα/ 2 =1, 28;1, 80.

3. De uma população normal com desvio padrão 2, extrai-se uma amostra aleatóriasimples de tamanho 36, que fornece o seguinte resultado:

36

Pi=1xi = 1236. Calcule

o intervalo de con ança para a média populacionalμ, utilizando o nível de sig-ni cânciaα = 2%.

4.3 Margem de erroVamos, agora, analisar a margem de erro do intervalo de con ança para a média de umapopulação normal com variância conhecida. Ela é dada por

= zα/ 2σ√ n (4.5)

Lembrando que o erro padrão é o desvio padrão do estimador, podemos escrever

= zα/ 2EP (X ) (4.6)

Analisando a equação (4.5), podemos ver que ela depende diretamente do valor críticoe do desvio padrão populacional e é inversamente proporcional ao tamanho da amostra.

Na Figura 4.5 ilustra-se a relação de dependência da margem de erro em relaçãoao desvio padrão populacionalσ. Temos aí duas distribuições amostrais centradas namesma média e baseadas em amostras de mesmo tamanho. Nas duas distribuições aárea total das caudas sombreadas éα, de modo que o intervalo limitado pelas linhasverticais é o intervalo de con ança de nível de con ança 1−α. Para a distribuição maisdispersa, isto é, comσ maior, o comprimento do intervalo é maior. Esse resultado deve

Page 74: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 74/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 69

ser intuitivo: se há mais variabilidade na população, a nossa margem de erro tem que sermaior, mantidas xas as outras condições (tamanho de amostra e nível de con ança).

Figura 4.5: Margem de erro versus sigma:σ1 < σ 2⇒

1 < 2

Por outro lado, se mantivermos xos o tamanho da amostra e o desvio padrão popu-lacional, é razoável também esperar que a margem de erro seja maior para um nível decon ança maior. Ou seja, se queremos aumentar a probabilidade de acerto, é razoávelque o intervalo seja maior. Aumentar a probabilidade de acerto signi ca aumentaro nível de con ança, o que acarreta em um valor críticozα/ 2 maior. Veja aFigura4.6 , onde ilustra-se o intervalo de con ança para dois níveis de con ança diferentes:1 −α2 > 1 −α1. O primeiro intervalo é maior, re etindo o maior grau de con ança.

Figura 4.6: Margem de erro versus nível de con ança: 1 −α 2 > 1 −α1⇒ 2 > 1

Finalmente, mantidos o mesmo desvio padrão populacional e o mesmo nível de con- ança, quanto maior o tamanho da amostra, mais perto vamos cando da população e,assim, vai diminuindo a nossa margem de erro.

Page 75: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 75/189

Page 76: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 76/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 71

Figura 4.7: Cálculo do nível de con ança a partir de ,σ,n

4.3.1 Lista de Exercícios 21. Considere os dois intervalos de con ança a seguir, obtidos a partir de uma mesma

amostra de uma populaçãoN (μ;16). Sem fazer qualquer cálculo, identi que paraqual deles o nível de con ança é maior.

[13, 04; 16, 96][12, 42; 17, 58]

2. Obtido um intervalo de con ança para a média de umaN (μ;25), o que deve serfeito para se reduzir a margem de erro pela metade se não devemos alterar o nívelde con ança?

4.4 Resumo do Capítulo• Como existe uma variabilidade nos valores de um estimador bθ ao longo das possíveis

amostras, uma maneira de informar sobre esta variabilidade é através da estimaçãopor intervalos de con ança. Esses intervalos, em geral, têm a formah bθ − ; bθ + i,onde é margem de erro.

• A obtenção de um intervalo de con ança é feita de modo que

Pr ³θ∈h bθ − ; bθ + i´= 1 −α

• O valor1 −α é o nível de con ança, enquanto o valorα é o nível de signi cância.

• A probabilidade se refere à probabilidade dentre as diversas possíveis amostras, ouseja, a probabilidade está associada à distribuição amostral de bθ. Cada amostra dáorigem a um intervalo diferente, mas o procedimento de obtenção dos intervalosgarante probabilidade1 −α de acerto, ou seja, inclusão do verdadeiro valor doparâmetro.

Page 77: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 77/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 72

• A margem de erro do intervalo de con ança para a média de uma população normalcom variância conhecida é

= zα/ 2σ√ n = zα/ 2EP (X )

onde zα/ 2 é o valor crítico da densidade normal padrão que deixa probabilidadeα/ 2 acima dele.

4.5 Exercícios1. De uma populaçãoN (μ; 9) extrai-se uma amostra aleatória simples de tamanho

25, obtendo-se25

Pi=1xi = 60. Desenvolva detalhadamente o intervalo de con ança de

nível de con ança 99% para a média da população.

2. Determine o tamanho da amostra necessário para se estimar a média de umapopulação normal comσ = 4 , 2 para que, com con ança de 95%, o erro máximode estimação seja± 0, 05.

3. O pesoX de um certo artigo é descrito aproximadamente por uma distribuiçãonormal comσ = 0 , 58. Uma amostra de tamanhon = 25 resultou emx = 2 , 8.Desenvolva detalhadamente o intervalo de con ança de nível de con ança 0, 90.

4. De uma população normal comσ = 5 , retira-se uma amostra aleatória simples detamanho 50, obtendo-sex = 42 .

(a) Obtenha o intervalo de con ança para a média com nível de signi cância de5%.(b) Qual é o erro de estimação?(c) Para que o erro seja≤ 1, com probabilidade de acerto de 95%, qual deverá

ser o tamanho da amostra?

5. Os valores da venda mensal de determinado artigo têm distribuição aproximada-mente normal com desvio padrão de R$500,00. O gerente da loja a rma vender,em média, R$34.700,00. O dono da loja, querendo veri car a veracidade de tal a r-mativa, seleciona uma amostra aleatória das vendas em determinado mês, obtendoos seguintes valores:

33840, 00 32960, 00 41815, 00 35060, 00 35050, 0032940, 00 32115, 00 32740, 00 33590, 00 33010, 00

(a) Obtenha o intervalo de con ança para a venda média mensal com nível designi cância de 5%.

(b) Obtenha o intervalo de con ança para a venda média mensal com nível designi cância de 1%.

Page 78: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 78/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 73

(c) Em qual dos dois níveis de signi cância podemos a rmar que o gerente sebaseou para fazer a a rmativa?

6. Intervalo de con ança com limites assimétricos O tempo de execução de de-terminado teste de aptidão para ingresso em um estágio é normalmente distribuído

com desvio padrão de 10 minutos. Uma amostra de 25 candidatos apresentou umtempo médio de 55 minutos. Construa um intervalo de con ança de limitesL1 eL2 (L1 < L 2) de modo que seja observada a seguinte especi cação: à descon ançade queμ < L 1 atribuiremos um nível de signi cância de 5% e à descon ança deque μ > L 2 atribuiremos o nível de signi cância de 10%.

4.6 Solução das Listas de ExercíciosLista de Exercícios 1

1. 1 −α = 0 , 90 =⇒z0,05 = 1 , 641 −α = 0 , 99 =

⇒z0,005 = 2 , 58

1 −α = 0 , 80 =⇒

z0,10 = 1 , 28

2. tab(1, 28) = α/ 2 = 0, 39973 =⇒

α = 2 × 0.39973 = 0.79946 ≈0, 80 ou 80%tab(1, 80) = α/ 2 = 0, 46407 =

⇒α = 2 × 0.46407 = 0.92814 ≈0, 93 ou 93%

3. α = 2% =⇒

1 −α = 98% =⇒

tab(z0,01) = 0 , 49 =⇒

z0,01 = 2 , 33

= 2 .33 ×2

√ 36= 0 , 7767

Como a média amostral observada éx = 123636 = 34 .333, o intervalo de con ança é

[34.333−0.7767; 34.333 + 0.7767] = [33, 556; 35, 110]

Lista de Exercícios 2

1. Como a amostra é a mesma, isso signi ca que a população é a mesma, bem comoo tamanho de amostra, ou seja,σ e n são os mesmos. Vimos que um nível decon ança maior resulta em um intervalo de con ança maior; logo, o segundo in-tervalo foi construído com base em um nível de con ança maior do que o utilizadona construção do primeiro.

2. Mantidos xos o nível de con ança e o desvio padrão populacional, vimos que amargem de erro é inversamente proporcional à raiz quadrada den. Assim, parareduzir pela metade a margem de erro, temos que dobrar√ n, ou seja, temos quequadruplicar o tamanho amostraln.

Page 79: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 79/189

Page 80: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 80/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 75

dá z0,05 = 1 , 64. Então

Pr( −1, 64 ≤Z ≤1, 64) = 0, 90⇒

Pr⎛

⎝−1, 64

X −μ

q 0,582

25 ≤1, 64⎞

= 0 , 90

⇒Pr µ−1, 64 ×

0, 585 ≤X −μ ≤1, 64 ×

0, 585 ¶= 0 , 90

Pr( −0, 19024 ≤X −μ ≤0, 19024) = 0, 90⇒

Pr( X −0, 19024 ≤μ ≤X + 0 , 19024) = 0, 90

Como a média amostral obtida éx = 2 , 8 o intervalo de con ança de nível decon ança 99% é

[2, 8

−0, 19024 ; 2, 8 + 0, 19024] = [2, 60976; 2, 99024]

4. α = 0 , 05⇒

1 −α = 0 , 95⇒

z0,025 = 1 , 96

(a) A margem de erro é= 1 , 96 ×

5√ 50

= 1 , 3859

Logo, o intervalo de con ança de nível de con ança 0,95 é

[42−1, 385 9 ; 42 + 1, 3859] = [40, 6141 ; 43, 3859]

(b) Como visto em (a) a margem de erro é= 1 , 3859.(c) Temos que reduzir a margem de erro; logo, o tamanho da amostra terá que

ser maior que 50.

= 1 , 96 ×5

√ n ≤1⇒

√ n ≥ 1, 96 × 5 = 9, 8⇒

n ≥ 9, 82 = 96 , 04

Logo,n deve ser no mínimo igual a 97.

5. A média amostral éx = 34312010 = 34312.

(a) A margem de erro é= 1 , 96 ×

500√ 10

= 309, 9

Logo, o intervalo de con ança de nível de con ança 95% é

[34312−309, 9 ; 34312 + 309, 9] = [34002, 1; 34621, 9]

Page 81: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 81/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 76

(b) A margem de erro é= 2 , 58 ×

500√ 10

= 407, 93

Logo, o intervalo de con ança de nível de con ança 95% é

[34312−407, 93 ; 34312 + 407, 93] = [33904, 07 ; 34719, 93]

(c) O gerente deve estar usando o nível de signi cância de 1% (ou nível de con- ança de 99%).

6. Veja aFigura 4.8.

Figura 4.8: Solução do Exercício 6 - Intervalo de con ança assimétrico

Temos que ter

Pr( Z < z 1) = 0 , 05⇒

Pr( Z > −z1) = 0 , 05⇒

tab(−z1) = 0 , 45⇒−z1 = 1 , 64

⇒z1 = −1, 64

Temos que ter

Pr( Z > z 2) = 0 , 10⇒

tab(z2) = 0 , 40⇒

z2 = 1 , 28

Resulta, então, que

Pr(

−1, 64

≤Z

≤1, 28) = 0 , 85

⇒Pr µ−1, 64 ≤√ n X −μσ ≤1, 28¶= 0 , 85

Pr µ−1, 64 ×σ√ n ≤X −μ ≤1, 28 ×

σ√ n¶= 0 , 85

Pr µ−X −1, 64 ×σ√ n ≤ −μ ≤ −X + 1 , 28 ×

σ√ n¶= 0 , 85

Pr µX −1, 28 ×σ√ n ≤μ ≤X + 1 , 64 ×

σ√ n¶= 0 , 85

Page 82: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 82/189

CAPÍTULO 4. INTERVALOS DE CONFIANÇA 77

Com os dados obtidos, o intervalo de con ança assimétrico é

·55 −1, 28 ×10

√ 25; 55 + 1, 28 ×

10√ 25¸= [52, 44 ; 57, 56

Page 83: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 83/189

Capítulo 5

Intervalos de Con ança: Proporções- Amostra Grande

No capítulo anterior, foram apresentadas as idéias básicas da estimação por intervalosde con ança. Para ilustrar o princípio utilizado na construção de tais intervalos, con-sideramos a situação especial de estimação da média de uma população normal comvariância conhecida. Neste caso, a distribuição amostral da média amostral é normal efoi com base nessa distribuição amostral normal que obtivemos o intervalo de con ança.

Neste capítulo usaremos o teorema limite central, que garante que a distribuiçãoamostral da proporção amostral pode ser aproximada por uma distribuição normal,desde que utilizemos amostras grandes.

5.1 Estimação de uma proporção populacionalO contexto de interesse é o seguinte: temos uma população em que cada elemento éclassi cado de acordo com a presença ou ausência de determinada característica. Emtermos de variável aleatória, essa população é representada por uma variável aleatóriade Bernoulli, isto é:

X = ½1 se elemento possui a característica de interesse0 se elemento não possui a caracaterística de interesse

Então, Pr( X = 1) = p, E (X ) = p e V ar(X ) = p(1 − p). O parâmetrop é tambéma proporção de elementos da população que possuem a caracterísitca de interesse. Emgeral, esse parâmetro é desconhecido e precisamos estimá-lo a partir de uma amostra.Suponha, então, que dessa população seja extraída uma amostra aleatória simplesX 1, X 2, . . . , X n com reposição. Vimos que a proporçãobP de elementos na amostra quepossuem a característica de interesse, de nida por

bP =S nn

=X 1 + X 2 + · · · + X n

n(5.1)

78

Page 84: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 84/189

Page 85: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 85/189

CAPÍTULO 5. INTERVALOS DE CONFIANÇA: PROPORÇÕES - AMOSTRA GRANDE 80

Figura 5.1: De nição do valor críticozα/ 2 da N (0; 1)

Como o resultado (5.3) vale para qualquer variável aleatóriaN (0; 1), podemos usar(5.2) para obter

Pr Ã−zα/ 2 ≤√ n bP

− p

p p(1 − p) ≤ zα/ 2

!= 1 −α

e, portanto

Pr Ã−zα/ 2r p(1 − p)n ≤bP − p ≤ zα/ 2r p(1 − p)

n ! = 1 −α =⇒

Pr Ã− bP −zα/ 2r p(1 − p)n ≤ − p ≤ − bP + zα/ 2r p(1 − p)

n ! = 1 −α =⇒

Pr à bP −zα/ 2r p(1 − p)n ≤ p ≤bP + zα/ 2r p(1 − p)n ! = 1 −α

Como no caso da média, chegamos a uma expressão do seguinte tipo:

Pr ³ bP − ≤ p ≤bP + ´= 1 −α

onde = zα/ 2q p(1− p)n .

Tanto no caso da média de uma população normal com variância conhecida, quantono caso da proporção, a margem de erro tem a forma

= zα/ 2EP ( bθ)

onde EP ( bθ) representa o erro padrão do estimador em questão. No caso da média,

EP ( bθ) = EP (X ) =σ√ n (5.4)

Page 86: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 86/189

CAPÍTULO 5. INTERVALOS DE CONFIANÇA: PROPORÇÕES - AMOSTRA GRANDE 81

e no caso da proporção,

EP ( bθ) = EP ( bP ) = r p(1 − p)n

(5.5)

Analisando as expressões (5.4) e (5.5), podemos ver uma diferença fundamental: oerro padrão da proporção amostral depende do parâmetro desconhecidop. Na prática,para construir o intervalo de con ança, temos que substituir esse valor por algumaestimativa.

Existem 3 abordagens possíveis:

1. Usar a própria proporção amostral observada; nesse caso, o intervalo de con ançaseria

bP ± zα/ 2r b p(1 − b p)n

2. Usar o intervalo de con ança conservador, ou seja, usar o maior valor possívelpara EP ( bP ) para um dadon, o que equivale a obter o intervalo de con ança como maior comprimento possível. Como o comprimento do intervalo é diretamenteproporcional ap p(1 − p) ou equivalentemente, ap(1 − p), vamos estudar o com-portamento desta função. NaFigura 5.2 , temos o grá co da funçãop(1− p) paravalores dep no intervalo de interesse[0, 1]. Vemos que o máximo dessa funçãoocorre quandop = 0 , 5. Logo, na falta de uma estimativa melhor parap, podemostomar p = 0 , 5, que fornece o maior intervalo de con ança possível, mantidas asoutras condições constantes.

Figura 5.2: Grá co da funçãop(1 − p) para 0 ≤ p ≤1

Neste caso, o o intervalo de con ança se torna

bP ± zα/ 2r 0, 5 × 0, 5n

= bP ± zα/ 20, 5√ n

3. Usar algum valor auxiliarb p0 ou estimativa prévia, obtida de outras fontes ou deuma amostra piloto:

dEP

P = r b p0(1 − b p0)n

(5.6)

Page 87: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 87/189

CAPÍTULO 5. INTERVALOS DE CONFIANÇA: PROPORÇÕES - AMOSTRA GRANDE 82

De nição 5.1 Seja X 1, X 2, . . . , X n uma amostra aleatória simples de uma população representada

pela variável X de Bernoulli com

Pr( X = 1) = p

Pr( X = 0) = 1 − pSe o tamanho n da amostra é su cientemente grande [em geral, deve-se ter np ≥ 5 e n(1 − p) ≥ 5], então o intervalo de con ança aproximado para p de nível de con ança 1 −α é dado por

" bP −zα/ 2r b p0(1 − b p0)n

; bP + zα/ 2r b p0(1 − b p0)n #

onde zα/ 2 é abscissa da curva normal padrão que deixa área α/ 2 acima dela e

b p0 é

alguma estimativa para o verdadeiro valor p.

Exemplo 5.1 Um gerente de produção deseja estimar a proporção de peças defeituosas em uma de suas linhas de produção. Para isso, ele seleciona uma amostra aleatória simples de 100 peças dessa linha de produção, obtendo 30 defeituosas. Determine ointervalo de con ança para a verdaeira proporção de peças defeituosas nessa linha de produção, a um nível de signi cância de 5%.

SoluçãoO primeiro fato a observar é que a amostra é grande, o que nos permite usar a

aproximação normal. Com um nível de signi cância deα = 0 , 05, o nível de con ança é1−α = 0 , 95 e da tabela da normal padrão, obtemos quezα/ 2 = 1 , 96. Como não temosestimativa prévia da proporção de defeituosasp, temos que usar a proporção amostral

b p = 0 , 30. Assim, a margem de erro é

= 1 , 96 × r 0, 3 × 0, 7100

= 0 , 0898

e o intervalo de con ança é

[0, 30

−0, 0898; 0, 30 + 0, 0898] = [0, 2102;0, 3898]

5.3 Determinação do tamanho da amostraUma questão que se coloca freqüentemente é: qual o tamanho da amostra necessáriopara se estimar uma proporçãop com uma margem de erroe nível de con ança 1−α?Vamos analisar a expressão da margem de erro:

= zα/ 2r p(1 − p)n

Page 88: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 88/189

CAPÍTULO 5. INTERVALOS DE CONFIANÇA: PROPORÇÕES - AMOSTRA GRANDE 83

Resolvendo paran, obtemos que

√ n = zα/ 2p p(1 − p)

ou

n = [ p(1 − p)]³zα/ 2

´2

Vemos, então, quen é diretamente proporcional ap(1− p), ou seja, quanto maiorp(1− p),maior será o tamanho da amostran. Na prática, não conhecemosp (na verdade, esta-mos querendo estimar esse parâmetro). Então, para determinar o tamanho de amostranecessário para uma margem de erro e um nível de con ança dados, podemos consideraro pior caso, ou seja, podemos tomar o maior valor possível dep(1 − p) e calcular otamanho da amostra com base nesse pior caso, que ocorre quandop = 0 , 5. É claroque essa é uma escolha conservadora, que em alguns casos pode levar a um tamanho deamostra desnecessariamente grande. Usando esta estimativa parap, obtemos que

n = ³0, 5 ·

zα/ 2

´2

Exemplo 5.2 Para estudar a viabilidade de lançamento de um novo produto no mer-cado, o gerente de uma grande empresa contrata uma rma de consultoria estatística para estudar a aceitação do produto entre os clientes potenciais. O gerente deseja obter uma estimativa com um erro máximo de 1% com probabilidade 80% e pede ao consultor estatístico que forneça o tamanho de amostra necessário.

1. De posse das informações dadas, o consultor calcula o tamanho da amostra necessáriono pior cenário. O que signi ca “pior cenário” nesse caso? Qual o tamanho de amostra obtido pelo consultor?

2. O gerente acha que o custo de tal amostra seria muito alto e autoriza o consultor a realizar um estudo piloto com uma amostra de 100 pessoas para obter uma esti-mativa da verdadeira proporção. O resultado desse estudo piloto é uma estimativa

b p = 0 , 76 de aceitação do novo produto. Com base nessa estimativa, o consultor recalcula o tamanho da amostra necessário. Qual é esse tamanho?

3. Selecionada a amostra com o tamanho obtido no item anterior, obteve-se uma proporção de 72% de clientes favoráveis ao produto. Construa um intervalo de con ança para a verdadeira proporção com nível de con ança de 90%.

Solução1. O pior cenário é quando a população está dividida meio-a-meio em suas preferên-

cias, ou seja, quandop = 0 , 5. Com nível de con ança de 80%, obtemosz0,10 =1, 28. Nesse caso,

0, 01 = 1, 28 × r 0, 5 × 0, 5n

=⇒

n = µ1, 280, 01¶2

× 0, 25 = 4096

Page 89: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 89/189

Page 90: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 90/189

CAPÍTULO 5. INTERVALOS DE CONFIANÇA: PROPORÇÕES - AMOSTRA GRANDE 85

3. Queremos, agora, reduzir a margem de erro para 5%, mantendo o mesmo nível decon ança. Certamente teremos que aumentar o tamanho da amostra:

≤ 0, 05⇒

2, 33 × r 0, 6 × 0, 4

n ≤ 0, 05⇒√ n ≥2, 330, 05

× p 0, 6 × 0, 4⇒

n ≥ µ2.330.05¶2

× 0.6 × 0.4⇒

n ≥ 522

Se usássemos o pior cenário, isto é,p = 0 , 5 teríamos que ter

n

≥ µ2, 33

0, 05¶2

× 0, 25

⇒n ≥ 543

5.4 Resumo do Capítulo• No estudo da proporção amostral, a população é descrita por uma variável aleatória

de BernoulliX tal que

Pr( X = 1) = pPr( X = 0) = 1

− p

em queX = 1 representa a presença da característica de interesse.

• Dada uma amostra aleatória simplesX 1, X 2, . . . , X n de tal população, a proporção

bP de elementos na amostra que possuem a característica de interesse é

bP =S nn

=X 1 + X 2 + · · · + X n

n

com as seguintes propriedades:

E ( bP ) = pV ar( bP ) =

p(1 − p)n

• Pelo Teorema Limite Central, resulta que

bP ≈N µ p;p(1 − p)

n ¶e essa aproximação só deve ser usada senp ≥5 e n(1 − p) ≥5.

Page 91: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 91/189

Page 92: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 92/189

Page 93: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 93/189

CAPÍTULO 5. INTERVALOS DE CONFIANÇA: PROPORÇÕES - AMOSTRA GRANDE 88

e o intervalo de con ança é[0, 59167 −0, 02355; 0, 59167 + 0, 02355] = [0, 56812; 0, 61522]

2. O problema pede a estimativa para a proporção dos que não querem a uoração;logo,

b p = 120

300 = 0 , 4

(a) α = 5%⇒

1 −α = 95%⇒

z0,025 = 1 , 96

= 1 , 96 × r 0, 4 × 0, 6300

= 0 , 05544

e o intervalo de con ança é[0, 4 −0, 05544; 0, 4 + 0, 05544] = [0, 34456; 0, 045544]

(b) 1 −α = 96%⇒

z0,02 = 2 , 05

= 2 , 05 × r 0, 4 × 0, 6

300 = 0 , 05798e o intervalo de con ança é

[0, 4 −0, 05798; 0, 4 + 0, 05798] = [0, 34202; 0, 045798]

3. É dado quen = 100, b p = 0 , 32 e EP ( bP ) = 0 , 03.α = 3%

⇒z0,015 = 2 , 17

= 2 , 17 × 0, 03 = 0, 0651

[0, 32 −0, 0651; 0, 32 + 0, 0651] = [0, 2549;0, 3851]

4. b p = 57150 = 0 , 38. Para uma margem de erro de 0,08 e um nível de con ança de90%, o tamanho da amostra teria que ser

n ≥µ1, 640, 08¶2

× 0, 38 × 0, 62 = 99, 011

Como o tamanho da amostra é 150, essa amostra é su ciente.

5. .

(a)

b p = 100

400 = 0 , 25

(b) EP ( bP ) = q 0,25× 0,75

400 = 0 , 02651(c) 1 −α = 0 , 80

⇒z0,1 = 1 , 28

[0, 25 −1, 28 × 0, 021651; 0, 25 + 1, 28 × 0, 021651] = [0, 22229;0, 27771]

6. b p0 = 0 , 35

n ≥µ1, 960, 05¶2

× 0, 35 × 0, 65 = 349, 59

Logo,n ≥350

Page 94: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 94/189

Capítulo 6

Intervalo de Con ança: Média daN (μ; σ2), σ2 Desconhecida

Neste capítulo você completará seu estudo básico sobre intervalos de con ança para amédia de uma população, analisando o problema de estimação da média de uma popu-lação normal quando não se conhece a variância desta população. Você verá que, nestecaso, é necessário estimar essa variância e isso introduz mais uma fonte de variabilidadenas nossas estimativas: com uma única amostra, temos que estimar a média e a var-iância da população. O procedimento é simples e análogo aos casos anteriores vistosnos capítulos amteriores; o que muda é a distribuição amostral do estimadorX. Emvez de usarmos a distribuição normal para determinar os valores críticos, usaremos adistribuiçãot de Student.

Você verá os seguintes conceitos:

• estimação da variância de uma população• distribuição amostral da média amostral de uma população normal com variância

desconhecida

• intervalo de con ança para a média de uma população normal com variância de-sconhecida

6.1 Idéias básicasConsidere uma população descrita por uma variável aleatória normal com médiaμ evariânciaσ2 : X

∼N (μ; σ2). Nosso interesse é estimar a médiaμ a partir de uma amostra

aleatória simplesX 1, X 2, . . . , X n . Como visto anteriormente, a distribuição amostral deX é normal com médiaμ e variânciaσ 2

n , ou seja

X ∼

N (μ; σ2) =⇒

X ∼

N µμ;σ2

n ¶89

Page 95: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 95/189

CAPÍTULO 6. INTERVALO DE CONFIANÇA: MÉDIA DAN (μ; σ2), σ2 DESCONHECIDA90

Assim, se o valor deσ é conhecido, resulta que

Z = √ n X −μσ ∼

N (0; 1) (6.1)

e esse resultado foi utilizado na construção do intervalo de con ança para a média deuma população normal com variância conhecida, fornecendo o seguinte intervalo:

·X −zα/ 2σ√ n ; X + zα/ 2

σ√ n¸

Suponhamos, agora, que a variânciaσ2 não seja conhecida. Neste caso, temos queestimá-la com os dados amostrais. Foi demonstrado que

S 2 =1

n −1

n

Pi=1

(X i −X )2 =1

n −1 ·n

Pi=1

X 2i −nX 2¸é um estimador não-viesado deσ2. Isso signi ca que, se calculássemos o valor deS 2 paracada uma das possíveis amostras aleatórias simples de tamanhon, a média desses valoresseria igual aσ2. Dessa forma,S 2 é um “bom” estimador deσ2 e podemos usá-lo comouma estimativa pontual deσ2. Como o desvio padrão é a raiz quadrada da variância, énatural perguntar:S é um “bom” estimador deσ, ou seja,S é um estimador não-viesadode σ? A resposta é NÃO, mas, para grandes amostras, o viés é pequeno, de modo que,em geral, usa-seS como estimador deσ.

Sendo assim, é natural pensarmos em substituir o valor deσ por S na expressão(6.1) e utilizarmos a estatística

T =√

n

X

−μ

S na construção de intervalos de con ança paraμ. Isso é exatamente o que faremos, mas,ao introduzirmosS no lugar deσ, a distribuição amostral deT deixa de ser normal epassa a ser uma distribuiçãot de Student.

A distribuiçãot de Student (ou simplesmente distribuiçãot) foi obtida por WilliamGosset (1876-1937), que trabalhava na Cervejaria Guinness na Irlanda. Como a cerve- jaria não permitia a publicação de resultados de pesquisa obtidos por seus funcionários,Gosset publicou, sob o pseudônimo de Student, o artigo “The Probable Error of a Mean”na revista Biometrika (vol. 6, no. 1).

6.2 Intervalo de con ança para a média de uma po-pulação normal com variância desconhecida

O intervalo de con ança para a média de uma população normal com variância descon-hecida é obtido com base no seguinte resultado:

Page 96: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 96/189

CAPÍTULO 6. INTERVALO DE CONFIANÇA: MÉDIA DAN (μ; σ2), σ2 DESCONHECIDA91

Teorema 6.1 Se X 1, X 2, . . . , X n é uma amostra aleatória simples de uma populaçãoX ∼

N (μ; σ2) , então

T = √ n X −μS ∼

t(n −1) (6.2)

onde S 2

=1

n−1

n

Pi=1 (X i −X )2

=1

n−1 ·n

Pi=1 X 2i −nX

2

¸.O número de graus de liberdadegl = n −1 resulta do fato de que, na soma quede ne S 2, há apenasn −1 parcelas independentes, ou seja, dadosS 2 e n −1 das parcelas(X i −X )2, a n−ésima parcela ca automaticamente determinada.

Usando a simetria da densidadet, temos o seguinte resultado:

Pr ¡−tn ; α/ 2 ≤ t(n) ≤ tn ; α/ 2¢= 1 −α (6.3)

Veja a Figura 6.1 .

Figura 6.1: Valores críticos dat−Student para construção do intervalo de con ança damédia de uma normal com variância desconhecida

Como o resultado (6.3) vale para qualquer distribuiçãot, usando o resultado (6.2)obtemos:

Pr

µ−tn−1; α/ 2 ≤√ n X −μ

S ≤ tn−1; α/ 2

¶= 1 −α =

Pr µ−tn−1; α/ 2S √ n ≤X −μ ≤ tn−1; α/ 2

S √ n¶= 1 −α =

Pr µX −tn−1; α/ 2S √ n ≤μ ≤X + tn−1; α/ 2

S √ n¶= 1 −α

Essa última expressão é o intervalo de con ança para a médiaμ de uma populaçãonormal com variância desconhecida.

Page 97: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 97/189

CAPÍTULO 6. INTERVALO DE CONFIANÇA: MÉDIA DAN (μ; σ2), σ2 DESCONHECIDA92

De nição 6.1 N (μ; σ2) −σ2

Seja X 1, X 2, . . . , X n uma amostra aleatória simples de uma população X ∼

N (μ; σ2) .O intervalo de con ança para μ de nível de con ança 1 −α é

·X −tn−1; α/ 2 S √ n ; X + tn−1; α/ 2 S √ n¸onde tn−1; α/ 2 é o valor crítico da distribuição t−Student com n −1 graus de liberdade que deixa área α/ 2 acima dele.

6.3 Margem de erroNote, mais uma vez, a forma do intervalo de con ança:

X ±

onde a margem de erro, agora, é de nida em termos do valor crítico da distribuiçãote do erro padrão estimado deX :

= tn−1; α/ 2S √ n

.= tn−1; α/ 2dEP (X ) (6.4)

onde

dEP (X ) =

S

√ n(6.5)

6.4 Amostras grandes

Vimos que, para populações normais, a distribuição exata da estatísticaT = √ n X −μS

é t(n −1). Mas vimos também que, quando o número de graus de liberdade é grande,as diferenças entre as distribuiçõest e N (0;1) tornam-se desprezíveis.

Por outro lado, se a população não é normal, mas tem médiaμ e variânciaσ2, oteorema limite central nos diz que a distribuição de√ n X −μ

σse aproxima de uma

N (0;1) à medida quen → ∞. Pode-se mostrar que esse resultado continua valendo sesubstituímosσ por seu estimadorS.

A conclusão dessas duas observações é a seguinte:

Page 98: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 98/189

CAPÍTULO 6. INTERVALO DE CONFIANÇA: MÉDIA DAN (μ; σ2), σ2 DESCONHECIDA93

De nição 6.2 Dada uma amostra aleatória simples X 1, X 2, . . . , X n de uma população X com média

μ e variância σ2, então

√ n X −μS ≈N (0; 1)

para n su cientemente grande. Nesse caso, o intervalo de con ança aproximado de nível de con ança 1 −α para μ é

·X −zα/ 2S √ n ; X + zα/ 2

S √ n¸

J

Exemplo 6.1 De uma população normal com média e variância desconhecidas, extrai-se uma amostra de tamanho 15 obtendo-se x = 12 e s2 = 49. Obtenha um intervalo de con ança para a verdadeira média populacional, utilizando o nível de con ança de 95%.

SoluçãoOs seguintes requisitos para o IC paraμ são satisfeitos: a população é normal e

a amostra é pequena. Dessa forma, temos que usar a distribuiçãot com n −1 = 14graus de liberdade. Como o nível de con ança é de 95%, em cada cauda da distribuiçãotemos que ter 2,5%. Assim, devemos procurar a abscissat14;0,025 procurando na linhacorrespondente a 14 graus de liberdade e na coluna correspondente à área de 0,025.Encontramos

t14;0,025 = 2 , 145

A margem de erro é= 2 , 145 ×

7√ 15

= 3 , 8769

e o intervalo de con ança

[12−3, 8769;12 + 3, 8769] = [8, 1231; 15, 8769]

Exemplo 6.2 A seguinte amostra foi extraída de uma população normal: 6, 6, 7, 8, 9, 9, 10, 11, 12.Construa o intervalo de con ança para a média populacional, com nível de signi cância de 10%.

SoluçãoComo antes, temos uma amostra pequena de uma população normal; logo, temos

que usar a distribuiçãot-Student. Comon = 9 , gl = n −1 = 8.A média amostral é

x = Pxi

n

=6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12

9=

789

= 8 , 6667

Page 99: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 99/189

Page 100: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 100/189

CAPÍTULO 6. INTERVALO DE CONFIANÇA: MÉDIA DAN (μ; σ2), σ2 DESCONHECIDA95

6.5.1 IC para a média de populações normaisO contexto básico analisado é o seguinte: de uma populaçãonormal extrai-se umaamostra aleatória simplesX 1, X 2, . . . , X n com o objetivo de se obter uma estimativaintervalar para a médiaμ. Foram consideradas duas situações: (i)σ2 conhecida e (ii)σ2

desconhecida. Em ambos os casos, a expressão para o intervalo de con ança de nível decon ança 1 −α é

X ±com a margem de erro assumindo a forma geral

= λα/ 2EP (X )ondeλα/ 2 representa o valor crítico de alguma distribuição eEP (X ) é o erro padrão damédia amostral.

σ2 conhecida

λα/ 2 = zα/ 2 N (0; 1)

EP (X ) =σ√ n

σ2 desconhecida

λα/ 2 = tn−1; α/ 2 t(n −1)

EP (X ) =S

√ nQuando n > 31, pode-se usarzα/ 2 no lugar detn−1; α/ 2.

6.5.2 IC para uma proporçãoO contexto básico considerado foi o seguinte: de uma população representada por umavariável aleatóriaX

∼Bern ( p) extrai-se uma amostra aleatória simplesX 1, X 2, . . . , X n

com o objetivo de se estimar a proporção populacionalp dos elementos que possuemdeterminada característica de interesse. Se a amostra é su cientemente grande (emgeral,n > 30),o intervalo de con ança para p tem a forma

bP ±com a margem de erro assumindo a forma geral

= zα/ 2EP ( bP )com

EP ( bP ) = r b p0(1 − b p0)n

Aqui,b p0 é uma estimativa prévia da proporção populacionalp ou a própria proporçãoamostral

b p obtida a partir da amostra ou aindap0 = 0 , 5 para o intervalo conservador.

Page 101: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 101/189

CAPÍTULO 6. INTERVALO DE CONFIANÇA: MÉDIA DAN (μ; σ2), σ2 DESCONHECIDA96

6.5.3 Intervalo de con ança para a média de populações não-normais - amostra grande

Dada uma amostra aleatória simples de tamanho grande de uma população qualquercom médiaμ, o intervalo de con ança de nível de con ança aproximado1 −α é

X ± zα/ 2S √ n

Esses resultados estão resumidos naTabela 6.1 e na Figura 6.2 .

Tabela 6.1: Resumo Comparativo dos Resultados sobre Intervalos de Con ançaParâmetro de Interesse Estatística Amostral Margem I.C.

e sua Distribuição de erro

Média da σ2 conhecida √ n X −μσ ∼

N (0;1) = zα/ 2σ

√ npopulação X ±N (μ; σ2)

σ2 desconhecida √ n X −μS ∼

t(n −1) = tn−1; α/ 2S

√ n

Proporção

[médiaBern ( p)] √ n

bP − p

p p(1 − p) ≈N (0; 1) = zα/ 2

q

p0 (1−

p0 )n

bP ±

Média de uma (amostra grande) √ n X −μS ≈N (0; 1) = zα/ 2

S √ n X ±

populaçãoX

6.6 Exercícios1. Para uma distribuiçãot de Student com 12 graus de liberdade, encontre a proba-

bilidade (área) de cada uma das seguintes regiões (esboce um grá co para auxiliarna solução do exercício):

(a) à esquerda de1, 782;(b) à direita de−1, 356;(c) à direita de2, 681;

Page 102: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 102/189

CAPÍTULO 6. INTERVALO DE CONFIANÇA: MÉDIA DAN (μ; σ2), σ2 DESCONHECIDA97

SIM NÃO

SIM NÃO SIM NÃO

populaçãonormal?

variânciaconhecida?

amostragrande?

Consulte um estatístico!Não foram estudadosmétodos apropriadospara esta situação!

n

St

nt S

X n

n 2 / ;1

)1(~

α ε

μ

−=

−−

n z

N X

n

σ ε

σ μ

α 2 /

)1;0(~

=

n

s z

N S

X n

2 /

)1;0(

α ε

μ

=

≈−

n

p p

PPS

P X

p Bern X

)ˆ1(ˆ

)1(

ˆ)(~

00 −≈

⎪⎩

⎪⎨

−=

=⇒

ε

Figura 6.2: Resumo de Intervalos de Con ança para a Média

Page 103: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 103/189

CAPÍTULO 6. INTERVALO DE CONFIANÇA: MÉDIA DAN (μ; σ2), σ2 DESCONHECIDA98

(d) entre 1, 083 e 3, 055;(e) entre−1, 356 e 2, 179.

2. Encontre os seguintes valores críticos da distribuiçãot de Student:

(a) t15;0,05

(b) t18;0,90

(c) t25;0,975

3. Os tempos gastos por quinze funcionários em uma das tarefas de um programa detreinamento estão listados abaixo. É razoável supor, nesse caso, que essa seja umaamostra aleatória simples de uma população normal, ou seja, é razoável supor quea população de todos os tempos de funcionários submetidos a esse treinamento sejaaproximadamente normal. Obtenha o intervalo de con ança de nível de con ançade 95% para o tempo médio populacional.

52 44 55 44 45 59 50 5462 46 54 58 60 62 63

4. Uma amostra aleatória simples de uma população normal apresenta as seguintescaracterísticas:

n = 25 x = 500 s2 = 900

Construa um intervalo de con ança de nível de con ança de 98% para a média dapopulação.

5. Em uma fábrica, uma amostra de 30 parafusos apresentou os seguintes diâmetros(em mm):

10 13 14 11 13 14 11 13 14 1512 14 15 13 14 12 12 11 15 1613 15 14 14 15 15 16 12 10 15

Supondo que os diâmetros sejam aproximadamente normais, obtenha um intervalode con ança para o diâmetro médio de todos os parafusos produzidos nessa fábrica,usando o nível de signi cância de 2%. Para facilitar a solução do exercício, vocêpode usar os seguintes resultados:

30

Pi=1xi = 401 30

Pi=1x2

i = 5443

6. Repita o exercício anterior com os seguintes dados de uma amostra de 100 para-fusos:

x = 13, 78 s2 = 2 , 865

Page 104: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 104/189

CAPÍTULO 6. INTERVALO DE CONFIANÇA: MÉDIA DAN (μ; σ2), σ2 DESCONHECIDA99

6.7 Solução dos Exercícios1. Temos que usar a Tabela 2, concentrando-nos na linha correspondente a 12 graus

de liberdade. Os valores dados podem ser encontrados no corpo da tabela nestalinha.

(a) À direita de1, 782 temos uma área de0, 05; logo, à esquerda de1, 782 a áreaé de0, 95.

(b) A área abaixo de−1, 356 é igual à área acima de1, 356, que é de0, 10. Logo,à esquerda de−1, 356 temos uma área de0, 10 e à direita de−1, 356 temosuma área de0, 90.

(c) À direita de2, 681 a área é0, 01.(d) À direita de1, 083 a área é0, 15; à direita de3, 055 a área é de0, 005. Logo,

a área entre1, 083 e 3, 055 é 0, 15 −0, 005 = 0, 145 .

(e) Como visto no item (b), a área à direita de−1, 356 é 0, 90. A área à direitade 2, 179 é 0, 025. Logo, a área entre−1, 356 e 2, 179 é 0, 90−0, 025 = 0, 875

2. .

(a) t15;0,05 = 1 , 753(b) O primeiro fato a observar é quet18;0,90 tem que ser negativo, pois à direita

dele a área é de0, 90 > 0, 50. Se à direita a área é 0,90, a área à esquerda é0,10. Pela simetria da curva,t18;0,90 = −t18;0,10 . Veja a Figura 6.3 . Resultaque

t18;0,90= −t18;0,10= −1, 33

Figura 6.3: Solução do Exercício 2

(c) Analogamente encontra-se quet25;0,975 = −2, 060

Page 105: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 105/189

Page 106: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 106/189

Capítulo 7

Intervalo de Con ança: Variânciada N (μ; σ2)

Neste capítulo você completará seu estudo básico sobre intervalos de con ança, anal-isando o problema de estimação da variância de uma população normal. Como antes,este intervalo se baseará na distribuição amostral de um estimador não-viesado paraσ2, a saber, S 2. Como a variância é um número não negativo, essa distribuição não ésimétrica e está de nida apenas para valores não-negativos.

Você verá os seguintes conceitos:

• estimação da variância de uma população

• intervalo de con ança para a variância de uma população normal

7.1 Idéias básicasO contexto subjacente é o seguinte: a partir de uma amostra aleatória simplesX 1, X 2, . . . , X nretirada de uma população normal com médiaμ e variânciaσ2 queremos construir umintervalo de con ança paraσ2. A hipótese de normalidade da população é fundamentalaqui. Assim como no caso da média, temos que usar a distribuição amostral de algumestimador. Neste caso, o estimador éS 2 e o resultado importate é o seguinte:(n −1)S 2

σ2

tem distribuição qui-quadrado comn −1 graus de liberdade:

(n

−1)S 2

σ2∼χ 2(n −1) (7.1)

7.2 Intervalo de con ança para a variância de umapopulação normal

Como no caso da distribuiçãot−Student, vamos de nir o valor críticoχ 2n ;α como a

abscissa da distribuição qui-quadrado comn graus de liberdade que deixa probabilidadeα acima dela. Veja aFigura 7.1 .

101

Page 107: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 107/189

CAPÍTULO 7. INTERVALO DE CONFIANÇA: VARIÂNCIA DAN (μ; σ2) 102

Figura 7.1: Valor crítico da distribuição qui-quadrado comn graus de liberdade

Com essa de nição, podemos ver que a abscissaχ 2n ;α/ 2 deixa probabilidadeα/ 2 acima

dela [vejaFigura 7.2-(a) ] e a abscissaχ 2n ;1−α/ 2 deixa probabilidadeα/ 2 abaixo dela

[veja Figura 7.2-(b) ]. Logo,Pr ¡χ 2

n ;1−α/ 2 ≤ χ 2(n) ≤ χ 2n ;α/ 2¢= 1 −α (7.2)

Como o resultado (7.2) vale para qualquer distribuição qui-quadrado, podemos usaro resultado (7.1) para escrever

Pr µχ 2n−1;1−α/ 2 ≤

(n −1)S 2

σ2 ≤ χ 2n−1;α/ 2¶= 1 −α

Daí resulta que

Pr Ãχ 2n−1;1−α/ 2

(n −1)S 2 ≤1σ2 ≤

χ 2n−1;α/ 2

(n −1)S 2! = 1 −α =⇒

Pr Ã(n −1)S 2

χ 2n−1;α/ 2 ≤σ2 ≤

(n −1)S 2

χ 2n−1;1−α/ 2! = 1 −α

e esse é o intervalo de con ança para a variância de uma população normal.

De nição 7.1

Seja X 1, X 2, . . . , X n uma amostra aleatória simples de uma população X ∼

N (μ; σ2) .O intervalo de con ança para σ2 de nível de con ança 1 −α é

"(n −1)S 2

χ 2n−1;α/ 2

;(n −1)S 2

χ 2n−1;1−α/ 2#

onde χ 2n ;α representa o valor crítico da distribuição qui-quadrado com n graus de liberdade

que deixa probabilidade α acima dele.

Page 108: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 108/189

Page 109: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 109/189

CAPÍTULO 7. INTERVALO DE CONFIANÇA: VARIÂNCIA DAN (μ; σ2) 104

Note que o intervalo de con ança é construído de tal forma a dividir o nível designi cânciaα em duas partes iguais, mesmo a distribuição não sendo simétrica.

Exemplo 7.1 De uma população normal com média e variância desconhecidas, extrai-se uma amostra de tamanho 15 obtendo-se x = 12 e s2 = 49. Obtenha um intervalo de con ança para a variância populacional, utilizando o nível de con ança de 95%.

SoluçãoO requisito para o IC paraσ2 é satisfeito, uma vez que a população é normal. Temos

que usar a distribuiçãoχ 2 comn −1 = 14 graus de liberdade. Como o nível de con ançaé de 95%, em cada cauda da distribuição temos que ter 2,5%. Assim, para a caudasuperior, devemos procurar a abscissaχ 2

14;0,025 procurando na linha correspondente a 14graus de liberdade e na coluna correspondente à área de 0,025. Encontramos

χ 214;0,025 = 26 , 119

Para a cauda inferior, devemos procurar a abscissaχ214;0,975 procurando na linha corre-spondente a 14 graus de liberdade e na coluna correspondente à área de 0,975. Encon-

tramosχ 2

14;0,975 = 5 , 629O intervalo de con ança é

·14 × 4926, 119

;14 × 495, 629 ¸= [26, 26;121, 87]

Exemplo 7.2 A seguinte amostra foi extraída de uma população normal: 6, 6, 7, 8, 9, 9, 10, 11, 12.Construa o intervalo de con ança para a variãcia populacional, com nível de signi cân-cia de 10%.

SoluçãoTemos uma amostra de uma população normal; logo, podemos usar a distribuição

χ 2. Comon = 9 , gl = n −1 = 8.A média amostral é

x = Pxi

n

=6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12

9=

78

9= 8 , 6667

e a variância amostral é

S 2 =1

n −1P(xi −x)2 =1

n −1"Px2i −

(Pxi)2

n #=

=18 ·62 + 6 2 + 7 2 + 8 2 + 9 2 + 9 2 + 10 2 + 11 2 + 12 2 −

782

9 ¸=

18 ·712−

60849 ¸=

368

= 4 , 5

Page 110: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 110/189

CAPÍTULO 7. INTERVALO DE CONFIANÇA: VARIÂNCIA DAN (μ; σ2) 105

Como o nível de signi cância éα = 10%, o nível de con ança é1−α = 90%. Em caudada distribuiçãoχ 2

8 temos que ter área igual a 5%. Assim, temos que procurar na linhacorrespondente a 8 graus de liberdade as abscissas relativas à área superior de 0,05 e de0,95. Obtemosχ 2

8;0,05 = 15 , 507 e χ 28;0,95 = 2 , 733. O intervalo de con ança é

·7 × 4, 515, 507 ; 7 × 4, 52, 733 ¸= [2, 03; 11, 53]

7.3 Exercícios1. SejaX uma variável aleatória com distribuição qui-quadrado com 17 graus de

liberdade. Encontre o valor da abscissak tal que:

(a) Pr( X > k ) = 0 , 2(b) Pr( X < k ) = 0 , 2

(c) Pr( X < k ) = 0 , 90

2. Os tempos gastos por quinze funcionários em uma das tarefas de um programa detreinamento estão listados abaixo. É razoável supor, nesse caso, que essa seja umaamostra aleatória simples de uma população normal, ou seja, é razoável supor quea população de todos os tempos de funcionários submetidos a esse treinamento sejaaproximadamente normal. Obtenha o intervalo de con ança de nível de con ançade 95% para a variância populacional.

52 44 55 44 45 59 50 5462 46 54 58 60 62 63

3. Uma amostra aleatória simples de uma população normal apresenta as seguintescaracterísticas:

n = 25 x = 500 s2 = 900

Construa um intervalo de con ança de nível de con ança de 98% para a média dapopulação.

4. Em uma fábrica, uma amostra de 30 parafusos apresentou os seguintes diâmetros(em mm):

10 13 14 11 13 14 11 13 14 15

12 14 15 13 14 12 12 11 15 1613 15 14 14 15 15 16 12 10 15Supondo que os diâmetros sejam aproximadamente normais, obtenha um intervalode con ança para o diâmetro médio de todos os parafusos produzidos nessa fábrica,usando o nível de signi cância de 2%. Para facilitar a solução do exercício, vocêpode usar os seguintes resultados:

30

Pi=1xi = 401

30

Pi=1x2

i = 5443

Page 111: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 111/189

CAPÍTULO 7. INTERVALO DE CONFIANÇA: VARIÂNCIA DAN (μ; σ2) 106

7.4 Solução dos Exercícios1. Na linha correspondente a 17 graus de liberdade, devem ser consultadas as seguintes

colunas:

(a) α = 0 , 2 =⇒k = 21 , 615(b) α = 0 , 8 =⇒

k = 12 , 002(c) α = 0 , 1 =

⇒k = 24 , 769

2. Contexto: População normal

n = 15 1 −α = 0 , 95⇒½χ 2

14;0,025 = 26 , 119χ 2

14;0,975 = 5 , 629

x =80815

= 53 , 8667

s2 = 114 ·44176 −8082

15 ¸= 46 , 5524

Intervalo de con ança:

·14 × 46, 552426, 119

;14 × 46, 5524

5, 629 ¸= [24, 95;1157, 78]

3. Contexto: População normal

n = 25 s2 = 900 1

−α = 0 , 98

⇒½χ 2

24;0,01 = 42, 980χ 2

24;0,99= 10, 856

Intervalo de con ança:

·24 × 90042, 98

;24 × 90010, 856 ¸= [502, 56; 1989, 68]

4. Contexto: População normal

n = 30 α = 2%⇒

1 −α = 0 , 98⇒½χ 2

29;0,01 = 49 , 588χ 2

29;0,99 = 14 , 258

x =40130 = 13 , 367

s2 =129 ·5443 −

4012

30 ¸= 2 , 861

Intervalo de con ança:

·29 × 2, 86149, 588

;29 × 2, 861

14, 258 ¸= [1, 67;5, 82]

Page 112: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 112/189

Capítulo 8

Testes de Hipóteses

Na teoria de estimação, vimos que é possível, através de estatísticas amostrais ade-quadas, estimar parâmetros de uma população, dentro de um certo intervalo de con- ança. Nos testes de hipóteses, ao invés de se construir um intervalo de con ança noqual se espera que o parâmetro da população esteja contido, testa-se a validade de umaa rmação sobre um parâmetro da população. Então, num teste de hipótese, procura-se tomar decisões a respeito de uma população, com base em informações obtidas deamostras desta mesma população.

Neste capítulo você aprenderá os seguintes conceitos:• hipóteses nula e alternativa

• erros tipo I e II

• estatística de teste

• regra de decisão• região crítica

• função característica de operação

• poder do teste

8.1 Noções básicasVamos trabalhar com alguns exemplos para ilustrar os conceitos básicos que precisamospara construir testes de hipóteses estatísticos.

8.1.1 Exemplo 1Um detetive de polícia é encarregado da investigação de um crime. Baseado nas evidên-cias encontradas, o detetive suspeita inicialmente do mordomo e precisa decidir, então,se prende ou libera o mordomo. Por outro lado, o mordomo pode ser culpado ou in-ocente. Assim, há 4 possibilidades, resumidas no Quadro 1, que podem ocorrer quandoo detetive tomar sua decisão:

107

Page 113: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 113/189

CAPÍTULO 8. TESTES DE HIPÓTESES 108

• prender o mordomo, quando, na verdade, o mordomo é o assassino−→decisãocorreta

• prender o mordomo, quando, na verdade, o mordomo é inocente−→decisão errada

• liberar o mordomo, quando, na verdade, o mordomo é o assassino

−→decisão

errada• liberar o mordomo, quando, na verdade, o mordomo é inocente−→decisão correta

Quadro 1Possibilidades sobre a decisão do detetive

DetetivePrende Libera

Mordomo Inocente Errado OKCulpado OK Errado

Se o problema do detetive fosse de origem estatística, a primeira providência queele teria que tomar seria formular umahipótese nula , que é uma a rmação sobre umparâmetro da população. A hipótese nula, normalmente designada porH 0, é umaa rmação que é estabelecida com o objetivo de ser testada; ela pode ser rejeitada ounão. Normalmente, a hipótese nula é formulada de tal forma que o objetivo é rejeitá-la.No exemplo, como o detetive suspeita do mordomo, a formulação mais adequada é

H 0 : mordomo é inocente

Se as evidências são su cientes para se rejeitar a hipótese nula, então aceita-se ahipótese alternativa , normalmente designada porH 1, que será aceita se a hipótese nulafor rejeitada. No exemplo, como só existem 2 possibilidades, temos que

H 1 : mordomo é culpado

Observe que o método é aplicado para se testar a hipótese nula. A hipótese alter-nativa será aceita se e somente se a hipótese nula for rejeitada, ou seja, a estratégia étomar uma decisão com relação à hipótese nula.

Depois de examinar todas as evidências, o detetive deve rejeitarH 0 (e concluir que

o mordomo é culpado) ou não rejeitarH 0 (e concluir que o mordomo é inocente). Noteque as conclusões são sempre estabelecidas em termos da hipótese nula. Como já visto,o detetive pode cometer dois tipos de erro:

• erro tipo I: rejeitar a hipótese nula quando é verdadeira;

• erro tipo II: não rejeitar a hipótese nula quando é falsa.

No Quadro 2 a seguir temos a ilustração dessas situações.

Page 114: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 114/189

CAPÍTULO 8. TESTES DE HIPÓTESES 109

Quadro 2Possibilidades para a decisão

DecisãoRejeitar H 0 Não rejeitarH 0

Possibi- H 0 verdadeira Erro I OKlidades H 0 falsa OK Erro II

Evidentemente, o erro tipo I pode ser evitado se nunca rejeitarmos a hipótese nula.No exemplo, isso signi ca que o detetive nunca cometeria o erro de condenar um homeminocente. De forma análoga, o erro tipo II pode ser evitado se sempre rejeitarmos ahipótese nula e, no exemplo, o detetive nunca liberaria um assassino.

A teoria estatística de testes de hipóteses trata de regras de decisão, baseadas emprobabilidades, que tentam balancear esses dois tipos de erro.

8.1.2 Exemplo 2Uma empresa compra anéis de vedação de dois fabricantes. Segundo informações dosfabricantes, os anéis do fabricante 1 têm diâmetro médio de 14 cm com desvio padrãode 1,2 cm e os anéis do fabricante 2 têm diâmetro médio de 15 cm com desvio padrão de2,0 cm. Ambos os processos de produção geram anéis com diâmetros cuja distribuiçãoé aproximadamente normal.

Uma caixa com 16 anéis sem identi cação é encontrada pelo gerente do almoxarifado.Embora ele suspeite que a caixa seja oriunda do fabricante 1, ele decide fazer umamedição dos anéis e basear sua decisão no diâmetro médio da amostra: se o diâmetromédio for maior que 14,5 cm, ele identi cará a caixa como oriunda do fabricante 2; casocontrário, ele identi cará a caixa como oriunda do fabricante 1.

Esse é um problema típico de decisão empresarial. Vamos analisar esse processo de-cisório sob o ponto de vista estatístico, estudando os possíveis erros e suas probabilidadesde ocorrência.

Uma primeira observação é que existem apenas duas possibilidades para a origemdos anéis de vedação. Como ele suspeita que a caixa venha do fabricante 1, vamosestabelecer a hipótese nula de forma que o resultado desejado seja rejeitá-la. De nimos,então, a hipótese nula como sendo

H 0 : anéis vêm do fabricante 2e, obviamente, a hipótese alternativa será

H 1 : anéis vêm do fabricante 1

Se denotamos porX a variável aleatória que representa o diâmetro dos anéis, essashipóteses se traduzem como

H 0 : X ∼

N (15;2, 02)H 1 : X

∼N (14;1, 22)

Page 115: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 115/189

CAPÍTULO 8. TESTES DE HIPÓTESES 110

A regra de decisão do gerente é baseada na média amostral observada para os 16anéis encontrados. Como dito, nossa decisão deve ser expressa sempre em termos deH 0. Logo, a regra de decisão é

x ≤ 14, 5 =⇒

rejeitoH 0

x > 14, 5 =⇒ não rejeitoH 0

Os erros associados a essa regra de decisão são:

Erro I: rejeitarH 0 quando H 0 é verdadeiraErro II: não rejeitarH 0 quando H 0 é falsa

SeH 0 é verdadeira, a amostra vem de uma população normal com média 15 e desviopadrão 2,0. Nesse caso, a média amostral com base em amostra de tamanho 16 étambém normal com média 15 e desvio padrão2,0

√ 16 . Se H 0 é falsa, a amostra vem deuma população normal com média 14 e desvio padrão 1,2. Nesse caso, a média amostralcom base em amostra de tamanho 16 é também normal com média 14 e desvio padrão1,2√ 16 .

Então, as probabilidades associadas aos erros podem ser expressas em termos deprobabilidade condicional:

Pr( Erro I ) = Pr ·X ≤14, 5|X ∼

N µ15;2, 02

16 ¶¸Pr( Erro II ) = Pr ·X > 14, 5|X

∼N µ14;

1, 22

16 ¶¸Na Figura 8.1 a probabilidade associada ao erro I corresponde à área sombreada decinza claro, enquanto a área sombreada de cinza escuro corresponde à probabilidade doerro tipo II.

Vamos calcular essas probabilidades. Em geral, a probabilidade do erro tipo I édenotada porα e a probabilidade do erro tipo II porβ. Assim,

α = Pr( Erro I) =

= Pr ·X ≤14, 5|X ∼

N µ15;2, 02

16 ¶¸= Pr µZ ≤ 14, 5 −152

4 ¶= Pr( Z ≤ −1, 00)= Pr( Z ≥1, 00)= 0 , 5 −tab(1, 00) = 0, 5 −0, 34134= 0 , 15866

Page 116: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 116/189

CAPÍTULO 8. TESTES DE HIPÓTESES 111

Figura 8.1: Probabilidades dos erros I e II para o Exemplo 2

β = Pr( Erro II) =

= Pr ·X > 14, 5|X ∼

N µ14;1, 22

16 ¶¸= Pr µZ >

14, 5 −141.24 ¶

= Pr( Z > 1, 67)= 0 , 5

−tab(1, 67) = 0 , 04746

É importante você entender a sutileza da notação. A decisão do gerente tem queser tomada em função do resultado amostral observado; assim, usamos a notaçãox.Lembre-se que usamos letras minúsculas para representar o valor observado de umavariável aleatória. Quando falamos da probabilidade do erro ou mesmo da regra dedecisão em termos gerais, estamos considerando o procedimento decisório geral. Comoesse procedimento depende da amostra sorteada, temos que expressar as probabilidadesdos erros e a regra de decisão levando em conta as possíveis amostras, ou seja, temos quelevar em conta a variável aleatóriaX que descreve a média amostral de uma possívelamostra aleatória simples de tamanhon.

No exemplo, a regra de decisão geral é: seX > 14, 5 o gerente classi ca comoprodução do fabricante 2. Assim, se a caixa em questão tiver uma média de, porexemplo, 14,4 o gerente classi cará a caixa como produzida pelo fabricante 1.

8.1.3 Exemplo 3Para resumir os resultados do exemplo anterior, podemos construir o seguinte quadro:

Page 117: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 117/189

CAPÍTULO 8. TESTES DE HIPÓTESES 112

Gerente decide que origem é doFabricante 1 Fabricante 2

Fabricante 2 Erro I(α = 0 , 15866) OKVerdadeiro 1 OK Erro II(β = 0 , 04746)

Vemos aí que a probabilidade do erro tipo I é maior. Analisando aFigura 8.1podemos ver também que, se mudarmos a regra de decisão escolhendo um valor de cortediferente de 14,5, essas probabilidades se alterarão. Aumentandoα, diminuiβ e vice-versa. Vamos, agora, estabelecer uma nova regra de decisão de modo que a probabilidadedo erro tipo I passe a ser 0,05. A nossa região de rejeição, ouregião crítica , continuatendo a formaX ≤k. Pela Figura 8.1 , vemos quek tem que ser menor que 14,5.

α = 0 , 05⇐⇒

Pr ·X ≤k | X ∼

N µ15;2, 02

16 ¶¸= 0 , 05⇐⇒

Pr µZ ≤ k −1524 ¶= 0 , 05

⇐⇒

Pr µZ ≥ −k −15

0, 5 ¶= 0 , 05⇐⇒

0, 5 −tabµ−k −150, 5 ¶= 0 , 05

⇐⇒

tabµ−k −150, 5 ¶= 0 , 45

⇐⇒

−k −15

0, 5= 1 , 64

⇐⇒k = 14 , 18

Com essa nova regra de decisão, o erro tipo II passa a ter probabilidade

β = Pr( Erro II) =

= Pr ·X > 14, 18|X ∼

N µ14;1, 22

16 ¶¸= Pr ÃZ >

14, 18 −141,24

!= Pr( Z > 0, 6)= 0 , 5 −tab(0, 6) = 0 , 27425

8.1.4 Exemplo 4Suponha, agora, que o gerente queira igualar as probabilidades de erro. Qual é a regrade decisão?

Page 118: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 118/189

CAPÍTULO 8. TESTES DE HIPÓTESES 113

α = β ⇐⇒

Pr ·X ≤k | X ∼

N

µ15;

2, 02

16

¶¸= Pr ·X > k | X

∼N

µ14;

1, 22

16

¶¸⇐⇒

Pr µZ ≤ k −152.04 ¶= Pr µZ > k −14

1.24 ¶⇐⇒k −15

0, 5= −

k −140, 3 ⇐⇒

0, 3k −4, 5⇐⇒−0, 5k + 7

0, 8k = 11 , 5⇐⇒

k = 14, 375

Neste caso, as probabilidades dos erros tipo I e II são

α = β = Pr ·X ≤14, 375 | X ∼

N µ15; 2, 02

16 ¶¸= Pr µZ ≤

14, 375−150, 5 ¶

= Pr( Z ≤ −1, 25)= Pr( Z ≥1, 25)= 0 , 5 −tab(1, 25) = 0, 10565

8.1.5 Exemplo 5O procedimento de se xar a probabilidadeα do erro tipo I é o mais utilizado pois,em geral, na prática a situação não é tão simples como a escolha entre duas decisões.Suponha, nos dois exemplos acima, que a empresa compre anéis de diversos fabricantesmas, pelas características de produção do fabricante 2, os anéis produzidos por ele sejamespeciais para a empresa. Assim, é importante identi car corretamente a origem, casoeles sejam oriundos do fabricante 2. Nesta situação, nossas hipóteses passariam a ser:

H 0 : anéis são produzidos pelo fabricante 2H 1 : anéis não são produzidos pelo fabricante 2

Queremos que a probabilidadeα seja pequena; assim, podemos xar α como 0,05 oumesmo 0,01. De posse do valor dessa probabilidade, poderíamos estabelecer a regiãocrítica ou região de rejeição. A diferença fundamental aqui está no cálculo da proba-bilidade do erro tipo II: não existe um único valor deβ, já que, sobH 1, a distribuiçãopode ter qualquer média.

Page 119: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 119/189

CAPÍTULO 8. TESTES DE HIPÓTESES 114

8.1.6 Exemplo 6Considere a seguinte regra de decisão sobre a honestidade de uma moeda. Se em trêslançamentos aparecerem 3 coroas, decidimos rejeitar a hipótese de que a moeda é hon-esta. Como devemos estabelecer as hipóteses nula e alternativa? Como devemos pro-ceder para calcularα e β ?

Em termos gerais, a questão que se coloca é se a moeda é honesta ou não. Comoregra geral, neste curso deveremos sempre de nir a hipótese nula de modo que elarepresente um único valor do parâmetro de interesse. Ou seja, a hipótese nula deveser uma hipótese simples . Neste exemplo, a distribuição em questão é uma binomialcom parâmetrosn = 3 e p desconhecido. Moeda honesta signi ca p = 1

2 . Logo, nossashipóteses devem ser:

H 0 : p =12

H 1 : p 6=1

2SejaX = número de coroas nos três lançamentos. Então,X

∼bin(3; p). Nossa regra

de decisão é rejeitarH 0 se X = 3 . A probabilidade do erro tipo I é

α = Pr ·X = 3 |X ∼

binµ3;12¶¸

=12

×12

×12

=18

Não é possível calcularβ = Pr( não rejeitarH 0|H 0 é falsa), pois a hipótese alternativa(aquela que devemos considerar quandoH 0 não é aceita) não estipula um valor únicopara p. Mas neste exemplo simples, podemos obter uma expressão paraβ em função de p. Note que

β = Pr [ X < 3|X ∼

bin(3; p)]= 1 −Pr [X ≥3|X

∼bin(3; p)]

= 1 −Pr [X = 3 |X ∼

bin(3; p)]= 1 − p3

8.1.7 Lista de Exercícios 11. Estabeleça as hipóteses nula e alternativa para as seguintes situações:

(a) Depois de uma pane geral no sistema de informação de uma empresa, ogerente administrativo deseja saber se houve alteração no tempo de processa-mento de determinada atividade. Antes da pane, o tempo de processamentopodia ser aproximado por uma variável aleatória normal com média de 100minutos e desvio padrão de 10 minutos. O gerente acredita que a pane nãotenha alterado a variabilidade do processo.

Page 120: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 120/189

CAPÍTULO 8. TESTES DE HIPÓTESES 115

(b) O dono de uma média empresa decide investigar a alegação de seus empre-gados de que o salário médio na sua empresa é menor que o salário médionacional, que é de 900 reais.

(c) Uma empresa fabricante de balas a rma que o peso médio de suas balas é depelo menos 2 gramas.

2. Considere uma população normal com variância 225, da qual se extrai uma amostraaleatória simples de tamanho 25. Deseja-se testar as seguintes hipóteses:

H 0 : μ = 40H 1 : μ = 45

(a) Se a região crítica éRC : X > 43 calcule as probabilidades dos erros tipo I eII.

(b) Determine a região crítica da formaX > k tal que a probabilidade do errotipo I seja 0,10. Nesse caso, qual é a probabilidade do erro tipo II?

8.2 Conceitos básicosO contexto em que se baseia a teoria de teste de hipótese é basicamente o mesmo dateoria de estimação por intervalo de con ança. Temos uma população representada poruma variável aleatóriaX cuja distribuição de probabilidade depende de algum parâmetroθ. O interesse agora está em testar a veracidade de alguma a rmativa sobreθ.

8.2.1 Hipótese nulaA hipótese nula, representada porH 0, é a hipótese básica que queremos testar. Emgeral, de nimos a hipótese nula de modo que o nosso objetivo seja rejeitarH 0. Nessetexto consideraremos apenas hipóteses nulas simples, isto é, hipóteses que estabelecemque o parâmetro de interesse éigual a um determinado valor. A forma geral é

H 0 : θ = θ0

Alguns exemplos são:

H 0 : μ = 6 H 0 : p = 0 , 5 H 0 : σ2

= 25O procedimento de teste de hipótese resultará em umaregra de decisão que nos permitirárejeitar ou não rejeitar H 0.

Page 121: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 121/189

Page 122: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 122/189

CAPÍTULO 8. TESTES DE HIPÓTESES 117

Vamos considerar o seguinte exemplo: se, ao lançarmos uma moeda 30 vezes, ob-tivermos 28 caras, iremos descon ar da hipótese de honestidade da moeda, porque aprobabilidade de obtermos 28 caras ou mais em 30 lançamentos de uma moeda honestaé 0,000000433996, uma probabilidade bastante pequena. É claro que o evento “28 carasou mais em 30 lançamentos” é um evento possível (acertar a sena no jogo da mega-senatambém é...) mas, sob o ponto de vista do teste de hipótese, a obtenção de tal eventoserá uma evidência de que a nossa hipótese nula de honestidade da moeda não é muitoplausível. Nesse caso, não diremos que a moeda não é honesta (não podemos dizer queé impossível acertar a sena!); nossa conclusão é que não há evidência su ciente paraapoiar a hipótese nula. (Situação análoga ocorre quando um júri diz que o réu é “nãoculpado”.)

A de nição de “probabilidade pequena” se faz através da escolha donível de sig-ni cância α do teste, que é a probabilidade do erro tipo I, isto é:

α = Pr( erro tipo I) = Pr( rejeitar H 0 | H 0 é verdadeira)

Em geral, o valor deα é pequeno e as escolhas mais comuns sãoα = 0 , 05 e α = 0 , 01.De nido o nível de signi cância α, podemos estabelecer a região crítica usando a

distribuição amostral da estatística de teste.

8.2.5 Função característica de operação e poder do testeNo procedimento de teste de hipótese, as decisões possíveis são rejeitar ou não rejeitarH 0. De nem-se, assim, as seguintes funções em termos das probabilidades de cada umadelas. Afunção característica de operação é de nida como

β (θ) = Pr( não rejeitarH 0 | θ)De ne-se afunção poder do teste como

Q(θ) = 1 −β (θ) = Pr( rejeitar H 0 | θ)

Estas funções (probabilidades) estão condicionadas ao verdadeiro e desconhecido valordo parâmetroθ. Se este valor estiver no conjunto de valores de nidos pela hipótese alter-nativa, entãoQ(θ) corresponde a uma probabilidade de acerto: ela mede a probabilidadede se rejeitarH 0 quando H 0 é falsa. Por outro lado, se a hipótese nula éH 0 : θ = θ0,então

Q(θ0) = 1 −β (θ0)= 1 −Pr( não rejeitarH 0 | θ0)= 1 −Pr( não rejeitarH 0 | H 0 verdadeira)= Pr( rejeitar H 0 | H 0 verdadeira)= α

Page 123: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 123/189

CAPÍTULO 8. TESTES DE HIPÓTESES 118

8.3 Exemplo 7Consideremos uma população representada por uma variável aleatória normal com médiaμ e variância 400. Deseja-se testar

H 0 : μ = 100H 1 : μ 6= 100

com base em uma amostra aleatória simples de tamanhon = 16 . Para tal, de ne-se aseguinte região crítica:

RC : X < 85 ou X > 115

1. Calcule a probabilidade do erro tipo I.

2. Calcule a função poder do teste para os seguintes valores deμ : 75, 80, 85, 90, 95,100, 105, 110, 115, 120, 125. Quanto vale a função poder do teste quandoμ = 100?Solução

Como queremos fazer um teste sobre a média da população, é natural usarmosX como estatística de teste. Como a população é normal com médiaμ e variância 400,sabemos queX também é normal com médiaμ e variância400

16 = 25 .

1. Sob a hipótese nula,μ = 100. Então,α = Pr( rejeitar H 0 | H 0 verdadeira)

= Pr £©X < 85ª∪©X > 115ª| X ∼

N (100; 25)¤= Pr

£X < 85 | X

∼N (100; 25)

¤+ Pr

£X > 115 | X

∼N (100; 25)

¤= Pr µZ <85

−100

5 ¶+ Pr µZ >115

−100

5 ¶= Pr( Z < −3) + Pr( Z > 3)= 2 × Pr( Z > 3)= 2 × [0, 5 −tab(3)]= 0 , 0027

2. A função poder é dada por1 −β (μ) = 1 −Pr( não rejeitarH 0 | μ)

= 1

−Pr(85

≤X

≤115 | μ)

= 1 −Pr £85 ≤X ≤115 | X ∼

N (μ;25)¤= 1 −Pr µ85 −μ5 ≤Z ≤

115 −μ5 ¶

Vamos ilustrar o cálculo paraμ = 75 :

1 −β (75) = 1 −Pr(2 ≤Z ≤8)= 1 −[tab(8) −tab(2)]= 0 , 97725

Page 124: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 124/189

CAPÍTULO 8. TESTES DE HIPÓTESES 119

De forma análoga obtemos a seguinte tabela:

μ 1 −β (μ)75 0,9772580 0,84134

85 0,5000090 0,1586695 0,02278

100 0,00270105 0,02278110 0,15866115 0,50000120 0,84134125 0,97725

Observe que, paraμ = 100 , valor da hipótese nula, a função poder é igual àprobabilidade do erro tipo I (nível de signi cância).É interessante notar também que quanto mais distante do valorμ0 = 100, maior opoder do teste, ou seja, há uma probabilidade mais alta de se rejeitarH 0 quandoo valor alternativoμ está bem distante deμ0.

8.4 Exemplo 8Considere a situação do exemplo anterior, com as seguintes diferenças: o tamanho daamostra én = 100 e a região crítica passa a ser

RC : X < 94 ou X > 106

Note que é razoável “estreitar” a região crítica, já que a amostra é maior. Vamos calcularα e a função poder do teste para os mesmos valores.

SoluçãoComo antes, a função poder é dada por

Q(μ) = 1 −Pr( não rejeitarH 0 | μ)= 1 −Pr(94 ≤X ≤106 | μ)

= 1 −Pr £94 ≤X ≤106 | X ∼N (μ; 4)¤= 1 −Pr µ94 −μ2 ≤Z ≤

106 −μ2 ¶

Page 125: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 125/189

CAPÍTULO 8. TESTES DE HIPÓTESES 120

com os seguintes valores:μ Q(μ)75 1,0000080 1,0000085 0,9999990 0,9772595 0,30854

100 0,00270105 0,30854110 0,97725115 0,99999120 1,00000125 1,00000

Note que esse teste tem o mesmo nível de signi cância do exemplo anterior:α =Q(100) = 0 , 0027.

Na Figura 8.2 temos o grá co da função poder para os dois exemplos. Note que opoder do teste baseado em uma amostra de tamanho 100 é sempre maior que o poderdo teste baseado em uma amostra de tamanho 16.

0,0

0,2

0,4

0,6

0,8

1,0

1,2

50 60 70 80 90 100 110 120 130

n=16

n=100

Figura 8.2: Comparação do poder de dois testes

8.4.1 Lista de Exercícios 21. Considere uma população normal com variância 225, da qual se extrai uma amostra

aleatória simples de tamanho 25. Deseja-se testar as seguintes hipóteses:

H 0 : μ = 40H 1 : μ 6= 40

Page 126: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 126/189

CAPÍTULO 8. TESTES DE HIPÓTESES 121

(a) e para isso de ne-se a seguinte região crítica:

RC : X > 46 ou X < 34

(b) Calcule a probabilidade do erro tipo I.

(c) Obtenha a expressão geral para a função poder do teste.(d) Calcule o poder do teste para os seguintes valores deμ : 20, 22, 24, . . . , 56, 58, 60.(e) Esboce o grá co da função poder.

8.5 Resumo do CapítuloNeste capítulo estudamos os conceitos básicos da teoria de testes de hipóteses, em que ointeresse está em testar a validade de uma a rmação sobre um parâmetro da população.Então, num teste de hipótese, procura-se tomar decisões a respeito de uma população,com base em informações obtidas de amostras desta mesma população.

Ao nal deste capítulo você deve ser capaz de entender perfeitamente os seguintesconceitos.

• A hipótese nula , representada porH 0, é a hipótese básica que queremos testar.Nesse texto consideraremos apenas hipóteses nulas simples do tipo

H 0 : θ = θ0

• A hipótese alternativa , representada porH 1, é a hipótese que devemos considerarno caso de rejeição da hipótese nula. A forma mais geral deH 1 é a hipótesebilateral, mas podemos ter hipóteses unilaterais à esquerda e hipóteses unilateraisà direita:

H 1 : θ 6= θ0 H 1 : θ < θ0 H 1 : θ > θ0

• A estatística de teste é a estatística amostral apropriada para construir o nossoteste de hipótese. As estatísticas de teste usuais são a média amostralX e aproporção amostralbP, que serão usadas na construção de testes sobre a média ea proporção populacionais, respectivamente.

• O procedimento de decisão é de nido em termos da hipótese nulaH 0, com asseguintes decisões possíveis (i) rejeitarH 0 ou (ii) não rejeitarH 0.

• Os erros possíveis no processo de decião baseado em um teste de hipótese são

Erro tipo I: rejeitarH 0 quando H 0 é verdadeiraErro tipo II: não rejeitarH 0 quando H 0 é falsa

• A região crítica ou região de rejeição é o conjunto de valores da estatística de testeque levam à rejeição deH 0; a região crítica será denotada porRC .

Page 127: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 127/189

CAPÍTULO 8. TESTES DE HIPÓTESES 122

• Em geral, a de nição da região crítica é feita xando-se a probabilidade do errotipo I; essa probabilidade é chamadanível de signi cância e será indicada pelaletra grega alfa:α.

• A função característica de operação é de nida como

β (θ) = Pr( não rejeitarH 0 | θ)

Para valores deθ fora da região crítica, essa probabilidade corresponde à proba-bilidade de um acerto.

• A função poder do teste é de nida como

Q(θ) = 1 −β (θ) = Pr( rejeitar H 0 | θ)

Para valores deθ dentro da região crítica, essa probabilidade corresponde à prob-abilidade de um acerto.

8.6 Exercícios1. Considere uma população normal com variância 64, da qual se extrai uma amostra

aleatória simples de tamanho 16. Deseja-se testar as seguintes hipóteses:

H 0 : μ = 23H 1 : μ = 28

(a) Se a região crítica éRC : X > 25, 5 calcule as probabilidades dos erros tipoI e II.

(b) Determine a região crítica da formaX > k tal que a probabilidade do errotipo I seja 0,05. Nesse caso, qual é a probabilidade do erro tipo II?

2. Desejando-se testar as hipóteses

H 0 : μ = 45H 1 : μ < 45

sobre a médiaμ de uma população normal com variância 36, estabeleceu-se aseguinte região crítica com base em amostra aleatória simples de tamanhon = 16 :

RC : X < 41, 25

(a) Calcule a probabilidade do erro tipo I.(b) Calcule o poder do teste para os seguintes valores deμ : 30, 31, . . . , 59, 60.(c) Esboce o grá co da função poder plotando os pontos(μ; Q(μ)).

Page 128: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 128/189

Page 129: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 129/189

Page 130: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 130/189

CAPÍTULO 8. TESTES DE HIPÓTESES 125

(a) .

α = Pr £X < 34 | X ∼

N (40; 9)¤+ Pr £X > 46 | X ∼

N (40;9)¤= Pr

µZ <

34 −403

¶+ Pr

µZ >

46 −403

¶= Pr( Z < −2) + Pr( Z > 2)= 2 × Pr( Z > 2)= 2 × [0, 5 −tab(2, )]= 0 , 0455

(b) .

Q(μ) = Pr( rejeitar H 0 | μ)= Pr

£X < 34 | X

∼N (μ; 9)

¤+ Pr

£X > 46 | X

∼N (μ; 9)

¤= Pr µZ < 34 −μ3 ¶+ Pr µZ > 46 −μ3 ¶(c) . Vamos fazer os cálculos paraμ = 20 , 22, 58, 60.

Q(20) = Pr µZ <34 −20

3 ¶+ Pr µZ >46 −20

3 ¶= Pr( Z < 4, 67) + Pr( Z > 8, 67)

≈ 1 + 0 = 1

Q(60) = Pr µZ < 34 −603 ¶+ Pr µZ > 46 −603 ¶= Pr( Z < −8, 67) + Pr( Z > −4, 67)= Pr( Z > 8, 67) + Pr( Z < 4, 67) = Q(20)

Q(22) = Pr µZ <34 −22

3 ¶+ Pr µZ >46 −22

3 ¶= Pr( Z < 4, 00) + Pr( Z > 8, 00)

≈ 1 + 0 = 1

Q(58) = Pr µZ <34 −58

3 ¶+ Pr µZ >46 −58

3 ¶= Pr( Z < −8, 00) + Pr( Z > −4, 00)= Pr( Z > 8, 00) + Pr( Z < 4, 00) = Q(22)

Podemos ver que a função poder é simétrica; assim, só precisamos calcularQ(μ) para μ = 20 , 22, 24, . . . , 38, 40. Os resultados estão na tabela a seguire o grá co está naFigura 8.3 .

Page 131: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 131/189

CAPÍTULO 8. TESTES DE HIPÓTESES 126

μ Q(μ) μ Q(μ)20 0,99999847 60 0,9999984722 0,99996833 58 0,9999683324 0,99957094 56 0,99957094

26 0,99616962 54 0,9961696228 0,97724987 52 0,9772498730 0,90878883 50 0,9087888332 0,74750899 48 0,7475089934 0,50003167 46 0,5000316736 0,25292160 44 0,2529216038 0,09504160 42 0,0950416040 0,04550026

0,0

0,2

0,4

0,6

0,8

1,0

1,2

0 10 20 30 40 50 60 70

Figura 8.3: Solução da Lista de Exercícios 1

8.8 Solução dos Exercícios

1. X ∼

N (μ;64)n = 16 ¾⇒X

∼N µμ;

6416¶ou X

∼N (μ; 4)

(a)

α = Pr £X > 25, 5 | X ∼

N (23;4)¤= Pr µZ >25, 5 −23

2 ¶= Pr( Z > 1, 25)= 0 , 5 −tab(1, 25)= 0 , 10565

Page 132: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 132/189

CAPÍTULO 8. TESTES DE HIPÓTESES 127

β = Pr( X ≤25, 5 | X ∼

N (28; 4)

= Pr µZ ≤25, 5 −28

2 ¶= Pr( Z ≤ −1, 25)

= Pr( Z > 1, 25)= 0 , 10565

(b)

α = 0 , 05⇐⇒

Pr £X > k | X ∼

N (23; 4)¤= 0 , 05⇐⇒

Pr µZ >k −23

2 ¶= 0 , 05⇐⇒

tab

µk

−23

2 ¶= 0 , 45

⇐⇒k −232

= 1 , 64⇐⇒

k = 26 , 28

β = Pr( X ≤26, 28 | X ∼

N (28; 4)

= Pr µZ ≤26, 28 −28

2 ¶= Pr( Z ≤ −0, 86)

= Pr( Z ≥0, 86)= 0 , 5 −tab(0, 86)= 0 , 19489

2. X ∼

N (μ;36) n = 16X ∼

N ¡μ; 3616¢ou X

∼N (μ; 2, 25)

A função poder do teste é

Q(μ) = Pr( rejeitar H 0|μ)

= Pr( X < 41, 25|X ∼N (μ; 1, 52)

= Pr µZ <41, 25 −μ

1, 5 ¶

Page 133: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 133/189

Page 134: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 134/189

CAPÍTULO 8. TESTES DE HIPÓTESES 129

(a)

α = Pr( X = 0 | p = 0 , 5) + Pr( X = 1 | p = 0 , 5) +Pr( X = 2 | p = 0 , 5) + Pr( X = 8 | p = 0 , 5) +Pr( X = 9 | p = 0 , 5) + Pr( X = 10 | p = 0 , 5)

= 0 , 510 + ¡101¢(0, 5)(0, 5)9 + ¡

102¢(0, 5)2 (0, 5)8 +

¡108¢(0, 5)8 (0, 5)2 + ¡10

9¢(0, 5)9 (0, 5) + ¡1010¢(0, 5)10

= 0 , 000976563 + 0, 009765625 + 0, 043945313 +0, 043945313 + 0, 009765625 + 0, 000976563

= 0 , 109375

(b)

Q(0, 2) = Pr( X = 0 | p = 0 , 2) + Pr( X = 1 | p = 0 , 2) +

Pr( X = 2 | p = 0 , 2) + Pr( X = 8 | p = 0 , 2) +Pr( X = 9 | p = 0 , 2) + Pr( X = 10 | p = 0 , 2)

= 0 , 810 + ¡101¢(0, 2)(0, 8)9 + ¡10

2¢(0, 2)2 (0, 8)8 +

¡108¢(0, 2)8 (0, 8)2 + ¡10

9¢(0, 2)9 (0, 8) + ¡1010¢(0, 2)10

= 0 , 107374182 + 0, 268435456 + 0, 301989888+0 , 00007373 + 0, 00000410 + 0, 00000010

= 0 , 677877453

Analogamente obtém-se a seguinte tabela:

p Q( p)0, 1 0,92980950, 2 0,67787750, 3 0,38437320, 4 0,17958430, 5 0,10937500, 6 0,17958430, 7 0,38437320, 8 0,6778775

0, 9 0,9298095Veja a Figura 8.5 .

Page 135: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 135/189

CAPÍTULO 8. TESTES DE HIPÓTESES 130

0,00,10,20,30,40,50,60,70,80,91,0

0,0 0,2 0,4 0,6 0,8 1,0

Figura 8.5: Função poder do teste para o Exercício 3

Page 136: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 136/189

Capítulo 9

Teste de Hipótese: Média daN (μ; σ2) - σ2 Conhecida

Neste capítulo iremos aplicar os conceitos básicos sobre a teoria de teste de hipótese auma situação especí ca. Nosso interesse estará concentrado na média de uma populaçãonormal. Assim como no caso dos intervalos de con ança, iremos iniciar nossos estudossupondo que a variância dessa população seja conhecida. Como já dito, essa situaçãonão é muito comum na prática, mas, em termos didáticos, a apresentação dos conceitos ca simpli cada. Entendendo bem a construção de um teste de hipótese para esse casoparticular, a apresentação para as outras situações é bastante semelhante, mudandoapenas a distribuição amostral.

Neste capítulo veremos os seguintes conceitos aplicados à média de uma populaçãonormal com variância conhecida:

• hipóteses nula e alternativa• erros tipo I e II

• estatística de teste

• regra de decisão

• região crítica

• função característica de operação

• poder do teste• valorP

Vamos apresentar inicialmente três exemplos que ilustrarão as diversas possibilidadesque podem surgir na prática.

131

Page 137: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 137/189

Page 138: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 138/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA133

Quando H 0 é verdadeira, a estatística de teste tem a seguinte distribuição:

H 0 verdadeira=⇒

X ∼

N µ100;10016 ¶

ou equivalentemente,Z 0 = X −100

q 10016∼

N (0; 1)

A nossa região crítica consiste nos valores deX com probabilidade pequena de ocor-rerem sob essa hipótese. Ou seja, a região crítica consiste nos valores deX muitoafastados da média suposta deμ = 100. Como a hipótese alternativa é bilateral, “muitoafastado” signi ca “muito maior” ou “muito menor” do queμ = 100. Veja a Figura9.1 .

Figura 9.1: Região crítica para o teste bilateral deH 0 : μ = 100

Então, nossa região crítica é

X > 100 + k ou X < 100−k

e isso é equivalente a

X −100 > k ou X −100 < −kUsando a função módulo, podemos escrever:

RC : ¯̄X −100¯̄> k

e o valor da constantek é determinado pelo nível de signi cância:

0, 05 = Pr £̄̄X −100¯̄> k | X ∼

N (100; 6, 25)¤

Page 139: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 139/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA134

9.1.4 Determinação da região críticaPara determinar a região crítica, basta encontrar o valor da constantek tal que

Pr

£̄̄X −100

¯̄> k | X

∼N (100; 6, 25)

¤= 0 , 05 =

Pr £X −100 > k | X ∼N (100;6, 25)¤+ Pr £X −100 < −k | X ∼N (100; 6, 25)¤= 0 , 05 =⇒Pr µZ >

k2, 5¶+ Pr µZ < −k

2, 5¶= 0 , 05 =⇒

Pr µZ >k

2, 5¶+ Pr µZ >k

2, 5¶= 0 , 05 =⇒

Pr µZ >k

2, 5¶= 0 , 025 =⇒

tabµk2, 5¶= 0 , 475 =

k2, 5 = 1 , 96 =⇒k = 4 , 9

A região crítica é

RC : X > 104, 9 ou X < 95, 1

Como o valor da estatística de teste para a amostra observada está na região crítica,devemos rejeitar a hipótese nula, ou seja, as evidências amostrais indicam uma alteraçãodo tempo de processamento da tarefa após a pane.

9.1.5 PoderA função poder do teste é de nida como

β (μ) = Pr( rejeitar H 0|μ)

Em termos da nossa região crítica podemos escrever

β (μ) = Pr

£X > 104, 9 | X

∼N (μ; 6, 25)

¤+ Pr

£X < 95, 1 | X

∼N (μ; 6, 25)

¤= Pr µZ > 104, 9 −μ2, 5 ¶+ Pr µZ < 95, 1 −μ

2, 5 ¶Calculandoβ (μ) para diferentes valores deμ obtemos o grá co exibido naFigura 9.2 .

Page 140: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 140/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA135

0,000,050,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,951,001,05

85 90 95 100 105 110 115

Figura 9.2: Função poder - Exemplo 1

9.2 Exemplo 2Na mesma situação do exemplo anterior, é bastante razoável supor que o gerente estejainteressado apenas no caso de aumento do tempo de processamento. A nal, se o tempodiminuir, isso signi ca que a tarefa vai ser executada mais rapidamente, o que representaum ganho. Então, as duas possibilidades são:

μ ≤ 100 OK!μ > 100 Problema!

Para de nir qual é a hipótese nula, vamos usar o seguinte procedimento. Como ditono capítulo anterior, neste curso só trabalharemos com hipóteses nulas simples, isto é,hipóteses nulas que envolvam igualdade do parâmetro a um determinado valor:θ = θ0.Assim, em um teste unilateral, a hipótese alternativa deve ser aquela que não envolve osinal de igualdade. No nosso exemplo, essa é a hipóteseμ > 100. A hipótese nula, tendoque ser uma hipótese simples, passa a serμ = 100, ou seja:

H 0 : μ = 100H 1 : μ > 100

A estatística de teste continua sendo

X ∼

N µμ;10016 ¶

O que muda é a região crítica, que agora passa a ser

RC : X > 100 + k

Veja a Figura 9.3 .

Page 141: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 141/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA136

Figura 9.3: Região crítica para o teste deH 0 : μ = 100 com alternativa unilateral àdireita H 1 : μ > 100

Como o nível de signi cância é 5%, isso signi ca que

0, 05 = Pr £X > 100 + k | X ∼

N (100; 6, 25)¤e o valor da constante é calculado como

Pr £X > 100 + k | X ∼

N (100; 6, 25)¤= 0 , 05 =⇒

Pr

µZ >

100 + k −100

2, 5 ¶= 0 , 05 =

⇒tabµk

2, 5¶= 0 , 45 =⇒

k2, 5

= 1 , 64 =⇒

k = 4 , 1

e isso nos leva à região crítica

RC : X > 104, 1

Como no exemplo anterior, temos que rejeitar a hipótese nula de que o tempo deprocessamento não se alterou, já que o valor observado da estatística amostral está naregião crítica.

A função poder do teste é

β (μ) = Pr( X > 104, 1|μ)

cujo grá co encontra-se naFigura 9.4. Note que para valores deμ menores do que 100a probabilidade de rejeitarH 0 é zero, o que é razoável, pois com uma hipótese unilateral

Page 142: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 142/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA137

0,0

0,2

0,4

0,6

0,8

1,0

1,2

80 85 90 95 100 105 110 115

Figura 9.4: Função poder - Exempo 2

à direita, só rejeitamos a hipótese nula para valores muito maiores do que 100. Se ovalor observado da estatística de teste é menor do que 100, é claro que não devemosrejeitar H 0.

9.3 Exemplo 3O dono de uma média empresa decide investigar a alegação de seus empregados de que osalário médio na sua empresa é menor que o salário médio nacional. Para isso, ele analisauma amostra de 25 salários, obtendo uma média de 894,53 reais. De informações obtidas junto ao sindicato patronal, ele sabe que, em nível nacional, o salário médio é de 900reais, com desvio padrão de 32 reais. Supondo que seja razoável aproximar a distribuiçãodos salários por uma distribuição normal com o mesmo desvio padrão nacional, vamosconstruir um teste de hipótese apropriado, com um nível de signi cância de 10%.

O problema aqui consiste em decidir se os salários são menores ou não do que amédia nacional de 900 reais, ou seja, as situações de interesse são

μ < 900μ

≥900

Como no exemplo anterior, a hipótese alternativa é aquela que não envolve o sinalde igualdade. Logo, nossas hipóteses são:

H 0 : μ = 900H 1 : μ < 900

e a estatística de teste éX ∼

N µμ;322

25¶

Page 143: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 143/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA138

O proprietário deve rejeitar a hipótese nula se a média amostral for muito menor doque 900, ou seja, a região crítica é

RC : X < 900 −k

Veja aFigura 9.5.

Figura 9.5: Região crítica para o teste deH 0 : μ = 900 com alternativa unilateral àesquerdaH 1 : μ < 900

O valor dek é determinado pelo nível de signi cância:

Pr £X < 900−k | X ∼N (900; 6, 42)¤= 0 , 10 =⇒Pr µZ <

900−k −9006, 4 ¶= 0 , 10 =

Pr µZ < −k

6, 4¶= 0 , 10 =⇒

Pr µZ >k

6, 4¶= 0 , 10 =⇒

tab

µk

6, 4

¶= 0 , 40 =

k6, 4

= 1 , 28 =⇒

k = 8 , 192

Logo, a região crítica éRC : X < 891, 808

Veja na Figura 9.6 a função poder deste teste: para valores maiores do que 900, aprobabilidade de rejeitar a hipótese nula é zero.

Page 144: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 144/189

Page 145: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 145/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA140

alternativas. Como antes, vamos denotar porzα a abscissa da curva normal padrão quedeixa área (probabilidade)α acima dela.

9.4.1 Teste bilateralConsideremos as hipóteses

H 0 : μ = μ0

H 1 : μ 6= μ0

A região crítica é [veja aFigura 9.7-(a) ]

RC : X > μ 0 + k ou X < μ 0 −k

e se a hipótese nula é verdadeira,

X ∼

N µμ0;σ2

n ¶Com nível de signi cânciaα = Pr( erro I), temos que ter:

Pr( rejeitar H 0 | H 0 verdadeira) = α =⇒

Pr ·X > μ 0 + k | X ∼

N µμ0;σ2

n ¶¸+ Pr ·X < μ 0 −k | X ∼

N µμ0;σ2

n ¶¸= α =⇒

Pr

ÃZ >

μ0 + k −μ0σ

√ n !+ Pr

ÃZ <

μ0 −k −μ0σ

√ n != α =

⇒Pr ÃZ >

√ n !+ Pr ÃZ < −kσ

√ n != α =⇒

Pr ÃZ >kσ

√ n !+ Pr ÃZ >kσ

√ n != α =⇒

Pr ÃZ >kσ

√ n !=α2

=⇒

kσ√ n

= zα/ 2 =

⇒k = zα/ 2

σ√ n

Logo, a região crítica é

X > μ 0 + zα/ 2σ√ n ou X > μ 0 −zα/ 2

σ√ n

Page 146: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 146/189

Page 147: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 147/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA142

9.4.2 Teste unilateral à direita

Consideremos as hipóteses

H 0 : μ = μ0

H 1 : μ > μ 0

A região crítica é [veja aFigura 9.7-(b) ]

RC : X > μ 0 + k

e se a hipótese nula é verdadeira,

X ∼

N µμ0;σ2

n ¶Com nível de signi cânciaα = Pr( erro I), temos que ter:

Pr( rejeitar H 0 | H 0 verdadeira) = α =⇒

Pr ·X > μ 0 + k | X ∼

N µμ0;σ2

n ¶¸= α =⇒

Pr ÃZ >μ0 + k −μ0

σ√ n != α =

Pr

ÃZ >

√ n != α =⇒

√ n= zα =

k = zασ√ n

Logo, a região crítica éX > μ 0 + zα

σ√ n

9.4.3 Teste unilateral à esquerdaConsideremos as hipóteses

H 0 : μ = μ0

H 1 : μ < μ 0

A região crítica é [veja aFigura 9.7-(c) ]

RC : X < μ 0 −k

Page 148: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 148/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA143

e se a hipótese nula é verdadeira,

X ∼

N µμ0;σ2

n ¶Com nível de signi

cânciaα = Pr( erro I), temos que ter:

Pr( rejeitar H 0 | H 0 verdadeira) = α =⇒

Pr ·X < μ 0 −k | X ∼

N µμ0;σ2

n ¶¸= α =⇒

Pr ÃZ <μ0 −k −μ0

σ√ n != α =

Pr

ÃZ <

√ n != α =

⇒Pr ÃZ >

√ n != α =⇒

√ n= zα =

k = zασ√ n

Logo, a região crítica é

X < μ 0 −zα

σ

√ n

9.4.4 Teste de hipótese intervalo de con ançaÉ interessante notar a expressão que aparece na região crítica para o teste bilateral; elaé a mesma obtida para a margem de erro do intervalo de con ança para a média de umapopulação normal com variância conhecida:

= zα/ 2σ√ n

Podemos ver, assim, que existe uma relação entre os dois procedimentos; na verdade,em um teste de hipótese bilateral, rejeitamos a hipótese nulaH 0 se o valor observadoda estatística de teste não estiver no intervalo de con ança.

Page 149: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 149/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA144

9.5 Valor P Nos exemplos acima, a determinação da região crítica foi feita com base no nível designi cância, isto é, xado o nível de signi cância encontramos o valork que de niaos limites entre valores prováveis (aqueles que levam à não rejeição deH 0) e pouco

prováveis (aqueles que levam à rejeição deH 0). Um outro procedimento bastante usual,especialmente quando são utilizados programas computacionais, consiste em calcular aprobabilidade de se obter um valor tão ou mais desfavorável que o valor observado, seH 0 for verdadeira. Essa probabilidade é chamada valorP . Vamos ilustrar esse conceitoconsiderando novamente os três exemplos anteriores.

9.5.1 Teste bilateral - Valor P para o Exemplo 1O valor obtido com os dados amostrais para a estatística de teste éx = 105, 5. Comoo teste é bilateral, valores “longe” de 100 são aqueles muito menores ou muito maioresque 100. O procedimento visto consistiu em dividir a probabilidade do erro tipo Iigualmente nas duas caudas da distribuição normal e dessa forma identi camos a regiãocrítica. Vamos, agora, calcular o valorP para o nosso exemplo; ele é a probabilidade deobtermos um valor tão ou mais extremo que o valor observado. Como o valor observadoestá à direita da média, devemos calcular a seguinte probabilidade:

P = Pr( X ≥105, 5 | H 0 verdadeira)

= Pr ·X ≥105, 5 | X ∼

N µ100;10016 ¶¸

= Pr µZ ≥105.5

−100

2.5 ¶= Pr( Z ≥2, 2) = 0 , 5 −tab(2, 2)= 0 , 0139

Vamos analisar aFigura 9.8 , onde está ilustrado esse valor. O valor amostralobservado paraX é x = 105, 5 = 100 + 5 , 5. Como o teste é bilateral, se tivéssemosobtido o valorx = 100 −5, 5, esse valor também seria considerado tão afastado de 100quanto 105,5. Assim, para testes bilaterais, temos que considerar a probabilidade nasduas caudas da distribuição. O que esse resultado está nos dizendo é o seguinte: seH 0for verdadeira, a probabilidade de obtermos um valor distante de 100 por 5,5 unidades

em qualquer direção é2 × 0, 0139 = 0, 0278. Essa probabilidade é chamadavalor P.No exemplo, vemos que o valorP é pequeno, o que signi ca que é pouco provávelobtermos um valor tão extremo quandoH 0 é verdadeira. Logo, é razoável supormos quea hipótese nula não seja verdadeira, a mesma conclusão obtida ao trabalharmos com onível de signi cância de 5%. Na verdade, rejeitaríamos a hipótese nula para qualquernível de signi cância maior que 0,0278.

Page 150: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 150/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA145

Figura 9.8: ValorP para o teste bilateral do Exemplo 1

9.5.2 Teste unilateral à direita - Exemplo 2Como o teste é unilateral à direita, valores extremos são aqueles muito maiores que 100.Como visto acima,

P = 0 , 0139

Neste caso não temos que multiplicar por 2, pois o teste é unilateral. Como o valorP é muito pequeno, temos evidência su ciente para rejeitar a hipótese nula. Essa mesmadecisão seria tomada para qualquer nível de signi cância menor que 0,0139.

9.5.3 Teste unilateral à esquerda - Exemplo 3No Exemplo 3, temos um teste bilateral à esquerda; logo, o valorP é

P = Pr £X ≤894, 53 | X ∼

N (900; 6, 4)¤= Pr µZ ≤

894.53 −9006.4 ¶

= Pr( Z ≤ −0, 85)

= Pr( Z ≥0, 85)= 0 , 5 −tab(0, 85)= 0 , 1977

Essa não é uma probabilidade pequena; ou seja, é razoável obter um valor tão ou maisextremo que 894,53 quandoH 0 é verdadeira. Assim, os dados não fornecem evidênciasu ciente para rejeitarmos a hipótese nula.

Com base nesses exemplos, podemos concluir o seguinte:

Page 151: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 151/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA146

Devemos rejeitar a hipótese nulaH 0 ao nível de signi cânciaα sempre que o valorP for menor ou igual aα,ou seja:

RejeitamosH 0⇐⇒P ≤α

Os programas de estatística calculam valoresP mais exatos do que aqueles obtidosatravés da tabela. Nas aplicações e exercícios deste curso devemos arredondar os resul-tados necessários para 2 casas decimais para podermos utilizar a tabela da distribuiçãonormal.

9.6 Exemplo 4Uma amostra de tamanhon = 25 é extraída de uma população normal com variância256, obtendo-sex = 23 . Deseja-se testar a hipótese

H 0 : μ = 18

Determine a região crítica ao nível de signi cância de 1% e encontre o valorP quando1. H 1 : μ 6= 18

2. H 1 : μ > 18

Solução

1. A região crítica éRC : X > 18 + k ou X < 18 −k

Comα = 0 , 01 temos que ter:

Pr ·X > 18 + k | X ∼

N µ18;25625 ¶¸+ Pr ·X < 18 −k | X

∼N µ18;

25625 ¶¸= 0 , 01 =

Pr µZ >18 + k + 18

3, 2 ¶+ Pr µZ <18 −k −18

3, 2 ¶= 0 , 01 =⇒

Pr µZ >k

3, 2¶+ Pr µZ < −k

3, 2¶= 0 , 01 =⇒

Pr µZ >k

3, 2¶+ Pr µZ >k

3, 2¶= 0 , 01 =⇒Pr µZ >

k3, 2¶= 0 , 005 =

tabµk3, 2¶= 0 , 495 =

⇒k

3, 2= 2 , 58 =

⇒k = 8 , 256

Page 152: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 152/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA147

Logo, a região crítica é

X > 26, 256 ou X < 9, 744

O valorP é

P = 2 × Pr ·X ≥23 | X ∼

N µ18;25625 ¶¸

= 2 × Pr µZ ≥23 −18

3, 2 ¶= 2 × Pr( Z ≥1, 56)= 2 × [0, 5 −tab(1, 56)]= 2 × [0, 5 −0, 4406]= 0 , 1188

RejeitamosH 0 a qualquer nível de signi cância α ≥ 0, 1188. Logo, ao nível designi cância de 1% (ou mesmo 5%) não podemos rejeitarH 0. Note que o valor daestatística de teste,x = 23 , está fora da região crítica.

2. A região crítica éRC : X > 18 + k

Comα = 0 , 01 temos que ter:

Pr

·X > 18 + k | X

N

µ18;

256

25 ¶¸= 0 , 01 =

⇒Pr µZ >

18 + k + 183, 2 ¶= 0 , 01 =

Pr µZ >k

3, 2¶= 0 , 01 =⇒

tabµk3, 2¶= 0 , 49 =

⇒k

3, 2= 2 , 33 =

k = 7 , 456Logo, a região crítica é

X > 25, 456

O valorP é

Page 153: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 153/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA148

P = Pr ·X ≥23 | X ∼

N µ18;25625 ¶¸

= Pr

µZ

23 −18

3, 2 ¶= Pr( Z ≥1, 56)= [0, 5 −tab(1, 56)]= [0, 5 −0, 4406]= 0 , 0594

RejeitamosH 0 a qualquer nível de signi cância α ≥ 0, 0594. Logo, ao nível designi cância de 1% não podemos rejeitarH 0. Note que o valor da estatística deteste, x = 23 , está fora da região crítica.

9.7 Exercícios1. Uma amostra aleatória simples de tamanhon = 9 extraída de uma população

normal com desvio padrão 3,1 apresentou média igual ax = 13 , 35. Deseja-setestar

H 0 : μ = 12 , 8H 1 : μ 6= 12 , 8

(a) Determine a região crítica correspondente ao nível de signi cânciaα = 0 , 02.

(b) Com base na região crítica encontrada no item anterior, estabeleça a con-clusão, tendo o cuidado de usar um fraseado que não seja puramente técnico.(c) Calcule o valorP e interprete o resultado obtido.(d) Esboce o grá co da função poder, calculandoβ (μ) para os seguintes valores

de μ :8 9 10 11 12 13 14 15 16 17 18

2. Uma empresa fabricante de balas a rma que o peso médio de suas balas é de pelomenos 2 gramas. Pela descrição do processo de produção, sabe-se que o peso dasbalas distribui-se normalmente com desvio padrão de 0,5 grama. Uma amostra de

25 balas apresenta peso médio de 1,98 gramas. O que se pode concluir sobre aa rmação do fabricante? Use um nível de signi cância de 5%.

3. Em uma linha de produção, peças são produzidas de modo que o comprimentoseja normalmente distribuído com desvio padrão de 0,5 cm. Ajustes periódicos sãofeitos na máquina para garantir que as peças tenham comprimento apropriado de15 cm, pois as peças muito curtas não podem ser aproveitadas (as peças longaspodem ser cortadas). A cada hora são extraídas 9 peças da produção, medindo-seseu comprimento. Estabeleça uma regra de decisão para de nir se o processo estáoperando adequadamente. Use o nível de signi cância de 0,1%.

Page 154: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 154/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA149

4. Depois de desenvolver um algoritmo para acelerar a execução de determinadatarefa rotineira em um escritório de contabilidade, o analista de sistema analisauma amostra de 25 tempos, obtendo uma média 46,5 segundos. Dos dados pas-sados, ele sabe que o tempo de execução é aproximadamente normal com médiade 48,5 segundos e desvio padrão de 5 segundos. Use o método do valorP paradecidir se o algoritmo do analista realmente melhorou o desempenho do sistema.

5. Uma propaganda a rma que o consumo médio de gasolina de determinada marcade automóvel é de 12 litros por 100 quilômetros rodados, com desvio padrão de 1,0litro. Um teste com 36 automóveis desta marca acusa um consumo médio de 12,4litros por 100 quilômetros rodados. O que se pode concluir sobre a propaganda?

9.8 Solução dos Exercícios1. X ∼

N (μ; 3, 12) n = 9 x = 13, 35

(a) α = 0 , 02 =⇒

zα/ 2 = 2 , 33RC : X > 12, 8 + k ou X < 12, 8 −k

Pr ·©X > 12, 8 + kª∪©X < 12, 8 −kª| X ∼

N µ12, 8;3, 12

9 ¶¸= 0 , 02⇐⇒

Pr ÃZ >12, 8 + k −12, 8

3,13

!+ Pr ÃZ <12, 8 −k −12, 8

3,13

!= 0 , 02⇐⇒

Pr( Z > 0, 96774k) + Pr( Z < −0, 96774k) = 0 , 02⇐⇒

2 × Pr( Z > 0, 96774k) = 0 , 02

⇐⇒Pr( Z > 0, 96774k) = 0 , 01⇐⇒

0, 96774k = 2 , 33⇐⇒

k = 2 , 41A região crítica é

X > 15, 21 ou X < 10, 39(b) O valor observadox = 13, 35 não está na região crítica. Logo, não há ev-

idência amostral su ciente para rejeitarmos a hipótese de que a média dapopulação seja 12,8.

(c) .

P = 2 × Pr ·X ≥13, 35 | X ∼

N µ12, 8;3, 12

9 ¶¸= 2 × Pr ÃZ ≥

13, 35 −12, 83,13

!= 2 × Pr( Z ≥0, 53)= 2 × [0, 5 −tab(0, 53)]= 0 , 4038

Page 155: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 155/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA150

O valorP é bastante alto; logo a hipótese nula só seria rejeitada para níveisde signi cância maiores que 0,40. Isso é evidência de que não se pode rejeitara hipótese nula em qualquer nível de signi cância razoável.

(d)

β (μ) = Pr( rejeitar H 0|μ)= Pr ·X > 15, 21|X

∼N µμ;

3, 12

9 ¶¸+ Pr ·X < 10, 38|X ∼

N µμ;3, 12

9 ¶¸Na tabela abaixo temos o valor deβ (μ) para diferentes valores deμ (vocêpode obter valores um pouco diferentes, por causa de arredondamentos!).Veja também aFigura 9.9.

μ β (μ)8 0,989379 0,90914

10 0,6434711 0,2742812 0,0594213 0,0218414 0,1210415 0,4194816 0,7777217 0,9583918 0,99653

Por exemplo:

β (8) = Pr ·X > 15, 21|X ∼

N µ8;3, 12

9 ¶¸+ Pr ·X < 10, 38|X ∼

N µ8;3, 12

9 ¶¸= Pr ÃZ >

15, 21 −83,13

!+ Pr ÃZ <10, 38 −8

3,13

!= Pr( Z > 6, 98) + Pr( Z < 2, 30)= [0, 5 −tab(6, 98)] + [0, 5 + tab(2, 30]= 0 , 5 −0, 5 + 0, 5 + 0, 4893 = 0, 9893

2. SejaX a variável aleatória que representa o peso das balas. EntãoX ∼N (μ; 0, 25).Comon = 25 , resulta que

X ∼

N (μ; 0, 01)A a rmativa do fabricante éμ ≥ 2. Logo, a negação de tal a rmação éμ < 2.Como essa última expressão não contém o sinal de igualdade, ela se torna a hipótesealternativa. Então, nossas hipóteses são:

H 0 : μ = 2H 1 : μ < 2

Page 156: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 156/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA151

0,0

0,2

0,4

0,6

0,8

1,0

1,2

0 5 10 15 20

Figura 9.9: Função poder - Exercício 1

A região crítica éRC : X < 2 −k

Pr[X < 2 −k | X ∼

N (2;0, 01)] = 0, 05 =⇒

Pr µZ < −k

0, 1¶= 0 , 05 =⇒

Pr µZ >k

0, 1¶= 0 , 05 =⇒

tabµk0, 1¶= 0 , 45 =⇒k

0, 1= 1 , 64 =

⇒k = 0 , 164

A região crítica éX < 2 −0, 164 = 1, 836

Como o valor observadox = 1 , 98 não se encontra na região crítica, não podemosrejeitar a hipótese nula. Ou seja, os dados não trazem evidência de que o fabricanteesteja mentindo.

3. O problema na produção surge quandoμ < 15. Logo, nossas hipóteses são:

H 0 : μ = 15H 1 : μ < 15

A região crítica éRC : X < 15 −k

Page 157: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 157/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA152

Pr ·X < 15 −k|X ∼

N µ15;0, 52

9 ¶¸= 0 , 001 =⇒

Pr ÃZ <15 −k −15

0,53

!= 0 , 001 =⇒

Pr( Z > 6k) = 0 , 001 =⇒tab(6k) = 0 , 499 =⇒

6k = 3 , 09 =⇒

k = 0 , 515

Então seX < 14, 485 o processo deve ser interrompido para um novo ajuste.

4. A intenção do analista é reduzir o tempo; logo, o interesse dele é queμ < 48, 5. Anegação dessa a rmativa éμ ≥48, 5. Logo, nossas hipóteses são:

H 0 : μ = 48 , 5

H 1 : μ < 48, 5A estatística amostral é

X ∼

N µμ;55

25¶O valor obtido éx = 46 , 5, que resulta no seguinte valorP :

P = Pr ·X < 46, 55|X ∼

N µ48, 5;55

25¶¸= Pr

µZ <

46, 5 −48, 51

¶= Pr( Z < −2, 0)= Pr( Z > 2, 0)= 0 , 5 −tab(2, 0)= 0 , 02275

Podemos a rmar que o tempo de execução reduziu, a qualquer nível de signi cânciainferior2, 275%. Note que rejeitamos a hipótese nula ao nível de signi cância de5%, mas não a 1%!

5. Se o consumo for menor ou igual a 12 litros por 100 km, não há problema com apropaganda. O problema surge se o consumo for superior. Logo, nossas hipótesessão:

H 0 : μ = 12H 1 : μ > 12

Supondo que o consumoX possa ser aproximado por uma distribuição normal,temos que

X ∼

N µμ;136¶

Page 158: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 158/189

CAPÍTULO 9. TESTE DE HIPÓTESE: MÉDIA DAN (μ; σ2) - σ2 CONHECIDA153

Vamos calcular o valorP :

P = Pr ·X > 12, 4|X ∼

N µ12;136¶¸

= Pr

µZ >

12, 4 −1216

¶= Pr( Z > 2, 4)= 0 , 5 −tab(2, 4)= 0 , 0082

A propaganda parece ser enganosa, pois a probabilidade de se obter um consumomédio de 12,4 litros por 100 km é pequena se o consumo realmente for de 12litros por 100 km. Note queH 0 é rejeitada para qualquer nível de signi cânciaα ≥0, 82%, o que inclui os níveis de signi cância usuais de 1% e 5%.

Page 159: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 159/189

Capítulo 10

Teste de Hipótese: Proporções -Amostra Grande

No capítulo anterior você aprendeu a construir testes de hipóteses sobre a média deuma população normal com variânciaσ2 conhecida. O procedimento baseou-se na dis-tribuição amostral da média amostral que, com as hipóteses de normalidade e conhec-imento da variância populacional, sabemos ser normal com a mesma média e variânciaσ 2

n . Neste capítulo iremos fazer uso do Teorema Limite Central para construir testes dehipóteses sobre proporções com base em amostras grandes. Vimos que, para amostrasgrandes, a distribuição amostral da proporção amostral pode ser aproximada por umadistribuição normal e, assim, o procedimento de teste de hipótese será idêntico ao estu-dado no capítulo anterior. Veremos, então, os seguintes conceitos aplicados à proporçãopopulacional:

• hipóteses nula e alternativa• estatística de teste

• erros tipo I e II

• regra de decisão

• região crítica

• valorP

10.1 Contexto básicoO contexto de interesse é o seguinte: temos uma população em que cada elemento éclassi cado de acordo com a presença ou ausência de determinada característica. Emtermos de variável aleatória, essa população é representada por uma variável aleatóriade Bernoulli, isto é:

X = ½1 se elemento possui a característica de interesse0 se elemento não possui a característica de interesse

154

Page 160: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 160/189

CAPÍTULO 10. TESTE DE HIPÓTESE: PROPORÇÕES - AMOSTRA GRANDE 155

Então, Pr( X = 1) = p, E (X ) = p e V ar(X ) = p(1 − p). O parâmetrop é tambéma proporção de elementos da população que possuem a caracterísitca de interesse. Emgeral, esse parâmetro é desconhecido e queremos testar hipóteses feitas sobre seu possívelvalor.

Suponha, então, que dessa população seja extraída uma amostra aleatória simplesX 1, X 2, . . . , X n com reposição. Vimos que a proporçãobP de elementos na amostra quepossuem a característica de interesse, de nida por

bP =S nn

=X 1 + X 2 + · · · + X n

n(10.1)

é um estimador não-viesado parap com variânciap(1− p)n . Mais precisamente,

E ( bP ) = p

V ar(

bP ) =

p(1 − p)n

Como a proporção amostral é uma média de uma amostra aleatória simples de umapopulação com distribuição de Bernoulli com parâmetrop, o Teorema Central do Limitenos diz, então, que a distribuição debP se aproxima de uma nornal com médiap evariância p(1− p)

n . Como visto, a aproximação deve ser feita senp ≥ 5 e n(1 − p) ≥ 5 e,em geral, essas condições são satisfeitas sen ≥30.

Resumindo, temos o seguinte resultado:

bP ≈N µ p;

p(1 − p)n ¶

ou, equivalentemente:

bP − p

q p(1− p)n

≈N (0; 1)

Vamos ver, agora, como usar esse resultado para construir testes de hipóteses sobre averdadeira proporção populacionalp.

10.2 Teste de hipóteses sobre proporçõesA hipótese nula que consideraremos será uma hipótese simples:

H 0 : p = p0

As hipóteses alternativas possíveis são

Bilateral : H 1 : p 6= p0

Unilateral à direita : H 1 : p > p0

Unilateral à esquerda : H 1 : p < p0

Page 161: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 161/189

CAPÍTULO 10. TESTE DE HIPÓTESE: PROPORÇÕES - AMOSTRA GRANDE 156

Como no caso da média, a escolha das hipóteses nula e alternativa deve ser feitalevando-se em conta que a hipótese nula deve ser uma hipótese simples. Assim, vocêdeve “traduzir” a situação de interesse do problema em desigualdades envolvendo aproporçãop. A hipótese alternativa é a desigualdade que não inclui o sinal de =.

A estatística de teste éZ = bP − pq p(1− p)

n≈N (0; 1)

Dado um nível de signi cância α, a região crítica é de nida como o conjunto devalores da estatísttca de teste que têm probabilidade pequena de ocorrerem sob a ve-racidade da hipótese nula. Assim, a região crítica é de nida como o conjunto de valoresde

Z 0 = bP − p0

r p0(1 − p0)n

≈N (0; 1)

com pequena probabilidade de ocorrência:Z 0 > k ou Z 0 < −k (teste bilateral)Z 0 > k (teste unilateral à direita)Z 0 < −k (teste unilateral à esquerda)

O valork é encontrado impondo-se a condição de a probabilidade do erro tipo I serigual aα :

Pr ( rejeitar H 0 | H 0 verdadeira) = α

10.2.1 Teste bilateral

Com nível de signi cânciaα = Pr( erro I), temos que ter:Pr( rejeitar H 0 | H 0 verdadeira) = α =

⇒Pr [Z 0 > k | Z 0∼N (0; 1)] + Pr [ Z 0 < −k | Z 0∼N (0; 1)] = α =

⇒Pr [Z 0 > k | Z 0∼N (0; 1)] + Pr [ Z 0 > k | Z 0∼N (0; 1)] = α =

⇒Pr [Z 0 > k | Z 0∼N (0; 1)] =

α2

=⇒

k = zα/ 2

ou seja, a região crítica é:Z 0 > z α/ 2 ou Z 0 <

−zα/ 2 (10.2)

Em termos da proporção amostral, temos o seguinte:

Z 0 > z α/ 2⇒ bP − p0

r p0(1 − p0)n

> z α/ 2⇒bP > p 0 + zα/ 2r p0(1 − p0)n

Z 0 < −zα/ 2⇒ bP − p0

r p0(1 − p0)n

< −zα/ 2⇒bP < p 0 −zα/ 2r p0(1 − p0)n

Page 162: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 162/189

CAPÍTULO 10. TESTE DE HIPÓTESE: PROPORÇÕES - AMOSTRA GRANDE 157

ou seja, a região crítica é

bP > p 0 + zα/ 2r p0(1 − p0)n

ou bP < p 0 −zα/ 2r p0(1 − p0)n

(10.3)

10.2.2 Testes unilateraisCom desenvolvimento análogo obtemos as seguintes regiões críticas:

Teste unilateral à direita: Z 0 > z α ou bP > p 0 + zαq p0 (1− p0 )n

Teste unilateral à esquerda: Z 0 < −zα ou bP < p 0 −zαq p0 (1− p0 )n

(10.4)

10.3 Valor P

Como já visto no capítulo anterior, o valorP é a probabilidade de se obter um valor tãoou mais extremo (na direção da hipótese alternativa) que o valor observado da estatísticade teste. Denotando porz0 o valor observado da estatística de teste, temos as seguintespossibilidades:

P = 2 × Pr( Z 0 > | z0 |) (teste bilateral)P = Pr( Z 0 > | z0 |) (teste unilateral à direita ou à esquerda) (10.5)

Valores pequenos deP indicam que o valor observado é pouco provável de ocorrer sob ahipótese nula; logo, valores pequenos deP levam à rejeição da hipótese nula. A hipótesenula é rejeitada a qualquer nível de signi cânciaα

≥P.

10.4 Exemplo 1Uma amostra de 64 elementos é usada para testar

H 0 : p = 0 , 35H 1 : p 6= 0 , 35

Estabeleça a região crítica para o nível de signi cância de 1%. Se a proporção amostral

para esta amostra éb p = 0 , 26, calcule o valorP.SoluçãoComα = 0 , 01 e um teste bilateral, resulta quez0,005 = 2 , 59. A estatística de teste é

Z 0 = bP −0, 35

q 0,35× 0,6564

=

e a região crítica éZ 0 > 2, 58 ou Z 0 < −2, 58

Page 163: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 163/189

CAPÍTULO 10. TESTE DE HIPÓTESE: PROPORÇÕES - AMOSTRA GRANDE 158

Em termos da proporção amostral, temos que

Z 0 > 2, 58⇒ bP −0, 35

q 0,35× 0,65

64

> 2, 58⇒bP > 0, 503 82

Z 0 < −2, 58⇒ bP −0, 35q 0,35× 0,65

64

< −2, 58⇒bP < 0, 19618

e a região crítica é

bP > 0, 504 ou bP < 0, 196

O valor observado da estatística de teste é

z0 =0.26 −0.35

q 0.35× 0.6564

= −1, 5095 ≈ −1, 51

Como o teste é bilateral, o valorP é calculado comoP = 2 × Pr [Z 0 > 1, 51 | Z 0∼N (0; 1)]

= 2 × [0, 5 −tab(1, 51)]= 2 × [0, 5 −0, 43448]= 0 , 13104

Como o valorP é grande, não se rejeita a hipótese nula, ou seja, a probabilidade de seobter um valor tão extremo quanto o observado é alta, seH 0 for verdadeira. A hipótesenula só seria rejeitada para níveis de signi cância maiores que 13,1%.

10.5 Exemplo 2Um fabricante a rma que no máximo 10% dos seus produtos são defeituosos. Um órgãode defesa do consumidor testa uma amostra de 81 desses itens, detectando 13,8% dedefeituosos.

1. Encontre a região crítica para um nível de signi cância de 5%.

2. Calcule o valorP.

SoluçãoA a rmativa de interesse para o fabricante ép ≤0, 10. A negação de tal a rmativa

(questionamento do órgão de defesa do conumidor) ép > 0, 10. Logo, nossas hipótesessão:

H 0 : p = 0 , 10H 1 : p > 0, 10

Note que todas as proporções estão na forma decimal! Não trabalhe com percentagens!

Page 164: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 164/189

Page 165: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 165/189

Page 166: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 166/189

CAPÍTULO 10. TESTE DE HIPÓTESE: PROPORÇÕES - AMOSTRA GRANDE 161

4. Deseja-se testar a honestidade de uma moeda. Para isso, lança-se a moeda 200vezes, obtendo-se 115 caras. Qual é a sua conclusão sobre a honestidade da moeda?Para responder a essa questão, calcule e interprete o valorP.

5. A direção de um grande jornal nacional a rma que 25% dos seus leitores são da

classe A. Se, em uma amostra de 740 leitores, encontramos 156 da classe A, qualé a conclusão que tiraríamos sobre a a rmativa da direção do jornal?

10.8 Solução dos Exercícios1. b p = 385

800 = 0 , 48125A a rmativa de interesse é “pelo menos 50% dos estudantes possuem computador”,ou seja,p ≥0, 5. Logo, as hipóteses são

H 0 : p = 0 , 50

H 1 : p < 0, 50α = 0 , 10 =

⇒z0,1 = 1 , 28

O valor observado da estatística de teste é

z0 =0, 48125−0, 5

q 0,5× 0,5800

= −1, 0607

e a região crítica éZ 0 < −1, 28

Como o valor observado não pertence à região crítica, não podemos rejeitar ahipótese nula. Ou seja, os dados trazem evidência de que a proporção de estudantesque possuem computador é de pelo menos 50%.

2. A a rmativa de interesse é “mais de 10% dos trabalhadores conseguem seus em-

Page 167: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 167/189

CAPÍTULO 10. TESTE DE HIPÓTESE: PROPORÇÕES - AMOSTRA GRANDE 162

3. O interesse é veri car sep > 0, 20. Logo,

H 0 : p = 0 , 20H 1 : p > 0, 20

Comoα = 5% e o teste é unilateral, resulta quez0,05 = 1 , 64. Logo, a região críticaéZ 0 > 1, 64

O valor observado da estatística de teste é

z0 =2564 −0.20

q 0.2× 0.864

= 3 , 8125

que está na região crítica; logo, rejeita-se a hipótese nula, ou seja, as evidênciasamostrais indicam que houve melhora com as mudanças.

4. As hipóteses são

H 0 : p = 0 , 5H 1 : p 6= 0 , 5

e a estatística de teste éZ 0 = bP −0, 5

q 0,5× 0,5200

O valor observado da estatística de teste éZ 0 =

115200 −0, 5

q 0,5× 0,5200

= 2 , 1213 ≈2, 12

e o valorP para o teste bilateral é

P = 2 × Pr [Z 0 > 2, 12 | Z 0∼N (0; 1)]= 2 × [0, 5 −tab(2, 12)]= 0 , 034

Como o valorP é pequeno, a probabilidade de obtermos 115 caras em 200 lança-mentos de uma moeda honesta é pequena, o que nos leva a suspeitar da honesti-dade da moeda. A hipótese nula seria rejeitada para qualquer nível de signi cânciaα ≥3, 4%.

5. Com as informações disponíveis, nossas hipóteses são:

H 0 : p = 0 , 25H 1 : p 6= 0 , 25

Page 168: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 168/189

CAPÍTULO 10. TESTE DE HIPÓTESE: PROPORÇÕES - AMOSTRA GRANDE 163

e a estatística de teste éZ 0 = bP −0, 25

q 0,25× 0,75740

O valor observado da estatística de teste é

Z 0 =156740 −0, 25

q 0,25× 0,75740

= −2, 46

e o valorP para o teste bilateral é

P = 2 × Pr [Z 0 > 2, 46 | Z 0∼N (0; 1)]= 2 × [0, 5 −tab(2, 46)]= 0 , 0139

Como o valorP é bastante pequeno, devemos rejeitar a hipótese nula de que aproporção de leitores da classe A é igual a 25%.

Page 169: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 169/189

Capítulo 11

Teste de Hipótese: Média daN (μ; σ2) - σ2 Desconhecida

Neste capítulo você completará seu estudo básico de testes de hipóteses sobre a média deuma população, analisando a situação relativa a uma população normal quando não seconhece a variância desta população. Assim como no caso do intervalo de con ança, paratestar hipóteses relativas à média de tal população, é necessário estimar essa variância eisso introduz mais uma fonte de variabilidade no procedimento: com uma única amostra,queremos testar hipóteses sobre a média, mas precisamos também estimar a variânciada população. O procedimento é simples e análogo aos casos estudados nos caítulosanteriores; o que muda é a distribuição amostral da estatística de teste. Em vez deusarmos a distribuição normal para determinar os valores críticos, usaremos novamentea distribuiçãot de Student.

Veremos, então, os seguintes conceitos aplicados à média de uma população normalcom variância desconhecida:

• hipóteses nula e alternativa

• estatística de teste

• regra de decisão

• região crítica

• valorP

11.1 Contexto básicoConsidere uma população descrita por uma variável aleatória normal com médiaμ evariância σ2 : X

∼N (μ; σ2). Nosso interesse é testar hipóteses sobre a médiaμ a

164

Page 170: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 170/189

Page 171: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 171/189

Page 172: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 172/189

CAPÍTULO 11. TESTE DE HIPÓTESE: MÉDIADAN (μ; σ2) - σ2 DESCONHECIDA167

Figura 11.1: Região crítica para o teste sobre a média de uma normal com variânciadesconhecida

Page 173: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 173/189

CAPÍTULO 11. TESTE DE HIPÓTESE: MÉDIADAN (μ; σ2) - σ2 DESCONHECIDA168

11.2.3 Nível de signi cância e região críticaO procedimento usual de teste de hipótese consiste em se xar o nível de signi cânciaα, que, por de nição, é a probabilidade de se cometer o erro tipo I:

α = Pr( erro tipo I) = Pr( rejeitar H 0|H 0 é verdadeira)

Assim, para cada tipo de hipótese alternativa a região crítica é identi cada impondo-sea condição

Pr( T ∈

RC |H 0 é verdadeira) = α

Hipótese bilateral

A região crítica é calculada como:

Pr [T 0 > k | T 0∼t(n −1)] + Pr[ T 0 < −k | T 0∼t(n −1)] = α =⇒

Pr [T 0 > k | T 0

t(n

−1)] + Pr [ T 0 > k | T 0

t(n

−1)] = α =

⇒Pr [T 0 > k | T 0∼t(n −1)] = α2

Usando a notaçãotn ;α para denotar a abscissa da distribuiçãot de Student comngraus de liberdade que deixa área (probabilidade)α acima dela, resulta a seguinte regiãocrítica para o teste bilateral:

T 0 > t n−1; α/ 2 ou T 0 < −tn−1; α/ 2 (11.1)Essa região crítica também pode ser escrita de outra forma usando a seguinte equiv-

alência:

T 0 > t n−1; α/ 2⇒X −μ0S

√ n> t n−1; α/ 2

⇒X > μ 0 + tn −1; α/ 2 S √ nT 0 < −tn−1; α/ 2⇒

X −μ0S

√ n< −tn−1; α/ 2⇒

X < μ 0 −tn−1; α/ 2S √ n

Teste unilateral à direita

A região crítica é calculada como:Pr [T 0 > k | T 0

t(n

−1)] = α =

⇒k = tn−1; α

ou seja, a região crítica é

T 0 > t n−1; α (11.2)ou equivalentemente

X > μ 0 + tn−1; αS √ n

Page 174: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 174/189

CAPÍTULO 11. TESTE DE HIPÓTESE: MÉDIADAN (μ; σ2) - σ2 DESCONHECIDA169

Teste unilateral à esquerda

De forma análoga, obtém-se a seguinte região crítica para o teste unilateral à esquerda:

T 0 < −tn−1; α (11.3)

ou equivalentementeX < μ 0 −tn−1; α

S √ n

11.3 ExemplosA título de comparação com a situação do penúltimo capítulo, em que supusemos a var-iância conhecida, vamos considerar os mesmos exemplos, mas agora tratando a variânciadada como sendo a variância amostralS 2.

11.3.1 Exemplo 1Depois de uma pane geral no sistema de informação de uma empresa, o gerente admin-istrativo deseja saber se houve alteração no tempo de processamento de determinadaatividade. Antes da pane, o tempo de processamento podia ser aproximado por umavariável aleatória normal com média de 100 minutos. Uma amostra de 16 tempos de

Page 175: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 175/189

Page 176: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 176/189

CAPÍTULO 11. TESTE DE HIPÓTESE: MÉDIADAN (μ; σ2) - σ2 DESCONHECIDA171

Consultando a tabela da distribuiçãot, resulta que

t15;0,05 = 1 , 753

o que nos leva aà região críticaT

0> 1, 753

ouX > 100 + 1, 753 ×

10√ 16

= 104, 38

Essa também é uma região mais extrema que aquela encontrada para o caso da normal:X > 104, 1. E novamente rejeitamos a hipótese nula, ou seja, as evidências amostraisindicam um aumento do tempo de processamento da tarefa após a pane.

11.3.3 Exemplo 3

O dono de uma média empresa decide investigar a alegação de seus empregados deque o salário médio na sua empresa é menor que o salário médio nacional. Para isso,ele analisa uma amostra de 25 salários, obtendo uma média de 894,53 reais e desviopadrão de 32 reais. De informações obtidas junto ao sindicato patronal, ele sabe que,em nível nacional, o salário médio é de 900 reais. Supondo que seja razoável aproximara distribuição dos salários por uma distribuição normal, vamos construir um teste dehipótese apropriado, com um nível de signi cância de 10%.

SoluçãoO problema aqui consiste em decidir se os salários são menores ou não do que a

média nacional de 900 reais, ou seja, as situações de interesse são

μ < 900μ ≥ 900

Como no exemplo anterior, a hipótese alternativa é aquela que não envolve o sinalde igualdade. Logo, nossas hipóteses são:

H 0 : μ = 900H 1 : μ < 900

A região crítica é de nida em termos da estatística de teste

T 0 = X −90032

√ 25∼

t(24)

comoT 0 < −t24;0 ,10

Com nível de signi cância de 10%, a abscissa de interesse é aquela que deixa área de10% acima dela em uma distribuiçãot com 24 graus de liberdade:

t24;0,10 = 1 , 318

Page 177: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 177/189

CAPÍTULO 11. TESTE DE HIPÓTESE: MÉDIADAN (μ; σ2) - σ2 DESCONHECIDA172

Logo, a região crítica éT 0 < −1, 318

ouX < 900−1, 318 ×

32√ 25

= 891, 56

Como o valor observado de 894,53 reais não está na região crítica, não rejeitamosH 0,ou seja, as evidências amostrais apontam que os salários da empresa não são menoresque a média nacional.

Comparando com a região crítica do caso normal,X < 891, 808, vemos, novamente,que no caso dat a região é mais extrema.

11.4 Poder do testeA de nição da função poder do teste é exatamente a mesma:

β (μ) = Pr( rejeitar H 0|μ)

O problema aqui é que, para calcularβ (μ), precisamos de um programa computacionalque calcule probabilidades da distribuiçãot para qualquer valor da abscissa. A títulode ilustração, vamos calcular o poder do Exemplo 1 para o valor alternativoμ = 95 :

β (95) = Pr ·X > 105, 73 | √ 16X −95

10 ∼t(15)¸

+ Pr ·X < 94, 673 |√

16X

−95

10 ∼t(15)¸= Pr ·√ 16X −95

10> √ 16

105, 73 −9510 ¸

+ Pr ·√ 16X −95

10< √ 16

94, 673−9510 ¸

= Pr [ t(15) > 4, 292] + Pr [t(15) < −0, 1308]= 0 , 00032 + 0, 44884 = 0, 44916

Os valores0.00032 e 0.44884 foram obtidos com um programa computacional estatístico.

11.5 Valor P Assim como no caso da função poder, o cálculo do valorP requer programas conm-putacionais que calculem probabilidades da distribuiçãot para qualquer abscissa. Masa interpretação do valorP continua sendo a mesma: valores pequenos deP indicameventos pouco prováveis de ocorrerem quandoH 0 é verdadeira. Assim, continua valendoa seguinte regra de decisão:

Page 178: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 178/189

CAPÍTULO 11. TESTE DE HIPÓTESE: MÉDIADAN (μ; σ2) - σ2 DESCONHECIDA173

Devemos rejeitar a hipótese nulaH 0 ao nível de signi cânciaα sempre que o valorP for menor ou igual aα,ou seja:

RejeitamosH 0⇐⇒P ≤α

No Exemplo 1, o valorP é

P = 2 × Pr ·X > 105, 5 | √ 16X −100

10 ∼t(15)¸

= 2 × Pr ·t(15) > √ 16105, 5 −100

10 ¸= 2 × Pr [t(15) > 2, 2]= 2 × 0, 02195 = 0, 0439

ComoP < 0, 05, rejeitamosH 0

ao nível de signi cância de 5%.

11.6 Exercícios1. Uma amostra aleatória simples de tamanhon = 9 extraída de uma população

normal apresentou média igual ax = 13 , 35 e desvio padrãos = 3 , 1. Deseja-setestar

H 0 : μ = 12 , 8H 1 : μ 6= 12 , 8

(a) Determine a região crítica correspondente ao nível de signi cânciaα = 0 , 02.(b) Com base na região crítica encontrada no item anterior, estabeleça a con-

clusão, tendo o cuidado de usar um fraseado que não seja puramente técnico.

2. Uma empresa fabricante de balas a rma que o peso médio de suas balas é de pelomenos 2 gramas. Pela descrição do processo de produção, sabe-se que o peso dasbalas distribui-se normalmente. Uma amostra de 25 balas apresenta peso médiode 1,98 gramas e um desvio padrão de 0,5 grama.. O que se pode concluir sobrea a rmação do fabricante? Use um nível de signi cância de 5%.

3. Em uma linha de produção, peças são produzidas de modo que o comprimento sejanormalmente distribuído. Ajustes periódicos são feitos na máquina para garantirque as peças tenham comprimento apropriado de 15 cm, pois as peças muito curtasnão podem ser aproveitadas (as peças longas podem ser cortadas). A cada horasão extraídas 9 peças da produção, medindo-se seu comprimento. Uma dessasamostras apresenta comprimento médio de 14,5 cm e desvio padrão de 0,5 cm.Use o nível de signi cância de 0,1% para testar a hipótese de que o processo estejaoperando adequadamente.

Page 179: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 179/189

CAPÍTULO 11. TESTE DE HIPÓTESE: MÉDIADAN (μ; σ2) - σ2 DESCONHECIDA174

4. Depois de desenvolver um algoritmo para acelerar a execução de determinadatarefa rotineira em um escritório de contabilidade, o analista de sistema analisauma amostra de 25 tempos, obtendo uma média 46,5 segundos e desvio padrãode 5 segundos. Dos dados passados, ele sabe que o tempo de execução é aproxi-madamente normal com média de 48,5 segundos. Use o nível de signi cância de5% para decidir se o algoritmo do analista realmente melhorou o desempenho dosistema.

5. Uma propaganda a rma que o consumo médio de gasolina de determinada marcade automóvel é de 12 litros por 100 quilômetros rodados. Um teste com 36 au-tomóveis desta marca acusa um consumo médio de 12,4 litros por 100 quilômetrosrodados com desvio padrão de 1 litro por quilômetro rodado. O que se podeconcluir sobre a propaganda? Use o nível de signi cância de 10%.

11.7 Solução dos Exercícios1. n = 9 , α = 0 , 02

⇒t8; 0,01 = 2 , 896. Logo, a região crítica é

T 0 > +2 , 896 ou T 0 < −2, 896

O valor observado da estatística de teste é

t0 =13.35 −12.8

3.13

= 0 , 53226

que não pertence à região crítica; logo, não podemos rejeitarH 0.

2. A a rmativa do fabricante éμ ≥ 2. Logo, a negação de tal a rmação éμ < 2.Como essa última expressão não contém o sinal de igualdade, ela se torna a hipótesealternativa. Então, nossas hipóteses são:

H 0 : μ = 2H 1 : μ < 2

n = 25; α = 0 , 05 =⇒

t24;0 ,05 = 1 , 711. Logo, a região crítica é

T 0 <

−1, 711

O valor observado da estatística de teste é

t0 =1.98 −2.0

0.55

= −0, 2

que não pertence à região crítica; logo, não podemos rejeitarH 0, ou seja, as ev-idências amostrais indicam que as balas pesam pelo menos 2 gramas.

Page 180: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 180/189

CAPÍTULO 11. TESTE DE HIPÓTESE: MÉDIADAN (μ; σ2) - σ2 DESCONHECIDA175

3. O problema na produção surge quandoμ < 15. Logo, nossas hipóteses são:H 0 : μ = 15H 1 : μ < 15

n = 9 , α = 0 , 001 =

t8; 0,001 = 4 , 501. A região crítica éT 0 < −4, 501

e o valor observado desta estatística de teste é

t0 =14.5 −15

0.53

= −3, 0

Como o valor observadot0 = −3, 0 não está na região crítica, não podemos re- jeitar H 0, ou seja, as evidências amostrais indicam que o processo está operandoadequadamente.

4. A intenção do analista é reduzir o tempo; logo, o interesse dele é queμ < 48, 5. Anegação dessa a rmativa éμ

≥48, 5. Logo, nossas hipóteses são:H 0 : μ = 48 , 5H 1 : μ < 48, 5

n = 25 , α = 0 , 05 =⇒

t24;0 ,05 = 1 , 711. Logo, a região crítica éT 0 < −1, 711

e o valor observado desta estatística é

t0 =46.5 −48.5

55

= −2, 0

Como o valor observadot0 = −2, 0 pertence à região crítica, devemos rejeitarH 0, ou seja, as evidências amostrais indicam que o analista foi bem-sucedido emreduzir o tempo de execução.

5. Se o consumo for menor ou igual a 12 litros por 100 km, não há problema com apropaganda. O problema surge se o consumo for superior. Logo, nossas hipótesessão:

H 0 : μ = 12H 1 : μ > 12

Supondo que o consumoX possa ser aproximado por uma distribuição normal,

podemos usar a distribuiçãot(35). Comα = 10%, t35;0,10 = 1 , 306 e a região críticaéT 0 > 1, 306

O valor observado desta estatística de teste é

t0 =12.4 −12

16

= 2 , 4

Como o valor observadot0 = 2 , 4 está na região crítica, devemos rejeitarH 0, ouseja, a propaganda parece ser enganosa.

Page 181: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 181/189

Capítulo 12

Teste de Hipótese: Variância daN (μ; σ2)

Neste capítulo completaremos o estudo de teste de hipótese sobre parâmetros de umapopulação, analisando o caso da variância de uma população normal. Assim como naconstrução de intervalos de con ança, nossa estatística de teste tem distribuição qui-quadrado e a região crítica, como antes, será formada pelos valores pouco prováveisdesta estatística de teste sob a hipótese nula.

12.1 Contexto básicoConsidere uma população descrita por uma variável aleatória normal com médiaμ evariânciaσ2 : X

∼N (μ; σ2). Nosso interesse é testar hipóteses sobre a a variânciaσ2

a partir de uma amostra aleatória simplesX 1, X 2, . . . , X n . Como visto anteriormente, aestatísticaχ 2 =

(n −1)S 2

σ2

tem distribuição qui-quadrado comn −1 graus de liberdade.De posse desta estatística de teste, o procedimento de construção do teste é idêntico

ao visto nos últimos capítulos: identi cadas a hipótese nula (sempre na forma de umahipótese simplesσ2 = σ2

0) e a hipótese alternativa, a região crítica é formada pelosvalores da estatística de teste pouco prováveis sobH 0 . O nível de signi cância e otipo de hipótese alternativa permitem a identi cação precisa do que são “valores poucoprováveis”: são valores na(s) cauda(s) da distribuição deχ 2 quando a hipótese nula éverdadeira.

Vamos formalizar o procedimento geral e em seguida apresentaremos alguns exemplosde aplicação.

176

Page 182: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 182/189

CAPÍTULO 12. TESTE DE HIPÓTESE: VARIÂNCIA DAN (μ; σ2) 177

12.2 Procedimento geral para construção do testede hipótese sobre a variância de uma N (μ; σ2)

Seja X 1, X 2, . . . , X n uma amostra aleatória simples de uma populaçãoX cuja dis-tribuição é N (μ; σ2). Nosso interesse é testar alguma hipótese sobre a variânciaσ2,que é estimada por

S 2 =1

n −1

n

Pi=1(X i −X )2 =

1n −1 ·

n

Pi=1X 2i −nX 2¸

Lembre-se queS 2 é um estimador não-viesado deσ2.

12.2.1 Hipótese nula e hipótese alternativaA hipótese nula que iremos considerar será

H 0 : σ2

= σ20

As possíveis formas da hipótese alternativa são:

Bilateral : H 1 : σ2 6= σ20

Unilateral à direita : H 1 : σ2 > σ 20

Unilateral à esquerda : H 1 : σ2 < σ 20

Como antes, a escolha entre essas três possibilidades se faz com base no conhecimentodo problema. Se não temos informação alguma sobre a alternativa, temos que usar umteste bilateral. A escolha entre os dois tipos de hipóteses unilaterais é feita de modo que,ao escrevermos as hipóteses do problema em linguagem simbólica, a hipótese alternativanão inclua o sinal de igualdade.

Hipóteses do problema Hipóteses estatísticas

½σ2 < σ 20

σ2 ≥σ20 ½H 0 : σ2 = σ2

0H 1 : σ2 < σ 2

0

½σ2 > σ 2

0σ2

≤σ2

0

½H 0 : σ2 = σ2

0H

1: μ > μ

0

12.2.2 Estatística de teste, erros, regra de decisãoComo o teste é sobre a variância de uma população normal, a estatística amostral a serutilizada é

(n −1)S 2

σ2 ∼χ 2(n −1)

Page 183: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 183/189

CAPÍTULO 12. TESTE DE HIPÓTESE: VARIÂNCIA DAN (μ; σ2) 178

O procedimento de decisão é de nido em termos da hipótese nulaH 0 e as decisõespossíveis são (i) rejeitar ou (ii) não rejeitarH 0. Conforme já visto, existem duas possi-bilidades de erro:

Erro tipo I: rejeitarH 0 quando H 0 é verdadeiraErro tipo II: não rejeitarH 0 quando H 0 é falsa

A regra de decisão consiste em de nir a região críticaRC como o conjunto de valorescuja probabilidade de ocorrência épequena sob a hipótese de veracidade deH 0. Logo,nossa regra de decisão se baseia na estatística de teste

X 20 =(n −1)S 2

σ20 ∼

χ 2(n −1)

Os valores com pequena probabilidade de ocorrência estão nas caudas da distribuição.Assim, a região crítica para cada tipo de hipótese alternativa é de nida como segue:

Alternativa bilateral: X 20 > k S ou X 20 < k I Alternativa unilateral à direita: X 20 > k S Alternativa unilateral à esquerda: X 20 < k I

Na Figura 12.1 ilustra-se a região crítica para cada tipo de hipótese alternativa.

12.2.3 Nível de signi cância e região críticaO procedimento usual de teste de hipótese consiste em se xar o nível de signi cânciaα, que, por de nição, é a probabilidade do erro tipo I:

α = Pr( erro tipo I) = Pr( rejeitar H 0|H 0 é verdadeira)

Assim, para cada tipo de hipótese alternativa a região crítica é identi cada impondo-sea condição

Pr( X ∈

RC |H 0 é verdadeira) = α

Hipótese bilateral

A região crítica é calculada como:

Pr £X 0 > k S | X 0∼χ 2(n −1)¤+ Pr £X 0 < k I | X 0∼χ 2(n −1)¤= α

Mesmo a distribuição qui-quadrado não sendo simétrica, é prática usual dividir a prob-abilidade de erro em partes iguais, ou seja, os limites da região crítica são de nidos demodo que

Pr £X 0 > k S | X 0∼χ 2(n −1)¤=α2

Pr £X 0 < k I | X 0∼χ 2(n −1)¤=α2

Page 184: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 184/189

Page 185: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 185/189

CAPÍTULO 12. TESTE DE HIPÓTESE: VARIÂNCIA DAN (μ; σ2) 180

Usando a notaçãoχ 2n ;α para denotar a abscissa da distribuição qui-quadrado com

n graus de liberdade que deixa área (probabilidade)α acima dela, resulta a seguinteregião crítica para o teste bilateral:

X 20 > χ 2n−1;α/ 2 ou X 20 < χ 2

n−1;1−α/ 2 (12.1)

Teste unilateral à direita

A região crítica é calculada como:

Pr £X 0 > k S | X 0∼χ 2(n −1)¤= α =⇒

kS = χ 2n−1;α

ou seja, a região crítica éX 20 > χ 2

n−1;α (12.2)

Teste unilateral à esquerda

De forma análoga, obtém-se a seguinte região crítica para o teste unilateral à esquerda:

X 20 < χ 2n−1;1−α (12.3)

12.3 Exemplo 1Uma amostra aleatória simples de tamanhon = 16 foi retirada de uma populaçãonormal, obtendo-ses2 = 32, 1. Ao nível de signi cância de 5% pode-se dizer queσ2 6= 20?

Solução

As hipóteses sãoH 0 : σ2 = 20H 1 : σ2 6= 20

Com 15 graus de liberdade, teste bilateral e nível de signi cância de 5%, os valorescríticos necessários são

χ 215;0,975 = 6 , 262

χ 215;0,025 = 27 , 488

e a região crítica éX 20 > 27, 488 ou X 20 < 6, 262

O valor observado da estatística de teste é

x20 =

15 × 32, 120

= 24 , 075

que não pertence à região crítica. Logo, não se rejeita a hipótese nula, ou seja, nãopodemos a rmar queσ2 6= 20 .

Page 186: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 186/189

CAPÍTULO 12. TESTE DE HIPÓTESE: VARIÂNCIA DAN (μ; σ2) 181

12.4 Exemplo 2 (Bussab&Morettin - Exercício 40 p.353)

Um escritório de investimento acredita que o rendimento das diversas ações movimen-tadas por ele foi de 24% ao longo dos últimos anos. Uma nova estratégia é implementadapara melhorar o desempenho, bem como garantir uma maior uniformidade nos rendi-mentos das diversas ações. No passado, o desvio padrão do rendimento era da ordemde 5%. Uma amostra de 8 empresas forneceu os seguinjtes rendimentos (dados em %):23,6; 22,8; 25,7; 24,8; 26,4; 24,3; 23,9; 25. Quais seriam as conclusões? Quais são ashipóteses necessárias para a solução deste problema?

SoluçãoTemos que supor que os rendimentos têm distribuição normal. As hipóteses de

interesse sãoμ > 24 e σ2 < 25. Logo, as hipóteses estatísticas são

H 0 : μ = 24 H 0 : σ2 = 25

H 1 : μ > 24 H 1 : σ2 < 25

Os dados fornecem8

Pi=1xi = 196, 5 e

8

Pi=1x2

i = 4835, 99

x =196, 5

8= 24 , 5625

s2 =17

[4835, 99 −8 × 24, 5625] =9, 45875

7= 1 , 35125

Como o tamanho da amostra é pequeno e tanto a média como variãncia são de-

sconhecidas, as estatísticas de teste sãoT 0 e X 20 . Os valores críticos, para um nível designi cância de 5%, são

t7;0,05 = 1 , 895 χ 7;0,95 = 2 , 167

e s regiões críticas sãoT 0 > 1, 895 X 20 < 2, 167

Os valores observados das estatísticas de teste são

t0 = √ 824, 5625−24√ 1, 35125

= 1 , 3687 < 1, 895

x20 = 7 × 1, 35125

25= 0 , 37835 < 2, 167

Vemos, então, quet0 não pertence à região crítica e, portanto, não podemos dizer que orendimento médio aumentou. Por outro lado,x2

0 pertence à região crítica e, portanto, osdados indicam que houve redução na variabilidade dos rendimentos das ações negociadaspelo escritório.

Page 187: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 187/189

CAPÍTULO 12. TESTE DE HIPÓTESE: VARIÂNCIA DAN (μ; σ2) 182

0 1 2 3 4 5 6 7 8 90,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,035860,1 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,075350,2 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,114090,3 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,151730,4 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,187930,5 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,222400,6 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,254900,7 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,285240,8 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,313270,9 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,338911 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214

1,1 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,382981,2 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,401471,3 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41309 0,41466 0,41621 0,417741,4 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,431891,5 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,444081,6 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,454491,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,463271,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,470621,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,476702 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169

2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,485742,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,488992,3 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,491582,4 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,493612,5 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,495202,6 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,496432,7 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,497362,8 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,498072,9 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,498613 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49900

3,1 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,499293,2 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,499503,3 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965

3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,499763,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,499833,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,499893,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,499923,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,499953,9 0,49995 0,49995 0,49996 0,49996 0,49996 0,49996 0,49996 0,49996 0,49997 0,499974 0,49997 0,49997 0,49997 0,49997 0,49997 0,49997 0,49998 0,49998 0,49998 0,49998

4,1 0,49998 0,49998 0,49998 0,49998 0,49998 0,49998 0,49998 0,49998 0,49999 0,499994,2 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,499994,3 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,499994,4 0,49999 0,49999 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,500004,5 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000

Corpo da tabela dá a probabilidade p tal queDistribuição Normal Padrão

Tabela 1

)0( c Z Z P p <<=

Page 188: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 188/189

CAPÍTULO 12. TESTE DE HIPÓTESE: VARIÂNCIA DAN (μ; σ2) 183

g.l.n 0,150 0,100 0,050 0,025 0,010 0,005 0,002 0,0011 1,963 3,078 6,314 12,706 31,821 63,657 159,153 318,3092 1,386 1,886 2,920 4,303 6,965 9,925 15,764 22,3273 1,250 1,638 2,353 3,182 4,541 5,841 8,053 10,215

4 1,190 1,533 2,132 2,776 3,747 4,604 5,951 7,1735 1,156 1,476 2,015 2,571 3,365 4,032 5,030 5,8936 1,134 1,440 1,943 2,447 3,143 3,707 4,524 5,2087 1,119 1,415 1,895 2,365 2,998 3,499 4,207 4,7858 1,108 1,397 1,860 2,306 2,896 3,355 3,991 4,5019 1,100 1,383 1,833 2,262 2,821 3,250 3,835 4,29710 1,093 1,372 1,812 2,228 2,764 3,169 3,716 4,14411 1,088 1,363 1,796 2,201 2,718 3,106 3,624 4,02512 1,083 1,356 1,782 2,179 2,681 3,055 3,550 3,93013 1,079 1,350 1,771 2,160 2,650 3,012 3,489 3,85214 1,076 1,345 1,761 2,145 2,624 2,977 3,438 3,78715 1,074 1,341 1,753 2,131 2,602 2,947 3,395 3,733

16 1,071 1,337 1,746 2,120 2,583 2,921 3,358 3,68617 1,069 1,333 1,740 2,110 2,567 2,898 3,326 3,64618 1,067 1,330 1,734 2,101 2,552 2,878 3,298 3,61019 1,066 1,328 1,729 2,093 2,539 2,861 3,273 3,57920 1,064 1,325 1,725 2,086 2,528 2,845 3,251 3,55221 1,063 1,323 1,721 2,080 2,518 2,831 3,231 3,52722 1,061 1,321 1,717 2,074 2,508 2,819 3,214 3,50523 1,060 1,319 1,714 2,069 2,500 2,807 3,198 3,48524 1,059 1,318 1,711 2,064 2,492 2,797 3,183 3,46725 1,058 1,316 1,708 2,060 2,485 2,787 3,170 3,45026 1,058 1,315 1,706 2,056 2,479 2,779 3,158 3,43527 1,057 1,314 1,703 2,052 2,473 2,771 3,147 3,421

28 1,056 1,313 1,701 2,048 2,467 2,763 3,136 3,40829 1,055 1,311 1,699 2,045 2,462 2,756 3,127 3,39630 1,055 1,310 1,697 2,042 2,457 2,750 3,118 3,38531 1,054 1,309 1,696 2,040 2,453 2,744 3,109 3,37532 1,054 1,309 1,694 2,037 2,449 2,738 3,102 3,36533 1,053 1,308 1,692 2,035 2,445 2,733 3,094 3,35634 1,052 1,307 1,691 2,032 2,441 2,728 3,088 3,34835 1,052 1,306 1,690 2,030 2,438 2,724 3,081 3,34040 1,050 1,303 1,684 2,021 2,423 2,704 3,055 3,30750 1,047 1,299 1,676 2,009 2,403 2,678 3,018 3,261

Área na cauda superior:

Valores críticos da distribuiçãot -StudentTabela 2

α α => ))(Pr( t nt

α

Page 189: estatística - texto bom

8/6/2019 estatística - texto bom

http://slidepdf.com/reader/full/estatistica-texto-bom 189/189

CAPÍTULO 12. TESTE DE HIPÓTESE: VARIÂNCIA DAN (μ; σ2) 184

T abe l a da Q u i -Q uad rado

D i st r ibu i ção qu i -qu ad rad oV alo re s c r í t ico s de c2 t a i s qu e

g . l . =

n 0 ,9 9 0 0 ,9 8 0 0 ,9 7 5 0 ,9 5 0 0 ,9 0 0 0 ,8 0 0 0 ,2 0 0 0 ,1 0 0 0 ,0 5 0 0 ,0 2 5 0 ,0 2 0 0 ,0 1 0

1 0 ,0 00 0 ,0 01 0 ,0 01 0 ,0 0 4 0 ,0 16 0 ,0 6 4 1 ,6 42 2 ,7 06 3 ,8 41 5 ,0 24 5 ,4 12 6 ,6 35

2 0 ,0 20 0 ,0 40 0 ,0 51 0 ,1 0 3 0 ,2 11 0 ,4 4 6 3 ,2 19 4 ,6 05 5 ,9 91 7 ,3 78 7 ,8 24 9 ,2 10

3 0 ,1 15 0 ,1 85 0 ,2 16 0 ,3 5 2 0 ,5 84 1 ,0 0 5 4 ,6 42 6 ,2 51 7 ,8 15 9 ,3 48 9 ,8 37 1 1 ,3 45

4 0 ,2 97 0 ,4 29 0 ,4 84 0 ,7 11 1 ,0 64 1 ,6 49 5 ,9 89 7 ,7 79 9 ,4 88 11 ,1 43 1 1 ,6 68 13 ,2 77

5 0 ,5 54 0 ,7 52 0 ,8 31 1 ,1 45 1 ,6 10 2 ,3 43 7 ,2 89 9 ,2 36 1 1 ,0 70 1 2,8 33 1 3,3 88 1 5 ,0 86

6 0 ,8 7 2 1 ,1 3 4 1 ,2 3 7 1 ,6 3 5 2 ,2 0 4 3 ,0 70 8 ,5 5 8 1 0,6 45 1 2 ,5 9 2 1 4,4 4 9 1 5,0 3 3 1 6 ,8 1 2

7 1 ,2 3 9 1 ,5 6 4 1 ,6 9 0 2 ,1 6 7 2 ,8 3 3 3 ,8 22 9 ,8 0 3 1 2,0 17 1 4 ,0 6 7 1 6,0 1 3 1 6,6 2 2 1 8 ,4 7 5

8 1 ,6 4 6 2 ,0 3 2 2 ,1 8 0 2 ,7 3 3 3 ,4 9 0 4 ,5 94 1 1 ,0 3 0 1 3 ,3 62 1 5 ,5 0 7 1 7 ,5 3 5 1 8 ,1 6 8 2 0 ,0 9 0

9 2 ,0 8 8 2 ,5 3 2 2 ,7 0 0 3 ,3 2 5 4 ,1 6 8 5 ,3 80 1 2 ,2 4 2 1 4 ,6 84 1 6 ,9 1 9 1 9 ,0 2 3 1 9 ,6 7 9 2 1 ,6 6 61 0 2 ,5 5 8 3 ,0 5 9 3 ,2 4 7 3 ,9 4 0 4 ,8 6 5 6 ,1 79 1 3 ,4 4 2 1 5 ,9 87 1 8 ,3 0 7 2 0 ,4 8 3 2 1 ,1 6 1 2 3 ,2 0 9

1 1 3 ,0 5 3 3 ,6 0 9 3 ,8 1 6 4 ,5 7 5 5 ,5 7 8 6 ,9 89 1 4 ,6 3 1 1 7 ,2 75 1 9 ,6 7 5 2 1 ,9 2 0 2 2 ,6 1 8 2 4 ,7 2 5

1 2 3 ,5 7 1 4 ,1 7 8 4 ,4 0 4 5 ,2 2 6 6 ,3 0 4 7 ,8 07 1 5 ,8 1 2 1 8 ,5 49 2 1 ,0 2 6 2 3 ,3 3 7 2 4 ,0 5 4 2 6 ,2 1 7

1 3 4 1 0 7 4 7 6 5 5 0 0 9 5 8 9 2 7 0 4 2 8 6 34 1 6 9 8 5 1 9 8 12 2 2 3 6 2 2 4 7 3 6 2 5 4 7 2 2 7 6 8 8

2;α χ n

( ) α χ χ α =≥ 2

;2P r nn

α