ralph dos santos silvavamos repetir o exemplo 1, sem admitir repetição. método: i selecionar uma...

34
T ÉCNICAS DE AMOSTRAGEM Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro

Upload: others

Post on 18-Jun-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

TÉCNICAS DE AMOSTRAGEM

Ralph dos Santos Silva

Departamento de Métodos EstatísticosInstituto de Matemática

Universidade Federal do Rio de Janeiro

Page 2: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Sumário

Definições e Notação

Estimação

Amostra Aleatória Simples Sem Reposição

Amostra Aleatória Simples Com Reposição

Page 3: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Definições e Notação

Definições e Notação

Regra geral da nossa notação:I Universo ou população:

LETRAS MAIÚSCULAS.I Amostra:

letras minúsculas.

Exemplos:

Y → média populacional;

y → média amostral.

Page 4: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Definições e Notação

Definições e Notação: População

Seja uma população composta de N unidades elementares Ui , i = 1, . . . ,N.

O conjuntoPN = U = {U1,U2, . . . ,UN}

define os rótulos que identificam cada unidade da população.

Temos que

N → tamanho da população de pesquisa;

Ui → rótulo para uma unidade genérica i ;

y → variável de pesquisa ou de interesse; e

Yi → valor da variável y para unidade i .

Page 5: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Definições e Notação

Alguns parâmetros de interesse

I Total populacional: Y =N∑

i=1

Yi .

I Média populacional: Y = µ =1N

N∑i=1

Yi .

I Variância populacional: S2 = S2y =

1N − 1

N∑i=1

(Yi − Y )2.

I Razão populacional: R = Rxy =

N∑i=1

Yi

N∑i=1

Xi

=YX

.

Page 6: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Definições e Notação

Alguns parâmetros de interesse

I Covariância populacional:

Sxy =1

N − 1

N∑i=1

(Yi − Y )(Xi − X ).

I Coeficiente de correlação (de Pearson) populacional:

ρ = ρxy =Sxy

Sx Sy=

N∑i=1

(Yi − Y )(Xi − X )√√√√ N∑i=1

(Yi − Y )2N∑

i=1

(Xi − X )2

.

Page 7: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Definições e Notação

Definições e Notação: Amostra

Qualquer subconjunto s ⊂ U não vazio, selecionado para ser observado eutilizado para estimar parâmetros de U:

s = {u1, u2, . . . , un} ⊂ U.

Temos que

n → é o tamanho da amostra

ui → é a unidade i da amostra, i = 1, 2, . . . , n; e

yi → é o valor da variável de interesse y para a unidade i da amostra.

Page 8: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Definições e Notação

Estatísticas (funções da amostra)

Seja {y1, y2, . . . , yn} o conjunto dos dados amostrais.

I Total amostral: t =n∑

i=1

yi .

I Média amostral: y =1n

n∑i=1

yi .

I Variância amostral: s2 = s2y =

1n − 1

n∑i=1

(yi − y)2.

I Razão amostral: r = rxy =

n∑i=1

yi

n∑i=1

xi

=yx

.

Page 9: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Definições e Notação

Estatísticas (funções da amostra)

I Covariância amostral:

sxy =1

n − 1

n∑i=1

(yi − y)(xi − x).

I Coeficiente de correlação (de Pearson) amostral:

ρ = ρxy =sxy

sx sy=

n∑i=1

(yi − y)(xi − x)√√√√ n∑i=1

(yi − y)2n∑

i=1

(xi − x)2

.

Page 10: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Definições e Notação

Exemplo de População

Seja uma população P3, tal que uma variável de interesse y apresente oseguinte conjunto de valores: Y1 = 4, Y2 = 5 e Y3 = 3.

Y =3∑

i=1

Yi = 4 + 5 + 3 = 12

Y =13

3∑i=1

Yi =4 + 5 + 3

3= 4

S2y =

13− 1

N∑i=1

(Yi − Y )2 = 1,[σ2 =

23

].

Observação: na prática nunca faremos uma amostra de uma populaçãodeste tamanho.

Page 11: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Definições e Notação

Exemplo 1Vamos selecionar todas as possíveis amostras de tamanho 2 dessapopulação, permitindo repetições.

Método:I Selecionar uma unidade com equiprobabilidade.I Anotar o valor de y e devolver a unidade à população.I Selecionar a segunda unidade com equiprobabilidade.

Amostral possível y1 y2 t y s2

1 {u1, u2} = {U1,U1} 4 4 8 4 02 {u1, u2} = {U1,U2} 4 5 9 4,5 0,53 {u1, u2} = {U1,U3} 4 3 7 3,5 0,54 {u1, u2} = {U2,U1} 5 4 9 4,5 0,55 {u1, u2} = {U2,U2} 5 5 10 5 06 {u1, u2} = {U2,U3} 5 3 8 4 27 {u1, u2} = {U3,U1} 3 4 7 3,5 0,58 {u1, u2} = {U3,U2} 3 5 8 4 29 {u1, u2} = {U3,U3} 3 3 6 3 0

Page 12: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Definições e Notação

Exemplo 1 (continuação)

I Veja que as estatísticas (das amostras) são diferentes para cadaamostra possível.

I Portanto, são variáveis aleatórias.I Suponha que todas as amostras possíveis têm a mesma probabilidade

de serem selecionadas, ou seja, Pr(sj) = 1/9 para j = 1, 2, . . . , 9.I Vamos calcular o valor esperado do total, da média e da variância da

amostra.I O que concluímos?

I t tendencioso para Y ;I y não tendencioso para Y ; eI s2 tendencioso para S2

y .

Page 13: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Definições e Notação

Exemplo 2Vamos repetir o Exemplo 1, sem admitir repetição.

Método:I Selecionar uma unidade com equiprobabilidade.I Selecionar, também com equiprobabilidade, a segunda unidade entre as

restantes.

Amostral possível y1 y2 t y s2

1 {u1, u2} = {U1,U2} 4 5 9 4,5 0,52 {u1, u2} = {U1,U3} 4 3 7 3,5 0,53 {u1, u2} = {U2,U3} 5 3 8 4 2

I Agora temos 3 amostras possíveis com Pr(sj) = 1/3, para j = 1, 2, 3.I Vamos calcular os mesmos valores esperados do Exemplo 1.I Quais as conclusões?

I t tendencioso para Y ;I y não tendencioso para Y ; eI s2 não tendencioso para S2

y .

Page 14: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Estimação

Definições

I Parâmetro: é uma função dos valores da variável de interesse napopulação.

I Estatística: é uma função dos valores da variável de interesse naamostra.

I O valor da estatística varia conforme a amostra selecionada, portantoé uma variável aleatória que possui um valor esperado e uma variância.

I Estimador: é uma estatística adequada para estimar o valor de umparâmetro a partir dos dados amostrais.

Estimador e Estimação

I Portanto: estimador é uma função dos dados amostrais que serve paraestimar um parâmetro.

I Precisão do estimador: é dada pela variância do estimador.I Estimativa: é o valor resultante da aplicação da função estimador aos

dados da amostra.I Todo estimador que puder ser escrito como uma combinação linear dos

valores amostrais será um estimador linear.

Page 15: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Estimação

Estimador e Estimação

Vamos considerar o problema de estimar o valor do total populacional apartir de uma amostra, ou seja:

uma v({y1, y2, . . . , yn}) que aproxime Y =N∑

i=1

Yi .

Será que existe um estimador linear com essa capacidade?

Ou seja, existe Y =n∑

i=1

ωiyi ' Y =N∑

i=1

Yi ?

Page 16: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Estimação

Exemplo 2 (continuação)I Vimos que Y = 12.I Mas 1, 5× Ep(t) = 12 = Y , ou ainda Ep(1, 5t) = 12 = Y .I Então a estatística t não é um bom estimador de Y , mas a estatística

1, 5t pode ser!I Se uma estatística é uma variável aleatória, ela tem uma distribuição de

probabilidades (que dá a probabilidade com que a variável aleatóriaassume cada um dos seus valores possíveis).

Distribuição amostralI Distribuição amostral é a distribuição de probabilidades de uma

estatística.I Distribuição amostral de t :

t 7 8 9Pr(t) 1/3 1/3 1/3

I Distribuição amostral de 1, 5t :

1,5t 10,5 12 13,5Pr(t) 1/3 1/3 1/3

Page 17: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Estimação

Probabilidade de inclusão

I Define-se como probabilidade de inclusão da unidade Ui na amostra aseguinte quantidade:

πi =∑s⊃Ui

Pr(s).

I Ou seja, a probabilidade da unidade Ui da população ser incluída naamostra, é igual a probabilidade de uma das possíveis amostras que acontenha ser a amostra selecionada.

Page 18: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Estimação

Variável indicadora de presençaI Seja a variável aleatória δi uma indicadora da presença da unidade Ui

na amostra:

δi =

{1, se a unidade Ui percente à amostra;0, caso contrário.

I Portanto, essa será uma variável aleatória de Bernouli com

Pr(δi = 1) = Pr(Ui ⊂ s) = πi .

I Então, temos que:

Ep(δi) = πi , Varp(δi) = πi(1− πi).

I Também temos que

Pr(δiδj = 1) = Pr(Ui ⊂ s; Uj ⊂ s) =∑

s⊃Ui ;Uj

Pr(s) = πij ,

tal queCov(δi , δj) = πij − πiπj .

Page 19: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Estimação

Estimador linear (continuação)

I O estimador linear do total pode ser escrito como:

Y =n∑

i=1

ωiyi =N∑

j=1

ωjYjδj .

I Seu valor esperado será:

Ep(Y ) = Ep

(n∑

i=1

ωiyi

)=

N∑j=1

ωjYjEp(δj) =N∑

j=1

ωjπjYj .

I Para que esse estimador seja não tendencioso, basta que:

ωjπj = 1 ⇒ ωj =1πj.

Page 20: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Estimação

Definição

I O peso amostral da unidade ui de uma amostra probabilística é igual aoinverso de sua probabilidade de inclusão nessa amostra:

ωi =1πi, i = 1, 2, . . . , n.

I Interpretação intuitiva: o peso amostral é o número de unidades dapopulação “representadas” pela unidade ui da amostra.

Page 21: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Estimação

Estimador de Horvitz-Thompson

I Então, um estimador não tendencioso para o total de uma variável deinteresse será dado por:

YHT =n∑

i=1

ωiyi =n∑

i=1

1πi

yi .

I O estimador do total que acabamos de definir, como soma ponderadados valores amostrais, onde o peso de cada unidade amostral é oinverso de sua probabilidade de inclusão, é chamado de estimador deHorvitz-Thompson, que foram seus formuladores.

I Esse estimador está definido para qualquer plano amostral onde todasas unidades da população tenham probabilidades positivas de seremselecionadas.

Page 22: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Estimação

Estimador de Horvitz-Thompson (continuação)

I Variância do estimador de Horvitz-Thompson:

Varp(YHT ) =N∑

i=1

1− πi

πiY 2

i +N∑

i=1

N∑j 6=i

πij − πiπj

πiπjYiYj .

I Um estimador não tendencioso para a variância do estimador deHorvitz-Thompson é:

Varp(YHT ) = vp(YHT ) =n∑

i=1

1− πi

π2i

y2i +

n∑i=1

n∑j 6=i

πij − πiπj

πiπjπijyiyj .

I Note a divisão por quantidades extras πi e πij no estimador da variânciado estimador de Horvitz-Thompson.

Exercícios:1. Dado o estimador YHT , encontre a expressão para Varp(YHT ).

2. Mostre que Varp(YHT ) é um estimador não tendencioso de Varp(YHT ).

Page 23: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Sem Reposição

Amostra Aleatória Simples Sem Reposição (AAS)

I Método básico de muitos planos amostrais.I O algoritmo base é:

Para uma AAS de tamanho n:1. Selecione uma unidade da população com equiprobabilidade.2. Retire a unidade selecionada da população.3. Repita os Passos 1 e 2 até ter selecionado n unidades.

I Esse esquema garante que todas as amostras possíveis de tamanho ntêm a mesma probabilidade de serem escolhidas.

I Garante que todas as unidades têm a mesma probabilidade de seleçãoe de inclusão.

Page 24: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Sem Reposição

Amostra Aleatória Simples Sem Reposição (AAS)I A probabilidade de seleção da unidade Ui em qualquer uma das n

seleções é 1/N:

Pr(Ui ser selecionada na 1a) =1N

Pr(Ui ser selecionada na 2a) =

[1− 1

N

]1

N − 1=

1N

Pr(Ui ser selecionada na 3a) =

[1− 1

N

] [1− 1

N − 1

]1

N − 2=

1N

...

I A probabilidade de inclusão da unidade Ui na amostra, dessa forma,será igual a probabilidade dela ser selecionada em pelo menos uma dasn seleções, ou seja:

πi = Pr(Ui ⊂ s) =n∑

i=1

1N

=nN.

Page 25: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Sem Reposição

Amostra Aleatória Simples Sem Reposição (AAS)

I A probabilidade de inclusão das unidades Ui e Uj na amostra, será iguala probabilidade de Ui ser selecionada em pelo menos uma das nseleções, e Uj ser selecionada em uma das n − 1 outras seleções, ouseja:

πij = Pr(Ui ⊂ s; Uj ⊂ s) =n∑

i=1

1N

n∑j 6=i,j=1

1N − 1

=nN× n − 1

N − 1.

Page 26: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Sem Reposição

Amostra Aleatória Simples Sem Reposição (AAS)I Para o estimador do total populacional, empregaremos o estimador de

Horvitz-Thompson:

YHT = YAAS =n∑

i=1

ωiyi =n∑

i=1

yi

πi=

n∑i=1

Nyi

n=

Nn

n∑i=1

yi = Ny ,

sendo ωi o peso amostral dado pelo inverso da probabilidade deinclusão.

I A variância do estimador do total é dada por

Var(YAAS) = N2(1− f )S2

n, sendo f =

nN.

I Um estimador não tendencioso de S2 é dado pela variância amostral:

S2 = s2 =1

n − 1

n∑i=1

(yi − y)2 =1

n − 1

[n∑

i=1

y2i − ny2

].

I Consequentemente,

v(YAAS) = Var(YAAS) = N2(1− f )s2

n.

Page 27: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Sem Reposição

Amostra Aleatória Simples Sem Reposição (AAS)

I Definimos a fração amostral como f =nN

.

I O termo (1− f ) é chamado de fator de correção para populações finitas.I Note que se N →∞, o fator de correção para populações finitas será

aproximadamente 1.I Estimador da média populacional:

Y AAS = y =YAAS

N=

1n

n∑i=1

yi .

I Variância do estimador da média:

Var(y) = (1− f )S2

n=

N − nN

× S2

n.

I Estimador da variância do estimador da média:

v(y) = (1− f )s2

n.

Page 28: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Sem Reposição

Exercício (Cochran)

Foram coletadas assinaturas para um abaixo assinado em 676 folhas. Cadafolha tinha espaço para 42 assinaturas, mas em muitas das folhas foicoletado um número menor de assinaturas. Uma amostra aleatória simplesde 50 folhas foi selecionada, e os resultados estão na tabela abaixo:

Tabela: Dados sobre assinaturas.

yi 42 41 36 32 29 27 23 19 16 15fi 23 4 1 1 1 2 1 1 2 2yi 14 11 19 9 7 6 5 4 3 Totalfi 1 1 1 1 1 3 2 1 1 50

a) Estimar o total de assinaturas do abaixo assinado e avariância do estimador.

b) Estimar o número médio de assinaturas por folha e avariância do estimador.

Page 29: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Sem Reposição

Seleção de uma amostral aletória simples

I Como selecionar uma amostral aletória simples de um cadastro?I Algoritmo natural é pouco eficiente do ponto de vista computacional.I Vamos dar 2 exemplos de Algoritmos: Hàjek, e Fan, Muller e Rezucha.

Algoritmo de HàjekI Selecionar um número aleatório da distribuição U(0, 1), para cada

unidade da população PN .I Ordenar a população segundo os valores dos aleatórios gerados.I Selecionar as n primeiras unidades da população nessa nova ordem.

Qualquer pacote já tem pelo menos uma rotina de ordenação e geração denúmeros pseudo-aleatórios.

Page 30: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Sem Reposição

Algoritmo de Fan, Muller e Rezucha

I Seja uma população com N unidades.I Deseja-se uma amostra de tamanho n desta população.

1. i ← 02. i ← i + 13. Para a unidade Ui gere um número aleatório Ai ∼ U(0, 1).4. Se Ai <

nN

, faça

4.1 Inclua Ui na amostra.4.2 Faça n ← n − 1 e N ← N − 1.

Caso contrário, se Ai >nN

, faça

4.1 Faça N ← N − 1.

5. Se n = 0 ou N = 0 pare. Caso contrário, retorne ao Passo 2.

I Processamento sequencial.I Pode não precisar percorrer todo o cadastro.

Page 31: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Sem Reposição

Exercício

Suponha que exista um cadastro de 1.000.000 de unidades. Deseja-seselecionar uma amostra aleatória simples sem reposição (AAS) com 1.500unidades desta população. Faça o que é pedido abaixo no R e utilize noinício das rotinas set.seed(12345).

1. Utilize o Algoritmo de Hàjek para selecionar esta amostra.

2. Utilize o Algoritmo de Fan, Muller e Rezucha para selecionar estaamostra.

3. Utilize a função sample ou sample.int para selecionar a amostra.

4. Compare os tempos de execução de cada algoritmo.

Page 32: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Com Reposição

Amostra Aleatória Simples Com Reposição (AASc)I Algoritmo natural da AASc:

1. Selecione uma unidade da população com equiprobabilidade;2. Reponha a unidade selecionada na população;3. Repita os Passos 1 e 2 até ter feito n seleções.

I Para uma variável de interesse y , temos que os valores amostraisy1, y2, . . . , yn serão:

I Independentes;I Identicamente distribuídos; eI Pr(yi = Yj ) =

1N, i = 1, 2, . . . , n, j = 1, 2, . . . ,N.

I Distribuição amostral de yi :

yi Y1 Y2 · · · Yj · · · YN

Pr(yi = Yj)1N

1N

· · · 1N

· · · 1N

I Temos queEAASc(yi) = Y e VarAASc(yi) = σ2.

I Conclusão: yi é um estimador não tendencioso para a média dapopulação, mas a variância é “grande”.

Page 33: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Com Reposição

Amostra Aleatória Simples Com Reposição (AASc)I Vamos analisar a média amostral:

EAASc(y) = Y e VarAASc(y) =σ2

n=

N − 1N

× S2

n.

I Então, a média amostral também é estimador não tendencioso para amédia da população.

I Vantagem: a variância é menor!I Comparação com a AAS:

VarAAS(y) 6 VarAASc(y).I Estimador da variância da média amostral

VarAASc(y) = vAASc(y) =s2

n.

I Na amostra aleatória simples com reposição, temos que

EAASc(s2) = σ2 =

N − 1N

S2.

I Para o total populacional:

YAASc = Ny , Var(YAASc) = N2 σ2

n, e v(YAASc) = N2 s2

n.

Page 34: Ralph dos Santos SilvaVamos repetir o Exemplo 1, sem admitir repetição. Método: I Selecionar uma unidade com equiprobabilidade. I Selecionar, também com equiprobabilidade, a segunda

Técnicas de Amostragem

Amostra Aleatória Simples Com Reposição

Exercício

Definimos

σ2 =1N

N∑i=1

(Yi − Y )2.

Para uma amostra aleatória simples com reposição, mostre que:

1. EAASc(yi) = Y e VarAASc(yi) = σ2.

2. EAASc(y) = Y e VarAASc(y) =σ2

n=

N − 1N

× S2

n.

3. VarAAS(y) 6 VarAASc(y).

4. EAASc(s2) = σ2 =N − 1

NS2.