sae - Łukasz wawrowski
TRANSCRIPT
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Statystyka Małych Obszaróww badaniach próbkowych
Łukasz [email protected]
Urząd Statystyczny w PoznaniuSKN Estymator, UEP
5.03.2012
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
1 WprowadzeniePodstawowe pojęciaBadanie
2 Estymatory bezpośrednieEstymator Horwitza-ThompsonaEstymator regresyjny
3 Estymatory pośrednieBroad Area Ratio Estimator
4 Podsumowanie
5 Literatura
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Podstawowe pojęciaBadanie
Statystyka Małych Obszarów
gałąź metody reprezentacyjnej,
przedmiotem zainteresowania charakterystki podpopulacji,
szacowanie dziedzin nie objętych planem losowania,
losowa liczebność domeny w próbie,
szacunki nawet przy zerowej liczbności próby w podpopulacji,
wykorzystanie wszystkich dostępnych źródeł danych.
Mały obszar
Domena (obszar geograficzny, typ przedsiębiorstwa, grupawiekowa), której liczebność w próbie jest mała.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Podstawowe pojęciaBadanie
Statystyka Małych Obszarów
gałąź metody reprezentacyjnej,
przedmiotem zainteresowania charakterystki podpopulacji,
szacowanie dziedzin nie objętych planem losowania,
losowa liczebność domeny w próbie,
szacunki nawet przy zerowej liczbności próby w podpopulacji,
wykorzystanie wszystkich dostępnych źródeł danych.
Mały obszar
Domena (obszar geograficzny, typ przedsiębiorstwa, grupawiekowa), której liczebność w próbie jest mała.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Podstawowe pojęciaBadanie
Estymator bezpośredni
Estymator bezpośredni wykorzystuje informacje o zmiennej badanejy pochodzące wyłącznie z domeny będącej przedmiotem badaniaw danym momencie czasu.
Mała liczebność próby ⇒ duża wariancja,
ale nieobciążony,
więc wykorzystywany przy tworzeniu estymatorów pośrednich.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Podstawowe pojęciaBadanie
Estymator pośredni
Estymator pośredni wykorzystuje informacje o wartościachzmiennej badanej y spoza okresu i domeny będącej przedmiotemzainteresowania.
Obciążony, ale niska wariancja,
„pożycza moc” spoza domeny przy spełnionych założeniach.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Podstawowe pojęciaBadanie
Opis badania
Celem badania było poznanie odsetka studentów zaliczającychpraktyki zgodnie z regulaminem studiów.
Liczebność populacji: 308 osób,
liczebność próby: 62 osoby (20%),
badana domena: wydział.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Podstawowe pojęciaBadanie
Przygotowanie zbioru
library(TeachingSampling)dane=read.csv(file="ankieta.csv")los=sample(dane$id, 62, replace=F)dane_los=dane[los,]p=rep(nrow(dane_los)/nrow(dane), nrow(dane_los))dane_los=cbind(dane_los, p)
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Podstawowe pojęciaBadanie
Przygotowanie zbioru
dane1=dane_los[dane_los$m5==1, ] #WEdane2=dane_los[dane_los$m5==2, ] #WIGEdane3=dane_los[dane_los$m5==3, ] #WGMdane4=dane_los[dane_los$m5==4, ] #WTdane5=dane_los[dane_los$m5==5, ] #WZ
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Podstawowe pojęciaBadanie
Tablica: Częstości
WydziałPopulacja Próba
N Tak Nie n Tak NieWE 112 96 16 18 17 1WIGE 28 24 4 7 6 1WGM 58 45 13 13 12 1WT 22 20 2 4 4 0WZ 88 75 13 20 18 2
Źródło: opracowanie własne.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Estymator Horwitza-ThompsonaEstymator regresyjny
Estymator Horwitza-Thompsona
yHTd =∑i∈sd
yiπi, (1)
gdzie: πi - prawdopodobieństwo wylosowania i-tego elementu dopróby.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Estymator Horwitza-ThompsonaEstymator regresyjny
Jak w R?
Funkcja:
E.SI(N, n, y)
Argumenty:N - wielkość populacji,n - wielkość próby,y - wektor zawierający dane jednostkowe zmiennej objaśnianej.Wynik:wartość wyestymowana, wariancja, współczynnik zmienności.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Estymator Horwitza-ThompsonaEstymator regresyjny
Przykład
Estymacja liczby osób, które odbyły praktykę zgodniez regulaminem na Wydziale Gospodarki Międzynarodowej.
E.SI(N=58, n=nrow(dane3), dane3$q1_tak)
yEstimation 53.538462Variance 15.443787CVE 7.340253
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Estymator Horwitza-ThompsonaEstymator regresyjny
GREG
yGREGd = yHTd + βd(xd − xHTd ), (2)
gdzie: βd - współczynnik regresji między zmienną objaśnianą,a zmiennymi dodatkowymi.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Estymator Horwitza-ThompsonaEstymator regresyjny
Jak w R?
Funkcja:
E.Beta(y, x, Pik, ck=1, b0=FALSE)GREG.SI(N, n, y, x, tx, b, b0=FALSE)
Argumenty:x - macierz zawierająca zmienne dodatkowe,Pik - wektor prawdopodobieństw dostania się do próby,ck - wektor wag,tx - wielkość populacji zmiennych dodatkowych,b0 - wyraz wolny.Wynik:wartość wyestymowana, wariancja, współczynnik zmienności.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Estymator Horwitza-ThompsonaEstymator regresyjny
Przykład
Estymacja liczby osób, które odbyły praktykę zgodniez regulaminem na Wydziale Gospodarki Międzynarodowejz wykorzystaniem zmiennych dodatkowych: płeć orazdoświadczenie.
dane_pom=cbind(dane3$q3, dane3$m1)b=E.Beta(dane3$q1_tak,dane_pom,dane3$p,b0=T)GREG.SI(58,nrow(dane3),dane3$q1_tak,dane_pom,58,b,b0=T)
yEstimation 58.000000Variance 13.384615CVE 6.307757
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Broad Area Ratio Estimator
Broad Area Ratio Estimator (BARE)
yBAREd =yHTdNnd , (3)
gdzie: N - populacja dużego obszaru, nd - populacja małegoobszaru.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Broad Area Ratio Estimator
Jak w R?
BARE.SI=function(N, n, nd, y){Total <- matrix(NA, nrow = 3, ncol = 1)rownames(Total) = c("Estimation", "Variance", "CVE")colnames(Total) = "y"ht=E.SI(N, n, y)BARE=(ht[1,1]/N)*ndvar=((nd/N)^2)*ht[2,1]Cve=100*sqrt(var)/BARETotal[,1]=c(BARE, var, Cve)return(Total)}
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Broad Area Ratio Estimator
Przykład
Estymacja liczby osób, które odbyły praktykę zgodniez regulaminem na Wydziale Gospodarki Międzynarodowejz wykorzystaniem wiedzy na temat całej populacji.
BARE.SI(N=308, n=62, nd=58, dane_los$q1_tak)
yEstimation 53.322581Variance 3.265668CVE 3.389026
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Zastosowanie
Statystyka Małych Obszarów wykorzystywana jest
w sytuacjach, w których tradycyjne metody okazują sięniewydolne i nieekonomiczne,
kiedy istnieje zapotrzebowanie na informację na niskimpoziemie agregacji przestrzennej,
przy ograniczonym budżecie.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Podsumowanie
W prezentacji został przedstawiony zarys SMO orazrandomizacyjne podejście do estymacji. Oprócz niego w SMOwyróżnia się także:
podejście modelowe,
podejście bayesowskie.
O czym innym razem... ¨
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Australian Bureau of Statistics, 2006, A Guide to Small AreaEstimation, Australia.
Paradysz J., 2009, Kryteria dobroci estymacji dla małychobszarów, Poznań.
Rao J.N.K., 2003, Small Area Estimation, John Wiley & Sons,New York.
Żądło T., 2008, Elementy statystyki małych obszarówz programem R, Wydawnictwo Akademii Ekonomicznejim. Karola Adamieckiego, Katowice.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych
WprowadzenieEstymatory bezpośrednieEstymatory pośrednie
PodsumowanieLiteratura
Dziękuje za uwagę.
Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych