Örneklem dağılışları

38
Örneklem Dağılışları

Upload: tejana

Post on 22-Jan-2016

63 views

Category:

Documents


0 download

DESCRIPTION

Örneklem Dağılışları. Bir araştırma yapmanın amacı, çalışılan örneklemden kitleye genelleme yapabilmektir. Çıkarsama yapma işlemi, olasılığa dayanan istatistiksel yöntemlerle yapılır. Bu bölümde Ö rneklemden elde edilen bulgular yardımıyla çıkarımsal istatistiğin iki ana konusu olan: - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Örneklem Dağılışları

Örneklem Dağılışları

Page 2: Örneklem Dağılışları

• Bir araştırma yapmanın amacı, çalışılan örneklemden kitleye genelleme yapabilmektir.

• Çıkarsama yapma işlemi, olasılığa dayanan istatistiksel yöntemlerle yapılır.

Page 3: Örneklem Dağılışları

Bu bölümde

Örneklemden elde edilen bulgular yardımıyla çıkarımsal istatistiğin iki ana konusu olan:

1) Kitle hakkında kestirimde bulunma,

2) Hipotezleri test etmenin dayanağı olan

örneklem dağılışları tanıtılacaktır.

Page 4: Örneklem Dağılışları

Kitleden Örneklem Çekmenin Nedenleri

1) Örneklemin incelenmesi kitlelere göre daha kısa sürede yapılır.

2) Örneklemin incelenmesi, kitlenin incelenmesinden daha ucuzdur.

3) Bazı durumlarda kitlenin incelenmesi olanaksız olabilir.

4) Örneklem sonuçları daha doğru olabilir. Çünkü daha az sayıda kişi ile (örnek ile) çalışılacağından, araştırma daha özenli yürütülebilir.

5) Eğer örneklem olasılıksal yöntemlerle seçiliyorsa, yapılan örnekleme hatasının kestirimini de bulmak mümkündür.

Page 5: Örneklem Dağılışları

Gözlem değerlerinin dağılımından farklı olarak, bu gözlemlerin oluşturduğu örneklemlerden elde edilen

(hesaplanan) istatistiklerin (ortalama, oran, varyans v.b.) dağılımları da önemlidir.

N genişliğinde bir kitleden n genişliğinden çekilebilecek bir çok örneklem vardır.

Eğer kitleden örneklem çekme işlemi yerine konulmadan yapılıyorsa n genişliğinde çekilebilecek örneklem sayısı

)!nN(!n

!N

n

N

dir.

Page 6: Örneklem Dağılışları

Örneklemlerden hesaplanan istatistiklerin dağılışına

örneklem dağılışı denir.

Bu olası örneklemlerin her birinden bir istatistik (ortalama, oran, standart sapma v.b.) hesaplanabilir.

N genişliğindeki kitleden n genişliğinde elde edilen tüm örneklemlerden birer ortalama hesaplanabilir ve bu örneklem ortalamalarının bir dağılımı elde edilebilir.

Buna ortalamanın örneklem dağılışı adı verilir.

Page 7: Örneklem Dağılışları

Gözlem birimlerinin dağılımını tanımlamak için ortalama ya da standart sapma gibi ölçümler kullanılır.

Örneklem dağılımının özelliklerini tanımlamak için de örneklem dağılışının ortalamasını ve standart sapmasını kullanırız.

Merkezi eğilim ölçüsü olarak ortalama, tek tek gözlem birimlerinin nerede odaklandığını gösterirken,

örneklem dağılışının ortalaması da, örneklemlerden elde edilen ortalamaların nerede odaklandığını gösterir.

Yaygınlık ölçüsü olarak kullanılan standart sapma da, tek tek gözlem birimlerinin ortalamadan ne kadarlık bir

ayrılış gösterdiğini tanımlarken, örneklem dağılışının standart sapması da her bir örneklemden elde edilen

ortalamaların ne derece yaygınlık gösterdiğini tanımlar.

Page 8: Örneklem Dağılışları

Aynı büyüklükteki örneklemlerden elde edilen ortalamalar ne kadar birbirine yakınsa (örneklemden

örnekleme değişim ne kadar azsa) herhangi bir örneklem sonucu o kadar güvenilirdir ya da kesindir.

Eğer hesaplanan ortalamalar, bir örneklemden diğerine çok farklılık gösteriyorsa, çekilen herhangi bir

örneklemden elde dilen ortalama (kestirim) o derece az güvenilir ya da kesindir.

Bu nedenle örneklem dağılışının standart sapması kesinliğin ya da hatanın bir ölçüsü olarak kullanılır.

Page 9: Örneklem Dağılışları

Pratikte hiçbir zaman olası tüm örneklemleri ya da bir kitleden bir çok örneklemi çekmeyiz. İstatistik kuramı

elimizdeki bir örneklemden yararlanarak örneklem dağılışının özelliklerini bulmamıza yardımcı olur.

Merkezi limit teoremi olarak adlandırılan teoreme göre örneklem ortalamalarının gösterdiği dağılım, normal dağılımdır.

Normal dağılımı tanımlayan parametreler, dağılımın ortalaması ve standart sapması

olduğundan bu parametrelerin özelliklerinin bilinmesi gerekir.

Page 10: Örneklem Dağılışları

Örnek 1: N=6 olan bir kitledeki gözlem değerleri aşağıdadır.

x1 =5 x2 =9 x3 =4 x4=1 x5 = 7 x6=6

Bu kitleden n=3 genişliğinde çekilebilecek

203

6

Tane olası örneklem vardır. Bu örneklemlerin her birinden bir ortalama hesaplandığında, ortalamanın örneklem dağılımını elde ederiz.

4942

335

,

,

Page 11: Örneklem Dağılışları

Örneklemlerdeki Değerler

Olası Örneklem

1. (x1 x2 x3)

2. (x1 x2 x4)

3. (x1 x2 x5)

4. (x1 x2 x6)

.

.

20. (x5 x6 x7)

5, 9, 4

5, 9,1

5, 9,7

5, 9, 6

.

.

1, 7, 6

Örneklem Ortalamaları

61 x

52 x

73 x

6 764 ,x

6 742 0 ,x

.

.

Page 12: Örneklem Dağılışları

Örneklem No Örneklem Ortalamaları1 5 9 4 6,002 5 9 1 5,003 5 9 7 7,004 5 9 6 6,675 5 4 1 3,336 5 4 7 5,337 5 4 6 5,008 5 1 7 4,339 5 1 6 4,00

10 5 7 6 6,0011 9 4 1 4,6712 9 4 7 6,6713 9 4 6 6,3314 9 1 7 5,6715 9 1 6 5,3316 9 7 6 7,3317 4 1 7 4,0018 4 1 6 3,6719 4 7 6 5,6720 1 7 6 4,67

Örneklemlerdeki Değerler

Page 13: Örneklem Dağılışları

Olası tüm örneklem ortalamalarının ortalaması alındığında

3 35 ,x olarak bulunur ve bu ortalama kitle ortalamasına eşittir. Bu ortalamaların dağılışı normal dağılım gösterir.

Örneklem ortalamalarının dağılımı

Page 14: Örneklem Dağılışları

Bu bilgilere göre örneklem ortalamaları kitle ortalaması etrafında bir normal dağılım gösterir.

Örneklem Ortalamaları

Page 15: Örneklem Dağılışları

Örneklem ortalamalarının standart sapması da örneklem ortalamalarının gerçekte bilmediğimiz kitle ortalaması etrafında nasıl bir dağılım gösterdiğini tanımlar. Örneklem ortalamaları, kitle ortalamasına çok yakın bir dağılım gösteriyorsa, bu ortalamaların dağılımının standart sapması küçük olacaktır.

Page 16: Örneklem Dağılışları

Örneklem dağılışının değişkenliğini belirleyen iki parametre vardır.

1) Kitle standart sapması ()

2) Örneklem genişliği (n)

Kitledeki değişkenlik arttıkça (), örneklem dağılışının değişkenliği artar. Buna karşın, örneklem genişliğinin (n) büyümesi örneklem dağılışının standart sapmasını azaltır.

İncelenilen örnekte n=3 olduğunda örneklem ortalamaları 3,33 ile 7,33 arasında değişim göstermiştir.

Page 17: Örneklem Dağılışları

N=6 olan kitleden n=4 genişliğindeki tüm örneklemler incelendiğinde

154

6

çekilebilecek örneklem sayısı = dir.

n=4 genişliğinde çekilen 15 örneklemden elde edilen ortalamalar 4 ile 6,75 arasında değişim göstermektedir.

n=3 3,33 - 7,33 DA=4,00

n=4 4,00 - 6,75 DA=2,75

Örneklem ortalamalarının dağılımının değişkenliği örneklem genişliği büyüyünce azalmıştır. Kitleden n=4 genişliğinde tek bir örneklem çekildiğinde elde edilen ortalama n=3 genişliğinde çekilen örneklemden elde dilen ortalamaya göre kitle ortalamasına daha yakın olma eğilimindedir.

Page 18: Örneklem Dağılışları

n=4 n=3

Page 19: Örneklem Dağılışları

Değişkenliğin ölçüsü olarak “varyans” kullanıldığında, örneklem ortalamalarının dağılımının varyansı, kitle varyansının örneklem genişliğine bölünmesi ile bulunur.

nx

22

Varyans yerine daha yaygın kullanılan standart sapmayı kullanacak olursak, örneklem ortalamalarının dağılımının standart sapması, kitle standart sapmasının örneklem genişliğinin kareköküne bölünmesi ile bulunacaktır.

nx

Örneklem ortalamalarının gösterdiği dağılımın standart sapması ortalamanın standart hatası olarak adlandırılır.

Page 20: Örneklem Dağılışları

2514

4942

7613

4942

,,

n için 4n

5,33 ,,

n için 3n

n=4 n=3

Page 21: Örneklem Dağılışları

Standart hata, tüm örneklem ortalamalarının kitle ortalaması etrafındaki dağılımını (yaygınlığını) gösterdiği için, örneklem ortalamasının kitle ortalamasını ne kadar kesinlikle kestirdiğinin bir ölçüsüdür.

N genişliğindeki bir örneklemden hesaplanan, örneklem standart sapması (s) kitle standart sapması () nın bir nokta kestirimidir. Bu durumda standart hata

n

SS x İle kestirilir.

Page 22: Örneklem Dağılışları

Eğer örneklemler normal dağılıma sahip bir kitleden çekiliyorsa, örneklem ortalamalarının dağılımı (ortalamanın örneklem dağılışı) da normaldir.

Eğer örneklemlerin çekildiği kitle normal dağılmıyorsa (örneklem normal dağılım göstermeyen bir kitleden çekiliyorsa), örneklem ortalamalarının dağılımı örneklem genişliği büyüdükçe normal dağılıma yaklaşır.

Bu bilgi örneklem ortalamaları ile ilgili olasılıkların hesaplanmasında kullanılabilir.

Page 23: Örneklem Dağılışları

Örnek 2: Miyokard enfaktüs tanısı konmuş erkeklerde kolesterol düzeyinin ortalaması 240 mg/dl standart sapması 40 mg/dl olan bir normal dağılıma uyduğu biliniyorsa, bu kitleden çekilecek 100 erkeğin kolesterol değerlerinin ortalamasının 250 mg/dl’den büyük olması olasılığı nedir?

5210040

240250,

/

n/

xz

0062,0

4938,05.0)5,2(

?)250(

zP

xP

Page 24: Örneklem Dağılışları

100 genişliğindeki bir örneklemin ortalamasının 250 mg/dl’den daha büyük olması olasılığı %0,62’dir.

Örneklem genişliği 16 olsaydı:

11640

240250

/z

1 5 8 7012 5 0 ,)z(P)x(P

16 genişliğindeki bir örneklem ortalamasının 250 mg/dl’den daha büyük olması olasılığı yaklaşık olarak %16’dır. Yani 100 genişliğindeki bir örneklemden böyle bir sonucun elde edilmesinden daha olası bir durumdur.

Page 25: Örneklem Dağılışları

KestirimPratikte kitle parametrelerini doğrudan hesaplamak olanaklı değildir. Bunun yerine herhangi bir kitle parametresi, elde edilen örneklem istatistiğinden kestirilir.

İstatistik, örneklemden örnekleme değişim gösterir.

Kestirim işleminde belirsizlik vardır.

Kitle parametrelerinin belirli bir güvenle, içinde bulunduğu aralığın tanımlanması işlemine

güven aralığı yöntemi denir.

Page 26: Örneklem Dağılışları

Örnek 3 : Akut miyokard enfarktüs tanısı almış 100 erkekten elde edilen ortalama kolesterol düzeyi 240 mg/dl olarak bulunmuş olsun. Örneklemin çekildiği kitlenin ortalaması hakkında kestirim yapılmak istenebilir.

240

100

x

n

Kitlede kolesterol düzeyi değerlerinin standart sapmasının 40 mg/dl olarak bilindiğini varsayalım.

4 0

Page 27: Örneklem Dağılışları

Bu örnekten elde edilen ortalama

mg/dl) kitle ortalamasının bir nokta kestirimidir. (

Örneklem ortalamalarının dağılımının normal dağılım gösterdiği bilinmektedir. 100 genişliğindeki örneklemlerin %95’i gerçek kitle ortalamasından:

x, 9 61 kadar (1,96 40/10) uzaklıkta yer alır.

örneklem ortalaması kullanılarak

Aralığının %95 olasılıkla bilinmeyen

kitle ortalamasını içerdiği söylenebilir.

x,x 9 61

Page 28: Örneklem Dağılışları

Bu örnek için

8424716232

84724010

40961240

,,

,,

Bilinmeyen kitle ortalaması % 95 olasılıkla 232,16 ile 247,84 arasında yer almaktadır.

x,x 9 61

Page 29: Örneklem Dağılışları

Pratikte kitle standart sapması () bilinmez ve örneklem standart sapması s ile kestirilir. yerine s’nin kullanımı ile

n/

xz

Z dağılımına dayandırılarak yazılan bu eşitlikte yerine s kullanıldığında ise aşağıdaki formül ile t dağılımına ulaşılır.

n/s

xt

x ’da olduğu gibi s’nin de örneklemden örnekleme değişimi söz konusudur.

t dağılımı yanılma düzeyine ve serbestlik derecesine göre değişir. Z dağılımı ile t dağılımı arasındaki farklar sonraki grafiklerde verilmiştir:

Page 30: Örneklem Dağılışları

1 1.000 3.078 6.314 12.706 31.821 63.657

2 0.816 1.886 2.920 4.303 6.965 9.925

3 0.765 1.638 2.353 3.182 4.541 5.841

4 0.741 1.533 2.132 2.776 3.747 4.604

5 0.727 1.476 2.015 2.571 3.365 4.032

6 0.718 1.440 1.943 2.447 3.143 3.707

7 0.711 1.415 1.895 2.365 2.998 3.499

8 0.706 1.397 1.860 2.306 2.896 3.355

9 0.703 1.383 1.833 2.262 2.821 3.250

10 0.700 1.372 1.812 2.228 2.764 3.169

11 0.697 1.363 1.796 2.201 2.718 3.106

12 0.695 1.356 1.782 2.179 2.681 3.055

13 0.694 1.350 1.771 2.160 2.650 3.012

14 0.692 1.345 1.761 2.145 2.624 2.977

15 0.691 1.341 1.753 2.131 2.602 2.947

16 0.690 1.337 1.746 2.120 2.583 2.921

17 0.689 1.333 1.740 2.110 2.567 2.898

18 0.688 1.330 1.734 2.101 2.552 2.878

19 0.688 1.328 1.729 2.093 2.539 2.861

20 0.687 1.325 1.725 2.086 2.528 2.845

25 0.684 1.316 1.708 2.060 2.485 2.787

30 0.683 1.310 1.697 2.042 2.457 2.750

40 0.681 1.303 1.684 2.021 2.423 2.704

50 0.679 1.299 1.676 2.009 2.403 2.678

60 0.679 1.296 1.671 2.000 2.390 2.660

70 0.678 1.294 1.667 1.994 2.381 2.648

80 0.678 1.292 1.664 1.990 2.374 2.639

90 0.677 1.291 1.662 1.987 2.368 2.632

100 0.677 1.290 1.660 1.984 2.364 2.626

0.674 1.282 1.645 1.960 2.326 2.576

: Tek Yön: 0.250 0.100 0.050 0.025 0.010 0.005

: Çift Yön: 0.500 0.200 0.100 0.050 0.020 0.010

t dağılım tablosu

Page 31: Örneklem Dağılışları

/ 2=0,05 / 2=0,051- = 0,90

-1,645 1,645

Şekil: Normal dağılım; z=1,645’in altında kalan

alan 0,90’dır.

Z

Standart normal dağılımda(z) ortalama etrafında gözlemlerin %90’ının bulunduğu sınırlar

Page 32: Örneklem Dağılışları

/ 2=0,05 / 2=0,051- = 0,90

-1,66 1,66

Şekil: 100 genişliğindeki örneklemlerden hesaplanacak t=1,66’nın altında kalan alan 0,90’dır.

t

t dağılımda ortalama etrafında gözlemlerin %90’ının bulunduğu sınırlar (n=100 için)

Page 33: Örneklem Dağılışları

/ 2=0,05 / 2=0,051- = 0,90

-1,75 1,75

Şekil: 16 genişliğindeki örneklemlerden hesaplanacak t=1,75’in altında kalan alan 0,90’dır.

t

t dağılımda ortalama etrafında gözlemlerin %90’ının bulunduğu sınırlar (n=16 için)

Page 34: Örneklem Dağılışları

Uygulamada kitle standart sapmasını bilmediğimiz için bilinmeyen kitle ortalamasının güven sınırları t

dağılımından yararlanarak aşağıdaki gibi belirlenir.

n

stx

n

stx )/;n()/;n( 2121

Kitle Ortalaması İçin Güven Sınırları

Page 35: Örneklem Dağılışları

2 3 5x

Örnek 4 : Akut miyokard enfarktüs tanısı alan erkekler arasından rasgele seçilen 100 erkeğin serum kolesterol değerlerinin ortalaması 235 mg/dl standart sapmasının (s) 35 mg/dl olarak bulunmuş olsun. Buna göre

)x(

Kitle ortalamasının nokta kestirimidir.

s=35 Kitle standart sapmasının nokta kestirimidir.

Kitle ortalamasının %95 olasılıkla içinde bulunduğu sınırlar

93,24107,228)100/35(98,1235

stxstx x)99;05,0(x)1n,2/(

Page 36: Örneklem Dağılışları

Örnek 5: Yukarıda verilen örneklem değerleri 100 kişilik örneklemden değil de 16 kişilik örneklemden hesaplanmış olsaydı:

6,2534,216)16/35(13,2235

stxstx x)15;05,0(x)1n,2/(

Küçük örneklem ile belirsizlik (kesin olmayışlık) artacağından daha geniş aralık elde edilmektedir.

Page 37: Örneklem Dağılışları

n

pptpP

n

pptp nn

)1()1()2/;1()2/;1(

Bilinmeyen kitle oranı için güven sınırları aşağıdaki gibi belirlenir.

pnpn stpPstp )2/;1()2/;1(

sp: Oranın standart hatası

Kitle Oranı İçin Güven Sınırları

Page 38: Örneklem Dağılışları

Örnek 6: A bölgesinde yaşayan 60 kişi üzerinde yapılan bir çalışmada anemi görülme oranı % 8,3(5 kişi) olarak bulunmuştur. Buna göre bilinmeyen kitle oranı %95 güvenirlikle yada %5 yanılma ile hangi sınırlar arasındadır?

p=5/60=0,083 q=(1-p)=1-0,083=0,917

0356,060

917,0083,0

ps

t(sd:60;0,025)=2

154,0012,0

0356,02083,00356,02083,0

)2/;1()2/;1(

P

P

stpPstp pnpn