İstatİstİk 2 - beykentkampus.beykent.edu.tr/paylasim/dosyalar/ders3_tahmin...toplam 200 matematik...
TRANSCRIPT
İstatistik
yöntemler
Hipotez
testleri
Çıkarımsal
istatistik
Betimsel
istatistik
İstatistik yöntemler
Tahmin
Aralık
tahmini
Nokta
tahmini
2
Tahmin edici
Bir anakütle parametresinin tahmin edicisi
örneklemden elde edilen bilgilere dayanan
rassal bir değişkendir.
Aldığı değerler anakütlenin bilinmeyen
parametresi hakkında yaklaşık bir değer sağlar.
Bu rassal değişkenin aldığı belirli bir değere
tahmin denir.
3
4
Nokta tahmini
Alt güven
limiti
Üst güven
limiti
Güven aralığı
Nokta tahmini, bir parametre hakkında tek bir sayı verir.
Aralık tahmini, anakütle parametresinin arasında kaldığı düşünülen iki sayı verir.
Nokta ve Aralık tahminleri
Sapmasızlık
Eğer bir istatistiğin örnekleme dağılımının
ortalaması, anakütlenin karşılık gelen
parametresine eşitse, bu istatistik parametrenin
sapmasız tahmin edicisi olarak adlandırılır.
Örnek 1 Ortalamaların örnekleme dağılımının
ortalaması ( ) anakütle ortalamasına ( ) eşittir.
Dolayısıyla örnek ortalaması , anakütle ortalamasının
sapmasız bir tahminidir.
x X
5
Sapmasızlık
Örnek 2 Örneklem varyansının örnekleme
dağılımının ortalaması
Örneklem varyansı ( s2 ), anakütle varyansının (σ²)
sapmalı bir tahminidir.
6
2
21s
n
n
2 Anakütle varyansı
Etkin tahminler
Eğer iki istatistiğin (mesela ortalama ve medyan)
örnekleme dağılımları aynı aritmetik ortalamaya sahipse,
varyansı daha küçük olan istatistik ortalamanın etkin
tahmin edicisi olarak adlandırılır.
Örnekleme dağılımları aynı ortalamaya sahip bütün
mümkün istatistikleri göz önüne aldığımızda, bunlardan
varyansı en küçük olana ortalamanın en etkin veya en
iyi tahmin edicisi adı verilir.
7
Sapmasız ve etkin tahminler – Örnek
Bir kürenin çapından bir bilimadamı tarafından alınan beş
ölçümlük bir örneklem : 6,33; 6,37; 6,36; 6,32; ve 6,37 cm.
olarak kaydedilmiştir. Gerçek ortalamanın sapmasız ve etkin
tahmini nedir?
Çözüm:
Gerçek ortalamanın sapmasız ve etkin tahminini (anakütle
ortalamasını) örneklem ortalaması hesaplayarak
bulabiliriz. (çünkü örneklem ortalaması, anakütle
ortalamasının sapmasız tahminidir.)
8
6 33 6 37 6 36 6 32 6 376 35
5
, , , , ,X , cm
Nokta tahmini
9
1. Bir örneklemden elde edilen bilgiye dayanarak
tek bir değer verir.
2. Yapılan tahminin bilinmeyen anakütle
tahminine ne kadar yakın olduğu hakkında bilgi
vermez.
3. Örnek: Örneklem ortalaması x = 3 ise
örneklemin çekildiği anakütlenin ortalaması için
yapılan nokta tahmini de 3 olacaktır.
Nokta tahmini – Örnek
Bir bankanın müşterilerinden oluşan bir örneklemden
elde edilen bilgilere göre, müşteriler sırada ortalama
13 dakika beklemektedirler. Anakütlenin ortalaması
hakkında bir nokta tahmininde bulununuz.
Çözüm:
Eğer örneklem ortalaması ise,
Anakütlenin ortalaması hakkında nokta tahmini de 13dk.
10
dkx 13
Aralık tahmini
1. Bir örneklemden elde edilen bilgilere dayanarak bir değer
aralığı verir.
2. Yapılan tahminin, bilinmeyen anakütle parametresine
yakınlığı hakkında bilgi verir.
• Bu bilgi bir olasılık ile ifade edilir. Yakınlığı tamamen
doğru olarak söyleyebilmek için anakütlenin gerçek
parametresinin değerini bilmek gerekir.
3. Örnek: Bilinmeyen anakütle ortalaması %95 güvenirlik
derecesiyle 50 ve 70 arasındadır.
11
Ortalama, ,
bilinmiyor.
Anakütle
Örneklem
Rasgele örneklem
%95 eminim ki
40 ve 60
arasındadır.
Ortalama
x = 50
Aralık tahmini
12
Güven aralığı tahminleri
Bir aralık, iki değer arasında kalan bir sıra değeri içerir. :
Örneklemden örnekleme istatistiklerde farklılıklar
olacağını göz önüne alır.
Tek bir örneklemden elde edilen bilgilere dayanır.
Bir nokta tahmininin duyarlık veya doğruluk derecesini
gösterir.
Güvenilirlik seviyesi olarak ifade edilir.
Tahminlerden asla %100 emin olamayız.
13
Güven aralığı ve Güven düzeyi
Varsayalımki bir örneklemin ortalamasını hesapladık :
o Örnek: Gözlemlenen banka müşterileri ortalama 13 dakika sırada
bekliyor.
o Gözlemlenen örneklemin çekildiği anakütleye ait ortalama
( μ ) bekleme süresi hakkında ne diyebiliriz?
Sadece bir aralık belirleyip, anakütle ortalamasının bu aralık
içinde bulunması ihtimalini söyleyebiliriz.
Bu aralığa güven aralığı denir
Olasılık seviyesi ise güven düzeyini verir.
x
14
Bir önceki örneği ele alırsak:
Anakütle ortalamasının 10 ve 16 dakika arasında
olmasının olasılığı %95 olsun. P(10< μ <16) = 0,95
Güven düzeyi %95’dir.
[10 , 16] ise %95’lik güven aralığıdır.
Bir banka müşterisinin 10 ila 16 dakika arasında beklemiş
olması konusunda %95 emin olduğumuzu söyleyebiliriz.
15
Güven aralığı ve güven düzeyi
Güven düzeyi, (1 - )
Güven düzeyi bir anakütle parametresinin belirli bir
güven aralığında olmasının ihtimalini verir.
Güven düzeyini (1 – α) olarak gösterebiliriz.
En yaygın kullanılan güven düzeyleri:
90%, 95%, ya da 99%.
( = 10%), ( = 5%), ( = 1%)
16
Güven aralığı
Güven aralığını nasıl belirleriz?
Bütün güven aralıkları için genel formül şudur :
Nokta tahmini (Kritik değer)(Standart hata)
İstenen güven aralığına
bağlıdır.
17
Anakütle ortalaması μ için güven aralığı
(σ2 biliniyor)
Varsayımlar
Anakütle varyansı σ2 biliniyor.
Anakütle normal dağılım izliyor.
x zn
/2 /21
x
– z z Z 0
x zn
x z
n
X
Alt güven limiti Üst güven limit
Nokta tahmini (Kritik değer)(Standart hata)
19
Anakütle varyansı (σ²) bilindiği durumlarda,
belirlenmiş bir güven düzeyi için (1 – α), güven
aralığı limitlerine ait z değerlerini (± z α/2)
belirleyebiliriz.
z/2 değeri standart normal dağılımda iki
kuyruktaki /2’lik olasılığını veren değerdir.
Anakütle varyansı bilinmediği zaman, örneklem varyansı (s) ile ikame
edebiliriz. O zaman da normal dağılım yerine t-dağılımı kullanırız.
Anakütle ortalaması μ için güven aralığı
(σ2 biliniyor)
Yaygın kullanılan güven aralıkları
Yaygın olarak kullanılan güven aralıkları şunlardır :
90%, 95%, ve 99%
Güven
düzeyi Z/2 değeri
1.645
1.96
2.58
0.90
0.95
0.99
90%
95%
99%
1
20
Güvenilirlik faktörü, z/2
%95’lik güven aralığı için :
z = -1,96 z = 1,96
01 ,95
0α
.0252
0α
.0252
Nokta tahmini Alt güven Limiti
Üst güven Limiti
Z değeri:
X değeri:
0
Standart normal dağılım tablosunda z0,025 = 1.96
21
Hata payı
Güven aralığı,
Ayrıca şu şekilde de gösterilebilir :
HP : hata payı
Aralık genişliği, hata payının iki katına eşittir.
n
σzxμ
n
σzx α/2α/2
x HP
α/2
σHP z
n
22
Hata payı
Hata payını düşürmek için
Anakütle standart sapmasını düşürebiliriz (σ↓)
Örneklem büyütülebilir (n↑)
Güven düzeyi düşürülebilir (1 – ) ↓
n
σzME α/2
23
Aralık tahmini– Örnek 1
50 lise öğrencisinden oluşan bir örneklemin haftalık tv
seyretme sürelerinin incelenmesi sonucunda, ortalama
20,5 saat ve standart sapması 5,5 saat olarak
hesaplanmıştır.
Bütün lise öğrencilerinin ortalama TV seyretme süreleri
hakkında %95’lik güven aralığını belirleyin.
24
Örneklem büyüklüğü (n) = 50
Örneklem ortalaması ( ) = 20,5
Standart sapma (σ) = 5,5
Güven düzeyi: 0,95 = 1 – α α = 0,05
25
Aralık tahmini– Örnek 1
x
Çözüm
%95 emin olabiliriz ki bütün lise öğrencileri için geçerli olan ortalama TV seyretme
süresi 18,975 ve 22,025 saat arasındadır
nzx
2/
18,975 < μ < 22,025
Z/2 = Z0,025=1,96
525,15,20
50
5,596,15,20
Tepki süresini ölçen bir psikolog, standart sapmanın
0,05saniye olduğunu tahmin etmektedir. Tahminindeki
hatanın 0,01 saniyeyi geçmeyeceğine (a) %95, (b) %99
güven duyması için ne kadar hacimli bir ölçüm örneklemi
olmalıdır?
(a) %95 güven düzeyi için
26
1 96x ,n
1 96 0 01ME , ,n
1 96 0 05
0 01, * ,
,n
21 96 0 05
0 01
, * ,n
,
96,04 < n min n = 97
Aralık tahmini – Örnek2
27
2 58x ,n
2 58 0 01ME , ,n
2 58 0 05
0 01, * ,
,n
22 58 0 05
0 01
, * ,n
,
166,04 < n min n = 167
Aralık tahmini – Örnek2
Tepki süresini ölçen bir psikolog, standart sapmanın
0,05saniye olduğunu tahmin etmektedir. Tahminindeki
hatanın 0,01 saniyeyi geçmeyeceğine (a) %95, (b) %99
güven duyması için ne kadar hacimli bir ölçüm örneklemi
olmalıdır?
(b) %99 güven düzeyi için
Toplam 200 matematik notundan rasgele seçilen 50 notluk
örnekleme göre, aritmetik ortalama 75, standart sapma da 10’dur.
(a) 200 notun ortalamasının tahmini için %95lik güven sınırları
nedir?
28
(a) Anakütle büyüklüğü örneklem büyüklüğüne oranla çok geniş
olmadığından, buna göre düzeltme yapmalıyız. Standart hata formülünde
bu durumu dikkate almamız gerekir. O zaman %95lik güven sınırları :
1
p
x
p
N n
Nn
2/ xx z
21
p
/
p
N nx z
Nn
10 200 5075 1 96
200 150,
75 2 4,
72,6
77,4
Güven aralığı – Örnek 3
Toplam 200 matematik notundan rasgele seçilen 50 notluk
örnekleme göre, aritmetik ortalama 75, standart sapma da 10’dur.
(b) 200 notun ortalamasının 75±1 olduğunu hangi güven derecesi
ile söyleyebiliriz
29
(b) Güven limitleri :
2 21
p
/ x /
p
N nx z x z
Nn
2
10 200 5075 75 1
200 150/z
2
10 200 501
200 150/z
2 1 23 1/z * ,
2 1 1 23 0 81/z / , ,
Standart normal dağılım tablosundan
For z = 0,81 P(z<0,81) = 0,7910
α/2 = P(z > 0,81)=1 – 0,7910 = 0,209
Güven düzeyi (1 – α) = 0,582
Güven aralığı – Örnek 3