İkİ deĞİŞkenlİ basİt doĞrusal regresyon modelİkisi.deu.edu.tr/emrah.gulay/bdrm.pdfİkİ...
TRANSCRIPT
İKİ DEĞİŞKENLİ BASİT DOĞRUSAL
REGRESYON MODELİ
Regresyon Y ile X (X ler) arasındaki ortalama ilişkinin
matematik fonksiyonla ifadesidir.
X’e bağlı olarak Y’nin ortalamasının nasıl değiştiğini
gösterir.
iii XbbXfY 21)(
Bu ilişki eğriselde olabilir. Ortalama ilişki aşağıdaki
gibi ifade edilir:
)()( ii XfXYE
)( iXYE X’in verilen bir X değeri için Y’nin şartlı ortalaması
veya şartlı beklenen değeridir.
Örneğin: 4000 nüfuslu bir kasabada 500 hane bulunsun ve
bunlardan sadece 60’ı memur olsun.
Anakütle Regresyon Denklemi
1 2E(Y|X)=f(X)=b b X
X’e bağlı olarak Y’nin ortalamasının nasıl değiştiğini
gösterir.
Anakütle regresyon denklemi X bağımsız değişkeninin sabit
değerleri için bağımlı değişken Y’nin ortalama veya beklenen
değerinin geometrik yeridir.
Her Xi değeri için bir Yi değeri vardır.
Her Xi değeri için bir ortalama değer vardır ve regresyon doğrusu
bu noktalardan geçmektedir.
Her , şartlı ortalama Xi nin bir fonksiyonudur.
f(Xi) fonksiyon Xi’yi gösterir. Bu fonksiyon doğrusal ya da eğrisel
olabilir.
X’in doğrusal bir fonksiyonudur.(Ana kütle regresyon
denklemi)
)()( iXfXYE
)()( iXfXYE
)()( ii XfXYE
),( iXYE
XbbXYE 21)|(
Doğrusal modelde, doğrusal kelimesiyle değişkenler arasındaki
doğrusallık ve parametreler arasındaki doğrusallık ifade
edilmektedir.
)|( XYE nin X’in doğrusal bir bir fonksiyonu ise;
uXYEY )|(
veya
iii uXbbY 21
)|( iiii XYEYu
u, pozitif negatif ve
sıfır değerlerini
alır.*(bkz.tablo)
b1. sabit terim b2 eğim katsayısıdır.
Regresyon denklemine hatayı eklememizin sebepleri
nelerdir:
1. İktisat teorisinin yetersizliğinden Y’ye etki eden
başka değişkenler modele alınamayabilir. Bunlar
hataya dahil edilir.
2. Aynı büyüklük ve kompozisyonundaki hanelerle
çalışmadığımız için stokastiklik ortaya çıkmakta ve
bu durum hata terimini ortaya çıkarmaktadır.(Zevk ve
tercihlerin bireyden bireye değişmesi gibi)
3.Y ve X değişkenleri hatasız ve doğru kabul
edilmektedir. Oysa ölçme hatası taşıyabilirler.
b1 ve b2 hakkında bazı çıkarsamalar:
Eğer b2 pozitif ise çizginin veya doğrunun eğimi
soldan sağa yukarıya doğru; yok eğer negatif ise
tersi geçerlidir.
Eğer b2’in mutlak değeri büyükse doğru daha
dik olmaktadır.
Eğer b2= 0 ise doğru X eksenine b1 noktasında
paralleldir.
Bir çok fonksiyonlar düz çizgi halinde değildirler
.
. .
.
y4
y1
y2
y3
x1 x2 x3 x4
}
}
{
{
u1
u2
u3
u4
x
y E(y|x) = b0 + b1x
Örnek Regresyon Denklemi
Tam sayım yapmadığımızı kabul ederek örnekleme
yaptığımızı kabul edelim.
Örnek regresyon denklemi:
ii XbbY 21ˆˆˆ
isiin tahmincb
isiin tahminc b
cisinin tahmin )|(ˆ
22
11
b
b
XYEY ii
ii
iiiiii
XbbY
YYXbbeXbbY
21
2121
ˆˆˆ
)ˆ(ˆˆˆˆ
y2
y1
x2 x1
Y
X
ΔX
ΔY= b2 ΔX
Doğrusal denklemin grafiği düz bir çizgi olup sabit ve eğim
katsayılarını birbirinden ayırma özelliğine sahiptir. Sabit sayı
X=0 olduğu zaman Y’nin alacağı azami değer ve eğim ise ΔY/ ΔX
oranı olup X üzerindeki bir noktadan diğer bir noktaya olan
hareketliliği göstermektedir.
b1
XbbY 21ˆ
2
1
10
1
2
n
i
n
i
i XYe bb
İfadesini minimize eden parametre tahmincilerinin değerlerini bulabilmek için
eşitliğin b0 ve b1 ‘e göre türevleri alınıp 0’a eşitlenir.
2
1
10
01
2
0
n
i
n
i
i XYe bbbb
n
i
XY1
102 bb
2
1
10
11
2
1
n
i
n
i
i XYe bbbb
n
i
XYX1
102 bb
Her iki denklemi de 0’a eşitlersek;
0
02
1
10
1
10
n
i
n
i
XbbY
XbbY
0.
0..2
1
10
1
10
n
i
n
i
XbbYX
XbbYX
b0‘a göre türev alınırsa; b1‘e göre türev alınırsa;
İki Değişkenli basit Doğrusal Regresyon Modelinin En Küçük
Kareler Yöntemiyle Tahmini
0
02
1
10
1
10
n
i
n
i
XbbY
XbbY
0.
0..2
1
10
1
10
n
i
n
i
XbbYX
XbbYX
Parantezleri açarsak;
0. 10 XbbnY 02
10 XbXbXY
Bu denklemlere doğrunun NORMAL DENKLEMLERİ denir.
Normal denklemler alt alta yazılıp birlikte çözüldüklerinde b0 ve b1
tahmincileri bulunur.
XbbnY 10.
2
10 XbXbXY n
XX
n
YXXY
b2
2
1)(
)).((
XbYb 10
şeklindeki formüller yardımıyla da tahminciler bulunabilir.
Ortalamadan Sapmalar Yoluyla En Küçük Kareler Denklemlerinin
İspatı
XbYb 21
olduğundan
Bu ifadenin her iki tarafını n ile böldüğümüzde
veya
elde edilir.
Bu eşitlik ortalamalar orjinine göre regresyon denklemidir.
Ortalamalar orjinine göre regresyon denkleminden tahmini
anakütle regresyon denklemi şöyle yazılabilir:
elde edilir.
olmak üzere,
Hata terimleri kareleri toplamı şu şekilde ifade edilebilir:
Bu ifadenin ‘e göre türevi alınıp sıfıra eşitlendiğinde;
elde edilir.
için diğer bir formül ise şöyledir:
Basit En Küçük Kareler Regresyon Modelinin
Varsayımları
Varsayım 1: Hata terimi ortalaması sıfıra eşit stokastik bir
değişkendir:
• Hata terimi u, pozitif ve negatif her iki yöndeki çok sayıda
sebeplerin toplamının etkisini göstermektedir. Bu sebepten
anakütle hata terimi u, X’in her değeri için şansa bağlı olarak
pozitif, negatif veya sıfır değerlerini belli bir ihtimalle
alabilmektedir. Yani u stokastik bir değişkendir ve değerleri
önceden kesin olarak bilinmemektedir.
iu
• Bazı bağımsız değişkenlerin modele alınamaması, modelin
matematiksel biçiminin yanlış seçilmiş olması, değişkenlerdeki
ölçme hataları, fertlerin davranışlarının yaradılış icabı farklı
olması gibi durumlar u’nun artı değer alabileceği gibi eksi değer
de alabileceğini gösterir.
• Modele dahil edilmeyen değişkenlerin etkisi, bazen Y’yi
gözlenebilecek olan değerinden daha büyük bazen de daha küçük
değerli yapabilecektir. Yani genelde, sürekli olarak artış yönünde
veya sürekli olarak azalış yönünde olan sapmalar(farklar)
beklenmeyecektir. Bu da u’nun stokastik olduğu anlamına gelir.
• u’lar sürekli artan veya sürekli azalan bir görünüm arzetmezler,
düzensiz bir görünüm sergilerler.
• Ayrıca, ui nin muhtelif değerleri birbirinden bağımsız stokastik
değişkenlerdir.
• Tüketim örneğinde, u’nun stokastik ve değerlerinin birbirinden
bağımsız olması şöyle açıklanabilir:
Bir hane için ui hata terim değerini pozitif elde etme ihtimali ne
artar, ne de azalır. Ayrıca u hata terimi değerlerinin dağılımının
normal, ortalamasının sıfır ve varyansının olduğunu
varsayacağız.
𝜎𝑢𝑖2
• Sonuç olarak,
yazılabilir. Yani ui ler, birbirinden bağımsız, sıfır ortalamalı, eş,t
varyanslı normal dağılımlıdır.
𝑢𝑖 ∼ 𝑁(0,𝜎𝑢𝑖2 )
Varsayım 2: Hata terimi u normal dağılımlıdır:
• EKK tahmincilerinin ihtimal dağılımları, ui nin ihtimal
dağılımı hakkında yapılan varsayıma bağlıdır. Bu sebepten b
tahminleri konusunda bir test uygulamak gerektiğinde (t,F
testi gibi)dağılımlarının normal olması gerekir, bu da ui nin
dağılımının normal olmasını gerektirmektedir.
• Uygulamalarda anakütle u değerleri bilinmediğinden,
Merkezi Limit Teoremi’ne göre normal dağıldıkları kabul
edilir.
ui değerleri E(ui)=0
u’ların normal dağılımı
• Normal dağılım eğrisinde, absiste u’nun ortalamasına (0)
tekabül eden noktadan çıkılacak dikmenin iki tarafı tam bir simetri
arzeder. ui normal dağılıyorsa, EKK nin tahmincileride
normal dağılırlar.
• Uygulamalarda u’nun dağılımının normal olup olmadığı,
Lilliefors grafik testi, χ2 uygunluk testi ve Jarque-Bera testi ile
araştırılmaktadır.
𝑏1 𝑣𝑒 𝑏2
Varsayım 3: Hata terimi ui değerleri arasında ilişki(otokorelasyon)
yoktur:
• u’nun herhangi bir ui değeri kendisinden önceki uj değeri ile
bağımlı değildir. Bu varsayım ui ve uj nin kovaryanslarının sıfıra
eşit olmasını gerektirir:
Kov(ui ,uj )=E[ui – E(ui)] [E[uj – E(uj)]
varsayım 1’e göre E(ui)=E(uj)=0’dır. O halde,
Kov(ui ,uj )=E(uiuj)=0, i≠j
Bu varsayım, Kov(Yi ,Yj )=0, i≠j varsayımı demektir.
Varsayım 4: Hata terimi ui nin varyansı eşittir,sabittir.
(homoskedastiklik veya eşit varyanslılık)
• ui nin varyansının her Xi için eşit olduğu varsayımı şöyle ifade
edilmektedir:
Var(ui │Xi)= E[ui – E(ui)]2
Varsayım 1’e göre E(ui)=0 olduğundan,
Var(ui │Xi)= E[ui2]
Var(ui │Xi)=σ2 veya Var(ui)=σ2 (1)
(1) eşit varyanslık halini göstermektedir.
• Bu varsayımın anlamı şudur: Her Xi değeri için hata terimi ui’nin
varyansı belli bir sabit sayı olup σ2 ’ye eşittir. Buna
homoskedastiklik varsayımı, veya eşit(homo) dağılan(skedastik),
veya eşit varyans varsayımı da denir.
• Varsayım 5: Bağımsız değişken X, hata terimi u ile ilişkili
olmayıp, stokastik değildir:
• Bağımsız değişken Xi ile hata terimi ui arasında ilişki yoktur, yani
kovaryansları sıfıra eşittir:
Kov(ui,Xi)= E[ui – E(ui)] [Xi – E(Xi)]
Kov(ui ,Xi)=0
• X değişkeninin birden fazla olduğu çoklu modellerde de ui ile her
X değişkeni arasındaki kovaryans sıfıra eşit olmalıdır:
Kov(ui ,X2)=Kov(ui ,X3)=0
• Bu varsaymın anlamı şudur:
Anakütle Regresyon Denkleminde Xi ve u’nun Y’ye etkisi
ayrıayrıdır(toplanabilirdir). Eğer, X ile u arasında ilişki varsa,
herbirinin Y bağımlı değişkeni üzerindeki etkisini ferdi olarak
takdir edemeyiz.
Eğer X ile u arasında aynı yönde pozitif ilişki varsa, u artarken
X’de artacak ve u azalırken X’de azalacaktır. Benzer şekilde X ile
ters yönde negatif ilişkili iseler, u azalırken X artar ve u artarken
X azalır. Bu nedenle, X ve u’nun Y üzerindeki etkisinin tahmini
mümkün olmayacaktır.
Varsayım 6: Bağımsız değişken X, tekrarlı örneklere göre
sabittir. Xi ile ui arasında ilişki olmaması yani Kov(ui,Xi)=0
varsayımı X’in stokastik bir değişken olmamasını (tesadüfi
dağılmasını) gerektirir. Bu da istatistiki olarak, anakütleden
çekilebilecek tüm örnekler için X değerlerinin sabit değerli
olduğunu gösterir.(aynı X değişkeni değerleri için ayrı Y
değerleri sözkonusu.) Şöyleki:
Kov(ui,Xi)= E[ui – E(ui)] [Xi – E(Xi)]
Varsayım 1’e göre E(ui)=0 olduğundan:
Kov(ui,Xi)= E[ui – E(ui)] [Xi – E(Xi)] E(ui)=0
Kov(ui,Xi)= E[ui(Xi – E(Xi)]
= E[uiXi– uiE(Xi)]
Xi ‘ler sabit kabul edilirse,
E[E(Xi)]=E(Xi)
Kov(ui,Xi)= E(uiXi)– E(ui)E(Xi)
Varsayım 1’ e göre E(ui)=0’dır. Yani;
Kov(ui,Xi)= E(uiXi)
= 0 (Varsayım 5 gereği)
Varsayım 7: Bağımsız değişken X’in varyansı sonlu pozitif
bir sayı olmalıdır.
Anakütleden çekilebilecek örneklerin herbiri için X değişkeni
değerlerinin sabit kabul edilmesi,X değişkeninin tüm
değerlerinin eşit olması demek değildir.
Buna rağmen X değerlerinin aynı zamanda eşit olması
halinde ,
Burada tüm X değerleri eşit ise ‘dır ve payda
olacaktır. Böylece sabit/0= olacağından
ve dolayısıyla tahmin edilemeyecektir.
Yani ,
Sonlu olmalıdır. Burada Q sonlu pozitif sabit bir sayıyı
göstermektedir.
Varsayım 8: Modelin spesifikasyonu doğrudur.
İki değişkenli doğrusal regresyon modelinin EKK ile
tahmininde kabul edilen en önemli varsayımlardan biri
regresyon modelinin spesifikasyonunun doğru yapıldığı,
modelin spesifikasyon hatası taşıyıp taşımadığıdır.
Modele bazı değişkenlerin alınmaması , eğrisel bir fonksiyon
alınması gerekirken doğrusal fonksiyon alınması, model
değişkenleri konusunda hatalı varsayımlar yapılması
hallerinde tahmin edilen fonksiyon güvenilir olmayacak,
spesifikasyon hatalı olacaktır.
Varsayım 9: Bağımsız değişkenler arasında İlişki yoktur.
(Çoklu doğrusal Bağlantı olmaması Varsayımı)
EKKY’nin bu varsayımı, birden fazla bağımsız değişkeni
olan çoklu modellerle ilgilidir. Bu varsayıma göre ,çoklu
modellerde bağımsız değişkenler arasında ilişki yoktur.
Bağımlı Değişken Y nin Dağılımı
Y bağımlı değişkeninin ortalaması
1 2( )E Y b b X
Varyansı
2 2 2( ) ( ( )) ( )
i i i i uVar Y E Y E Y E u
olduğu gösterilecektir.
1. Y nin ortalaması kendisinin beklenen değerine eşittir.
1 2i iY b b X u
Beklenen değer alındığında
1 2( ) ( )
i iE Y E b b X u
1 2( ) ( ) ( )
i iE Y E b b X E u ( ) 0
iE u
b1 ve b2 parametreler iken Xi değerleri değişmez değerler
kümesinden geldikleri için
1 2( )
iE Y b b X bulunur.
1 2i iY b b X u
1 2( ) ( )
i iE Y E b b X u
2. Yi nin varyansı
2 2 2( ) ( ( )) ( )
i i i i uVar Y E Y E Y E u
1 2i iY b b X u 1 2
( )i
E Y b b X ve
eşitliklerini varyans tanımında yerine koyarsak
2 2 2
1 2 1 2( ) ( ) ( )
i i i uVar Y E b b X u b b X E u
ui lar sabit varyanslıdır. Yani hepsinin varyansı 2
u
sabit değerlidir. 2 2
( )i u
E u
Yani
2 2 2( ) ( ( )) ( )
i i i i uVar Y E Y E Y E u
3. Yi nin dağılımı normaldir.
Yi nin dağılımının biçimi, ui nin dağılımının biçimiyle
belirlenir ve bu dağılım varsayım gereğince normaldir. b1 ve
b2 sabit parametreler olmaları nedeniyle Yi nin dağılımını
etkilemezler. Ayrıca Xi açıklayıcı değişkenin değerleri de
varsayım gereğince değişmez değerler kümesinde olduğundan
Yi nin dağılım biçimini etkilemezler.
ÖRNEK REGRESYON DENKLEMİ
i21i XbbY
Katsayıların Tahmini
Normal Denklemler ile,
Doğrudan Formüller ile,
Ortalamadan Farklar ile,
Tüketim Gelir
75 80
88 100
95 120
125 140
115 160
127 180
165 200
172 220
183 240
225 260
NORMAL DENKLEMLER
SY = n + SX
SXY= SX + SX2
1b 2b
1b2b
SY=? , SX=? , SXY= ? , SX2= ? , n
75
88
95
125
115
127
165
172
183
225
Y
80
100
120
140
160
180
200
220
240
260
X YX X2
6000
8800
11400
17500
18400
22860
33000
37840
43920
58500
6400
10000
14400
19600
25600
32400
40000
48400
57600
67600
SY=1370 SX2=322000 SX=1700 SYX=258220
NORMAL DENKLEMLER
1370 = 10 + 1700
258220 = 1700 + 322000
-170 /
-232900 = -1700 - 289000
258220 = 1700 + 322000
25320 = 33000 2b
= 0.7672727
= 6.5636364
2b
1b
1b 2b
2b1b
1b 2b
2b1b
XY 7672727.05636364.6ˆ
ÖRNEK REGRESYON DENKLEMİ
i21i XbbY
22
2
1)X(Xn
XYXYXb
2)1700()322000.(10
)258220).(1700()1370).(322000(
= 6.5636364
DOĞRUDAN FORMÜLLER
DOĞRUDAN FORMÜLLER
222)X(Xn
YXXYnb
2)1700()322000)(10(
)1370)(1700()258220).(10(
= 0.7672727
XY 7672727.05636364.6ˆ
ÖRNEK REGRESYON DENKLEMİ
i21i XbbY
ORTALAMADAN FARKLAR
22x
xyb
XbYb 21
Syx=? Sx2=? y=? x=? ?X ?Y
Y
X
i
i
iiii
i
i
i
i
•
•
•
•
•
•
•
•
y
x
Y
Y
Y
Y
Y
0X X
( , )X Y
••
••
•
•
e
y =y -e = -Yi
y
N (X , Y )
i
i
ÖRD= =b +b X1 2
^^
^}
}
Ortalamalar Orijinine göre Örnek Regresyon Doğrusu
(ÖRD)
75
88
95
125
115
127
165
172
183
225
Y
80
100
120
140
160
180
200
220
240
260
X
-62
-49
-42
-12
-22
-10
28
35
46
88
-90
-70
-50
-30
-10
10
30
50
70
90
SY=1370 Sx=0 SX=1700
YYy XXx
Sy=0
137Y 170X
ORTALAMADAN FARKLAR
ORTALAMADAN FARKLAR
5580
3430
2100
360
220
-100
840
1750
3220
7920
8100
4900
2500
900
100
100
900
2500
4900
8100
3844
2401
1764
144
484
100
784
1225
2116
7744
x2 yx y2
Syx=25320 Sx2=33000 Sy2=20606
ORTALAMADAN FARKLAR
22x
xyb
33000
25320 = 0.7672727
XbYb 21 = 6.5636364 =137-(0.7672).(170)
XY 7672727.05636364.6ˆ
ÖRNEK REGRESYON DENKLEMİ
i21i XbbY
ELASTİKİYETLERİN HESAPLANMASI
i
i
Y
X .
dX
dY
X/X
Y/Ylim
EX
EYE
i
i
0xyx
•Nokta Elastikiyet
•Ortalama Elastikiyet
NOKTA ELASTİKİYET
0
i
Y
X .
ˆdX
dYE
0YX
0
i
Y
X .
ˆb2
X0 = 130
0Y
130 .
ˆ767.0E 130YX 0
NOKTA ELASTİKİYET
0Y 0 X0.76727275636364.6
(130) 0.76727275636364.6
3091.106
106.3091
130 .767.0E
130XY 00.94
ORTALAMA ELASTİKİYET
Y
X .
dX
dYE
XY
Y
X . b2
170X ; 137Y
137
170 . 767.0E
XY = 0.95
Tahminin Standart Hatası ve Varyansı
n
)YY(s
2
i S
n
e2
iS (n30 ise)
2n
)YY(s
2
ii
S
2n
e2
i
S (n<30 ise)
?Y S2
)YY( ?e2
S
Tahminin standart hatası, regresyon doğrusu etrafındaki
dağılımın bir ölçüsüdür.
Tahminin Standart Hatası ve Varyansı
i21i XbbY
ii X 7672727.05636364.6Y
Tahminin Standart Hatası ve Varyansı
Tüketim iY
67.9455
83.2909
98.6364
113.9818
129.3273
144.6727
160.0182
175.3636
190.7091
206.0545
75
88
95
125
115
127
165
172
183
225
80
100
120
140
160
180
200
220
240
260
Gelir iii YYe 2
ii
2
i )YY(e
7.0545
4.7091
-3.6364
11.0182
-14.3273
-17.6727
4.9818
-3.3636
-7.7091
18.9455
49.7666
22.1755
13.2231
121.4003
205.2707
312.3253
24.8185
11.3140
59.4301
358.9302
1370Yi SSY=1370 Se=0 Se2=1178.6545
Tahminin Standart Hatası ve Varyansı
2-10
1178.6545s 147.3318 =12.138
s2= 147.3318
2n
YXbYbYs 21
2
SSS
210
)258220(7672727.0)1370(5636364.6208296s
SY2 =? SY = ? SYX=? b1 =? b2 =?
= 12.138
Tahminin Standart Hatası ve Varyansı
2n
yxbys 2
2
SS
YYy XXx Sy2 = ? Syx = ? b2= ?
210
)25320(7672727.020606s
= 12.138
DEĞİŞKENLİKLER
S2
)YY( S2
)YY( 2)YY( S
Y
X
X
Y
Yi
Xi
S2
)YY(2
)YY( S
2)YY( S
2
y 2
y 2
e
DEĞİŞKENLİKLER
2)YY( S 2
)YY( S 2)YY( S
Sy2=20600 3455.19427y2
S Se2=1178.6545
3844
2401
1764
144
484
100
784
1225
2116
7744
49.7666
22.1755
13.2231
121.4003
205.2707
312.3253
24.8185
11.3140
59.4301
358.9302
4768.5302
2884.6664
1471.7686
529.8367
58.8707
58.8707
529.8367
1471.7686
2884.6664
4768.5302
DEĞİŞKENLİKLER
S2
)( YY S2
)YY( 2)ˆ( YY S
Sy2 = 2
yS Se2 +
S
S
S
2n
e
2n
y
2n
y222
22
ˆ
2sss yy
20606 = 19427.3455 + 1178.6545
210
6545.1178
210
3455.19427
210
206062575.75 = 2428.4182 + 141.3318
varyanslar
BELİRLİLİK KATSAYISI
Noktaların doğruya yakınlık derecesini göstermektedir.
Y’deki değişmelerin yüzde kaçının X tarafından
açıklanabildiğini ifade etmektedir.
R2 0 ile 1 arasında değişmektedir.
KORELASYON KATSAYISI
Y ile X arasındaki ilişkinin yönünü ve şiddetini
vermektedir.
-1 ile +1 arasında yer almaktadır.
BELİRLİLİK KATSAYISI
varyansToplam
varyansAçıklanan
s
sr
2
y
2
y2
varyansToplam
an varyansAçıklanmay
s
sr1
2
y
22
varyansToplam
an varyansAçıklanmay
s
s1r
2
y
22
75.2575
4182.2428 = 0.9428
75.2775
3318.1471 = 0.9428
75.2575
3318.147 = 0.0572
S
S2
2
)(
)(
YY
YY2
2
)(
)ˆ(
YY
YY
S
S2
2
)(
)ˆ(
YY
YY
S
S
2
2
2
2
2
2 ˆ
y
e
y
y
y
y
2
2
2
2ˆ
y
e
y
y
TD
HBD
TD
RBD
TD
TD
2
2
21
y
er
2
2
21
y
er Belirsizlik katsayısı
BELİRLİLİK KATSAYISI
22
22
yx
)xy( r
SS
S
)20606)(33000(
)25320(
2
= 0.9428
22yx
xy r
SS
S
)20606)(33000(
25320 = 0.9710
DAĞILMA DİYAGRAMLARI
Y
X
•
•
• •
•
•
•
•
•
•
•
••
15
10
5
15
105 20
3
Y=3+0.5X
r=0.82
s=1.94
-6
Y
X15
10
5
15
105 20
3
Y=3+0.5X
r=0.82
s=1.94
-6
Y
X15
10
5
15
105 20
3
Y=3+0.5X
r=0.82
s=1.94
-6
Y
X15
10
5
15
105 20
3
Y=3+0.5X
r=0.82
s=1.94
-6
(d)(c)
(b)(a)
••
••
•
•
• •
•
•
Aşırı kıymet
•••
•
STANDARTLAŞTIRILMIŞ HATA TERİMLERİ
0.5812
0.38796
-0.29959
0.90774
-1.18037
-1.45598
0.41043
-0.27712
-0.63512
1.56084
7.0545
4.7091
-3.6364
11.0182
-14.3273
-17.6727
4.9818
-3.3636
-7.7091
18.9455
80
100
120
140
160
180
200
220
240
260
ei ei/s Xi
e/s 'nin dağılma diyagramı
-2
0
2
60 100 140 180 220 260
EKK Tahminlerinin Standart Hataları ve
Kullanılışı
EKK tahminleri ve örnek verilerine dayanarak hesaplanır.
Bir anakütleden bir çok örnek çekilebilir, bu durumda her örnek seti
için farklı tahminciler elde edilecektir. Örnek değerlerinin anakütle
değerleri b1 ve b2 ye ne ölçüde yakın olduğu standart hatalarla
hesaplanır.
Standart hata, tahmincinin örnekleme dağılımının standart
hatasıdır.
1b2b
Bir tahmincinin örnekleme dağılımı anakütleden seçilebilecek aynı
büyüklükteki örneklerin lerin dağılımıdır. (75 milyar)
60 hanelik anakütleden çekebileceğimiz onluk (75 milyar) örnek için
hesaplanan değerlerinin örnekleme dağılımı ortalama
etrafında normal dağılmaktadır.
Anakütleden çekilen örnekler için hesaplanan EKK leri
örneklerin farlı değerli Y(tüketim) ve X(gelir gibi) e sahip
hanelerden oluşması gibi örnekleme hatalarından dolayı gerçek
değerinden farklıdır.
b
2b )ˆ( 2bE
2b
2b
Örnekleme hataları + ve – yönde aynı ihtimalle ortaya çıkan
hatalardır. Ortalama ölçüsü standart hatadır.
En Küçük Karalerle Parametre Tahminlerinin
Ortalama ve Varyansı
1b ’in ortalaması:
1 1ˆ( )E b b
1b ’in varyansı:
2
2 2
1 1 1 2ˆ ˆ( ) ( ) .
i
u
i
XVar b E b b
n x
2b ’nin ortalaması:
2b ’n'in varyansı:
2 2ˆ( )E b b
2 2
2 2 2 2
1ˆ ˆ( ) ( ) .u
i
Var b E b bx
Katsayıların Standart Hataları
2
2
1xn
X . s)b( s
S
S
22
x
s)b( s
S
)33000.(10
322000 . 138.12 = 11.99
33000
138.12 = 0.0668
Aralık Tahminleri
± t a/2 . s( ) 1b 1b
±t a/2 . s( ) 2b 2b = 0.7672727 2.306 (0.0668)
0.6132319< b2 <0.9213135
= 6.5636364 2.306 (11.99)
-21.0853 < b1 < 34.2126
Hipotez Testleri
0.6132319< b2 <0.9213135
-21.0853 < b1 < 34.2126
Güven Aralığı Yaklaşımı İle
Hipotez Testleri
Anlamlılık Testi Yaklaşımı İle
•Hipotezlerin Formüle Edilmesi
•Tablo Değerlerinin Bulunması
•Test İstatistiğinin Hesaplanması
•Karar Verilmesi
Hipotez Testleri
1.Aşama H0: b2 = 0
H1: b2 0
2.Aşama a = ? = 0.05 ; S.d.=? = n-k = 10-2=8
3.Aşama
ta,sd =? t0.05,8=? =2.306
?)b(s
bbt
2
*
22hes
0668.0
07672727.0 =11.4861
4.Aşama |thes= 11.4861 | > |ttab= 2.306 |
H0 hipotezi reddedilebilir
Regresyon ve Varyans Analizi
Değişkenlik KaynağıSapma Kareleri
Toplamı=SKT
Serbestlik
Derecesi=sd
SKT Ortalaması=
SKTO
Regresyona Bağlı
Değişkenlik=RBDS
2y f1=k-1=1 S
2y
Hata Terimine Bağlı
Değişkenlik=HBD Se2 f1=n-kkn
e2
=s
2
Toplam
Değişkenlik=TD Sy2 n-1
Regresyon ve Varyans Analizi
Değişkenlik
KaynağıSKT sd SKTO
RBD 19427.3455 2-1=1 19427.3455
HBD 1178.6545 10-2=8 147.3318
TD 20606 10-1=9 Fhes=3318.147
3455.19427=131.8612
EKK Modelinde Önceden Tahmin
•İleriye Ait Tahmin
•Önceden Tahmin
•Örnekten Tahmin Edilen İlişkinin Ayni Kaldığı
•X Değerlerinin Aynı Eğilimde Olacağı
Y’nin Aralık Tahmini
0Y ± ta/2 . s 2
20
x
)XX(
n
11
0Y ± ta/2 . s )Y( 0 Y0’ın güven aralığı
Y’nin Aralık Tahmini
0 Y ˆ X0=80 = 67.9455
67.9455 ±2.306. 12.318
2
33000
) 80 (
10
1 1
170
35.47840 Y0| X0 100.41251
Y’nin Ortalamasının Aralık Tahmini
0 Y ˆ ± t a /2 . s
2
2
0
x
) X X (
n
1
0Y ± ta/2 . s )Y( 0 Y’nin ortalamasının güven aralığı
Y’nin Ortalamasının Aralık Tahmini
0 Y ˆ X0=80 = 67.9455
67.9455 ±2.306. 12.318
2
33000
) 80 (
10
1 170
51.49402 E(Y0| X0) 84.39689
Y’nin Güven Aralıkları
35.47840
52.01572
68.28577
84.26359
99.93034
115.27579
130.29996
145.01304
159.43390
173.58749
100.41251
114.56610
128.98696
143.70004
158.72421
174.06966
189.73641
205.71423
221.98428
238.52160
80.00
100.00
120.00
140.00
160.00
180.00
200.00
220.00
240.00
260.00
51.49402
69.33821
86.90184
103.99618
120.34284
135.68829
150.03254
163.62911
176.75639
189.60311
84.39689
97.24361
110.37089
123.96746
138.31171
153.65716
170.00382
187.09816
204.66179
222.50598
X0 Alt Sınır Üst Sınır Üst Sınır Alt Sınır
Y’ninAralık Tahminleri Y’nin OrtalamasınınAralık
Tahminleri
X
3002001000
Y 240
220
200
180
160
140
120
100
80
60
40
20
0
En Küçük Kareler Tahminlerinin Özellikleri
Genellikle bir tahminin ana kütle parametresinin gerçek
değerine yakın olması ve bu gerçek parametre
yakınlarında dar bir aralıkta değişmesi istenir. Ana kütle
parametresine ‘yakınlık’ çeşitli ekonometri tahmin
yöntemleri ile bulunmuş tahminlerin örnekteki
dağılımların ortalaması ve varyansıyla ölçülür.
1. Tahmin Edicilerin Küçük Örnek Özellikleri
Burada her zamanki varsayımsal yenilemeli
örnekleme süreci kullanılır, yani her biri n
gözlemli çok sayıda örneğin alındığı varsayılır.
Ekonometri yöntemlerinin her birini kullanarak her
örnekten hesaplanıp dağılımları oluşturulur.
Küçük örnekten bulunmuş iyi bir tahmin edici için
temel ölçütler:Sapmasızlık, En küçük varyans,
Etkinlik, Doğrusal en iyi, sapmasızlık (DES), En
küçük ortalama hata karesi (OHK), Yeterlilik
dir.
b
En Küçük Kareler Tahminlerinin Özellikleri
a. Sapmasız Tahmin Edici
Bir tahmin edicinin sapması, beklenen değeriyle
gerçek parametre arasındaki fark olarak tanımlanır.
Sapma= -b
Eğer sapma sıfırsa yani = b ise, sapmasız olur.
Bu da örneklerin sayısı artıkça, sapmasız tahmin
edicinin, parametrenin gerçek değerlerine yaklaştığı
anlamına gelir. Sapmasız bir tahmin edici ‘ortalama
olarak’ parametrenin gerçek değerini verir.
Aranan bir özellik olmasına karşın, sapmasızlık
kendi başına çok önemli değildir. Ancak küçük bir
varyansla birleşirse önemli olur.
)ˆ(bE
)ˆ(bE
, b’nin sapmalı tahmin edicisidir
, b’nin sapmasız tahmin edicisidir
b b
a. Sapmasız Tahmin Edici
b. En Küçük Varyanslı Tahmin Edici (En İyi Tahmin
Edici)…
Bir tahmin, başka ekonometri yöntemleriyle bulunmuş başka
herhangi bir tahminle karşılaştırıldığında en küçük varyansa sahip
olduğu görülürse en iyi tahmindir. nin en iyi olma koşulu:
<
Ya da;
Var( )<Var( )
Burada , gerçek parametre b nin (sapmasız olması gerekmeyen)
herhangi bir başka tahminidir.
b
2)]ˆ(ˆ[ bEbE 2
)]~
(~
[ bEbE
b b~
b~
Varyansı küçük olduğu halde sapması büyük olan bir tahmin
edici, gerçek b parametresinden oldukça uzak bir değer
etrafında toplanabilmektedir.
, b nin büyük varyanslı sapmasız tahmin edicisidir.
, b nin küçük varyanslı sapmalı bir tahmin edicisidir.
b
b~
b. …En Küçük Varyanslı Tahmin Edici (En İyi Tahmin Edici)
c. Etkin Tahmin Edici
Bir tahmin edici; sapmasız ve başka herhangi sapmasız
tahmin ediciyle karşılaştırıldığında daha düşük varyansa
sahipse etkin tahmin edicidir.
Aşağıdaki iki koşul yerine getirilirse etkindir:
(i)
ve
Burada , gerçek b nin başka bir sapmasız tahmin
edicisidir. Başka bir deyişle, etkin tahmin edici, bütün
tahmin sapmasız ediciler sınıfı içinde en düşük (en iyi)
varyansa sahip olan tahmin edicidir.
b
bbE )ˆ(
2**2)]([)]ˆ(ˆ[ bEbEbEbE
*b
(ii)
d. Doğrusal Tahmin Edici…
Bir tahmin edici, örnekteki gözlemlerin doğrusal bir
fonksiyonuysa doğrusal sayılır. Örnek gözlemleri
veriyken, doğrusal bir tahmin edici şu biçimi alır:
Burada ki ler sabit değerlerdir.
Örneğin
olduğundan
örnek ortalaması doğrusal bir tahmin edicidir. Çünkü:
1 1 2 2...
n nk Y k Y k Y
Y
1 2
1...
nk k k
n
1 2 1 2
1 1 1 1 1... ... )
i
i n n
YY Y Y Y Y Y Y Y
n n n n n n
örnek ortalaması hesaplanırken her gözleme, 1/n ye eşit olan
aynı k ağırlığı verilmiştir.
Y
d...Doğrusal Tahmin Edici…
e. Doğrusal en iyi sapmasız tahmin edici
(DEST)
Bir tahmin edici, doğrusalsa sapmasızsa ve gerçek
b nin öteki doğrusal sapmasız tahmin edicileriyle
karşılaştırıldığında en küçük varyansa sahipse,
DEST olur.
f. En küçük ortalama hata kareli (OHK)
tahmin edici
Ortalama hata karesi ölçütü, sapmasızlık ve en küçük
varyans özelliklerinin bir bileşimidir. Burada OHK, tahmin
edicinin, ana kütledeki gerçek parametre b ile olan farkının
karelesinin beklenen değeri olarak tanımlanır:
OHK nin, tahmin edicinin varyansıyla sapma karesinin
toplamına eşit olduğu gösterilebilir:
2ˆ ˆ( ) ( )OHK b E b b
)ˆ()ˆ()ˆ(2
bsapmabVarbOHK
2 2
ˆ ˆ ˆ ˆ ˆ ˆ( ) ( ) 2 [ ( )][ ( ) ]E b E b E b b E b E b E b b
2ˆ( )OHK E b b
2
ˆ ˆ ˆ( ) ( )E b E b E b b
2ˆ ˆ ˆ( ) ( )E b E b Var b
2
2ˆ ( )E b b sapma b
f… En küçük ortalama hata kareli (OHK)
tahmin edici…
İspat:
ˆ ˆ ˆ[ ( )][ ( ) ] 0E b E b E b b
2
ˆ ˆ ˆ ˆ ˆ( ) ( ) ( )E bE b E b bb bE b
2 2
ˆ ˆ ˆ ˆ( ) ( ) 0E b E b bE b bE b
)ˆ()ˆ()ˆ(2
bsapmabVarbOHK
Çünkü:
f. En küçük ortalama hata kareli (OHK)
tahmin edici
g. Yeterli tahmin edici
Yeterli bir tahmin edici, gerçek parametre
hakkında bir örneğin içerdiği bütün bilgileri
kullanıma koyan bir tahmin edicidir. Bu başka
hiçbir tahmin edicinin, tahmin edilmekte olan
gerçek ana kütle parametresi hakkında daha fazla
bilgi sunamayacağı anlamına gelir.
2. Tahmin edicilerin büyük örnek
özellikleri: Asimtotik özellikler
Büyük örnek özelliklerinin, bir tahminin iyiliğini
belirleme ölçütü olarak kullanılması, örneğin
sonsuz büyük olmasını gerektirir. İşte bu nedenle
bu özelliklere asimtotik özellikler denir. Örnek
büyük olduğu zaman bu özelliklerin yaklaşık
olarak sağlandığı varsayılır. Özellikler ise
şunlardır: asimtotik sapmazlık, tutarlılık ve
asimtotik etkinlik.
Asimtotik dağılım:
Bir dizi rassal değişken düşünüldüğünde;
Bunlardan her birinin kendi dağılımı, ortalaması ve
varyansı vardır. Dağılımlar gitgide artan örnek
büyüklüklerinden oluşturulmuştur. nT sonsuza
giderken bu dağılımlar da belli bir dağılıma doğru
yaklaşıyor olabilirler. İşte bu dağılıma {X(n)} dizisinin
asimtotik dağılımı denir.
2...Tahmin edicilerin büyük örnek
özellikleri: Asimtotik özellikler
( ){ } .T1 2
nn n nX X X X
a. Asimtotik sapmasızlık…
Bir tahmincinin asimtotik sapması, asimtotik
ortalaması ile gerçek parametre arsındaki farka eşittir.
b
ˆlim ( )
nn
E b b
ˆ '
ˆlim ( )n
n
b nin
asimtotik E b b
sapması
Eğer edicisinin asimtotik ortalaması, ana kütlenin
gerçek b parametresine eşit ise, bu tahmin edici, bu
parametrenin asimtotik sapmasız tahmin edicisidir.
Eğer bir tahmin edici (sonlu küçük örneklerde)
sapmasızsa aynı zamanda asimtotik sapmasızdır,
ama bunun tersi doğru değildir.
a… Asimtotik sapmasızlık
Asimtotik bir sapmasız tahmin edici, örnek
büyüklüğü yeterine büyük olduğunda sapması
kaybolan bir tahmin edicidir.
b. Tutarlılık…
ˆ,b
b
ˆlim ( )
nn
E b b
ˆlim ( ) 0n
Var b
Bir edicisi, aşağıdaki iki koşulla, ana kütlenin b
gerçek parametresinin tutarlı bir tahmin edicisidir:
1. asimtotik sapmasız olmalıdır.
2. n sonsuza giderken 'nin varyansı sıfıra yaklaşmalıdır:
b
Eğer varyans sıfırsa, dağılım ana kütlenin gerçek
parametresinin üstünde bir noktada toplanır.
Bir tahmin edicinin tutarlı olup olmadığını anlamak için, n
arttıkça sapmanın ve varyansının ne olduğuna bakılmalıdır.
(n) büyüdükçe hem sapma hem varyans azalmalı ve limitte
( iken) sıfır olmalıdır. Tutarlılık kavramı aşağıda
çizilmiştir. Örnek büyüklüğü artıkça hem sapma hem
varyans azalmaktadır.
n
Tutarlılık…
c. Asimtotik etkinlik
Eğer
(1) tutarlıysa
(2)Başka herhangi bir tutarlı tahmin ediciye göre daha küçük
bir asimtotik varyansı varsa
bu tahmin edici ana kütlenin gerçek b parametresinin
asimtotik etkin bir tahmincisidir.
Eğer;
ise asimtotik etkindir. Burada , b nin başka bir tutarlı
tahmin edicisidir. Tutarlı tahmin ediciler
karşılaştırıldığında hangisinin varyansı daha hızla
sıfıra yaklaşıyorsa o, asimtotik etkendir.
b
21 ˆlim ( )
nn
E n b bn
2*lim
1bbE
nn
n
b *b
3. En Küçük Kareler Tahmin Edicilerinin
Özellikleri
Hata terimi u'nun bazı genel varsayımları yerine
getirmesi, yani ortalamasının sıfır ve varyansının
sabit olması koşuluyla, en küçük kareler
tahmincilerinin DES ( doğrusal, en iyi,
sapmasız) özelliklerini sağlamasına Gauss-Markow
en küçük kareler teoremi denmektedir.
a. Doğrusallık
En küçük kareler tahminleri ve gözlenen örnekteki Yi
değerlerinin doğrusal fonksiyonlarıdır. Varsayım gereği Xi ler
hep aynı değerlerle göründüklerine göre en küçük kareler
tahminlerinin yalnız Y değerlerine bağlı olduğu gösterilebilir.
1b 2b
2 2ˆ i
i i i
i
xb Y k Y
x
2
ii
i
xk
x
1ˆ ( )b f Y
2ˆ ( )b f Y
İspat:
Varsayım gereği X değerleri sabit değerler kümesidir. Bu
durumda ki lerde örnekten örneğe değişmezler.
Bu durumda şunu yazabiliriz:
2 1 1 2 2ˆ ... ( )
i i n nb k Y k Y k Y k Y f Y
2b Y’lerin doğrusal bir fonksiyonudur. Bağımlı değişken
değerlerinin doğrusal bir bileşimidir.
1
1ˆ [ ]i i
b Xk Yn
X ve ki Örnekten örneğe değişmez.
katsayı tahmini sadece Y ye bağlıdır.
…Doğrusallık
b. Sapmasızlık
ve nin sapmasızlık özelliği ve
şeklindedir. Bu özelliğin anlamı, örneklerin sayısı
artıkça tahminler de parametrelerin gerçek
değerine yaklaşır. Başka bir deyişle, n sayıda Y ve
X gözleminden oluşan, olanak içindeki bütün
örnekleri seçildiğinde ve ile
tahminleri her örnek için hesaplandığında, bu
tahminlerden çok fazla sayıda elde edilir. Bunların
ortalaması ise ilişkinin parametrelerine eşit olur.
Tahminlerin dağılımı, orta nokta olarak
parametrenin gerçek b değeri üzerinde
toplanacaktır.
1b 2b 2 2ˆ( )E b b1 1
ˆ( )E b b
1b2b
c. En Küçük Varyans
Gauss-Markow teoremi ispatı: Bu teoreme göre en küçük
kareler tahminleri, başka ekonometri yöntemleriyle
bulunmuş herhangi bir başka doğrusal sapmasız tahmin
ediciler arasında en iyisidir ( varyansı en küçük olandır).
EKK yönteminin tercih edilmesinin temel nedeni de bu
özelliktir.