İkİ deĞİŞkenlİ basİt doĞrusal regresyon modelİkisi.deu.edu.tr/emrah.gulay/bdrm.pdfİkİ...

İKİ DEĞİŞKENLİ BASİT DOĞRUSAL

REGRESYON MODELİ

Regresyon Y ile X (X ler) arasındaki ortalama ilişkinin

matematik fonksiyonla ifadesidir.

X’e bağlı olarak Y’nin ortalamasının nasıl değiştiğini

gösterir.

iii XbbXfY 21)(

Bu ilişki eğriselde olabilir. Ortalama ilişki aşağıdaki

gibi ifade edilir:

)()( ii XfXYE

)( iXYE X’in verilen bir X değeri için Y’nin şartlı ortalaması

veya şartlı beklenen değeridir.

Örneğin: 4000 nüfuslu bir kasabada 500 hane bulunsun ve

bunlardan sadece 60’ı memur olsun.

Anakütle Regresyon Denklemi

1 2E(Y|X)=f(X)=b b X

X’e bağlı olarak Y’nin ortalamasının nasıl değiştiğini

gösterir.

Anakütle regresyon denklemi X bağımsız değişkeninin sabit

değerleri için bağımlı değişken Y’nin ortalama veya beklenen

değerinin geometrik yeridir.

Her Xi değeri için bir Yi değeri vardır.

Her Xi değeri için bir ortalama değer vardır ve regresyon doğrusu

bu noktalardan geçmektedir.

Her , şartlı ortalama Xi nin bir fonksiyonudur.

f(Xi) fonksiyon Xi’yi gösterir. Bu fonksiyon doğrusal ya da eğrisel

olabilir.

X’in doğrusal bir fonksiyonudur.(Ana kütle regresyon

denklemi)

)()( iXfXYE

)()( iXfXYE

)()( ii XfXYE

),( iXYE

XbbXYE 21)|(

Doğrusal modelde, doğrusal kelimesiyle değişkenler arasındaki

doğrusallık ve parametreler arasındaki doğrusallık ifade

edilmektedir.

)|( XYE nin X’in doğrusal bir bir fonksiyonu ise;

uXYEY )|(

veya

iii uXbbY 21

)|( iiii XYEYu

u, pozitif negatif ve

sıfır değerlerini

alır.*(bkz.tablo)

b1. sabit terim b2 eğim katsayısıdır.

Regresyon denklemine hatayı eklememizin sebepleri

nelerdir:

1. İktisat teorisinin yetersizliğinden Y’ye etki eden

başka değişkenler modele alınamayabilir. Bunlar

hataya dahil edilir.

2. Aynı büyüklük ve kompozisyonundaki hanelerle

çalışmadığımız için stokastiklik ortaya çıkmakta ve

bu durum hata terimini ortaya çıkarmaktadır.(Zevk ve

tercihlerin bireyden bireye değişmesi gibi)

3.Y ve X değişkenleri hatasız ve doğru kabul

edilmektedir. Oysa ölçme hatası taşıyabilirler.

b1 ve b2 hakkında bazı çıkarsamalar:

Eğer b2 pozitif ise çizginin veya doğrunun eğimi

soldan sağa yukarıya doğru; yok eğer negatif ise

tersi geçerlidir.

Eğer b2’in mutlak değeri büyükse doğru daha

dik olmaktadır.

Eğer b2= 0 ise doğru X eksenine b1 noktasında

paralleldir.

Bir çok fonksiyonlar düz çizgi halinde değildirler

.

. .

.

y4

y1

y2

y3

x1 x2 x3 x4

}

}

{

{

u1

u2

u3

u4

x

y E(y|x) = b0 + b1x

Örnek Regresyon Denklemi

Tam sayım yapmadığımızı kabul ederek örnekleme

yaptığımızı kabul edelim.

Örnek regresyon denklemi:

ii XbbY 21ˆˆˆ

isiin tahmincb

isiin tahminc b

cisinin tahmin )|(ˆ

22

11

b

b

XYEY ii

ii

iiiiii

XbbY

YYXbbeXbbY

21

2121

ˆˆˆ

)ˆ(ˆˆˆˆ

y2

y1

x2 x1

Y

X

ΔX

ΔY= b2 ΔX

Doğrusal denklemin grafiği düz bir çizgi olup sabit ve eğim

katsayılarını birbirinden ayırma özelliğine sahiptir. Sabit sayı

X=0 olduğu zaman Y’nin alacağı azami değer ve eğim ise ΔY/ ΔX

oranı olup X üzerindeki bir noktadan diğer bir noktaya olan

hareketliliği göstermektedir.

b1

XbbY 21ˆ

2

1

10

1

2

n

i

n

i

i XYe bb

İfadesini minimize eden parametre tahmincilerinin değerlerini bulabilmek için

eşitliğin b0 ve b1 ‘e göre türevleri alınıp 0’a eşitlenir.

2

1

10

01

2

0

n

i

n

i

i XYe bbbb

n

i

XY1

102 bb

2

1

10

11

2

1

n

i

n

i

i XYe bbbb

n

i

XYX1

102 bb

Her iki denklemi de 0’a eşitlersek;

0

02

1

10

1

10

n

i

n

i

XbbY

XbbY

0.

0..2

1

10

1

10

n

i

n

i

XbbYX

XbbYX

b0‘a göre türev alınırsa; b1‘e göre türev alınırsa;

İki Değişkenli basit Doğrusal Regresyon Modelinin En Küçük

Kareler Yöntemiyle Tahmini

0

02

1

10

1

10

n

i

n

i

XbbY

XbbY

0.

0..2

1

10

1

10

n

i

n

i

XbbYX

XbbYX

Parantezleri açarsak;

0. 10 XbbnY 02

10 XbXbXY

Bu denklemlere doğrunun NORMAL DENKLEMLERİ denir.

Normal denklemler alt alta yazılıp birlikte çözüldüklerinde b0 ve b1

tahmincileri bulunur.

XbbnY 10.

2

10 XbXbXY n

XX

n

YXXY

b2

2

1)(

)).((

XbYb 10

şeklindeki formüller yardımıyla da tahminciler bulunabilir.

Ortalamadan Sapmalar Yoluyla En Küçük Kareler Denklemlerinin

İspatı

XbYb 21

olduğundan

Bu ifadenin her iki tarafını n ile böldüğümüzde

veya

elde edilir.

Bu eşitlik ortalamalar orjinine göre regresyon denklemidir.

Ortalamalar orjinine göre regresyon denkleminden tahmini

anakütle regresyon denklemi şöyle yazılabilir:

elde edilir.

olmak üzere,

Hata terimleri kareleri toplamı şu şekilde ifade edilebilir:

Bu ifadenin ‘e göre türevi alınıp sıfıra eşitlendiğinde;

elde edilir.

için diğer bir formül ise şöyledir:

Basit En Küçük Kareler Regresyon Modelinin

Varsayımları

Varsayım 1: Hata terimi ortalaması sıfıra eşit stokastik bir

değişkendir:

• Hata terimi u, pozitif ve negatif her iki yöndeki çok sayıda

sebeplerin toplamının etkisini göstermektedir. Bu sebepten

anakütle hata terimi u, X’in her değeri için şansa bağlı olarak

pozitif, negatif veya sıfır değerlerini belli bir ihtimalle

alabilmektedir. Yani u stokastik bir değişkendir ve değerleri

önceden kesin olarak bilinmemektedir.

iu

• Bazı bağımsız değişkenlerin modele alınamaması, modelin

matematiksel biçiminin yanlış seçilmiş olması, değişkenlerdeki

ölçme hataları, fertlerin davranışlarının yaradılış icabı farklı

olması gibi durumlar u’nun artı değer alabileceği gibi eksi değer

de alabileceğini gösterir.

• Modele dahil edilmeyen değişkenlerin etkisi, bazen Y’yi

gözlenebilecek olan değerinden daha büyük bazen de daha küçük

değerli yapabilecektir. Yani genelde, sürekli olarak artış yönünde

veya sürekli olarak azalış yönünde olan sapmalar(farklar)

beklenmeyecektir. Bu da u’nun stokastik olduğu anlamına gelir.

• u’lar sürekli artan veya sürekli azalan bir görünüm arzetmezler,

düzensiz bir görünüm sergilerler.

• Ayrıca, ui nin muhtelif değerleri birbirinden bağımsız stokastik

değişkenlerdir.

• Tüketim örneğinde, u’nun stokastik ve değerlerinin birbirinden

bağımsız olması şöyle açıklanabilir:

Bir hane için ui hata terim değerini pozitif elde etme ihtimali ne

artar, ne de azalır. Ayrıca u hata terimi değerlerinin dağılımının

normal, ortalamasının sıfır ve varyansının olduğunu

varsayacağız.

𝜎𝑢𝑖2

• Sonuç olarak,

yazılabilir. Yani ui ler, birbirinden bağımsız, sıfır ortalamalı, eş,t

varyanslı normal dağılımlıdır.

𝑢𝑖 ∼ 𝑁(0,𝜎𝑢𝑖2 )

Varsayım 2: Hata terimi u normal dağılımlıdır:

• EKK tahmincilerinin ihtimal dağılımları, ui nin ihtimal

dağılımı hakkında yapılan varsayıma bağlıdır. Bu sebepten b

tahminleri konusunda bir test uygulamak gerektiğinde (t,F

testi gibi)dağılımlarının normal olması gerekir, bu da ui nin

dağılımının normal olmasını gerektirmektedir.

• Uygulamalarda anakütle u değerleri bilinmediğinden,

Merkezi Limit Teoremi’ne göre normal dağıldıkları kabul

edilir.

ui değerleri E(ui)=0

u’ların normal dağılımı

• Normal dağılım eğrisinde, absiste u’nun ortalamasına (0)

tekabül eden noktadan çıkılacak dikmenin iki tarafı tam bir simetri

arzeder. ui normal dağılıyorsa, EKK nin tahmincileride

normal dağılırlar.

• Uygulamalarda u’nun dağılımının normal olup olmadığı,

Lilliefors grafik testi, χ2 uygunluk testi ve Jarque-Bera testi ile

araştırılmaktadır.

𝑏1 𝑣𝑒 𝑏2

Varsayım 3: Hata terimi ui değerleri arasında ilişki(otokorelasyon)

yoktur:

• u’nun herhangi bir ui değeri kendisinden önceki uj değeri ile

bağımlı değildir. Bu varsayım ui ve uj nin kovaryanslarının sıfıra

eşit olmasını gerektirir:

Kov(ui ,uj )=E[ui – E(ui)] [E[uj – E(uj)]

varsayım 1’e göre E(ui)=E(uj)=0’dır. O halde,

Kov(ui ,uj )=E(uiuj)=0, i≠j

Bu varsayım, Kov(Yi ,Yj )=0, i≠j varsayımı demektir.

Varsayım 4: Hata terimi ui nin varyansı eşittir,sabittir.

(homoskedastiklik veya eşit varyanslılık)

• ui nin varyansının her Xi için eşit olduğu varsayımı şöyle ifade

edilmektedir:

Var(ui │Xi)= E[ui – E(ui)]2

Varsayım 1’e göre E(ui)=0 olduğundan,

Var(ui │Xi)= E[ui2]

Var(ui │Xi)=σ2 veya Var(ui)=σ2 (1)

(1) eşit varyanslık halini göstermektedir.

• Bu varsayımın anlamı şudur: Her Xi değeri için hata terimi ui’nin

varyansı belli bir sabit sayı olup σ2 ’ye eşittir. Buna

homoskedastiklik varsayımı, veya eşit(homo) dağılan(skedastik),

veya eşit varyans varsayımı da denir.

• Varsayım 5: Bağımsız değişken X, hata terimi u ile ilişkili

olmayıp, stokastik değildir:

• Bağımsız değişken Xi ile hata terimi ui arasında ilişki yoktur, yani

kovaryansları sıfıra eşittir:

Kov(ui,Xi)= E[ui – E(ui)] [Xi – E(Xi)]

Kov(ui ,Xi)=0

• X değişkeninin birden fazla olduğu çoklu modellerde de ui ile her

X değişkeni arasındaki kovaryans sıfıra eşit olmalıdır:

Kov(ui ,X2)=Kov(ui ,X3)=0

• Bu varsaymın anlamı şudur:

Anakütle Regresyon Denkleminde Xi ve u’nun Y’ye etkisi

ayrıayrıdır(toplanabilirdir). Eğer, X ile u arasında ilişki varsa,

herbirinin Y bağımlı değişkeni üzerindeki etkisini ferdi olarak

takdir edemeyiz.

Eğer X ile u arasında aynı yönde pozitif ilişki varsa, u artarken

X’de artacak ve u azalırken X’de azalacaktır. Benzer şekilde X ile

ters yönde negatif ilişkili iseler, u azalırken X artar ve u artarken

X azalır. Bu nedenle, X ve u’nun Y üzerindeki etkisinin tahmini

mümkün olmayacaktır.

Varsayım 6: Bağımsız değişken X, tekrarlı örneklere göre

sabittir. Xi ile ui arasında ilişki olmaması yani Kov(ui,Xi)=0

varsayımı X’in stokastik bir değişken olmamasını (tesadüfi

dağılmasını) gerektirir. Bu da istatistiki olarak, anakütleden

çekilebilecek tüm örnekler için X değerlerinin sabit değerli

olduğunu gösterir.(aynı X değişkeni değerleri için ayrı Y

değerleri sözkonusu.) Şöyleki:

Kov(ui,Xi)= E[ui – E(ui)] [Xi – E(Xi)]

Varsayım 1’e göre E(ui)=0 olduğundan:

Kov(ui,Xi)= E[ui – E(ui)] [Xi – E(Xi)] E(ui)=0

Kov(ui,Xi)= E[ui(Xi – E(Xi)]

= E[uiXi– uiE(Xi)]

Xi ‘ler sabit kabul edilirse,

E[E(Xi)]=E(Xi)

Kov(ui,Xi)= E(uiXi)– E(ui)E(Xi)

Varsayım 1’ e göre E(ui)=0’dır. Yani;

Kov(ui,Xi)= E(uiXi)

= 0 (Varsayım 5 gereği)

Varsayım 7: Bağımsız değişken X’in varyansı sonlu pozitif

bir sayı olmalıdır.

Anakütleden çekilebilecek örneklerin herbiri için X değişkeni

değerlerinin sabit kabul edilmesi,X değişkeninin tüm

değerlerinin eşit olması demek değildir.

Buna rağmen X değerlerinin aynı zamanda eşit olması

halinde ,

Burada tüm X değerleri eşit ise ‘dır ve payda

olacaktır. Böylece sabit/0= olacağından

ve dolayısıyla tahmin edilemeyecektir.

Yani ,

Sonlu olmalıdır. Burada Q sonlu pozitif sabit bir sayıyı

göstermektedir.

Varsayım 8: Modelin spesifikasyonu doğrudur.

İki değişkenli doğrusal regresyon modelinin EKK ile

tahmininde kabul edilen en önemli varsayımlardan biri

regresyon modelinin spesifikasyonunun doğru yapıldığı,

modelin spesifikasyon hatası taşıyıp taşımadığıdır.

Modele bazı değişkenlerin alınmaması , eğrisel bir fonksiyon

alınması gerekirken doğrusal fonksiyon alınması, model

değişkenleri konusunda hatalı varsayımlar yapılması

hallerinde tahmin edilen fonksiyon güvenilir olmayacak,

spesifikasyon hatalı olacaktır.

Varsayım 9: Bağımsız değişkenler arasında İlişki yoktur.

(Çoklu doğrusal Bağlantı olmaması Varsayımı)

EKKY’nin bu varsayımı, birden fazla bağımsız değişkeni

olan çoklu modellerle ilgilidir. Bu varsayıma göre ,çoklu

modellerde bağımsız değişkenler arasında ilişki yoktur.

Bağımlı Değişken Y nin Dağılımı

Y bağımlı değişkeninin ortalaması

1 2( )E Y b b X

Varyansı

2 2 2( ) ( ( )) ( )

i i i i uVar Y E Y E Y E u

olduğu gösterilecektir.

1. Y nin ortalaması kendisinin beklenen değerine eşittir.

1 2i iY b b X u

Beklenen değer alındığında

1 2( ) ( )

i iE Y E b b X u

1 2( ) ( ) ( )

i iE Y E b b X E u ( ) 0

iE u

b1 ve b2 parametreler iken Xi değerleri değişmez değerler

kümesinden geldikleri için

1 2( )

iE Y b b X bulunur.

1 2i iY b b X u

1 2( ) ( )

i iE Y E b b X u

2. Yi nin varyansı

2 2 2( ) ( ( )) ( )


1 2i iY b b X u 1 2

( )i

E Y b b X ve

eşitliklerini varyans tanımında yerine koyarsak

2 2 2

1 2 1 2( ) ( ) ( )

i i i uVar Y E b b X u b b X E u

ui lar sabit varyanslıdır. Yani hepsinin varyansı 2

u

sabit değerlidir. 2 2

( )i u

E u

Yani

2 2 2( ) ( ( )) ( )


3. Yi nin dağılımı normaldir.

Yi nin dağılımının biçimi, ui nin dağılımının biçimiyle

belirlenir ve bu dağılım varsayım gereğince normaldir. b1 ve

b2 sabit parametreler olmaları nedeniyle Yi nin dağılımını

etkilemezler. Ayrıca Xi açıklayıcı değişkenin değerleri de

varsayım gereğince değişmez değerler kümesinde olduğundan

Yi nin dağılım biçimini etkilemezler.

ÖRNEK REGRESYON DENKLEMİ

i21i XbbY

Katsayıların Tahmini

Normal Denklemler ile,

Doğrudan Formüller ile,

Ortalamadan Farklar ile,

Tüketim Gelir

75 80

88 100

95 120

125 140

115 160

127 180

165 200

172 220

183 240

225 260

NORMAL DENKLEMLER

SY = n + SX

SXY= SX + SX2

1b 2b

1b2b

SY=? , SX=? , SXY= ? , SX2= ? , n

75

88

95

125

115

127

165

172

183

225

Y

80

100

120

140

160

180

200

220

240

260

X YX X2

6000

8800

11400

17500

18400

22860

33000

37840

43920

58500

6400

10000

14400

19600

25600

32400

40000

48400

57600

67600

SY=1370 SX2=322000 SX=1700 SYX=258220

NORMAL DENKLEMLER

1370 = 10 + 1700

258220 = 1700 + 322000

-170 /

-232900 = -1700 - 289000

258220 = 1700 + 322000

25320 = 33000 2b

= 0.7672727

= 6.5636364

2b

1b

1b 2b

2b1b

1b 2b

2b1b

XY 7672727.05636364.6ˆ


i21i XbbY

22

2

1)X(Xn

XYXYXb

2)1700()322000.(10

)258220).(1700()1370).(322000(

= 6.5636364

DOĞRUDAN FORMÜLLER

DOĞRUDAN FORMÜLLER

222)X(Xn

YXXYnb

2)1700()322000)(10(

)1370)(1700()258220).(10(

= 0.7672727

XY 7672727.05636364.6ˆ


i21i XbbY

ORTALAMADAN FARKLAR

22x

xyb

XbYb 21

Syx=? Sx2=? y=? x=? ?X ?Y

Y

X

i

i

iiii

i

i

i

i

•

•

•

•

•

•

•

•

y

x

Y

Y

Y

Y

Y

0X X

( , )X Y

••

••

•

•

e

y =y -e = -Yi

y

N (X , Y )

i

i

ÖRD= =b +b X1 2

^^

^}

}

Ortalamalar Orijinine göre Örnek Regresyon Doğrusu

(ÖRD)

75

88

95

125

115

127

165

172

183

225

Y

80

100

120

140

160

180

200

220

240

260

X

-62

-49

-42

-12

-22

-10

28

35

46

88

-90

-70

-50

-30

-10

10

30

50

70

90

SY=1370 Sx=0 SX=1700

YYy XXx

Sy=0

137Y 170X

ORTALAMADAN FARKLAR

ORTALAMADAN FARKLAR

5580

3430

2100

360

220

-100

840

1750

3220

7920

8100

4900

2500

900

100

100

900

2500

4900

8100

3844

2401

1764

144

484

100

784

1225

2116

7744

x2 yx y2

Syx=25320 Sx2=33000 Sy2=20606

ORTALAMADAN FARKLAR

22x

xyb

33000

25320 = 0.7672727

XbYb 21 = 6.5636364 =137-(0.7672).(170)

XY 7672727.05636364.6ˆ


i21i XbbY

ELASTİKİYETLERİN HESAPLANMASI

i

i

Y

X .

dX

dY

X/X

Y/Ylim

EX

EYE

i

i

0xyx

•Nokta Elastikiyet

•Ortalama Elastikiyet

NOKTA ELASTİKİYET

0

i

Y

X .

ˆdX

dYE

0YX

0

i

Y

X .

ˆb2

X0 = 130

0Y

130 .

ˆ767.0E 130YX 0

NOKTA ELASTİKİYET

0Y 0 X0.76727275636364.6

(130) 0.76727275636364.6

3091.106

106.3091

130 .767.0E

130XY 00.94

ORTALAMA ELASTİKİYET

Y

X .

dX

dYE

XY

Y

X . b2

170X ; 137Y

137

170 . 767.0E

XY = 0.95

Tahminin Standart Hatası ve Varyansı

n

)YY(s

2

i S

n

e2

iS (n30 ise)

2n

)YY(s

2

ii

S

2n

e2

i

S (n<30 ise)

?Y S2

)YY( ?e2

S

Tahminin standart hatası, regresyon doğrusu etrafındaki

dağılımın bir ölçüsüdür.


i21i XbbY

ii X 7672727.05636364.6Y


Tüketim iY

67.9455

83.2909

98.6364

113.9818

129.3273

144.6727

160.0182

175.3636

190.7091

206.0545

75

88

95

125

115

127

165

172

183

225

80

100

120

140

160

180

200

220

240

260

Gelir iii YYe 2

ii

2

i )YY(e

7.0545

4.7091

-3.6364

11.0182

-14.3273

-17.6727

4.9818

-3.3636

-7.7091

18.9455

49.7666

22.1755

13.2231

121.4003

205.2707

312.3253

24.8185

11.3140

59.4301

358.9302

1370Yi SSY=1370 Se=0 Se2=1178.6545


2-10

1178.6545s 147.3318 =12.138

s2= 147.3318

2n

YXbYbYs 21

2

SSS

210

)258220(7672727.0)1370(5636364.6208296s

SY2 =? SY = ? SYX=? b1 =? b2 =?

= 12.138


2n

yxbys 2

2

SS

YYy XXx Sy2 = ? Syx = ? b2= ?

210

)25320(7672727.020606s

= 12.138

DEĞİŞKENLİKLER

S2

)YY( S2

)YY( 2)YY( S

Y

X

X

Y

Yi

Xi

S2

)YY(2

)YY( S

2)YY( S

2

y 2

y 2

e

DEĞİŞKENLİKLER

2)YY( S 2

)YY( S 2)YY( S

Sy2=20600 3455.19427y2

S Se2=1178.6545

3844

2401

1764

144

484

100

784

1225

2116

7744

49.7666

22.1755

13.2231

121.4003

205.2707

312.3253

24.8185

11.3140

59.4301

358.9302

4768.5302

2884.6664

1471.7686

529.8367

58.8707

58.8707

529.8367

1471.7686

2884.6664

4768.5302

DEĞİŞKENLİKLER

S2

)( YY S2

)YY( 2)ˆ( YY S

Sy2 = 2

yS Se2 +

S

S

S

2n

e

2n

y

2n

y222

22

ˆ

2sss yy

20606 = 19427.3455 + 1178.6545

210

6545.1178

210

3455.19427

210

206062575.75 = 2428.4182 + 141.3318

varyanslar

BELİRLİLİK KATSAYISI

Noktaların doğruya yakınlık derecesini göstermektedir.

Y’deki değişmelerin yüzde kaçının X tarafından

açıklanabildiğini ifade etmektedir.

R2 0 ile 1 arasında değişmektedir.

KORELASYON KATSAYISI

Y ile X arasındaki ilişkinin yönünü ve şiddetini

vermektedir.

-1 ile +1 arasında yer almaktadır.


varyansToplam

varyansAçıklanan

s

sr

2

y

2

y2

varyansToplam

an varyansAçıklanmay

s

sr1

2

y

22

varyansToplam

an varyansAçıklanmay

s

s1r

2

y

22

75.2575

4182.2428 = 0.9428

75.2775

3318.1471 = 0.9428

75.2575

3318.147 = 0.0572

S

S2

2

)(

)(

YY

YY2

2

)(

)ˆ(

YY

YY

S

S2

2

)(

)ˆ(

YY

YY

S

S

2

2

2

2

2

2 ˆ

y

e

y

y

y

y

2

2

2

2ˆ

y

e

y

y

TD

HBD

TD

RBD

TD

TD

2

2

21

y

er

2

2

21

y

er Belirsizlik katsayısı


22

22

yx

)xy( r

SS

S

)20606)(33000(

)25320(

2

= 0.9428

22yx

xy r

SS

S

)20606)(33000(

25320 = 0.9710

DAĞILMA DİYAGRAMLARI

Y

X

•

•

• •

•

•

•

•

•

•

•

••

15

10

5

15

105 20

3

Y=3+0.5X

r=0.82

s=1.94

-6

Y

X15

10

5

15

105 20

3

Y=3+0.5X

r=0.82

s=1.94

-6

Y

X15

10

5

15

105 20

3

Y=3+0.5X

r=0.82

s=1.94

-6

Y

X15

10

5

15

105 20

3

Y=3+0.5X

r=0.82

s=1.94

-6

(d)(c)

(b)(a)

••

••

•

•

• •

•

•

Aşırı kıymet

•••

•

STANDARTLAŞTIRILMIŞ HATA TERİMLERİ

0.5812

0.38796

-0.29959

0.90774

-1.18037

-1.45598

0.41043

-0.27712

-0.63512

1.56084

7.0545

4.7091

-3.6364

11.0182

-14.3273

-17.6727

4.9818

-3.3636

-7.7091

18.9455

80

100

120

140

160

180

200

220

240

260

ei ei/s Xi

e/s 'nin dağılma diyagramı

-2

0

2

60 100 140 180 220 260

EKK Tahminlerinin Standart Hataları ve

Kullanılışı

EKK tahminleri ve örnek verilerine dayanarak hesaplanır.

Bir anakütleden bir çok örnek çekilebilir, bu durumda her örnek seti

için farklı tahminciler elde edilecektir. Örnek değerlerinin anakütle

değerleri b1 ve b2 ye ne ölçüde yakın olduğu standart hatalarla

hesaplanır.

Standart hata, tahmincinin örnekleme dağılımının standart

hatasıdır.

1b2b

Bir tahmincinin örnekleme dağılımı anakütleden seçilebilecek aynı

büyüklükteki örneklerin lerin dağılımıdır. (75 milyar)

60 hanelik anakütleden çekebileceğimiz onluk (75 milyar) örnek için

hesaplanan değerlerinin örnekleme dağılımı ortalama

etrafında normal dağılmaktadır.

Anakütleden çekilen örnekler için hesaplanan EKK leri

örneklerin farlı değerli Y(tüketim) ve X(gelir gibi) e sahip

hanelerden oluşması gibi örnekleme hatalarından dolayı gerçek

değerinden farklıdır.

b

2b )ˆ( 2bE

2b

2b

Örnekleme hataları + ve – yönde aynı ihtimalle ortaya çıkan

hatalardır. Ortalama ölçüsü standart hatadır.

En Küçük Karalerle Parametre Tahminlerinin

Ortalama ve Varyansı

1b ’in ortalaması:

1 1ˆ( )E b b

1b ’in varyansı:

2

2 2

1 1 1 2ˆ ˆ( ) ( ) .

i

u

i

XVar b E b b

n x

2b ’nin ortalaması:

2b ’n'in varyansı:

2 2ˆ( )E b b

2 2

2 2 2 2

1ˆ ˆ( ) ( ) .u

i

Var b E b bx

Katsayıların Standart Hataları

2

2

1xn

X . s)b( s

S

S

22

x

s)b( s

S

)33000.(10

322000 . 138.12 = 11.99

33000

138.12 = 0.0668

Aralık Tahminleri

± t a/2 . s( ) 1b 1b

±t a/2 . s( ) 2b 2b = 0.7672727 2.306 (0.0668)

0.6132319< b2 <0.9213135

= 6.5636364 2.306 (11.99)

-21.0853 < b1 < 34.2126

Hipotez Testleri

0.6132319< b2 <0.9213135

-21.0853 < b1 < 34.2126

Güven Aralığı Yaklaşımı İle

Hipotez Testleri

Anlamlılık Testi Yaklaşımı İle

•Hipotezlerin Formüle Edilmesi

•Tablo Değerlerinin Bulunması

•Test İstatistiğinin Hesaplanması

•Karar Verilmesi

Hipotez Testleri

1.Aşama H0: b2 = 0

H1: b2 0

2.Aşama a = ? = 0.05 ; S.d.=? = n-k = 10-2=8

3.Aşama

ta,sd =? t0.05,8=? =2.306

?)b(s

bbt

2

*

22hes

0668.0

07672727.0 =11.4861

4.Aşama |thes= 11.4861 | > |ttab= 2.306 |

H0 hipotezi reddedilebilir

Regresyon ve Varyans Analizi

Değişkenlik KaynağıSapma Kareleri

Toplamı=SKT

Serbestlik

Derecesi=sd

SKT Ortalaması=

SKTO

Regresyona Bağlı

Değişkenlik=RBDS

2y f1=k-1=1 S

2y

Hata Terimine Bağlı

Değişkenlik=HBD Se2 f1=n-kkn

e2

=s

2

Toplam

Değişkenlik=TD Sy2 n-1

Regresyon ve Varyans Analizi

Değişkenlik

KaynağıSKT sd SKTO

RBD 19427.3455 2-1=1 19427.3455

HBD 1178.6545 10-2=8 147.3318

TD 20606 10-1=9 Fhes=3318.147

3455.19427=131.8612

EKK Modelinde Önceden Tahmin

•İleriye Ait Tahmin

•Önceden Tahmin

•Örnekten Tahmin Edilen İlişkinin Ayni Kaldığı

•X Değerlerinin Aynı Eğilimde Olacağı

Y’nin Aralık Tahmini

0Y ± ta/2 . s 2

20

x

)XX(

n

11

0Y ± ta/2 . s )Y( 0 Y0’ın güven aralığı

Y’nin Aralık Tahmini

0 Y ˆ X0=80 = 67.9455

67.9455 ±2.306. 12.318

2

33000

) 80 (

10

1 1

170

35.47840 Y0| X0 100.41251

Y’nin Ortalamasının Aralık Tahmini

0 Y ˆ ± t a /2 . s

2

2

0

x

) X X (

n

1

0Y ± ta/2 . s )Y( 0 Y’nin ortalamasının güven aralığı

Y’nin Ortalamasının Aralık Tahmini

0 Y ˆ X0=80 = 67.9455

67.9455 ±2.306. 12.318

2

33000

) 80 (

10

1 170

51.49402 E(Y0| X0) 84.39689

Y’nin Güven Aralıkları

35.47840

52.01572

68.28577

84.26359

99.93034

115.27579

130.29996

145.01304

159.43390

173.58749

100.41251

114.56610

128.98696

143.70004

158.72421

174.06966

189.73641

205.71423

221.98428

238.52160

80.00

100.00

120.00

140.00

160.00

180.00

200.00

220.00

240.00

260.00

51.49402

69.33821

86.90184

103.99618

120.34284

135.68829

150.03254

163.62911

176.75639

189.60311

84.39689

97.24361

110.37089

123.96746

138.31171

153.65716

170.00382

187.09816

204.66179

222.50598

X0 Alt Sınır Üst Sınır Üst Sınır Alt Sınır

Y’ninAralık Tahminleri Y’nin OrtalamasınınAralık

Tahminleri

X

3002001000

Y 240

220

200

180

160

140

120

100

80

60

40

20

0

En Küçük Kareler Tahminlerinin Özellikleri

Genellikle bir tahminin ana kütle parametresinin gerçek

değerine yakın olması ve bu gerçek parametre

yakınlarında dar bir aralıkta değişmesi istenir. Ana kütle

parametresine ‘yakınlık’ çeşitli ekonometri tahmin

yöntemleri ile bulunmuş tahminlerin örnekteki

dağılımların ortalaması ve varyansıyla ölçülür.

1. Tahmin Edicilerin Küçük Örnek Özellikleri

Burada her zamanki varsayımsal yenilemeli

örnekleme süreci kullanılır, yani her biri n

gözlemli çok sayıda örneğin alındığı varsayılır.

Ekonometri yöntemlerinin her birini kullanarak her

örnekten hesaplanıp dağılımları oluşturulur.

Küçük örnekten bulunmuş iyi bir tahmin edici için

temel ölçütler:Sapmasızlık, En küçük varyans,

Etkinlik, Doğrusal en iyi, sapmasızlık (DES), En

küçük ortalama hata karesi (OHK), Yeterlilik

dir.

b

En Küçük Kareler Tahminlerinin Özellikleri

a. Sapmasız Tahmin Edici

Bir tahmin edicinin sapması, beklenen değeriyle

gerçek parametre arasındaki fark olarak tanımlanır.

Sapma= -b

Eğer sapma sıfırsa yani = b ise, sapmasız olur.

Bu da örneklerin sayısı artıkça, sapmasız tahmin

edicinin, parametrenin gerçek değerlerine yaklaştığı

anlamına gelir. Sapmasız bir tahmin edici ‘ortalama

olarak’ parametrenin gerçek değerini verir.

Aranan bir özellik olmasına karşın, sapmasızlık

kendi başına çok önemli değildir. Ancak küçük bir

varyansla birleşirse önemli olur.

)ˆ(bE

)ˆ(bE

, b’nin sapmalı tahmin edicisidir

, b’nin sapmasız tahmin edicisidir

b b

a. Sapmasız Tahmin Edici

b. En Küçük Varyanslı Tahmin Edici (En İyi Tahmin

Edici)…

Bir tahmin, başka ekonometri yöntemleriyle bulunmuş başka

herhangi bir tahminle karşılaştırıldığında en küçük varyansa sahip

olduğu görülürse en iyi tahmindir. nin en iyi olma koşulu:

<

Ya da;

Var( )<Var( )

Burada , gerçek parametre b nin (sapmasız olması gerekmeyen)

herhangi bir başka tahminidir.

b

2)]ˆ(ˆ[ bEbE 2

)]~

(~

[ bEbE

b b~

b~

Varyansı küçük olduğu halde sapması büyük olan bir tahmin

edici, gerçek b parametresinden oldukça uzak bir değer

etrafında toplanabilmektedir.

, b nin büyük varyanslı sapmasız tahmin edicisidir.

, b nin küçük varyanslı sapmalı bir tahmin edicisidir.

b

b~

b. …En Küçük Varyanslı Tahmin Edici (En İyi Tahmin Edici)

c. Etkin Tahmin Edici

Bir tahmin edici; sapmasız ve başka herhangi sapmasız

tahmin ediciyle karşılaştırıldığında daha düşük varyansa

sahipse etkin tahmin edicidir.

Aşağıdaki iki koşul yerine getirilirse etkindir:

(i)

ve

Burada , gerçek b nin başka bir sapmasız tahmin

edicisidir. Başka bir deyişle, etkin tahmin edici, bütün

tahmin sapmasız ediciler sınıfı içinde en düşük (en iyi)

varyansa sahip olan tahmin edicidir.

b

bbE )ˆ(

2**2)]([)]ˆ(ˆ[ bEbEbEbE

*b

(ii)

d. Doğrusal Tahmin Edici…

Bir tahmin edici, örnekteki gözlemlerin doğrusal bir

fonksiyonuysa doğrusal sayılır. Örnek gözlemleri

veriyken, doğrusal bir tahmin edici şu biçimi alır:

Burada ki ler sabit değerlerdir.

Örneğin

olduğundan

örnek ortalaması doğrusal bir tahmin edicidir. Çünkü:

1 1 2 2...

n nk Y k Y k Y

Y

1 2

1...

nk k k

n

1 2 1 2

1 1 1 1 1... ... )

i

i n n

YY Y Y Y Y Y Y Y

n n n n n n

örnek ortalaması hesaplanırken her gözleme, 1/n ye eşit olan

aynı k ağırlığı verilmiştir.

Y

d...Doğrusal Tahmin Edici…

e. Doğrusal en iyi sapmasız tahmin edici

(DEST)

Bir tahmin edici, doğrusalsa sapmasızsa ve gerçek

b nin öteki doğrusal sapmasız tahmin edicileriyle

karşılaştırıldığında en küçük varyansa sahipse,

DEST olur.

f. En küçük ortalama hata kareli (OHK)

tahmin edici

Ortalama hata karesi ölçütü, sapmasızlık ve en küçük

varyans özelliklerinin bir bileşimidir. Burada OHK, tahmin

edicinin, ana kütledeki gerçek parametre b ile olan farkının

karelesinin beklenen değeri olarak tanımlanır:

OHK nin, tahmin edicinin varyansıyla sapma karesinin

toplamına eşit olduğu gösterilebilir:

2ˆ ˆ( ) ( )OHK b E b b

)ˆ()ˆ()ˆ(2

bsapmabVarbOHK

2 2

ˆ ˆ ˆ ˆ ˆ ˆ( ) ( ) 2 [ ( )][ ( ) ]E b E b E b b E b E b E b b

2ˆ( )OHK E b b

2

ˆ ˆ ˆ( ) ( )E b E b E b b

2ˆ ˆ ˆ( ) ( )E b E b Var b

2

2ˆ ( )E b b sapma b

f… En küçük ortalama hata kareli (OHK)

tahmin edici…

İspat:

ˆ ˆ ˆ[ ( )][ ( ) ] 0E b E b E b b

2

ˆ ˆ ˆ ˆ ˆ( ) ( ) ( )E bE b E b bb bE b

2 2

ˆ ˆ ˆ ˆ( ) ( ) 0E b E b bE b bE b

)ˆ()ˆ()ˆ(2

bsapmabVarbOHK

Çünkü:

f. En küçük ortalama hata kareli (OHK)

tahmin edici

g. Yeterli tahmin edici

Yeterli bir tahmin edici, gerçek parametre

hakkında bir örneğin içerdiği bütün bilgileri

kullanıma koyan bir tahmin edicidir. Bu başka

hiçbir tahmin edicinin, tahmin edilmekte olan

gerçek ana kütle parametresi hakkında daha fazla

bilgi sunamayacağı anlamına gelir.

2. Tahmin edicilerin büyük örnek

özellikleri: Asimtotik özellikler

Büyük örnek özelliklerinin, bir tahminin iyiliğini

belirleme ölçütü olarak kullanılması, örneğin

sonsuz büyük olmasını gerektirir. İşte bu nedenle

bu özelliklere asimtotik özellikler denir. Örnek

büyük olduğu zaman bu özelliklerin yaklaşık

olarak sağlandığı varsayılır. Özellikler ise

şunlardır: asimtotik sapmazlık, tutarlılık ve

asimtotik etkinlik.

Asimtotik dağılım:

Bir dizi rassal değişken düşünüldüğünde;

Bunlardan her birinin kendi dağılımı, ortalaması ve

varyansı vardır. Dağılımlar gitgide artan örnek

büyüklüklerinden oluşturulmuştur. nT sonsuza

giderken bu dağılımlar da belli bir dağılıma doğru

yaklaşıyor olabilirler. İşte bu dağılıma {X(n)} dizisinin

asimtotik dağılımı denir.

2...Tahmin edicilerin büyük örnek

özellikleri: Asimtotik özellikler

( ){ } .T1 2

nn n nX X X X

a. Asimtotik sapmasızlık…

Bir tahmincinin asimtotik sapması, asimtotik

ortalaması ile gerçek parametre arsındaki farka eşittir.

b

ˆlim ( )

nn

E b b

ˆ '

ˆlim ( )n

n

b nin

asimtotik E b b

sapması

Eğer edicisinin asimtotik ortalaması, ana kütlenin

gerçek b parametresine eşit ise, bu tahmin edici, bu

parametrenin asimtotik sapmasız tahmin edicisidir.

Eğer bir tahmin edici (sonlu küçük örneklerde)

sapmasızsa aynı zamanda asimtotik sapmasızdır,

ama bunun tersi doğru değildir.

a… Asimtotik sapmasızlık

Asimtotik bir sapmasız tahmin edici, örnek

büyüklüğü yeterine büyük olduğunda sapması

kaybolan bir tahmin edicidir.

b. Tutarlılık…

ˆ,b

b

ˆlim ( )

nn

E b b

ˆlim ( ) 0n

Var b

Bir edicisi, aşağıdaki iki koşulla, ana kütlenin b

gerçek parametresinin tutarlı bir tahmin edicisidir:

1. asimtotik sapmasız olmalıdır.

2. n sonsuza giderken 'nin varyansı sıfıra yaklaşmalıdır:

b

Eğer varyans sıfırsa, dağılım ana kütlenin gerçek

parametresinin üstünde bir noktada toplanır.

Bir tahmin edicinin tutarlı olup olmadığını anlamak için, n

arttıkça sapmanın ve varyansının ne olduğuna bakılmalıdır.

(n) büyüdükçe hem sapma hem varyans azalmalı ve limitte

( iken) sıfır olmalıdır. Tutarlılık kavramı aşağıda

çizilmiştir. Örnek büyüklüğü artıkça hem sapma hem

varyans azalmaktadır.

n

Tutarlılık…

c. Asimtotik etkinlik

Eğer

(1) tutarlıysa

(2)Başka herhangi bir tutarlı tahmin ediciye göre daha küçük

bir asimtotik varyansı varsa

bu tahmin edici ana kütlenin gerçek b parametresinin

asimtotik etkin bir tahmincisidir.

Eğer;

ise asimtotik etkindir. Burada , b nin başka bir tutarlı

tahmin edicisidir. Tutarlı tahmin ediciler

karşılaştırıldığında hangisinin varyansı daha hızla

sıfıra yaklaşıyorsa o, asimtotik etkendir.

b

21 ˆlim ( )

nn

E n b bn

2*lim

1bbE

nn

n

b *b

3. En Küçük Kareler Tahmin Edicilerinin

Özellikleri

Hata terimi u'nun bazı genel varsayımları yerine

getirmesi, yani ortalamasının sıfır ve varyansının

sabit olması koşuluyla, en küçük kareler

tahmincilerinin DES ( doğrusal, en iyi,

sapmasız) özelliklerini sağlamasına Gauss-Markow

en küçük kareler teoremi denmektedir.

a. Doğrusallık

En küçük kareler tahminleri ve gözlenen örnekteki Yi

değerlerinin doğrusal fonksiyonlarıdır. Varsayım gereği Xi ler

hep aynı değerlerle göründüklerine göre en küçük kareler

tahminlerinin yalnız Y değerlerine bağlı olduğu gösterilebilir.

1b 2b

2 2ˆ i

i i i

i

xb Y k Y

x

2

ii

i

xk

x

1ˆ ( )b f Y

2ˆ ( )b f Y

İspat:

Varsayım gereği X değerleri sabit değerler kümesidir. Bu

durumda ki lerde örnekten örneğe değişmezler.

Bu durumda şunu yazabiliriz:

2 1 1 2 2ˆ ... ( )

i i n nb k Y k Y k Y k Y f Y

2b Y’lerin doğrusal bir fonksiyonudur. Bağımlı değişken

değerlerinin doğrusal bir bileşimidir.

1

1ˆ [ ]i i

b Xk Yn

X ve ki Örnekten örneğe değişmez.

katsayı tahmini sadece Y ye bağlıdır.

…Doğrusallık

b. Sapmasızlık

ve nin sapmasızlık özelliği ve

şeklindedir. Bu özelliğin anlamı, örneklerin sayısı

artıkça tahminler de parametrelerin gerçek

değerine yaklaşır. Başka bir deyişle, n sayıda Y ve

X gözleminden oluşan, olanak içindeki bütün

örnekleri seçildiğinde ve ile

tahminleri her örnek için hesaplandığında, bu

tahminlerden çok fazla sayıda elde edilir. Bunların

ortalaması ise ilişkinin parametrelerine eşit olur.

Tahminlerin dağılımı, orta nokta olarak

parametrenin gerçek b değeri üzerinde

toplanacaktır.

1b 2b 2 2ˆ( )E b b1 1

ˆ( )E b b

1b2b

c. En Küçük Varyans

Gauss-Markow teoremi ispatı: Bu teoreme göre en küçük

kareler tahminleri, başka ekonometri yöntemleriyle

bulunmuş herhangi bir başka doğrusal sapmasız tahmin

ediciler arasında en iyisidir ( varyansı en küçük olandır).

EKK yönteminin tercih edilmesinin temel nedeni de bu

özelliktir.

İkİ deĞİŞkenlİ basİt doĞrusal regresyon modelİkisi.deu.edu.tr/emrah.gulay/bdrm.pdfİkİ...

Documents