ikonometriq 7 10.11

9
Свойства на оценките За да се оценят параметрите на моделите се използват данни от представителни извадки. Оценките на параметрите имат вероятностен характер, не може да се твърди, че получените оценки напълно ще съвпадат с истинския параметър. Ако съществуват различни оценки на параметрите е необходимо да се изведат критерии според които една оценка може да се предпочете пред друга. Тези критерии са следните : 1. Неизместеност на оценката – една оценка е неизместена, ако нейното математическо очакване е равно на оценявания параметър. E( ) = това ще рече, че ако се направят много на брой извадки и за всяка от тях се изчисли отделна оценка тогава средната от тези параметри ще клони към истинския, към оценявания параметър. 2. Ефективност на оценките – една оценка е толкова по – ефективна, колкото по –малка дисперсия има тя. Това твърдение е вярно само тогава, когато оценката е неизместена. 3. Състоятелност – означава как оценката реагира при промяна на обема на извадката. Колкото е по – голям обема на извадката, толкова точността е по – голяма при равни други условия. 4. Достатъчност (изчерпателност) – една оценка е достатъчна, ако тя изчерпва цялата информация, която се съдържа в една извадка. Тези критерии са необходими, за да се разгледа какво се случва при пропускане на важни променливи и включване на излишни и неподходящи променливи в многофакторните иконометрични модели. До този момент като цяло са разглеждани модели, в които е направено допускането, че в модела са включени всички важни променливи, които обясняват резултативната променлива без нито една излишна

Upload: unssss

Post on 27-Mar-2015

413 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: ikonometriq 7 10.11

Свойства на оценките

За да се оценят параметрите на моделите се използват данни от представителни извадки. Оценките на параметрите имат вероятностен характер, не може да се твърди, че получените оценки напълно ще съвпадат с истинския параметър. Ако съществуват различни оценки на параметрите е необходимо да се изведат критерии според които една оценка може да се предпочете пред друга. Тези критерии са следните :

1. Неизместеност на оценката – една оценка е неизместена, ако нейното

математическо очакване е равно на оценявания параметър. E( ) = това ще рече,

че ако се направят много на брой извадки и за всяка от тях се изчисли отделна оценка тогава средната от тези параметри ще клони към истинския, към оценявания параметър.

2. Ефективност на оценките – една оценка е толкова по – ефективна, колкото по –малка дисперсия има тя. Това твърдение е вярно само тогава, когато оценката е неизместена.

3. Състоятелност – означава как оценката реагира при промяна на обема на извадката. Колкото е по – голям обема на извадката, толкова точността е по – голяма при равни други условия.

4. Достатъчност (изчерпателност) – една оценка е достатъчна, ако тя изчерпва цялата информация, която се съдържа в една извадка.

Тези критерии са необходими, за да се разгледа какво се случва при пропускане на важни променливи и включване на излишни и неподходящи променливи в многофакторните иконометрични модели. До този момент като цяло са разглеждани модели, в които е направено допускането, че в модела са включени всички важни променливи, които обясняват резултативната променлива без нито една излишна променлива. На практика обаче това почти никога не е така. Има различни ситуации:

1. Пропуснати важни променливи в един иконометричен модел – нека да

предположим, че истинският модел има следния вид y = + + . Да

предположим също така че в този модел е пропуснат факторът и вместо

реалния модел е оценен следния модел y = + . Тогава оценката на

параметъра ще бъде следната = / . Ако заместим Y от горното

уравнение в тази формула ще се получи следното : = ( + + )/

Page 2: ikonometriq 7 10.11

= + Математическото очакване на последната част обаче е 0 E( ) =

0. Поради това ако вземем двете страни на равенството и математическото

очакване ще се получи следното E( = + + . Където се намира по

следната формула = / . И представлява параметър, изчислен от

регресията на от . Тези формули са необходими за да се направи следния

извод : е изместена оценка на истинския (реалния) параметър като

изместването е равно на . Ако означим оценката на параметъра от

истинското уравнение y = + + по следния начин , тогава дисперсията

на този параметър може да се запише по следния начин var ( ) = / )

= . От друга страна, тъй като ние реално сме използвали модел 2 (модела

с пропуснатата променлива) то дисперсията на нашия модел на параметъра ще

бъде следната var ( ) = / . От това равенство се вижда, че има по – малка

дисперсия. А когато една оценка има по – малка дисперсия, то тя е ефективна

(второ свойство). Изводът е, че въпреки, че оценката на параметъра е

изместена, то тя е ефективна, когато имаме пропусната важна променлива.

Съответно тя е ролкова по ефективна колкото е по – голямо число. Разбира се,

този извод е валиден, ако се направи допускането, че двете дисперсии са равни (от написаните).

2. Включване на излишна променлива в модела – за да проследим какво се случва

при включването на излишни променливи ще запишен оценката на параметрите

и като направим следното допускане: истинският модел ще бъде следния y =

+ (модел 1). Въпреки това поради някакви причини сме оценили и следния

модел y = + + (модел 2), като сме включили излишна променлива .

По този начин оценката на параметрите и на втория модел, ще бъдат

Page 3: ikonometriq 7 10.11

следните = - / = - / ,

където =

=

=

=

Ако наистина първия модел е истинския модел, то математическото очакване на

е равно на E( ) = и математическото очакване на е E ( = .

Когато заместим в тези формули се получава, че E( ) = E( ) = 0. Изводът от

тези формули е следния – включването на излишна променлива не води до изместване на оценките на параметрите т.е. оценките остават неизместени

въпреки, че е включена излишна променлива. Дисперсията на параметъра е

равна на следното Var( ) = / . Поради факта обаче, че сме включили излишна

променлива то дисперсията ще бъде следната Var( ) = / (1 - ), където

е коефициента на корелацията на и . По този начин може да се каже, че

втората дисперсия е по – голяма от първата Var( ) = Var( ) освен ако R

(коефициента на кореалция) е 0. Така може да се направи извода, че включването на излишна променлива води до неефективна оценка.

Тест на ВалдТестът на Валд се изполва при едновременната проверка на два или повече параметъра от модела. Например – ако имаме един n – факторен модел и от този модел е необходимо да се извърши проверка дали два или три параметъра едновременно са равни на 0, тази проверка може да бъде извършена с помощта на теста на Валд. Друг случай, в който може да се използва тест на Валд е

например при производствените функции като Кот-Дъгласовата функция =

+ – тази функция използва двата фактора К е капитал, L е работна сила, A,

Page 4: ikonometriq 7 10.11

L и са параметри на модела. При тази функция една от известните проверки на

хипотези е следната : дали при L + са равни, по- големи или по – малки от 1. За да

се извърши тази проверка се използва теста на Валд, когато е равно 1 е налице производство с постоянна ефективност, ако е по – голямо е производство с нарастваща ефективнот и ако е по – малко – с намаляваща ефективност. Тестът на Валд преминава през следните етапи:

1) Дефиниране на 0-лева и алтернативна хипотеза. 2) Определя се риска за грешка L (0,05)3) Набавя се информация, изчислява се емпирична характеристика по

следната формула W = n /1- . Теоретичната характеристика се взема от

Xи квадрат разпредлението с К степени на свобода , където К е броят на

параметрите, които се изследват. Съответно ако емпиричната характеристика е по - голяма от теоретичната се приема алтернативната хипотеза, в противен случай се приема 0-левата.

Проблеми в иконометричните модели

ХетероскедасцититетЕдно от основните изисисквания за случайния компонент е те да имат постоянна

дисперсия, тя е известна още като хомоскедасцититет или хомоскедастичност. Хетероскедастичност има тогава, когато дисперсията на остатъците е непостоянна.

Най – общо може да се каже, че ако реда се раздели на части и за отделните части се изчисли дисперсията, то те трябва да бъдат равни, за да е налице хомоскедастичност.

< x

Page 5: ikonometriq 7 10.11

Възможно е между случайния компонент и Х да не съществува корелация поради

обстоятелството, че мени положителните и отрицателните стойности, но въпреки това

да съществува хетероскедастичност, тъй като между Х и същестува корелация. Тестове

за хетероскедастичност:

1. Ресет тест (RESET) – тест на Рамзи – от оценявания модел = + + … + +

се конструира една спомагателна регресия (спомагателен модел), в който се

представя като зависима променлива от втората, третата и по – висока степени на

Y. става зависима променлива и се предтавя като = f( , …) . В този

спомагателен модел, ако параметрите са значими това е сигнал за наличието на хетероскедастичност. Тестът на Рамзи е универсален, тъй като освен наличието на хетероскедастичност, проверява и грешки в спесификацията на модела.

2. Тест на Уайт – при този тест случайният компонент се представя отново като зависима променлива от всички фактори, техните квадрати и евентуално от тяхното смесено произведение. При теста на Уайт факторите ще бъдат следните –

да си представим, че имаме двуфакторен модел , , тогава факторите ще бъдат

, , , , . Отново се появява значимостта на параметрите.

3. Тест на Глейзър – този тест се конструирт следните 3 модела се представя като

зависима променлива от:

| | = + модел 1

| | = + модел 2

| | = + модел 3

Отново проверката е дали е равен на 0.

Последици от наличието на хетероскедастичност:

1) Оценките на параметрите по метода на най – малките квадрати са неизместени, но и неефективни при наличието на хетероскедастичност.

2) Оценките на самото разсейване – разсейването е изместено. Като по този начин тестовете за значимост на параметрите стават невалидни (Т-теста става

Page 6: ikonometriq 7 10.11

невалиден). Нека да разгледаме следния модел = + Var( ) = .

Оценката на параметъра по метода на най- малките квадрати ще бъде следната

= = + . Ако предположим, че математическото

очакване на е 0 и и Х са независими помежду си, тогава математическото

очакване на последния компонент ще бъде равен на 0 т.е. E( ) = т.е. налице е

неизместена оценка. Дисперсията на параметъра е равна на Var( ) = 1/

+ + … + ), където = или за кратко Var( ) =

).

Как може да се предпазим от наличието на хетероскедастичност: Най – често използваният начин е като се използва претеглен метод на най – малките квадрати за оценка на параметрите на модела. Нека да предположим, че дисперсията може да се

предтави по следния начин = (z-тегло). Тогава обикновения модел може да се

запише по следния начин / = + , където е новият случаен компонент, който е

= / и презумцията е, че има вече постоянна дисперсия.

Основна причина за съществуването на хетероскедастичността обикновено е разлика в мащабите на отделните единици. Например ако за единици използваме отделните страни и се конструира модел за връзката между БВП и инвестиции, то логично е да се очаква, че страни като САЩ, Япония от една страна с големи инвестиции и БВП, и други малки страни като България, ще се появи наличието на такава хетероскедастичност. Неутрализирането на този ефект от мащаба в този пример евентуално би могло да стане чрез използването на тегло Z, което например да бъде населението на съответната страна. По този начин вместо за БВП на страната ще се работи с БВП на човек от населението.

Page 7: ikonometriq 7 10.11

Нека = )( / ) / = + E( ) = . По този

начин показваме, че оценката е неизместена. За да покажем, че е ефективна дисперсията

на Var( ) =

Var( ) =

= 1 само ако Z е константа

< 1 оценките получени от претегления метод на най – малките квадрати са по – ефективни от обикновените

Изводът е, че претегления метод на най- малките квадрати дава неизместени и ефективни оценки.