Подобряване на качеството на модела

52
Подобряване на качеството на модела • Качество на модела • Включване и изключване на променливи • Тестване на ограничения за коефициентите • Стабилност на модела

Upload: burton

Post on 20-Jan-2016

72 views

Category:

Documents


0 download

DESCRIPTION

Подобряване на качеството на модела. Качество на модела Включване и изключване на променливи Тестване на ограничения за коефициентите Стабилност на модела. Въпроси на качеството с практическо значение. Кои са характеристиките на добрия модел - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Подобряване на качеството на модела

Подобряване на качеството на модела

• Качество на модела

• Включване и изключване на променливи

• Тестване на ограничения за коефициентите

• Стабилност на модела

Page 2: Подобряване на качеството на модела

Въпроси на качеството с практическо значение

• Кои са характеристиките на добрия модел

• Какви са възможните грешки, ако разработения модел се отличава от “идеалния” – грешки на спецификацията на модела

• Какви са последиците от тях• Как да се открият грешките от лоша

спецификация на модела

Page 3: Подобряване на качеството на модела

Добрият модел е: (по Харви)

• Достатъчно опростен, но запазващ характеристиките на процеса

• Еднозначно решен спрямо дадена извадка

• С възможно най-висок коефициент на детерминация

• Верифициран с икономическата теория• Направената прогноза и действителната

реализация са близки

Page 4: Подобряване на качеството на модела

Възможните грешки -спецификация на модела

• Некоректна спецификация– Има пропусната ключова праменлива– Има включена излишна променлива– Избрана е некоректна функционална

форма

Page 5: Подобряване на качеството на модела

Грешки на спецификацията

• Пропуснат съществен фактор – лоша спецификация– Няма специализирани тестове

– Индиректно – коефициента на детерминация

– Тестове за добавяне на променлива

Page 6: Подобряване на качеството на модела

Пропуснат фактор - последици

• Пропуснатия фактор се корелира с включени в модела фактори– Некоректна оценка на коефициентите –коректния

коефициент ще бъде по-голям от оценката при позитивна корелация и обратно

– Некоректен свободен член (дори и ако пропуснатия фактор не се корелира с фактор от модела)

• Некоректно оценена стандартна грешка на модела

• Намаляване силете на тестовете – некоректни заключения

Page 7: Подобряване на качеството на модела

2-Apr-2002 10:02:02 Ordinary Least Squares Estimation ****************************************************************************** Dependent variable is Q12105 50 observations used for estimation from 1995M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C .22785 .052291 2.5552[.000] T -.3225E-3 .2771E-3 -.57589[.502] P12105 -.2913E-3 .5808E-3 -.82592[.001] P12102 -.7579E-3 .2930E-3 -1.5577[.125] P12103 -.8552E-3 .2350E-3 -3.5287[.001] P12104 .0012251 .5052E-3 2.8525[.005]

****************************************************************************** R-Squared .62522 R-Bar-Squared .58089 S.E. of Regression .234218 F-Stat. F( 5, 53) 30.5201[.000] Mean of Dependent Variable .31225 S.D. of Dependent Variable .170551 Residual Sum of Squares .055735 Equation Log-likelihood 119.3572 Akaike Info. Criterion 112.3572 Schwarz Bayesian Criterion 105.0272 DW-statistic 1.5925 ******************************************************************************

Page 8: Подобряване на качеството на модела

2-Apr-2002 10:02:02 Ordinary Least Squares Estimation ****************************************************************************** Dependent variable is Q12105 50 observations used for estimation from 1995M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C .22785 .052291 2.5552[.000] T -.1275 .1012771 -.57589[.002] P12105 -.2913 .0075808 -.82592[.035] P12102 -.3254 .0562930 -1.5577[.075] P12103 -.1236 .0092350 -3.5287[.001] P12104 .0875 .0245052 2.8525[.002] INCOME .2150 .1002592 8.2892[.000]****************************************************************************** R-Squared .77522 R-Bar-Squared .75089 S.E. of Regression .035218 F-Stat. F( 5, 53) 30.5201[.000] Mean of Dependent Variable .31225 S.D. of Dependent Variable .010551 Residual Sum of Squares .055735 Equation Log-likelihood 119.3572 Akaike Info. Criterion 112.3572 Schwarz Bayesian Criterion 105.0272 DW-statistic 1.6225 ******************************************************************************

Page 9: Подобряване на качеството на модела

“Излишна” променлива• Включена е “излишна” променлива• “Излишна” – няма теоретични основания

за включването й• Може да се установи само индиректно –

логически• На практика се случва когато:

– Теоретично неизяснени проблеми– Няма практически разработки– Теорията не е достатъчно формализирана

Page 10: Подобряване на качеството на модела

“Излишна” променлива - последици

• Не променя или увеличава R2

• Оценките са коректни, но

• с голяма стандартна грешка

• некоректни заключения за статистическата значимост

• Води до изключване от модела на статистически значима променлива

Page 11: Подобряване на качеството на модела

“Излишна” променлива - последици

• Тестовете за модела като цяло – коректни

• Необходима по-голяма извадка за “добри” оценки

Извод

По-добре да се включи излишна обясняваща променлива, отколкото да

се изпусне съществен фактор

Page 12: Подобряване на качеството на модела

Некоректна функционална форма

• Икономическата теория не се интерисува от функционална форма на модела

• От практическа гледна точка – това е от съществено значение

• Индикация за некоректна форма – диагностичния тест

• Правила за правилно определяне на функционална форма – няма

• Памага – натрупания опит

Page 13: Подобряване на качеството на модела

Препоръчителни функционални форми

• Определяне на теоретични еластичности – двойно логаритмична функция

• Обуславя се от същността на логаритмичната функция – процентно изменение

Page 14: Подобряване на качеството на модела

Препоръчителни функционални ....

• Анализ на темпа – полу-логаритмична функция от номиналното изменение на факторите

• Позволява да се определи % изменение на зависимата променлива при определено номинално изменение на факторите

Page 15: Подобряване на качеството на модела

Препоръчителни функционални ....

• Анализ на абсолютното нарастване – полу-логаритмична функция от релативнато изменение на факторите

• Позволява да се определи номиналното изменение на зависимата променлива при определено релативно изменение на факторите

Page 16: Подобряване на качеството на модела

Препоръчителни функционални ....

• Анализ и определяне на абсолютното нарастване в зависимост от времето (във финансовите анализи) – модели на линейния тренд

• Позволява да се определи абсолютното изменение на зависимата променлива спрямо началото на периода

tt btaY

Page 17: Подобряване на качеството на модела

Препоръчителни функционални ....

• Анализ и определяне на постоянните разходи за 1-ца продукция – реципрочна функция

• От теорията – постоянните разходи намаляват асимптотично да определено равнище

Page 18: Подобряване на качеството на модела

Препоръчителни функционални ....

• Анализ и определяне на относителния дял на разходите за потребление на даден продукт – реципрочна функция (крива на Енджел)

• Практически установено

Page 19: Подобряване на качеството на модела

Препоръчителни функционални ....

• Анализ и определяне на средния доход от безработицата – реципрочна функция (крива на Филипс)

• Практически установено- има допълнителни ограничения а0 <0 и а1 >0

Page 20: Подобряване на качеството на модела

Препоръчителни функционални ....

• Анализ и определяне на маржиналните и средни разходи за производство – полином от 3-та степен

• Практически установено- има допълнителни ограничения:– а0, а1 и a3>0 ; – а2 <0 и – a2

2<3a1 a3

• 8a3

Page 21: Подобряване на качеството на модела

Показатели за оценка

• Основен показател - R2

• Изискване за директно сравняване – зависимата променлива да е една и съща– Един и същи показател– В една и съща функционална зависимост

• Причина – не могат да се сравняват величини с различни измерения

Page 22: Подобряване на качеството на модела

При необходимост от промени в модела

• Могат да се използват резултати получени за други периоди

• Пример

Q = a0 + a1P + a2Income – проблем при оценката

от друг анализ - еластичността на дохода - 0.7

Трансформация

Q* = Q – 0,7*Income

Q* = a0 + a1P

Page 23: Подобряване на качеството на модела

Друг тип трансформации

• При агрегирани данни– Преизчисляването им на база на човек от

населението – анализ на вноса от изменението на ценовото равнище и БВП

– Разделяне на двете страни на единият от факторите

Q = a0 + a1P + a2Income /Income

(Q/Income) = b0 + b1(P/Income)

Page 24: Подобряване на качеството на модела

Друг тип трансформации

• Използване на първите разлики вместо самите показатели

Q = a0 + a1P + a2Income

ΔQ = a0 + a1 Δ P + a2 Δ Income

• Използване на някаква функция от показателите (логаритмична)

Page 25: Подобряване на качеството на модела

Добавяне на променлива

• Използва се за проверка дали включването на даден показател ще подобри модела

• Докога продължава процеса –преизчисления R2 се увеличава:– ItI – по-голяма от 1

• От следрегресионното меню• H0: ak = am = al = =0• Приемането на H0 - добавените променливи

не подобряват модела • Отхвърлянето на H0 - факторите трябва да

бъдат включени в модела

Page 26: Подобряване на качеството на модела

10-May-2003 0:54:33 Variable Addition Test (OLS case) ****************************************************************************** Dependent variable is Q12102 List of the variables added to the regression: P12101 60 observations used for estimation from 1996M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C -.064037 .066828 -.95823[.342] T .6945E-3 .5623E-3 1.2350[.222] P12102 -.0011191 .4795E-3 -2.3340[.023] P12106 .0015867 .9152E-3 1.7337[.089] P12104 -.6497E-5 .2326E-3 -.027930[.978] P12105 -.1219E-3 .5165E-3 -.23590[.814] INCOME .6038E-5 .2523E-5 2.3927[.020] P12101 -.5055E-4 .4424E-3 -.11427[.909]****************************************************************************** Joint test of zero restrictions on the coefficients of additional variables: Lagrange Multiplier Statistic CHSQ( 1)= .015063[.902] Likelihood Ratio Statistic CHSQ( 1)= .015065[.902] F Statistic F( 1, 52)= .013058[.909] ******************************************************************************

Page 27: Подобряване на качеството на модела

Изключване на променлива

• Използва се за проверка дали изключването на даден показател ще подобри модела

• От следрегресионното меню• H0: ak = am = al = =0• Приемането на H0 - изключването на

променливите не влошава модела• Отхвърлянето на H0 - факторите не

могат да бъдат изключени от модела

Page 28: Подобряване на качеството на модела

10-May-2003 0:53:26 Variable Deletion Test (OLS case) ****************************************************************************** Dependent variable is Q12102 List of the variables deleted from the regression: C T P12105 60 observations used for estimation from 1996M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] P12102 -.9239E-3 .3828E-3 -2.4134[.019] P12106 .8964E-3 .3135E-3 2.8589[.006] P12104 -.8165E-4 .1930E-3 -.42307[.674] INCOME .6801E-5 .1478E-5 4.6017[.000]****************************************************************************** Joint test of zero restrictions on the coefficients of deleted variables: Lagrange Multiplier Statistic CHSQ( 3)= 2.4861[.478] Likelihood Ratio Statistic CHSQ( 3)= 2.5391[.468] F Statistic F( 3, 53)= .76366[.519] ******************************************************************************

Page 29: Подобряване на качеството на модела

Икономическа адекватност на модела

• Проверка на знаците на регресионните коефициенти

• Проверка на други детерминирани връзки между коефициентите– За еластичностите на заместване – сумата

от еластичностите = 0– За проверка на ефекта от инвестиции –

сбора от коефициентите пред разходите за труд и капитал = 1

Page 30: Подобряване на качеството на модела

Сравняване на модели

• Позволяват да се провери степента на годност на даден модел, спрямо степента на годност на друг модел

• Моделите – една и съща зависима променлива

• Тестове за непокриващи се хипотези• Две хипотези се наричат непокриващи се,

ако независимите променливи включени в първата хипотеза не се явяват независими променливи по отношение на втората хипотеза.

Page 31: Подобряване на качеството на модела

Непокриващи се хипотези

ubXaYH :0

vZbaYH 111 :

Page 32: Подобряване на качеството на модела

Тестове за непокриващи се хипотези

• Обхващащ или заграждащ тест. – Той работи с 2 модела, като позволява

част от независимите променливи на първия модел да се включват и като независими променливи и във втория модел

– Анализира комбинирания модел

dWcZbXaY **

Page 33: Подобряване на качеството на модела

Обхващащ тест

• Параметрите на този обобщен модел се тестват за следните ограничения:

• с=0• b=0

• Ако ограничението с=0 се приема, това практически означава отхвърляне на хипотезата Н1, спрямо хипотезата Н0

• Ако ограничението с=0 се отхвърли - отхвърляне на хипотезата Н0 в полза на хипотеза Н1

Page 34: Подобряване на качеството на модела

Обхващащ тест ...

• Ако ограничението b=0 се приеме - приемане на хипотезата Н1, спрямо хипотезата Н0

• Ако ограничението b=0 се отхвърли - приемане на хипотезата Н0 спрямо хипотеза Н1

Page 35: Подобряване на качеството на модела

Обхващащ тест ...

• Недостатъци• 2 проблема

– в комбинирания модел остават общите за двата първоначални модела променливи и тестването на ограниченията b=0 или c=0 не дава никаква информация за тези общи независими променливи

– че броят на независимите променливи във хибридния модел може да се окаже твърде голям и да възникне проблем с колинеарността между независимите променливи

Page 36: Подобряване на качеството на модела

Обхващащ тест ...

• Решение на проблемите

• Z* е вектор, включващ тези променливи на Z, които не принадлежат на Х

• В този случай приемането на ограничението с=0, позволява да се направи заключение в полза на хипотезата Н0 срещу хипотезата Н1

*cZbXaY

Page 37: Подобряване на качеството на модела

J тест

• Използва следната комбинация от двата начални модела

• Тества се ограничението = 0 - тест срещу хипотезата Н1

• Проблем - не може да бъде оценен директно – разработен 3-етапен метод

ZbbXY 11

Page 38: Подобряване на качеството на модела

Група тестове

• Извеждат се едновременно

• J тест, N тест, NT тест, W тест, JA тест, AIC тест и SBC тест

• Възможни са 4 случая– И двете хипотези да се отхвърлят, – Да се отхвърли първата хипотеза,– Да се отхвърли втората хипотеза,– Да се приемат и двете хипотези.

Page 39: Подобряване на качеството на модела

Alternative Tests for Non-Nested Regression Models

******************************************************************************

Dependent variable is LNQ101 48 observations used from 1997M1 to 2000M

Regressors for model M1:

C T LNP101 LNP106 LNP107

LNINCOME S12

Regressors for model M2:

C T P12101 P12106 P12107

INCOME S12

******************************************************************************

Test Statistic M1 against M2 M2 against M1

N-Test 1.1641[.244] -2.7316[.006]

NT-Test 1.0797[.280] -2.3175[.020]

W-Test 1.1142[.265] -2.1861[.029]

J-Test -1.1081[.268] 2.3808[.017]

JA-Test -1.1968[.231] 2.2684[.023]

Encompassing F( 4, 37) 1.6376[.185] F( 4, 37) 2.7205[.044]

******************************************************************************

Model M1: DW 1.5023 ;R-Bar-Squared .88452 ;Log-likelihood 25.4154

Model M2: DW 1.4355 ;R-Bar-Squared .87303 ;Log-likelihood 23.1396

Model M1+M2: DW 1.6063 ;R-Bar-Squared .89128 ;Log-likelihood 29.3273

Akaike's Information Criterion of M1 versus M2= 2.2758 favours M1

Schwarz's Bayesian Criterion of M1 versus M2= 2.2758 favours M1

******************************************************************************

Page 40: Подобряване на качеството на модела

Икономическа адекватност на модела ...

–При определяне на маржиналните и средните разходи за производство:

а0, а1 и a3>0 ;

а2 <0 и

a22<3a1 a3

• Проверката на различните ограничения от тип равенство чрез Валд теста

Page 41: Подобряване на качеството на модела

Валд тест

• Тест за налагане на ограничения на параметрите на модела– При наличие на специфични изисквания

наложени от теорията– При проверка на причините за динамиката:

произтича от детерминираната част на модела или е стохастична (при авторегресионните модели с разпределен лаг)

Page 42: Подобряване на качеството на модела

Валд тест

• Ограниченията: линейни и нелинейни

• Н0: всички поставени ограничения са едновременно изпълнени

Page 43: Подобряване на качеството на модела

Валд тест• Wald test of restriction(s) imposed on parameters • ******************************************************************************• Based on OLS regression of LNQ101 on: • C T LNP101 LNP106 LNP107 • LNINCOME S12 • 48 observations used for estimation from 1997M1 to 2000M12 • ******************************************************************************• Coefficients A1 to A7 are assigned to the above regressors respectively. • List of restriction(s) for the Wald test: • a3+a4+a5=1 • ******************************************************************************• Wald Statistic CHSQ( 3)= 46.8390[.000] • ******************************************************************************

Page 44: Подобряване на качеството на модела

Интерпретация на резултата

• Валд теста нормализира поставеното ограничение и го проверява при– Н0: нормализирано ограничение = 0– за конкретния случай:

a(3) + a(4) +a(5) -1 = 0• Като резултат извежда 2 вида статистики: F

статистика и Chi-square със вероятността за приемане на Н0

• F статистика – валидна само при линейни ограничения

• Резултатите от Валд теста зависят от начина на задаване на ограниченията (при нелинейни ограничения)

Page 45: Подобряване на качеството на модела

Икономическа адекватност на модела ...

• Когато трябва да се провери ограничение от типа “по-голямо”/”по-малко” – няма автоматизиран тест – t-теста

• Сравнява се получената стойност за t и критичната стойност (равнище на статистическа значимост и степените на свобода)

• За целта изходния модел се преобразува така, че ограничението да бъде сравнение с 0 и да се явява параметър в преобразувания модел

Page 46: Подобряване на качеството на модела

Икономическа адекватност на модела ...

• От преобразувания модел могат да бъдат тествани и хипотезите:

• В първия случай, Н0 се приема - получената стойност на t е по-малка от критичната стойност на t при едностранния t тест, отчетен със знак минус.

• Във втория случай, Н0 се приема - получената стойност на t е по-голяма от критичната стойност на t при едностранния t тест.

0:0 iaH 0:0 iaH

Page 47: Подобряване на качеството на модела

Стабилност и устойчивост на модела

• Показват доколко разработеният модел може да направи коректна прогноза

• Тестове – Браун, Дърбин и Ивънс- базирани на рекурсивните остатъци

• Графични тестове

Page 48: Подобряване на качеството на модела

Стабилност и устойчивост на модела ...

• Рекурсивни остатъци:– Определяне на регресионните коефициенти при

използване на n+1 набюдения– Определяне на грешката при n+2-то наблюдение –

първи остатък– Определяне на регресионните коефициенти при

използване на n+2 набюдения– Определяне на грешката при n+3-то наблюдение –

втори остатък– .... До изчерпране на всички наблюдения

Page 49: Подобряване на качеството на модела

Стабилност и устойчивост на модела ...

• 2 теста– QUSUM – анализира директно получените

рекурсивни остатъци– QSUMSQ – анализира квадратите на

рекурсивните остатъци

• QUSUM– Н0: редът на рекурсивните остатъци има средно

равно на 0 и вариация ≈ на броя на остатъците– На графиката – нормализираните рекурсивни

остатйци

Page 50: Подобряване на качеството на модела

Тестове за стабилност

Page 51: Подобряване на качеството на модела

Тестове за стабилност

Page 52: Подобряване на качеството на модела

Възможност за определяне на структурни прекъсвания

• Ако графиката на рекурсивните остатъци пресича граничните линии в определен период и се връща отново - структурно прекъсване в този период