regresia multifactoriala

Upload: crinam90

Post on 12-Jul-2015

737 views

Category:

Documents


3 download

TRANSCRIPT

REGRESIE MULTIFACTORIALConcepte generale privind definirea, specificarea i identificarea modelului multifactorialSub form general, un model multifactorialse definete prin urmtoarea relaie:y = f(xj)+uunde:y =variabila endogen, efect sau rezultativ;xj =variabilele exogene sau factoriale sau cauzale;k = numrul variabilelor exogene;u = variabila rezidual, aleatoare sau eroare; f(xj)=funciaderegresie cu ajutorul creia vor fi estimate (aproximate) valorile variabilei y1k j , 1 Exemplu1) Modelarea consumuluiC = f (V, P, N) + uunde:C = consumul unui produs sau grupe de produse;V = venitul pe familie;P = preul produsului sau indicele preurilor grupei de produse;N =numrul membrilor unei familii.2) Funcia de producie Cobb-DouglasQ = f (K, L) + uunde:Q =volumul (valoarea) produciei;K = capitalul;L = fora de munc.3) Modelarea evoluiei preurilorI p = f (I v, I cv, I m) + uunde:I p = indicele preurilor;I v = indicele veniturilor (salariilor) consumatorilor;I cv = indicele cursului valutar;I m = indicele masei monetare.2ExempluDe regul, n economie, principalele funcii de regresie multifactoriale sunt de forma:- funcia liniar Y t = b 0 + b 1 x 1t + b 2 x 2t + b k x kt- funcia liniar dublu logaritmic kbktbtbt tx x x b Y 2 12 1 0kt k t t tx b x b x b b Y ln ln ln ln ln2 2 1 1 0+ + + + - funcia liniar semilogaritmickt k t tx b x b x b bte Y+ + + +2 2 1 1 0 kt k t t tx b x b x b b Y + + + + 2 2 1 1 0lnsaukt t txkx xtb b b b Y 2 12 1 0 kt k t t tx b x b x b b Y + + + + ln ln ln ln ln2 2 1 1 0 kt k t t tx x x Y + + + + 2 2 1 1 0lnunde: 0 0lnb ; k j b j j, 1 , ln 3Estimarea parametrilor modelului multifactorialEstimarea parametrilor modelului se face n urma etapei de identificareaacestuia. Deoarecemareamajoritateamodelelor econometrice pot fi liniarizate, un model multifactorial, n form general, se prezint astfel:y t = b 0 x 0t + b 1 x 1t + b 2 x 2t + + b j x jt + + b k x kt + u tunde:n t , 1 , n =numrul termenilor seriilor statistice;k 1, j , k = numrul variabilelor exogene,ceea ce analitic devine:'+ + + + + + + + + + + + + + + n nk k n2 2 n1 n 0 n2 2k k 22 2 21 1 0 21 1k k 12 2 11 1 0 1u x b x b x b b y.......... .......... .......... .......... .......... .......... .......... ..........u x b x b x b b yu x b x b x b b y4Definind cu:

,_

nyyyY 21vectorul coloan al variabilei endogene(yt) n , t 1 de dimensiune (n, 1);

,_

k n nkkkx xx xx xx xX 13 1 32 1 21 1 11111matricea variabilelor exogene(xj)k 0, j de dimensiune (n, k + 1);

,_

nbbbbB210 vectorul coloan al parametrilor (b j) k 0, j de dimensiune (k + 1, 1);5

,_

nuuuuU321vectorul coloanal variabilei aleatoare(ut) n , t 1 de dimensiune (n, 1).Relaia sub form matriceal, devine:Y = XB + URelaia se mai poate scrie astfel:6) 1 ( 1 ) 1 ( ) 1 ( ) 1 (111211012 1 21 1 121 + +

,_

+

,_

,_

,_

n k k n nuuubbbx xx xx xyyyn kk n nkkn 7Funciaderegresiecorespunztoaremodelului, scrissub forma unei ecuaii matriceale, este:BX Y Reziduurile t (estimaiile variabilei aleatoare u) se definesc astfel:B X Y Y Y U unde: Y= valorile estimate (ajustate) ale variabilei Y.ncazul unui model multifactorial parametrii pot fi estimai prin intermediul mai multor metode cumar fi: metodapunctelor empirice, metodapunctelor medii, metodacelor mai mici ptrate (M.C.M.M.P.), metoda verosimilitii maxime etc.Metoda punctelor empirice i metoda punctelor medii sunt folosite n cazul modelelor ncare aplicarea metodei celor mai mici ptrate este anevoioas, necesitnd calcule complicate, de regul pentru funciile neliniare (funcia logistic).8Metoda celor mai mici ptrateeste metoda cel mai des utilizat. n cazul unui model multifactorial aplicarea acesteia presupune minimizarea funciei:( ) ( ) ( ) ( ) ( )FB u U U Y Y Y XB Y XB Y XBttnmin min minminmin 22 21 ( ) ( ) ( ) + min Y Y B X Y B X XB 2

care implic calculul derivatei funciei nraport cuestimatorul Bi anularea acesteia:( )( ) ( )FBBX Y X XB + 0 2 2 0 ( ) X XB X Y

ncazul ncarematricea(XX)admiteinvers, prinnmulireala stnga a ecuaiei matriceale cu (XX) 1 rezult c:( ) ( ) ( ) ( ) X X X XB X X X Y1 1 Estimatorii parametrilor se calculeaz astfel cu ajutorul relaiei:( ) ( )

,_

kbbbY X X X B211

La nivelul eantionului, modelul multifactorial liniar format din dou componente se prezint astfel: 9t t t tu x b x b b y + + + 2 2 1 1 0Valorileajustatealevariabilei endogenesecalculeazcuajutorul relaiei:Estimarea parametrilor acestui model se realizeaz cu ajutorul M.C.M.M.P.:Minimul acestei funcii estedat decalculul derivatelorparialen raport cu parametrii modelului:Dup efectuarea calculelor rezult urmtorul sistem de ecuaii:ExempluUnntreprinztorcumprunmagazinavndosuprafade230m2ntr-un cartier n care locuiesc n jur de 6400 de familii. Osocietate de consultan de management comercial l informeazccifra deafaceri amagazinelor cuprofilul respectiv depinde liniar de suprafaa comercial a magazinului i de numrul familiilor din cartierulrespectiv care,de regul, cumpr de la magazinul cel mai apropiat.n acest sens, i pune la dispoziie informaiile referitoare la aceti indicatori, nregistrate la 13 magazine avnd acelai profil:Tabelul 1 10t t tx b x b b y2 2 1 1 0 + + ( ) ( ) ntt t t jx b x b b y b F122 2 1 1 0 min( ) ( )( ) 0 1 2 02 2 1 1 0 0 tt t tx b x b b y b F( ) ( )( ) 0 2 01 2 2 1 1 0 1 ttt t tx x b x b b y b F( ) ( )( ) 0 2 02 2 2 1 1 0 2 tt t t tx x b x b b y b F' + + + + + + t t t t t tt t t t t tt t ty x x b x x b x by x x x b x b x by x b x b b n222 2 2 1 1 2 01 2 1 221 1 1 02 2 1 1 0 Nr. de familii (sute) 70 35 55 25 28 43 15 33 23 4 45 20 56Supr. comercial (zeci m2) 21 26 14 10 12 20 5 28 9 6 10 8 36Cifra de afaceri (mil. lei) 198 209 197 156 85 187 43 211 120 62 176 117 273Se cere:a) Pe baza datelor problemei, innd cont de semnificaia economic a fenomenelor observate, s se construiasc modelul econometric cu ajutorul cruia poate fi studiat dependena dintre fenomenele respective;b) S se estimeze parametrii modelului.Soluie:a) Descriereaeconometricalegturii dintreceletrei variabile,y- cifrade afaceri, x1 - numrul de familii i x2 - suprafaa comercial, se poate face cu ajutorul modelului( )t t t tu x x f y + 2 1 ,, care explic variaia cifrei de afaceri pe seama ambilor factori.Identificarea funciei de regresie se realizeaz cu ajutorul reprezentrii grafice a variabilei y n funcie de celelalte dou variabile factoriale x1, respectiv x2.Figura 2Deoarece graficele de mai sus arat c legtura dintre y i x1, respectiv y i x2 poate fi aproximat cu o dreapt, modelul de mai sus devine:t t t tu x b x b b y + + + 2 2 1 1 0Acesta este un model multifactorial liniar deoarece y, fiind corelat liniar cu x1, respectiv cu x2, se deduce uor c va fi corelat liniar i n raport cu ambii factori.Estimarea parametrilor unui model multifactorialt t t tu x b x b b y + + + 2 2 1 1 0 necesit efectuarea urmtoarelor calcule:110501001502002503000 10 20 30 40 50 60 70 80x1y- obinerea sistemului de ecuaii normale prin aplicarea M.C.M.M.P. care const n:( ) ( ) ntt t t jx b x b b y b F122 2 1 1 0 minMinimul acestei funcii estedat decalculul derivatelorparialenraport cu parametrii modelului :( ) ( )( ) 0 1 2 02 2 1 1 0 0 tt t tx b x b b y b F( ) ( )( ) 0 2 01 2 2 1 1 0 1 ttt t tx x b x b b y b F( ) ( )( ) 0 2 02 2 2 1 1 0 2 tt t t tx x b x b b y b FDup efectuarea calculelor rezult urmtorul sistem de ecuaii:' + + + + + + t t t t t tt t t t t tt t ty x x b x x b x by x x x b x b x by x b x b b n222 2 2 1 1 2 01 2 1 221 1 1 02 2 1 1 0 Valorileestimatorilor rezult n urma rezolvrii sistemului de ecuaii ale crui necunoscutesunt cei trei parametrii2 1 0, , b b b, iarvaloriletermenilorsistemului de ecuaii se obin pe baza tabelului 2, coloanele 1, 2, 3, 4, 5, 6, 7, 8:Tabelul 2Nr.crt.tx1xt 2ytx yt t 1x yt t 2x xt t 1 2xt 12xt 22tttxxy212446 , 44963 , 15023 , 37 ++t t ty y u 0 1 2 3 4 5 6 7 8 9 101 70 21 198 13860 4158 1470 4900 441 231,3796 -33,37962 35 26 209 7315 5434 910 1225 676 200,2326 8,76743 55 14 197 10835 2758 770 3025 196 179,2229 17,77714 25 10 156 3900 1560 250 625 100 117,3557 38,64435 28 12 85 2380 1020 336 784 144 130,3339 -45,33396 43 20 187 8041 3740 860 1849 400 186,7352 0,26487 15 5 43 645 215 75 225 25 81,1697 -38,1697128 33 28 211 6963 5908 924 1089 784 205,7293 5,27079 23 9 120 2760 1080 207 529 81 110,1185 9,881510 4 6 62 248 372 24 16 36 68,9552 -6,955211 45 10 176 7920 1760 450 2025 100 147,2815 28,718512 20 8 117 2340 936 160 400 64 101,3851 15,614913 56 36 273 15288 9828 2016 3186 1296 274,1009 -1,1009Total 452 205 2034 82495 38769 8452 19828 4343 2034 0Estimarea parametrului 0b :4343 8452 2058452 19828 452205 452 134343 8452 387698452 19828 82495205 452 203422 2 1 22 121 12 122 2 1 22 121 12 10 t t t tt t t tt tt t t t tt t t t tt t tx x x xx x x xx x nx x x y xx x x y xx x yb5023 , 370 bn mod analog se obin valorile celorlali doi parametrii: 4963 , 11 b i 2446 , 42 b .Ocalemai rapiddeestimareaparametrilorserealizeazutilizndcalculul matriceal, sistemul de ecuaii de mai sus devenind:( ) ( ) X XB X Ynmulind la stnga expresia cu( ) X X1 obinem:( ) ( ) ( ) ( ) Y X X X B X X X X 1 1Rezult c: ( ) ( ) Y X X XbbbB

,_

1210unde matricele sunt de forma:13X

_,

1 70 211 35 261 55 141 25 101 28 121 43 201 15 51 33 281 23 91 4 61 45 101 20 81 56 36

,_

273117176621202114318785156197209198Y

,_

13321uuuuUSe calculeaz matricele:( )

,_

4343 8452 2058452 19828 452205 452 13X X( )

,_

38769824952034Y X X X 36557768( )

_,

X X14676700 230376 244436230376 14434 17216244436 17216 53460( )

,_

53460 17216 24443617216 14434 230376244436 230376 146767003655776811X X( )

,_

0015 , 0 0005 , 0 0067 , 00005 , 0 0004 , 0 0063 , 00067 , 0 0063 , 0 4015 , 01X XCalculnd produsul:14( ) ( )

,_

,_

2446 , 44963 , 15023 , 372101bbbY X X X BValorile teoretice ale cifrei de afaceri rezult deci din relaia:t t tx x y2 12446 , 4 4963 , 1 5023 , 37 + + Exersai n EXCELSe consider urmtoarele serii de date pentru caracteristica dependentYi pentrutrei variabile explicative 1 2, X Xi 3. XValorile corespunztoare celor patru caracteristici sunt prezentate n tabelul de mai jos:Tabelul 3. Seriile de date pentru cele 4 variabile statistice15Y1X2X3X7,50 80,00 20,00 0,208,50 80,80 22,30 0,409,40 81,40 34,80 0,7010,30 82,00 39,20 0,8011,20 83,80 44,20 0,9012,30 84,50 49,00 1,0012,90 85,10 54,00 1,2013,70 85,90 60,00 1,4014,50 86,40 62,90 1,6015,20 87,20 68,30 1,9016,00 88,10 74,90 2,3016,80 88,90 82,90 2,4017,60 90,00 87,00 2,9018,40 91,10 93,80 3,1019,20 92,00 100,00 3,5020,00 92,90 112,20 4,6020,70 93,10 130,40 4,7021,40 93,90 140,70 5,0022,00 94,20 149,00 5,2022,70 95,00 155,00 5,80S se estimeze parametrii modelului de regresie t t t t tu x b x b x b b y + + + + 3 3 2 2 1 1 0 prinmetodacelormai mici ptrate i sse verifice semnificaia acestora (Critical t = 2,12);Parametrii modelului de regresie t t t t tu x b x b x b b y + + + + 3 3 2 2 1 1 0 se estimeazprinmetodacelormai mici ptratecuajutorul programului EXCEL Instruciuni n EXCEL:1. Introducei datele pe 4 coloane. n A1 se introduce variabila Y, iar n B1, C1, D1 se introduc variabilele1 2, X X i3. X2. ApsaiTools/Data Analysis, iardin fereastra Data Analysis alegei opiunea Regression. 3. Selectai butonul . 164. Se deschide fereastra din Figura3 n care sunt introduse caracteristicile modelului de regresie.Figura 3. Introducerea caracteristicilor modelului de regresie5. Introduceicmpulncaresepoziioneazseriavalorilorlui Y. n acest exemplu n cmpul Input Y Range: se introduce $A$2:$A$21.6. Introducei cmpul ncaresepoziioneazseriilevalorilorcelor3 variabile exogene. n acest exemplu n cmpul Input X Range: se introduce $B$2:$D$21.7. Introducei Worksheet-ul ncaresescriurezultatele. Deexemplu, dacrezultateleseafieazpeaceeai pagincudatelesepoateselecta Output Range: $A$25. Implicit, rezultatele se afieaz pe o pagin nou.8. Selectai opiuneaResiduals nurmacreiavorfi afiatevalorile estimate (ajustate) ale variabilei endogene i valorile reziduurilor.9. Selectai butonul .In cel de-al treilea tabel afiat de EXCEL sunt prezentate urmtoarele rezultate:Coefficients Standard Errort Stat P-value Lower 95%(Limita inf.Upper 95%(Limita 17(Abaterea mediePtratic)a intervalului de ncredere)sup. aintervaluluide ncredere)Intercept(Termenul liber)0b = -64,26010bs = 3,98080bt= -16,14240,0000> 0,05-72,6991 -55,8212X Variable 1 (X1)1b = 0,89361bs = 0,05011bt= 17,83180,0000< 0,050,7874 0,9998X Variable 2 (X2)2b = 0,03592bs = 0,01062bt= 3,37800,0038< 0,050,0134 0,0584X Variable 3 (X3)3b = -0,61773bs = 0.22563bt= -2,73820,0146< 0,05-1,0960 -0,1395Interpretarea rezultatelor din tabelul 3 Intercept este termenul liber, deci coeficientul0b= -64,2601. Termenul liber este punctul n care variabilele explicative (factoriale) sunt egale cu 0. Deci y = -64,2601 uniti de msur, dac xj=0. Deoarece 0bt= -16,1424>Criticalt=2,12,iar pragul de semnificaie,P-value ,este 0,000095%.Intervalul dencrederepentruacest parametrueste -72,6991 0b-55,8212.18 Coeficientul1b =0,8936, ceea ce nsemn c, la creterea cuo unitate de msur a variabileix1, variabila endogen y va crete cu 0,8936 uniti de msur. Deoarece 1bt= 17,8318 > Criticalt= 2,12,iar pragul de semnificaie,P-value,este0,000095%.Intervalul de ncredere pentru acest parametru este 0,7874 1b0,9998. Coeficientul 2b = 0,0359 ceea ce nsemn c, la creterea cu o unitate de msur a variabileix2, variabila endogen y va crete cu 0,0359 uniti de msur. Deoarece2bt=3,3780 > Criticalt= 2,12,iar pragul de semnificaie,P-value,este0,003895%.Intervalul de ncredere pentru acest parametru este 0,0134 2b0,0584. Coeficientul3b=-0,6177ceea ce nsemn c, lacreterea cuo unitate de msur a variabileix3, variabila endogen y va crete cu 0,8936 19uniti de msur. Deoarece 3bt=-2,7382 > Criticalt= 2,12,iar pragul de semnificaie,P-value,este0,014695%.Intervalul de ncredere pentru acest parametru este - 1,0960 3b-0,1395.Lucrare de verificareI. Se consider modelul liniar de regresie coninnd dou variabile exogene:t t t tu x b x b b y + + + 2 2 1 1 0Pentruestimarea celor trei parametri aufost nregistrate 36 de valori, rezultatele fiind prezentate dup cum urmeaz:. 12 18 233 , 0 5 932 12 30 85 ) (2221 / 2 122212 22 1 x xtt ttt tttttttttr x y x yx x y y yFolosind relaiile de mai sus se cere:1. S se estimeze parametrii modelului liniar de regresie;2. S se testeze dac parametrii jbdifer semnificativ de zero i s se interpreteze valorile acestora.20II. Pentru un model de regresie cu dou variabile exogene i termen liber se cunosc urmtoarele rezultate:. 6 0 0 ,9 05 51 7 0,8 0 0 00 5 0 2 10 2 1 4 12111]1

111]1

yY X X X Folosind datele de mai sus se cere: 1. S se determine numrul de valori din care este format fiecare serie de date;2. S se estimeze parametrii modelului liniar de regresie.21