regresia liniara liniara multipla

Post on 17-Jul-2015

297 views

Category:

Documents

3 download

Embed Size (px)

TRANSCRIPT

Proiect econometrie: regresia liniara simpla; regresia liniara multipla a.Realizarea i interpretarea regresiei unifactoriale )i ix f y =Nr. mediu salariai din agricultur,vntoare i silvicultur= f (PIB) 1.S se reprezinte grafic datele 2.S se determine modelul de regresie pe baza datelor din eantion 3.S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05. 4.Ssetestezesemnificaiaparametrilormodeluluideregresie,pentruunnivelde semnificaie 0,05. 5.Ssemsoareintensitatealegturiidintrevariabilefolosindcoeficientuldecorelaiei raportul de corelaie, testnd semnificaia acestora pentru un nivel de semnificaie 0,05. 6.Ce pondere din variaia variabilei efect este explicat de variatia variabilei cauz? 1)Construirea i comentarea graficului Graficulconstruit,denumitcorelogram,neindicexistena,formaidirecialegturii dintre cele dou variabile: Corelograma dintrenr. mediu salariai din agricultur,vntoare i silvicultur i PIB Evideniaz legtura direct (punctele sunt plasate pe direcia primei bisectoare) 2)Estimarea parametrilor modelului liniar de regresie (a, b) Aplicareamodeluluiliniarderegresiepresupuneutilizareaecuaieideregresieliniar:i ibx a y= Parametrii a i b se determin cu ajutorul metodei celor mai mici ptrate: ) ) min min 2 2ii iii ibx a y y yaplicareaeiconducndla obinerea sistemului de ecuaii normale:= = = = == =nii iniiniiniiniiy x x b x ay x b na1 1211 1, unde n=14 judete Pentruarezolvasistemulvomfolosiurmtorultabelncaresuntprezentatevalorile intermediare: PIBix Nr mediu salariati in agricultura iy 2ix i iy x =1447,66296+0,07728792*ix11488,92423131994823278376052335,616144 4976,41546247645577693514,41832,278565 18020,91842324752837331944982840,460838 7012,7140749177961,39866868,91989,659957 5341,6218128532690,6116500301860,504113 3883,69201508234935729121747,818326 8000,7389164011200,5311307242066,020422 14160,42608200516928369303232542,090822 3540,4168212534432,25954952,81721,293112 5248,1139927542553,67342091,91853,277693 9440,8318889128704,6300972702177,322755 9026,3164381474091,7148302112145,286912 100912581101828281260448712227,575361 85707,2810073457241326942283208071,794177 ix 195939 iy35411 2ix8497065541 i iy x =940374191 16591,38072 Sistemuldeecuaiinormaledevine: = = 940374191 8497065541 19593935411 195939 14b ab a

, unde 66296 . 1447195939 8497065541 1494037191 195939 8497065541 35411212121 1 1 12=

='+

'

=AA= = == = = =ninii ininininii i i i iax x ny x x x ya

07728792 . 0195939 8497065541 1435411 195939 940374191 14212121 1 1=

='+

'

=AA= = == = =ninii inininii i i ibx x ny x y x nbDeci: i ix y = 07728792 . 0 66296 . 1447 Interpretare: b = + 0.07728792 -b> 0, deci ntre nr. mediu de salariati si PIB exist o legtur direct -la creterea cu o unitate a PIB , Nr mediu de salariati se mrete cu 0.07728792 3)1.H0: modelul nu este valid statistic 2.H1: modelul este valid statistict 3.tiind c pragul de semnificaie este05 , 0 = i 1 = k (exist un singur factor de influen) se stabilete: 4.1.valoareacritic: 75 , 412 ; 1 ; 05 , 0 2 ; 1 ; 1 ; ;= = = =

F F F Fn k n k tabelar

4.2.regiunea de respingere: dac 1 ; ;>k n k cF F, atunci H0 se respinge 5.Determinareastatisticiitestului(calculatF)arelabazrelaia: 30 , 4672 , 164 , 7922/= = =ex yssF Pentru determinarea statisticii testului F se folosete urmtorul algoritm de calcul: 36 . 2529143541115151= = == iiyy salariati in medie in agricultura vanatoare si silvicultura - -SS -Sum of Squares - suma ptratelor = variana SST=SSR + SSE SSR= ) 34375693 122/== A=nii x yy ySS= ) 65 . 7156280 12 2== A=nii i ey ySST= ) 41531977122== A=nii yy y -df - degree of freedom - grade de libertate k = 1 n k 1 = 12 n 1 = k + (n k 1) = 1 + 12 = 13 -MS - media ptratelor = dispersia corectat MS = SS : df 3437569313437569322/= =A=ksxx y 72 . 5963561 1 1465 . 7156280122= = A=k nsee -F ---testul F 64 . 5772 . 5963563437569322/= = =ex yssF 6.Concluzie: Deoarece calculatF (57.64)> 1 ; ;k n kF (4,75) 0Hserespinge,deci 1H esteadevrat, prin urmare, modelul este valid. Rezolvarea punctului aplicaiei cu ajutorul programului informatic EXCEL SUMMARY OUTPUT Regression Statistics Multiple R 0,909776 R Square 0,827692 Adjusted R Square 0,813333 Standard Error 772,2414 Observations14 ANOVA dfSSMSF Significance F Regression1 34375697 34375697 57,64284 0,000006 Residual127156281 596356,7 Total13 41531977 Coeffic Standardt StatP- LowerUpperLowerUpper ientsErrorvalue95%95%95,0%95,0% Intercept 1447,663250,7895 5,772422 0,000088 901,2394919 1994,086 901,2395 1994,086 PIB xi 0,0772880,01018 7,592288 0,000006 0,055108061 0,099468 0,055108 0,099468 Pentru aplicarea testului F se completeaz tabelul: Sursa variaiei df (degree of freedom) (grade de libertate) SS (Sum of Squares) (suma ptratelor= variana) MS =SS : df (media ptratelor = dispersia corectat) F (Statistica testul F sau calculatF ) Significance F (probabilitatea critic) Regression (variaia datorat regresiei) k 1SSR= )= = Anii x yy y122/34375696.56 ksx yx y2/ 2/A== 34375696.56 TestulF=2/ x ys /2es F = 57,64284 0,000006< 0,05 (resping H0 model valid) Residual (variaia rezidual) n-k-1 12 SS= )= = Anii i ey y12 2 7156280,651 122 A=k nsee= 596356.7 Total (variaia total) n-1 13 SST=41531977.21 )= = Anii yy y122=SST=SSR + SSE 122

A=nsyy Not: k reprezint numrul variabilelor factoriale (n cazul modelului unifactorialk = 1). Interpretare rezultate din tabelul 2 ANOVA: n acest tabel este calculat statistica testului F pentru validarea modelului de regresie.Modelulderegresieconstruit(i ix y 07728792 . 0 66296 . 1447 = )estevalidipoatefi utilizat pentru analiza dependenei dintre cele dou variabile, ntruct: -calculatF (57.64) > 1 ; ;k n kF (4,75),-SignificanceF(probabilitateacritic)este0,000006maimicdectpragulde semnificaie ) 05 , 0 = . 4.S se testeze semnificaiaparametrilormodelului de regresie, pentru un nivel de semnificaie 0,05 Ecuaia de regresie - la nivelul colectivitii generale este: i i ix y I F = - la nivelul eantionului este:i i ie bx a y =Testarea semnificaiei parametrului : H0 : = 0 ( nu este semnificativ statistic) H1 : = 0, (i este semnificativ statistic) Deoarece n = 1430 avemeantion de volum redus i pentru testare vom utiliza testul t. tiindcpraguldesemnificaieeste05 , 0 = i1 = k (existunsingurfactorde influen) se stabilete: Valoareacritic: 179 , 212 ; 5 , 0 2 14 ; 5 , 02 ;21 ;2= = = =

BILATERAL BILATERALn k nt t t t jregiuneaderespingere:dac 2 ;2

>ncalct t,sau 2 ;2

>nat tatunciH0se respinge Determinareastatisticiitestului(tcalculat )arelabazrelaia: a a aaa calculatsasasat t =

=

= =0 ixiyiy=1447,66296+0,07728792*ix )2i iy y 2ix )2x xi 11488,924232335,6161447635,9382741319948236283760,468 4976,415461832,27856581955,416832476455781346744,29 18020,918422840,460838996924,044132475283716202693,92 7012,714071989,659957339492,62549177961,348761492,94 5341,621811860,504113102717,613328532690,674892460,25 3883,69201747,818326685283,18115082349102253413,6 8000,738912066,0204223330550,46264011200,535939341,57 14160,426082542,0908224344,01969620051692827144,86905 3540,416821721,2931121543,94864812534432,2109312106,2 5248,113991853,277693206368,222327542553,676519508,54 9440,831882177,3227551021468,49389128704,620746594,75 9026,316432145,286912252292,142381474091,724694369,85 1009125812227,575361124908,975710182828115246236,96 85707,281008071,794177795,568449873457241325142547407 ix 195939 iy 35411iy 16591,38072 )2i iy y7156280,651 2ix 8497065541 )2x xi5754773276 a= 1447,66296 b= 0,07728792 )78 . 2505754773276 14849706554124 . 77222=

=

=x x nxs siie a )24 . 77212651 . 715628022 1122 2= =

=

A= A==ny yn k nsnii ie ee 64 . 139951419593914141= = == iixx Statistica testului:772 . 578 . 25066296 . 1447= = = =aa calcsat tConcluzia:-deoarece 2 ; 2 / >n calct t ( 179 , 2 772 . 5 > ) ,deci H0se respinge , ceea ce nsemn c este semnificativ diferit de zero ( nu este semnificativ statistic) Testarea semnificaiei parametruluiF : H0 :F = 0 (pantaFeste zero, adicFnu este semnificativ diferit de zero, deciFnu este semnificativ statistic) H1:F =0,(pantaFnuestediferitdezero,adicFestesemnificativdiferitdezero, deciFeste semnificativ statistic) Deoarece n = 1430 avem eantion de volum redus i pentru testare vom utiliza testul t. tiindcpraguldesemnificaieeste05 , 0 = i1 = k (existunsingurfactorde influen) se stabilete: -valoarea critic: 179 , 212 ; 5 , 0 2 15 ; 5 , 02 ;21 ;2= = = =

BILATERAL BILATERALn k nt t t t -regiunea de respingere: dac 2 ;2

>ncalct t sau 2 ;2

>nbt tatunci H0 se respinge Determinarea statisticii testului ( tcalculat ) are la baz relaia: b b bbb calcsbsbsbt t =

=

= =0 b= 0,07728792 )0101 . 05477327624 . 77212= =

==niiebx xss Statistica testului este:59 . 70101 . 007728792 , 0= = = =bb calcsbt tConcluzia: -deoarece 2 ; 2 / >n calct t ( 179 , 2 59 . 7 > ) ,deci H0se respinge , ceea ce nsemn cH1se accept, deciFeste semnificativ diferit de zero ( F este semnificativ statistic) Rezolvarea punctului aplicaiei cu ajutorul programului informatic EXCEL

Coefficients Standard Errort Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0% Intercept 1447,66296 250,7895385 5,772422 0,000088 901,2394919 1994,086901,23951994,086 PIB xi 0,07728792 0,010179793 7,592288 0,000006 0,055108061 0,0994680,0551080,099468 Interpretarea rezultatelor din tabelul 3: Coeficienii (parametrii)ecuaieide regresie liniar ( a=1447,66296 ib=0,07728792) neconducla scrierea urmtoarei funciide regresieliniare: i ix y 07728792 , 0 66296 . 1447 = , n care: Interceptestetermenulliber,decicoeficientulapentru cares-astabilitvaloarea-1447.66296 Termenul liber este punctul n care variabila explicativ (factorial) este 0, deci acel punct n care dreapta de regresie intersecteaz axa Oy.Se observ c parametrul este semnificativ statistic deoare