numarul mediu de salariati = f(pib, populatie - regiunea 4 si 5 - 8 judete
Post on 05-Apr-2018
226 Views
Preview:
TRANSCRIPT
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
1/13
Academia de Studii EconomiceFacultatea de Comer
Proiect econometrie
Nr. Mediu de salariai = f(PIB, populaie)Regiunea 4 si 5 (8 judee)
Bucureti, 2009
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
2/13
Regiunea Judeul Populaia la 1
iulie 2005(nr.persoane)
Nr. mediu al
salariailor(mii. pers.)
PIB regional 2004
mil. lei (RON)preturi curente
Sud-Vest Dolj 718874 119 6610,6
Gorj 384852 79 4659,9Mehedini 303869 47 2684,8
Olt 483674 69 3759,8Vest Arad 459286 116 6187,3
Caras Severin 331876 60 3411,3Hunedoara 480459 118 5266,7
Timis 658837 190 10431,6
Cerinte:
a. Realizarea i interpretarea regresiei unifactorialeNr. mediu de salariai = f (populaie)1. S se reprezinte grafic datele2. S se determine modelul de regresie pe baza datelor din eantion3. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.4. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.5. S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie i raportul de
corelaie, testnd semnificaia acestora pentru un nivel de semnificaie 0,05.6. Ce pondere din variaia variabilei efect este explicat de variatia variabilei cauz?
b. Realizarea i interpretarea regresiei multifactoriale Nr. mediu de salariai = f (PIB, populaie)1 S se determine modelul de regresie pe baza datelor din eantion2 S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.3 S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.4 S se msoare intensitatea legturii dintre variabile folosind raportul de corelaie, testnd
semnificaia acestuia pentru un nivel de semnificaie 0,05.5 Ce pondere din variaia variabilei efect este explicat de variatia variabilelor?
2
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
3/13
Rezolvare:
a. Realizarea si interpretarea regresiei unifactorialeNr. Mediu de salariati = f (populatie)
Se identifica cele doua variabile
xi variabila factorial =populatia (n nr persoane) din regiunile Nord-Vest si Sud - Estyi- variabila dependent = numrul mediu de salariati (mii persoane) din regiunile Nord-Vest si Sud Est
1.S se reprezinte grafic datele
Graficulconstruit, denumit corelogram, ne indic existena, forma i direcia legturii dintre cele douvariabile
Corelograma intre populatia din regiunile SV si V
si numarul mediu al salariatilor din aceleasi regiuni
y = 0.0002x - 18.371
R2 = 0.6235
0
20
40
60
80
100
120
140
160
180
200
0 100000 200000 300000 400000 500000 600000 700000 800000
Populatia
Nrmediualsalariatilor
Scara: 1cm OY = 20 mil persoane1cm OX = 100 000 persoane
Corelograma evideniaz legtura direct (punctele sunt plasate pe direcia primei bisectoare) i liniar(dreapta de regresie are panta pozitiv) dintre populatia din regiunile SV si V si numarul mediu al salariailordin aceleai regiuni.
3
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
4/13
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.789625R Square 0.623507Adjusted R Square 0.560758Standard Error 30.52726
Observations 8
ANOVA
df SS MS F Significanc
e F
Regression 1 9260.017 9260.017 9.936558 0.019759Residual 6 5591.483 931.9139
Total 7 14851.5
CoefficientsStandard
Error t Stat P-value Lower 95%Upper95%
Intercept -18.3707 38.99547 -0.4711 0.654212 -113.789 77.04781
X Variable 1 0.000247 7.84E-05 3.152231 0.019759 5.53E-05 0.000439
RESIDUAL OUTPUT
Observation Predicted Y Residuals
1 159.3791 -40.37912 76.78835 2.2116453 56.76439 -9.764394 101.2232 -32.22325 95.193 20.8076 63.68944 -3.689447 100.4283 17.57173
8 144.5343 45.46575
2. S se determine modelul de regresie pe baza datelor din eantion
Aplicarea modelului liniar de regresiepresupune utilizarea ecuaiei de regresie liniar: ii bxay +=
CoefficientsStandard
Error t Stat P-value Lower 95%Upper95%
Intercept -18.3707 38.99547 -0.4711 0.654212 -113.789 77.04781
X Variable 1 0.000247 7.84E-05 3.152231 0.019759 5.53E-05 0.000439
a = -18.3707b = 0.000247y = -18.3707 + 0.000247xi
4
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
5/13
Interpretare: b = 0.000247 b se numete coeficient de regresie reprezentnd panta liniei drepte b> 0, deci ntre numrul mediu de salariatiipopulatie exist o legtur direct la creterea populaiei cu o persoana, numrul mediu de salariati se mrete cu 0,5495 mii persoane .
3. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.
ANOVA
df SS MS F Significanc
e F
Regression 1 9260.017 9260.017 9.936558 0.019759Residual 6 5591.483 931.9139
Total 7 14851.5
Interpretare rezultate din tabelul ANOVA :
n acest tabel este calculat testul F pentru validarea modelului de regresie. ntruct F=9.936558, iarSignificance F (pragul de semnificaie) este 0.019759 (valoare mai mic de 0,05), atunci modelul deregresie construit este valid i poate fi utilizat pentru analiza dependenei dintre cele dou variabile.
4. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.
CoefficientsStandard
Error t Stat P-value Lower 95%Upper95%
Intercept -18.3707 38.99547 -0.4711 0.654212 -113.789 77.04781
X Variable 1 0.000247 7.84E-05 3.152231 0.019759 5.53E-05 0.000439
Interpretarea rezultatelor din tabelul : Intercept este termenul liber, deci coeficientul aeste-18.3707. Termenul liber este punctul n care
variabila explicativ (factorial) este 0. Deci numarul mediu de salariati, dac populatia este 0 va fi
18.3707 persoane. Deoarece at = -0.4711, iar pragul de semnificaie P-value este 0.654212 > 0,05nseamn c acest coeficient nueste semnificativ. De altfel faptul c limita inferioar a intervaluluide ncredere (-113.789 77.04781) pentru acest parametru este negativ, iar limita superioareste pozitiv arat c parametrul din colectivitatea general este aproximativ zero.
Coeficientul b este 0.000247, ceea ce nsemn c la creterea a populaiei cu o persoana, numrul
mediu de salariati va crete cu 0.000247 mii persoane. Deoarece bt = 3.152231, iar pragul desemnificaieP-value este 0.019759 < 0,05 nseamn c acest coeficient este semnificativ. Intervalulde ncredere pentru acest parametru este 5.53E-05 0.000439
5. S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie i raportul de corelaie,testnd semnificaia acestora pentru un nivel de semnificaie 0,05.
Coeficientul de corelaie r:
( ) ( )
( ) ( )
=
=
=
==
=
n
ii
n
ii
n
i
ii
yx
xy
yx
yyxx
yyxx
ss
s
ss
yxr
1
2
1
2
1),(covsau
( )[ ] ( )[ ]2222
=
iiii
iiii
yynxxn
yxyxnr
5
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
6/13
( ) ( )
( ) ( )
=
=
=
==
=
n
i
i
n
i
i
n
i
ii
yx
xy
yxyyxx
yyxx
ss
s
ss
yxr
1
2
1
2
1),(cov
Populaia
la 1 iulie2005(mii
persoane)
xi
Nr.
mediu alsalariail
or(mii.pers.)
yi
( )xxi ( )yyi ( )( )yyxx ii ( )2
xxi ( )2
yyi
718,874 119 628626,9
19,2512101068 3,95172E+11 370,5625
384,852 79
-
89862,3 -20,75 1864642 8075224806 430,5625
303,869 47
-89943,2
-52,754744506 8089785994 2782,563
483,674 69-
89763,4-30,75 2760226 8057473837 945,5625
459,286 116-
89787,816,25 -1459052 8061852733 264,0625
331,876 60 -89915,2 -39,75 3574130 8084748698 1580,063
480,459 118467,459 18,25 8531,127 218517,9167 333,0625
658,837 190-
89588,3 90,25-8085341 8026058054 8145,063
721976,9
ix798
iy( ) xxi
90234,11
( )
0
yyi ( )( )15508709
yyxx ii ( )
114,43567E
2
+
xxi ( )14851,5
2
yyi
6
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
7/13
ix iy2
ix2iy ii yx
718,874 119 5,1678E+11 1416185546006
384,852 79 148111,0619 624130403,31
303,869 47 92336,36916 220914281,84
483,674 69 233940,5383 476133373,51
459,286 116 210943,6298 1345653277,18
331,876 60 110141,6794 360019912,560
480,459 118 230840,8507 1392456694,16
658,837 190 434066,1926 36100125179
721976,9
ix
798
iy = 2ix5,16781E+11
= 2iy 94452 = iiyx85879128
r = 0,78 > 0, ceea ce ne arata ca intre populatie si numarul mediu al salariatilor exista o legatura directa puternica
Testarea semnificaiei coeficientului de corelaie:
- se stabilete ipoteza nul: H0: r nu este semnificativ statistic;- se stabilete ipoteza alternativ: H1: r este semnificativ statistic;- se calculeaz testul t:
=
=
==
22 78,01
678,0
1
2
r
nr
s
rt
r
3,0531
t0,05;6 = 2,447
tcalc > t0,05;6Coeficientul de corelaie este semnificativ statistic
Msurarea intensitii legturii cu raportul de corelaie R:
7
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
8/13
( )
( )78,0
35,22
64,79
1
2
1
2
==
=
=
=
n
i
i
n
i
i
yy
yy
R
Rezultatul R = 0,78 ne arat c, ntre poplulatie i numrul mediu de salariati exist o legtur directputernic.DeoareceR = r = 0,78, apreciem c exist o legtur liniar, puternic i direct ntre cele dou variabile.
Testarea semnificaiei raportului de corelaie (R) :
H0: raportul de corelaie nu este semnificativ statistic;H1: raportul de corelaie este semnificativ statistic;
Decizia: dac 1;; > knkcalc FF , atunci H0 se respinge
Determinarea lui Fcalculat se face cu relaia :09,46
1
13
78,01
78,01
1 2
2
=
=
=k
kn
R
RF
Pentru un prag de semnificaie de 5% valoarea tabelat a testului este:99,56;1;05,0118;1;05,01;; === tFF knk
Deoarece 6;1;05,0FFcalc > , atunci H0 se respinge, deci H1 se accept, ceea ce nseamn c raportul decorelaie (R) este semnificativ statistic.
6. Ce pondere din variaia variabilei efect este explicat de variaia variabilei cauz?
Ponderea este data de coeficientul de determinatie (R Square) :
( )
( )
=
=
=
=
=
n
i
i
n
i
i
y
e
y
xy
yy
yy
R
1
2
1
2
2
2
2
2
/2
1 = 0.623507 obtinut in EXCEL care reprezinta faptul ca 62% din variatia
numarului mediu de salariati este explicata de populatie
8
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
9/13
b.Realizarea i interpretarea regresiei multifactoriale Nr. mediu de salariai = f (PIB, populaie)
Pib-ul obtinut in regiunile SV si V
Residual Plot
-50
0
50
0 2000 4000 6000 8000 10000 12000
Pib-ul obtinut in regiunile SV si VResiduals
Populatia in regiunile SV si V Residual
Plot
-50
0
50
0 200000 400000 600000 800000
Populatia in regiunile SV si V
Residuals
Pib-ul obtinut in regiunile SV si V Line
Fit Plot
0500
0 5000 10000 15000
Pib-ul obtinut in regiunile SV si
V
Nr
mediu
al
sala
riatilor
Nr mediu al
salariatilor
Predicted Nr
mediu al
salariatilor
Populatia in regiunile SV si V Line Fit
Plot
0
500
0 500000 1000000
Populatia in regiunile SV si V
N
rmediu
al
s
alariatilo
r
Nr mediu al
salariatilor
Predicted Nrmediu al
salariatilor
9
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
10/13
SUMMARYOUTPUT
Regression Statistics
Multiple R 0.982622198R Square 0.965546384Adjusted R Square 0.951764938Standard Error 10.1162036
Observations 8
ANOVA
df SS MS F Significance
F
Regression 2 14339.81212 7169.906062 70.06132 0.000220337Residual 5 511.687876 102.3375752
Total 7 14851.5
CoefficientsStandard
Error t Stat P-value Lower 95% Upper 95%
Intercept -0.866836063 13.15907743 -0.06587362 0.950031 -34.69332146 32.95964934Populatia inregiunile SV si V 5.69674E-06 4.30263E-05 0.13240144 0.89983 -0.000104906 0.000116299Pib-ul obtinut inregiunile SV si V 0.018208019 0.002584385 7.04539834 0.00089 0.011564647 0.024851391
RESIDUALOUTPUT
Observation
Predicted Nrmediu al
salariatilor Residuals
1 123.5943312 -4.5943312442 86.17311237 -7.1731123653 49.74911549 -2.7491154934 70.3470381 -1.3470380995 114.4080713 1.5919286826 63.13678969 -3.13678969
7 97.76638642 20.233613588 192.8251554 -2.825155368
10
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
11/13
1. S se determine modelul de regresie pe baza datelor din esantion
Notam:
X1 variabila factorial =populatia (n nr persoane) din regiunile Nord-Vest si Sud Est
X2- variabila factoriala =PIB regional 2004(in mil. lei)Y- variabila dependent = numrul mediu de salariai (mii persoane) din regiunile Nord-Vest si Sud Est
Ecuaia de regresie este:
22110, 21 xbxbby xx ++= , unde 21 xxy reprezint valorile ajustate ale variabilei Yn funcie de cele dou variabile
factorialeX1iX2.
Coefficients
Standard
Error t Stat P-value Lower 95% Upper 95%Intercept -0.866836063 13.15907743 -0.06587362 0.950031 -34.69332146 32.95964934Populaia inregiunile SV si V 5.69674E-06 4.30263E-05 0.13240144 0.89983 -0.000104906 0.000116299PIB-ul obinut inregiunile SV si V 0.018208019 0.002584385 7.04539834 0.00089 0.011564647 0.024851391
b0 = -0.866836063
b1 = 5.69674E-06
b2 = 0.018208019
iii xxy 21 90.0182080106-5.69674E63-0.8668360 ++=
Parametrul b0 are caracter de mrime medie, arat c s-a nregistrat o scdere medie de -0.866836063 miipersoane, dac numrul mediu de salariai ar fi fost influenat de ali factori, exceptnd variabileleX1 iX2, inclusen model.Dac populaia ar crete cu o persoan, atunci numrul mediu de salariai ar crete cu 5.69674E-06 mii persoane,iar dac PIB-ul obinut in cele doua regiuni(Sud-vest si Vest) ar crete cu 1 mil. lei, atunci numrul mediu desalariai ar crete cu 0.018208019 mii persoane.
2. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.
ANOVA
df SS MS F Significance
F
Regression 2 14339.81212 7169.906062 70.06132 0.000220337Residual 5 511.687876 102.3375752
Total 7 14851.5
11
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
12/13
Interpretare rezultate din tabelulANOVA:n acest tabel este calculat testul F pentru validarea modelului de regresie. ntruct F=70.06132, iarSignificance F (pragul de semnificaie) este 0.000220337 (valoare mai mare de 0,05), atunci modelul deregresie construit este valid i poate fi utilizat pentru analiza dependenei dintre variabile.
3. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.
CoefficientsStandard
Error t Stat P-value Lower 95% Upper 95%
Intercept -0.866836063 13.15907743 -0.06587362 0.950031 -34.69332146 32.95964934Populatia inregiunile SV si V 5.69674E-06 4.30263E-05 0.13240144 0.89983 -0.000104906 0.000116299Pib-ul obtinut inregiunile SV si V 0.018208019 0.002584385 7.04539834 0.00089 0.011564647 0.024851391
Interpretarea rezultatelor din tabelul 3:
Intercept este termenul liber, deci coeficientul b0este-0.866836063. Termenul liber este punctul ncare variabilele explicative (factoriale) sunt 0. Deci numarul mediu de salariati, dac valoarea
populatie si a PIB-ului ar fi 0, s-ar situa la nivelul -0.866836063 mii persoane. Deoarece 0bt =-0.06587362, iar pragul de semnificaie P-value este 0.950031 > 0,05 nseamn c acest coeficientnueste semnificativ. De altfel faptul c limita inferioar a intervalului de ncredere pentru acest
parametru este negativ, iar limita superioar este pozitiv -34.69332146 32.95964934) aratc parametrul din colectivitatea general este aproximativ zero.
Coeficientul b1 este 5.69674E-06, ceea ce nsemn c la creterea populatiei cu o persoana, numarul
mediu de salariati va crete cu 5.69674E-06 mii persoane. Deoarece 1bt = 0.13240144, iar pragul desemnificaie P-value este 0.89983 > 0,05 nseamn c acest coeficient nu este semnificativ. De
asemenea, acest parametru este aproximativ zero, deoarece limita inferioar a intervalului dencredere pentru acest parametru este negativ, iar limita superioar este pozitiv ( -0.000104906
0.000116299). Coeficientul b2 este 0.018208019 i ne arat c, la o cretere cu 1 mil a PIB-ului obtinut in cele doua
regiuni, numarul mediu de salariati va nregistra o cretere cu 0.018208019 mii persoane. Rezultatul
2bt =7.04539834 i pragul de semnificaie corespunztorP-value de 0.00089 < 0,05 ne conduce laconcluzia c acest coeficient este semnificativ. Intervalul de incredere pentru acest parametru este-0,04114133 0,2493662.
4. S se msoare intensitatea legturii dintre variabile folosind raportul de corelaie, testnd semnificaiaacestuia pentru un nivel de semnificaie 0,05.
R= 0,989430469arat c ntre numarul mediu de salariati i cele 2 variabile luate n studiu (PIB-ul obtinutin cele doua regiuni si populatia) exist o legtur directa foarte puternic.
Testarea semnificaiei raportului de corelaie (R) :
H0: raportul de corelaie nu este semnificativ statistic;H1: raportul de corelaie este semnificativ statistic;
Decizia: dac 1;; > knkcalc FF , atunci H0 se respinge
Determinarea lui Fcalculat se face cu relaia :
12
-
7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete
13/13
49,1481
6
98.0*98,01
98,01
1 2
2
=
=
=k
kn
R
RF
Pentru un prag de semnificaie de 5% valoarea tabelat a testului este:14,56;2;05,0118;2;05,01;; === FFF knk
Deoarece 6;1;05,0FFcalc > , atunci H0 se respinge, deci H1 se accept, ceea ce nseamn c raportul decorelaie (R) este semnificativ statistic.
5. Ce pondere din variaia variabilei efect este explicat de variatia variabilelor?
Ponderea este data de coeficientul de determinatie (R Square) := 0.965546384 obtinut in EXCEL care reprezinta faptul ca 96% din variatia numarului mediu de salariati este
explicata de populatie si PIB-ul obtinut in cele doua regiuni.
13
top related