regresja ciąg dalszy

Regresja ciąg dalszy

Badania Operacyjne

Współczynnik R2

Wzór współczynnika R2:TSS – total sum of squaresSSE – sum of square errorsZawsze w przedziale [0,1]

Wada: dodanie zmiennej zawsze poprawi wartość współczynnika

Stąd skorygowany współczynnik R2, który uwzględnia liczbę zmiennych:

Model – istotność statystycznaModel 1: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16)Zmienna zależna (Y): Avgseatsales

Współczynnik Błąd stand. t-Studenta wartość pconst 28,8438 174,665 0,1651 0,87159Avgprice -2,1235 0,34039 -6,2384 0,00004 ***Avgoppprice 1,03456 0,466527 2,2176 0,04664 **Avgincome 3,08937 0,998893 3,0928 0,00931 ***

Średn.aryt.zm.zależnej 87,24375 Odch.stand.zm.zależnej 27,93562Suma kwadratów reszt 2616,380 Błąd standardowy reszt 14,76590Wsp. determ. R-kwadrat 0,776492 Skorygowany R-kwadrat 0,720615F(3, 12) 13,89645 Wartość p dla testu F 0,000329Logarytm wiarygodności -63,47868 Kryt. inform. Akaike'a 134,9574Kryt. bayes. Schwarza 138,0477 Kryt. Hannana-Quinna 135,1156Autokorel.reszt - rho1 0,405714 Stat. Durbina-Watsona 1,111409

1) Statystyka F: łączna istotność statystyczna parametrów przy wszystkich zmiennych – wartość p

2) Statystyka t-studenta: istotność statystyczna poszczególnych zmiennych (zależy od liczby obserwacji)Idea: usuwamy KOLEJNO (po jednym) zmienne, które odpowiadają parametrom statystycznie nieistotnym poczynając od najmniej istotnej.

Czyli usuwamy zmienną Const.

Istotność statystycznaModel 2: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16)Zmienna zależna (Y): Avgseatsales

Współczynnik Błąd stand. t-Studenta wartość pAvgprice -2,1184 0,326056 -6,4970 0,00002 ***Avgoppprice 1,10189 0,218123 5,0517 0,00022 ***Avgincome 3,1993 0,716326 4,4663 0,00064 ***

Średn.aryt.zm.zależnej 87,24375 Odch.stand.zm.zależnej 27,93562Suma kwadratów reszt 2622,326 Błąd standardowy reszt 14,20273Wsp. determ. R-kwadrat 0,980356 Skorygowany R-kwadrat 0,977333F(3, 13) 216,2550 Wartość p dla testu F 2,43e-11Logarytm wiarygodności -63,49684 Kryt. inform. Akaike'a 132,9937Kryt. bayes. Schwarza 135,3115 Kryt. Hannana-Quinna 133,1124Autokorel.reszt - rho1 0,407666 Stat. Durbina-Watsona 1,099873

Teraz wygląda dobrze

Zaokrąglone wartości

Liczymy statystykę t dla hipotezy, że współczynnik przy zmiennej Avgoppprice jest równy 1

Ponieważ wartość ta jest istotnie mniejsza od 2, to hipoteza zyskuje mocne poparcie.To samo dla reszty współczynnikówOtrzymujemy równanie:Avgseatsales = -2 Avgprice + 1 Avgoppprice +3 Avgincome

Specyfikacja równania

• Być może zależności nie są liniowe• Np.• Po zlogarytmowaniu

Jest jeszcze lepiejModel 2: OLS, using observations 2013:1-2016:4 (T = 16)Dependent variable: l_Avgseatsale

coefficient std. error t-ratio p-value ------------------------------------------------------------- l_Avgprice −7.63739 1.01895 −7.495 4.53e-06 *** l_Avgoppprice 3.66443 0.649140 5.645 8.00e-05 *** l_Avgincome 5.64535 1.01230 5.577 8.97e-05 ***

Mean dependent var 4.407235 S.D. dependent var 0.389005Sum squared resid 0.420587 S.E. of regression 0.179869R-squared 0.998656 Adjusted R-squared 0.998450F(3, 13) 3221.034 P-value(F) 6.55e-19Log-likelihood 6.406527 Akaike criterion −6.813054Schwarz criterion −4.495288 Hannan-Quinn −6.694365rho 0.411095 Durbin-Watson 1.123173

Log-likelihood for Avgseatsales = −64.1092Autokorel.reszt - rho1 0,407666 Stat. Durbina-Watsona 1,099873

Współliniowość: Dodajemy zmienną Wydatki na marketing

Rok KwartałPrzeciętna liczba

sprzedanych biletów na jeden lot

Przeciętna cena

(w PLN)

Przeciętna cena

konkurenta

Przeciętny dochód

(wskaźnik)

Wydatki na marketing

Rok 1 Kw. I 64,8 250 250 104,0 95Kw. II 33,6 265 250 101,5 100Kw. III 37,8 265 240 103,0 101Kw. IV 83,3 240 240 105,0 85



Rok 4 Kw. I 75,7 250 220 108,5 95Kw. II 91,6 240 230 108,5 86Kw. III 112,7 240 250 108,0 87

Kw. IV 102,2 235 240 109,0 81

Współczynnik korelacji pomiędzy przeciętną ceną i wydatkami na marketing: 0,954445755

Model 2: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16)Zmienna zależna (Y): Avgseatsales

Współczynnik Błąd stand. t-Studenta wartość pAvgprice -1,8416 0,661585 -2,7836 0,01654 **Avgoppprice 0,954767 0,377211 2,5311 0,02636 **Avgincome 3,19366 0,738443 4,3249 0,00099 ***Marketing -0,362965 0,747255 -0,4857 0,63591

Średn.aryt.zm.zależnej 87,24375 Odch.stand.zm.zależnej 27,93562Suma kwadratów reszt 2571,762 Błąd standardowy reszt 14,63945Wsp. determ. R-kwadrat 0,980734 Skorygowany R-kwadrat 0,975918F(4, 12) 152,7176 Wartość p dla testu F 3,52e-10Logarytm wiarygodności -63,34108 Kryt. inform. Akaike'a 134,6822Kryt. bayes. Schwarza 137,7725 Kryt. Hannana-Quinna 134,8404Autokorel.reszt - rho1 0,401994 Stat. Durbina-Watsona 1,135021

Ocena współliniowości VIF - czynnika powiększania wariancji

Minimalna możliwa wartość = 1.0Wartości > 10.0 mogą wskazywać na problem współliniowości-rozdęcia wariancji

Avgprice 21,761 Avgoppprice 1,436 Avgincome 4,592 Marketing 31,078

Heteroskedatsyczność reszt

U nas nie ma:

heteroskedastyczność:

Normalność składnika losowego

U nas nie jest źle:

regresja ciąg dalszy

Documents