regresja ciąg dalszy
DESCRIPTION
Regresja ciąg dalszy. Badania Operacyjne. Współczynnik R 2. Wzór współczynnika R 2 : TSS – total sum of squares SSE – sum of square errors Zawsze w przedziale [0,1] Wada: dodanie zmiennej zawsze poprawi wartość współczynnika - PowerPoint PPT PresentationTRANSCRIPT
Regresja ciąg dalszy
Badania Operacyjne
Współczynnik R2
Wzór współczynnika R2:TSS – total sum of squaresSSE – sum of square errorsZawsze w przedziale [0,1]
Wada: dodanie zmiennej zawsze poprawi wartość współczynnika
Stąd skorygowany współczynnik R2, który uwzględnia liczbę zmiennych:
Model – istotność statystycznaModel 1: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16)Zmienna zależna (Y): Avgseatsales
Współczynnik Błąd stand. t-Studenta wartość pconst 28,8438 174,665 0,1651 0,87159Avgprice -2,1235 0,34039 -6,2384 0,00004 ***Avgoppprice 1,03456 0,466527 2,2176 0,04664 **Avgincome 3,08937 0,998893 3,0928 0,00931 ***
Średn.aryt.zm.zależnej 87,24375 Odch.stand.zm.zależnej 27,93562Suma kwadratów reszt 2616,380 Błąd standardowy reszt 14,76590Wsp. determ. R-kwadrat 0,776492 Skorygowany R-kwadrat 0,720615F(3, 12) 13,89645 Wartość p dla testu F 0,000329Logarytm wiarygodności -63,47868 Kryt. inform. Akaike'a 134,9574Kryt. bayes. Schwarza 138,0477 Kryt. Hannana-Quinna 135,1156Autokorel.reszt - rho1 0,405714 Stat. Durbina-Watsona 1,111409
1) Statystyka F: łączna istotność statystyczna parametrów przy wszystkich zmiennych – wartość p
2) Statystyka t-studenta: istotność statystyczna poszczególnych zmiennych (zależy od liczby obserwacji)Idea: usuwamy KOLEJNO (po jednym) zmienne, które odpowiadają parametrom statystycznie nieistotnym poczynając od najmniej istotnej.
Czyli usuwamy zmienną Const.
Istotność statystycznaModel 2: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16)Zmienna zależna (Y): Avgseatsales
Współczynnik Błąd stand. t-Studenta wartość pAvgprice -2,1184 0,326056 -6,4970 0,00002 ***Avgoppprice 1,10189 0,218123 5,0517 0,00022 ***Avgincome 3,1993 0,716326 4,4663 0,00064 ***
Średn.aryt.zm.zależnej 87,24375 Odch.stand.zm.zależnej 27,93562Suma kwadratów reszt 2622,326 Błąd standardowy reszt 14,20273Wsp. determ. R-kwadrat 0,980356 Skorygowany R-kwadrat 0,977333F(3, 13) 216,2550 Wartość p dla testu F 2,43e-11Logarytm wiarygodności -63,49684 Kryt. inform. Akaike'a 132,9937Kryt. bayes. Schwarza 135,3115 Kryt. Hannana-Quinna 133,1124Autokorel.reszt - rho1 0,407666 Stat. Durbina-Watsona 1,099873
Teraz wygląda dobrze
Zaokrąglone wartości
Liczymy statystykę t dla hipotezy, że współczynnik przy zmiennej Avgoppprice jest równy 1
Ponieważ wartość ta jest istotnie mniejsza od 2, to hipoteza zyskuje mocne poparcie.To samo dla reszty współczynnikówOtrzymujemy równanie:Avgseatsales = -2 Avgprice + 1 Avgoppprice +3 Avgincome
Specyfikacja równania
• Być może zależności nie są liniowe• Np.• Po zlogarytmowaniu
Jest jeszcze lepiejModel 2: OLS, using observations 2013:1-2016:4 (T = 16)Dependent variable: l_Avgseatsale
coefficient std. error t-ratio p-value ------------------------------------------------------------- l_Avgprice −7.63739 1.01895 −7.495 4.53e-06 *** l_Avgoppprice 3.66443 0.649140 5.645 8.00e-05 *** l_Avgincome 5.64535 1.01230 5.577 8.97e-05 ***
Mean dependent var 4.407235 S.D. dependent var 0.389005Sum squared resid 0.420587 S.E. of regression 0.179869R-squared 0.998656 Adjusted R-squared 0.998450F(3, 13) 3221.034 P-value(F) 6.55e-19Log-likelihood 6.406527 Akaike criterion −6.813054Schwarz criterion −4.495288 Hannan-Quinn −6.694365rho 0.411095 Durbin-Watson 1.123173
Log-likelihood for Avgseatsales = −64.1092Autokorel.reszt - rho1 0,407666 Stat. Durbina-Watsona 1,099873
Współliniowość: Dodajemy zmienną Wydatki na marketing
Rok KwartałPrzeciętna liczba
sprzedanych biletów na jeden lot
Przeciętna cena
(w PLN)
Przeciętna cena
konkurenta
Przeciętny dochód
(wskaźnik)
Wydatki na marketing
Rok 1 Kw. I 64,8 250 250 104,0 95Kw. II 33,6 265 250 101,5 100Kw. III 37,8 265 240 103,0 101Kw. IV 83,3 240 240 105,0 85
Rok 2 Kw. I 111,7 230 240 100,0 71Kw. II 137,5 225 260 96,5 65Kw. III 109,5 225 250 93,3 64Kw. IV 96,8 220 240 95,0 60
Rok 3 Kw. I 59,5 230 240 97,0 72Kw. II 83,2 235 250 99,0 81Kw. III 90,5 245 250 102,5 92Kw. IV 105,5 240 240 105,0 86
Rok 4 Kw. I 75,7 250 220 108,5 95Kw. II 91,6 240 230 108,5 86Kw. III 112,7 240 250 108,0 87
Kw. IV 102,2 235 240 109,0 81
Współczynnik korelacji pomiędzy przeciętną ceną i wydatkami na marketing: 0,954445755
Model 2: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16)Zmienna zależna (Y): Avgseatsales
Współczynnik Błąd stand. t-Studenta wartość pAvgprice -1,8416 0,661585 -2,7836 0,01654 **Avgoppprice 0,954767 0,377211 2,5311 0,02636 **Avgincome 3,19366 0,738443 4,3249 0,00099 ***Marketing -0,362965 0,747255 -0,4857 0,63591
Średn.aryt.zm.zależnej 87,24375 Odch.stand.zm.zależnej 27,93562Suma kwadratów reszt 2571,762 Błąd standardowy reszt 14,63945Wsp. determ. R-kwadrat 0,980734 Skorygowany R-kwadrat 0,975918F(4, 12) 152,7176 Wartość p dla testu F 3,52e-10Logarytm wiarygodności -63,34108 Kryt. inform. Akaike'a 134,6822Kryt. bayes. Schwarza 137,7725 Kryt. Hannana-Quinna 134,8404Autokorel.reszt - rho1 0,401994 Stat. Durbina-Watsona 1,135021
Ocena współliniowości VIF - czynnika powiększania wariancji
Minimalna możliwa wartość = 1.0Wartości > 10.0 mogą wskazywać na problem współliniowości-rozdęcia wariancji
Avgprice 21,761 Avgoppprice 1,436 Avgincome 4,592 Marketing 31,078
Heteroskedatsyczność reszt
U nas nie ma:
heteroskedastyczność:
Normalność składnika losowego
U nas nie jest źle: