732g71 statistik b732g71/f7ht2017.pdf · exempel: kvadratisk trend om vi tror att kpi ökar gradvis...

29

Upload: others

Post on 01-Feb-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

732G71 Statistik BFöreläsning 7

Bertil Wegmann

IDA, Linköpings universitet

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

Page 2: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Detaljhandelns försäljning (fasta priser, kalenderkorrigerat)

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 2 / 29

Page 3: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Tidsserieregressionsanalys (kap. 6.1-6.4)

En tidsserie kan möjligen delas upp i följande komponenter:

Trend

Cykel

Säsongsvariation

Slumpvariation

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 3 / 29

Page 4: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Tidsserier med endast trend

Det enklaste fallet är en tidsserie som endast innehåller en trend- ochslumpkomponent.

Trendmodell:

yt = TRt + εt ,

där yt är värdet på y vid tidpunkt t, TRt är trenden vid tidpunkt t och εtär feltermen vid tidpunkt t.

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 4 / 29

Page 5: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Olika modeller för trenden

Beroende på hur trenden ser ut, kan den modelleras på olika sätt.

yt = TRt + εt

Ingen trend: TRt = β0

Linjär trend: TRt = β0 + β1t

Kvadratisk trend: TRt = β0 + β1t + β2t2

Regressionsantaganden: εt ∼ N (0, σ)

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 5 / 29

Page 6: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: KPI, månadsvis 2006:1 - 2015:10

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 6 / 29

Page 7: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: Ingen trend

Om vi först (felaktigt) antar att vi inte har någon trend skattar viföljande modell: yt = β0 + εt , där β0 skattas som medelvärdet avKPI: b0 = 108.85.

Ett 95 % prediktionsintervall för yt för denna modell ges av

y ± t[0.05/2],(n−1)s√1+ 1

n , där s är den vanliga skattningen av

standardavvikelsen för y , d.v.s. s =√

∑(yt−y )2n−1 .

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 7 / 29

Page 8: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: skattad KPI utan trend

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 8 / 29

Page 9: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: Linjär trend

Om vi tror att KPI ökar linjärt över tid kan vi skatta en linjärtrendmodell med tidsvariabeln t som förklaringsvariabel, därt = 1, 2, 3, . . . , 118:

yt = β0 + β1t + εt

De vanliga formlerna för en enkel linjär regressionsanalys kan användasför att anpassa modellen.

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 9 / 29

Page 10: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: Linjär trend

Regression Analysis: KPI versus t

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value

Regression 1 1383,3 1383,30 633,37 0,000

t 1 1383,3 1383,30 633,37 0,000

Error 116 253,3 2,18

Total 117 1636,7

Model Summary

S R-sq R-sq(adj) R-sq(pred)

1,47785 84,52% 84,39% 83,89%

Coefficients

Term Coef SE Coef T-Value P-Value VIF

Constant 102,871 0,274 375,67 0,000

t 0,10052 0,00399 25,17 0,000 1,00

Regression Equation

KPI = 102,871 + 0,10052 t

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 10 / 29

Page 11: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: Linjär trend

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 11 / 29

Page 12: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: Kvadratisk trend

Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisktrendmodell:

yt = β0 + β1t + β2t2 + εt

Den kvadratiska trendmodellen kan anpassas med vanlig multipel linjärregressionsanalys.

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 12 / 29

Page 13: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: Kvadratisk trend

Regression Analysis: KPI versus t; tSquared

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value

Regression 2 1553,42 776,708 1073,08 0,000

t 1 477,81 477,810 660,13 0,000

tSquared 1 170,11 170,111 235,02 0,000

Error 115 83,24 0,724

Total 117 1636,65

Model Summary

S R-sq R-sq(adj) R-sq(pred)

0,850769 94,91% 94,83% 94,72%

Coefficients

Term Coef SE Coef T-Value P-Value VIF

Constant 100,117 0,239 418,90 0,000

t 0,23821 0,00927 25,69 0,000 16,26

tSquared -0,001157 0,000075 -15,33 0,000 16,26

Regression Equation

KPI = 100,117 + 0,23821 t - 0,001157 tSquared

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 13 / 29

Page 14: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: Kvadratisk trend

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 14 / 29

Page 15: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Autokorrelation

Ett av antagandena i linjär regressionsanalys är att feltermerna äroberoende av varandra. Detta antagande är ofta inte uppfyllt när manhar tidsserier.

Positiv autokorrelation:

En positiv felterm vid tidpunkt t tenderar att följas av en positiv

felterm vid tidpunkt t + 1.

En negativ felterm vid tidpunkt t tenderar att följas av en negativ

felterm vid tidpunkt t + 1.

Negativ autokorrelation:

En positiv felterm vid tidpunkt t tenderar att följas av en negativ

felterm vid tidpunkt t + 1.

En negativ felterm vid tidpunkt t tenderar att följas av en positiv

felterm vid tidpunkt t + 1.

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 15 / 29

Page 16: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: autokorrelation för linjär trendmodell

Vi undersöker om vi har positiv/negativ autokorrelation i den fjärderesidualplotten. Vad verkar vara fallet?

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 16 / 29

Page 17: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: autokorrelation för kvadratisk trendmodell

Vi undersöker om vi har positiv/negativ autokorrelation i den fjärderesidualplotten. Vad verkar vara fallet?

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 17 / 29

Page 18: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Durbin-Watson test för positiv autokorrelation

H0 : Feltermerna är ej autokorreleradeHa : Feltermerna är positivt autokorrelerade

d =∑n

t=2 (et − et−1)2

∑nt=2 e

2t

,

där et är residualen (skattade feltermen) vid tidpunkt t.

Förkasta H0 om d < dL,α

Förkasta ej H0 om d > dU,α

Om dL,α ≤ d ≤ dU,α ger testet inget svar om hypoteserna.

Värden på dL,α och dU,α ges från tabeller på sidan 598 och 599.

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 18 / 29

Page 19: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Durbin-Watson test för negativ autokorrelation

H0 : Feltermerna är ej autokorreleradeHa : Feltermerna är negativt autokorrelerade

d =∑n

t=2 (et − et−1)2

∑nt=2 e

2t

,

där et är residualen (skattade feltermen) vid tidpunkt t.

Förkasta H0 om (4− d) < dL,α

Förkasta ej H0 om (4− d) > dU,α

Om dL,α ≤ (4− d) ≤ dU,α ger testet inget svar om hypoteserna.

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 19 / 29

Page 20: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: Durbin-Watson test för Linjär trendmodell

Regression Analysis: KPI versus t

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value

Regression 1 1383,3 1383,30 633,37 0,000

t 1 1383,3 1383,30 633,37 0,000

Error 116 253,3 2,18

Total 117 1636,7

Model Summary

S R-sq R-sq(adj) R-sq(pred)

1,47785 84,52% 84,39% 83,89%

Coefficients

Term Coef SE Coef T-Value P-Value VIF

Constant 102,871 0,274 375,67 0,000

t 0,10052 0,00399 25,17 0,000 1,00

Regression Equation

KPI = 102,871 + 0,10052 t

Durbin-Watson Statistic = 0,102533

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 20 / 29

Page 21: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Exempel: Durbin-Watson test för Kvadratisk trendmodell

Regression Analysis: KPI versus t; tSquared

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value

Regression 2 1553,42 776,708 1073,08 0,000

t 1 477,81 477,810 660,13 0,000

tSquared 1 170,11 170,111 235,02 0,000

Error 115 83,24 0,724

Total 117 1636,65

Model Summary

S R-sq R-sq(adj) R-sq(pred)

0,850769 94,91% 94,83% 94,72%

Coefficients

Term Coef SE Coef T-Value P-Value VIF

Constant 100,117 0,239 418,90 0,000

t 0,23821 0,00927 25,69 0,000 16,26

tSquared -0,001157 0,000075 -15,33 0,000 16,26

Regression Equation

KPI = 100,117 + 0,23821 t - 0,001157 tSquared

Durbin-Watson Statistic = 0,303298

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 21 / 29

Page 22: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Säsongsvariation

Många tidsserier som är mätta månadsvis, kvartalsvis osv. uppvisarsäsongsvariation. Om säsongsvariationen inte beror på nivån är denkonstant. Är säsongsvariationen konstant för detaljhandelns försäljningper kvartal?

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 22 / 29

Page 23: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Ökande säsongsvariation

Om säsongsvariationen beror på nivån på tidsserien är den ökande ellerminskande.

Vid ökande säsongsvariation kan man transformera y för att fåkonstant säsongsvariation. Nedan följer tre vanliga transformationersom man kan pröva med om man har detta problem.

y∗ =√y = y0.5

y∗ = y0.25

y∗ = ln y

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 23 / 29

Page 24: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Ökande säsongsvariation för detaljhandelns försäljning

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 24 / 29

Page 25: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Dummyvariabler för att modellera säsongsvariation

Om en tidsserie har konstant säsongsvariation kan vi använda följandemodell:

yt = TRt + SNt + εt ,

där yt är värdet på y vid tidpunkt t, TRt är trenden vid tidpunkt t,SNt är säsongsfaktorn vid tidpunkt t och εt är feltermen vid tidpunktt.

Säsongsfaktorerna kan skattas om vi skapar dummyvariabler: om vihar L säsonger skapar vi L− 1 dummyvariabler.

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 25 / 29

Page 26: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Multipel linjär regressionsanalys med dummyvariabler

Modellen

ln yt = β0 + β1t + β2D1 + β3D2 + β4D3 + εt

skattas i Minitab som en vanlig linjär multipel regressionsmodell, därD1 = 1 om kvartal 1, 0 annars, D2 = 1 om kvartal 2, 0 annars,D3 = 1 om kvartal 3, 0 annars.

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 26 / 29

Page 27: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Skattad multipel linjär regressionsmodell

Regression Analysis: ln y versus t; D_1; D_2; D_3

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value

Regression 4 6,68290 1,67073 429,84 0,000

t 1 6,25034 6,25034 1608,06 0,000

D_1 1 0,38878 0,38878 100,02 0,000

D_2 1 0,08288 0,08288 21,32 0,000

D_3 1 0,10065 0,10065 25,90 0,000

Error 94 0,36537 0,00389

Total 98 7,04827

Model Summary

S R-sq R-sq(adj) R-sq(pred)

0,0623449 94,82% 94,60% 94,19%

Coefficients

Term Coef SE Coef T-Value P-Value VIF

Constant 3,9674 0,0168 236,16 0,000

t 0,008795 0,000219 40,10 0,000 1,00

D_1 -0,1782 0,0178 -10,00 0,000 1,53

D_2 -0,0823 0,0178 -4,62 0,000 1,53

D_3 -0,0907 0,0178 -5,09 0,000 1,53

Regression Equation

ln y = 3,9674 + 0,008795 t - 0,1782 D_1 - 0,0823 D_2 - 0,0907 D_3

Durbin-Watson Statistic = 0,161703

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 27 / 29

Page 28: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Signi�kanstest och modellutvärdering

Eftersom vi har skattat en vanlig multipel linjär regressionsmodell kanvi använda de vanliga signi�kanstesten.

F-test för hela modellen

Signi�kanstest för trend: t-test för förklaringsvariabel tSigni�kanstest för säsongsvariation: Partiellt F-test för

dummyvariablerna

Modellen utvärderas sedan på vanligt sätt, d.v.s. vi kan undersökaförklaringsgraden och s (eller MSE) samt undersöka residualplottaroch testa för autokorrelation.

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 28 / 29

Page 29: 732G71 Statistik B732G71/F7ht2017.pdf · Exempel: Kvadratisk trend Om vi tror att KPI ökar gradvis kan vi skatta en kvadratisk trendmodell: y t = b0 + b1 t + b2 t2 +e t Den kvadratiska

Residualplottar

Bertil Wegmann (IDA, LiU) 732G71, Statistik B 29 / 29