aikasarjan arima -mallipohjaisesta kausitasoituksesta · kusta empiirisen osan aineistosta. ......

Post on 23-Jan-2020

2 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

469

K a n s a n t a l o u d e l l i n e n a i k a k a u s k i r j a – 1 0 1 . v s k . – 4 / 2 0 0 5 ARTIKKELEITA

Aikasarjan ARIMA-mallipohjaisestakausitasoituksesta

Arto Kokkinen*♣

Tutkija, Helsingin yliopisto;Talous- ja sosiaalihistoria

Yliaktuaari, Tilastokeskus

Faiz Alsuhail*♣♣

valtiot. yo

Helsingin yliopisto

* Artikkelissa esitetyt näkemykset ovat kirjoittajien omia,eivätkä välttämättä vastaa Tilastokeskuksen tai Helsinginyliopiston virallista kantaa. Kirjoittajat kiittävät Tilastokes-kusta empiirisen osan aineistosta.

♣ Arto Kokkinen kiittää Yrjö Jahnssonin säätiön rahoit-tamaa, prof. Riitta Hjerppen johtamaa Suomen taloudenkonvergenssi 1945-2000 -tutkimushanketta taloudellisestatuesta.

♣♣ Faiz Alsuhail työskenteli kesällä 2005 Tilastokeskukses-sa harjoittelijana.

1 Tilastokeskuksessa käytettiin aiemmin X11-ARIMA jaX12-ARIMA -menetelmiä.

1. Johdanto

Tilastokeskus siirtyy vuoden 2005 loppuunmennessä käyttämään suhdanneaikasarjojen kau-sitasoituksissa ARIMA-mallipohjaista TRAMO/SEATS -menetelmää.1 Osassa tutkijoiden käyt-tämistä aineistoista (mm. kansantalouden tilin-pidon suhdannetiedoissa) siirryttiin tähän me-netelmään jo vuonna 2004.

Vuotta tiheämmin havaintoja sisältävissätaloudellisissa suhdanneaikasarjoissa esiintyy

usein voimakasta vuoden sisäisille havaintojak-soille tyypillistä vaihtelua. Tätä vaihtelua kut-sutaan kausivaihteluksi. Asia voidaan hahmot-taa esimerkiksi tarkastelemalla kuvaa 1, jossaeri neljännesten vientivolyymit poikkeavat sys-temaattisesti toisistaan. Tavaraviennin volyy-min alkuperäisen sarjan havainnoista voidaanlaskea muutos vuoden takaisesta vastaavankauden havainnosta, mutta vertaus edelliseenhavaintoon ei tuota järkevää tulosta. Vuodentakaisen muutoksen lisäksi vertaus edelliseenhavaintoon olisi myös toivottavaa, sillä sen pe-rusteella havaitaan käännepisteet tarkastelta-vassa muuttujassa. Jotta tähän päästäisiin, ai-kasarja on jaettava komponentteihin ja vuodensisäinen kausivaihtelu tasoitettava.

Taloudelliset aikasarjat esitetään usein jaet-tavaksi neljään eri komponenttiin, joilla on seu-raavanlaiset määritelmät. Trendi kuvaa ilmiönrakenteellisista syistä johtuvaa hidasta ja pitkä-aikaista muutosta. Suhdannesyklillä (business

470

A R T I K K E L E I T A KAK 4 / 2005

cycle) taas viitataan vaihteluun, joka johtuu esi-merkiksi taloudellisista suhdanteista. Kyseessäon keskipitkän aikavälin vaihtelu. Koska tren-din ja suhdannesyklin erottaminen toisistaanyksikäsitteisellä ja selkeällä tavalla on hankalaa,komponentit estimoidaan yleensä yhdessä. Kir-jallisuudessa puhutaan tällöin trendisyklistä(trendcycle), jolla tarkoitetaan juuri näidenkahden komponentin yhteisvaikutusta. Jatkos-sa, kun puhumme trendistä, tarkoitamme ni-menomaan trendisykliä.

Kausivaihtelun ajatellaan olevan vuosittais-ta ja jokseenkin säännöllistä vaihtelua trendinympärillä. Syinä kausivaihtelun esiintymiseenovat esimerkiksi vuodenajan vaihtelun tai erituotteille otollisten vuoden sisäisten myynti-kausien tuomat muutokset tarkasteltavassa il-miössä. Aikasarjan neljännen komponentin eliepäsäännöllisen vaihtelun oletetaan olevan val-koista kohinaa, joka ei sisällä aikasarjan ana-lyysin kannalta hyödyllistä tietoa.

Suhdanneaikasarjojen kausitasoituksissa onhavaittavissa kaksi pääsuuntausta: mallipohjai-set menetelmät ja ad hoc -suotimiin perustu-vat menetelmät. Ad hoc -lähestymistavan me-netelmissä aikasarjat tasoitetaan kiinteällä suo-dinkaavalla. Sofistikoituja liukuvia keskiarvo-ja käyttävät X11–X12 -perheen menetelmätovat esimerkkejä ad hoc -suotimista. Muinaesimerkkeinä käyvät mm. Dainties, Sabl jaBV4. Mallipohjaisista menetelmistä mainitta-koon TRAMO/SEATS:n lisäksi aikasarjara-kenneyhtälömalleihin pohjautuva STAMP.Tässä kirjoituksessa tarkastelemme ARIMA-mallipohjaisen TRAMO/SEATS-menetelmänperusominaisuuksia

ARIMA-mallipohjaisen kausitasoituksenlähtökohtana on mallintaa ensin havaintosarjanvaihtelu ARIMA-mallin avulla. Saatua ARIMA-mallia käytetään hyväksi, kun aikasarjan vaih-

telu jaetaan trendiin, kausikomponenttiin jaepäsäännöllisen vaihtelun komponenttiin.Komponentteihin jako tehdään siten, että saa-dut komponentit ovat esitettävissä ARIMA-malleina.

Merkittävimpänä erona ad hoc -lähestymis-tapaan on, että TRAMO/SEATS:ssa kullekinaikasarjalle muodostetaan oma, sarjakohtainensuodinkaava, jolla aineisto tasoitetaan. Mene-telmä sisältää myös tehokkaan tavan tehdä työ-ja kauppapäiväkorjauksia ja tunnistaa poikkea-via havaintoja. TRAMO/SEATS antaa myösmahdollisuuden ennusteiden, keskivirheiden jaluottamusvälien muodostamiseen.

Kausitasoitusmenetelmiä ryhdyttiin käyttä-mään taloutta kuvaavien suhdanneaikasarjojenanalysoinnissa 1920-luvulla. Tietokoneidenyleistyminen mahdollisti suurten aikasarja-ai-neistojen kausitasoitusmenetelmien kehityksen1950- ja 60-luvuilla Niin sanottu X-11-mene-telmä otettiin käyttöön USA:ssa v. 1965. Tä-män menetelmän yksi versio otettiin Suomes-sa käyttöön 1960-luvun lopussa, ja sitä käytet-tiin Tilastokeskuksessa aina vuoteen 1994 saak-ka. Tällöin siirryttiin siitä muunnettuun X11-ARIMA -menetelmän soveltamiseen (Öller jaNyblom 2002). Oleellisin pääuudistus oliARIMA-mallien avulla tuotettujen lisähavain-tojen luominen sarjan loppupäähän viimeistentasoitettujen havaintojen revisoitumisen vähen-tämiseksi.

Suurimman uskottavuuden menetelmälläestimoitujen aikasarjamallien muuntaminen ta-soitussuotimiksi keksittiin 1980-luvun alku-vuosina (Bell, Burman, Hillmer ja Tiao). Bankof England otti ensimmäisenä ARIMA-mallei-hin pohjautuvan tasoitusohjelman käyttöönvuonna 1982. Nykyinen tämän koulukunnantunnetuin suurten aikasarjajoukkojen kausita-soituksissa käytetty menetelmä TRAMO/

471

A r t o K o k k i n e n j a F a i z A l s u h a i l

SEATS pohjautuu tähän ohjelmaan (Öller jaNyblom 2002). Ohjelman ja menetelmän ny-kymuotoon saattajia ovat olleet Maravall jaGomez (ks. esim. Maravall ja Gomez 1996).

Kausitasoituksessa puututaanalkuperäisen sarjan auto-korrelaatiorakenteeseen

Kausikomponentti vaikeuttaa ihmisen kykyähavaita suhdanneaikasarjan käännepisteet suh-teessa edelliseen havaintoon. Myös pidemmänajan kehityksen suunta ja muodot ovat vaikeas-ti hahmotettavissa alkuperäisestä havaintosar-jasta. Kausivaihtelu mielletäänkin usein vuot-ta tiheämmin havaintoja sisältävässä aikasarjas-sa kiusankappaleeksi, jolla ei ole paljoakaantekemistä pidemmän ajan kehityskuvan kans-sa. Tästä ei pidä tehdä sellaista johtopäätöstä,että kausivaihtelu olisi vakioista ja determinis-tistä, ja että sen mallintaminen ja tasoittaminenolisi vain triviaali pikkuseikka suurempienasioiden tiellä (ks. myös Takala 1994, 69–71).

Aina kun aikasarjaa kausitasoitetaan, puu-tutaan alkuperäisen aikasarjan autokorrelaatio-rakenteeseen. Mikäli käytettävä suodin (olipase sitten yleinen ad hoc -suodin tai vääräänmalliin pohjautuva) ei tartu vain ja ainoastaanaikasarjan kausivaihtelutaajuuksiin tai trendiäestimoitaessa trendin taajuuksiin, vääristetäänalkuperäisen aikasarjan autokorrelaatioraken-ne vieraaksi alkuperäisen ilmiön ajassa toistu-ville ominaisuuksille. Tämän vuoksi suhdanne-aikasarjan tasoittamiseen ensin esimerkiksikiinteällä suotimella, ja näin saadun kausitasoi-tetun tai trendisarjan dynaamiseen mallintami-seen on syytä suhtautua varauksellisesti (ks.myös Rahiala 1994, 107, 126).

ARIMA-mallipohjainen kausitasoitus jaTRAMO/SEATS-menetelmä tarjoavat tähän

ongelmaan yhden analyyttisen ratkaisun. Alku-peräinen sarja esipuhdistetaan muun muassapoikkeavista havainnoista ja työ- tai kauppa-päivien lukumäärien vaihteluista siten, että esi-käsitelty sarja voidaan ARIMA-mallintaa. Tätäkoko esikäsitellyn sarjan autokorrelaatioraken-teen mallinnusta käytetään hyväksi, kun aika-sarjan eri taajuusalueiden vaihtelu jaetaan kom-ponentteihin. Dekomponointi toteutetaan si-ten, että kukin komponentti kuvaa vain juurisiihen komponenttiin liittyvää osaa koko sar-jan autokorrelaatiorakenteesta ja vaihtelusta,eli komponentit ovat keskenään ortogonaalisia.Sekä esikäsitelty sarja että sen komponentitovat ARIMA-mallinnettu samalla kertaa kun-nioittaen alkuperäisen sarjan dynaamisia, ajas-sa toistuvia ominaisuuksia. Luotettavan histo-ria-analyysin lisäksi tämä mahdollistaa muunmuassa koko aikasarjan2 ja sen komponenttienyhtäaikaisen ennustamisen käyttäen hyväksikullekin komponentille konstruoituja keskivir-heitä ja luottamusvälejä.

Yksikäsitteisen hajotelmanratkaisu

Koska mainitut komponentit ovat alun perinhavaitsemattomia (ks. kuvio 1), ne voidaanmuodostaa lukuisilla eri tavoilla. Jaettaessa ha-vaintosarjaa komponentteihin törmätään myös

2 Aikasarjan komponentit muodostetaan esipuhdistetustaaikasarjasta. Lopuksi havaintosarjan puhdistuksessa poiste-tut tekijät yhdistetään muodostettuihin komponentteihin.Tasomuutokset liitetään mukaan trendiin ja muut poikkea-vat havainnot aikasarjan epäsäännölliseen osaan. Determi-nistiset työ- ja kauppapäiväkorjaustekijät liitetään osaksikausivaihtelukomponenttia. Lopulta koko alkuperäisen ai-kasarjan vaihtelu on jaettu komponentteihin ja kaikkia sys-temaattisen vaihtelun tekijöitä voidaan ennustaa samanai-kaisesti.

472

A R T I K K E L E I T A KAK 4 / 2005

ARIMA-mallipohjaisessa lähestymistavassaidentifioituvuusongelmaan. TRAMO/SEATS-menetelmässä aikasarjan dekomponoinnissahaetaan ratkaisu, jossa epäsäännöllisen kompo-nentin varianssi maksimoituu. Tätä ratkaisuakutsutaan kanoniseksi dekompositioksi ja setuottaa aikasarjalle yksikäsitteisen hajotelman.

Vuoden aikana laskettujen kausivaihtelu-termien summan tulisi olla likimain nolla.Trendi taas mielletään deterministiseksi pitkänaikavälin kehitykseksi, jota voidaan kuvata en-simmäisen asteen yhtälöllä, jolloin trendin kak-sinkertainen differensointi tuottaa vakioisennollasarjan.

Käytännössä kuitenkin ajatellaan, että vuo-den sisäisten kausivaihtelutermien summa jakahdesti differensoitu trendi noudattavat sto-kastisia prosesseja, joiden odotusarvo on nolla

(Maravall 2004). Nämä prosessit voivat olla sel-laisia, että poikkeamat odotusarvosta korreloi-vat keskenään (Planas 1997).

TRAMO/SEATS:ssa on lähtökohtana, ettäaikasarjan komponentit ovat keskenään orto-gonaalisia. Tulkinnallisesti tämä tarkoittaa, ettäsyyt, jotka aiheuttavat aineiston kausivaihtelua(kuten vuodenaika) ovat riippumattomia ai-neiston pitkän aikavälin trendin takana olevis-ta syistä (investoinnit, tutkimus- ja kehitystoi-minta). Lisäksi oletetaan, että aikasarja koos-tuu komponenteista, jotka ovat lineaaristenstokastisten prosessien realisaatioita. Tällöinkutakin komponenttia (epäsäännöllistä termiälukuun ottamatta) voidaan kuvata ARIMA-mallilla.

Kuvio 1. Tavaroiden viennin volyymi, alkuperäinen sarja.

473

A r t o K o k k i n e n j a F a i z A l s u h a i l

2. Kaksivaiheinen TRAMO/SEATS-menetelmä

TRAMO/SEATS-menetelmä voidaan ymmär-tää kaksivaiheisena menetelmänä, jossa ensim-mäisessä vaiheessa (TRAMO) muodostetaanhavaitun sarjan ARIMA-esitys. Tätä ennenpoistetaan havaintojaksojen pituuseroista joh-tuva deterministinen vaihtelu (työ/kauppapäi-väkorjaus) sekä poikkeavat havainnot siten,että ARIMA-mallinnus onnistuu paremmin.Tasoituksen toisessa vaiheessa (SEATS) saatuARIMA-malli jaetaan haluttuihin komponent-teihin.

TRAMO (Time series Regression withARIMA noise, Missing values and Outliers) vai-heessa luodaan malli, jossa on sekä regressio-että ARIMA-osa. Mallin regressio-osan tarkoi-tuksena on esipuhdistaa aineistoa ennen ARIMA-sovitusta. Tällä tarkoitetaan työ/kauppapäivä-tekijöistä johtuvien kalenterivaikutusten pois-tamista sekä poikkeavien äärihavaintojen etsi-mistä ja korjaamista. Lisäksi puuttuvia havain-toja interpoloidaan. Esipuhdistetun aineistonARIMA-sovite jaetaan myöhemmin trendiin jakausivaihteluun. Sovitteen ulkopuolelle jääväosa on epäsäännöllistä vaihtelua.

SEATS (Signal Extraction in ARIMA TimeSeries) pyrkii erottamaan signaalin, eli kausi-vaihteluista puhdistetun aikasarjan, TRAMO:nmuodostamasta ARIMA-prosessista. Aikasarjapyritään SEATS:n avulla jakamaan trendiin,kausivaihteluun sekä epäsäännöllisen vaihtelunkomponenttiin, joka on valkoista kohinaa. Mi-käli aikasarjassa esiintyy säännöllisyyttä, jota eispektrianalyysin perusteella voida liittää tren-diin tai kausivaihteluun, otetaan käyttöön nel-jäs komponentti, jota kutsutaan hetkellisenvaihtelun komponentiksi. Kyseessä on apukom-ponentti, jonka tarkoituksena on vangita aika-

sarjan vaihtelu, joka ei kuulu trendiä tai kausi-vaihtelua kuvaavaan osaan. Kaikilla kompo-nenteilla (pl. epäsäännöllinen osa) on ARIMA-muotoinen esitys. Aggregoimalla SEATS:nmuodostamat komponentit päästään TRAMO:nantamaan esipuhdistettua aineistoa kuvaavaanARIMA-esitykseen. Siis

zt = pt + st + ct + ut , (2.1)

jossa zt on esipuhdistetun aikasarjan havainto,pt on trendi, st kausivaihtelu, ct (mahdollinen)hetkellisen vaihtelun komponentti ja ut epä-säännöllisen vaihtelun komponentti.3

Signaalin erottaminen puhdistetusta aika-sarjasta perustuu ajatukseen, jossa aikasarjanhavainnot voidaan esittää signaalin mt ja senulkopuolisen kohinan nt summana. Tavoittee-na on muodostaa sekä signaalille, että sen ul-kopuoliselle osalle ARIMA-muotoiset mallit.Signaalilla tarkoitamme kausipuhdistettua ai-kasarjaa, joka on muotoa mt = pt (+ ct ) + ut. Kunkyseessä on tilanne, jossa aikasarja halutaan ja-kaa kahteen komponenttiin, voidaan käyttääWiener-Kolmogorov -suodinta. Esimerkki täl-laisesta tilanteesta on juuri signaalin erottami-nen aikasarjan muusta osasta (Box Hillmer jaTiao 1978).

Jotta Wiener-Kolmogorov -suodinta olisimahdollista käyttää TRAMO/SEATS-tasoitus-menetelmän yhteydessä, jossa aikasarja pyri-tään jakamaan useisiin komponentteihin, muo-dostetaan kullekin komponentille oma W–K-suodin, jota käytetään kyseistä komponenttiaerotettaessa. Signaali-kohina- hajotelma teh-dään siis useaan kertaan eri komponenttejamuodostettaessa.

3 Lopuksi esipuhdistuksessa irrotetut tekijät liitetään myöskomponentteihin. Ks. edellinen alaviite.

474

A R T I K K E L E I T A KAK 4 / 2005

Signaalin ja muiden aikasarjan osien (keskine-liövirheen mielessä) optimaaliset ennusteetovat näiden komponenttien ehdolliset odotus-arvot. Tällöin kukin aikasarjan komponentti onvoitava esittää ARIMA-mallina, jossa virheter-mit noudattavat normaalijakaumaa. Tällöinmyös signaalin ja esipuhdistetun aikasarjan ha-vaintojen (z1, z2,…,zT) yhteisjakauma on multi-normaalinen ja signaalin mt optimaalinen esti-maatti on aikasarjahavainnoista koostuva lineaa-rikombinaatio

E(mt | z1, z2,…,zT)=α1z1 +α2z2 +…+αTzT (2.2)

(Kaiser ja Maravall 2000).Kun käytössä on äärettömän pitkä aika-

sarja, on White (1963) osoittanut, että yllä ole-van lineaarikombinaation kertoimet voidaanlaskea Wiener-Kolmogorov -suotimen avulla.Formaalisti suodin määritellään signaalin mt jaaikasarjan (esipuhdistettujen) havaintojen au-tokovariansseja generoivien funktioiden osa-määränä

(2.3)

josta sieventämällä saadaan (ks. yksityiskohdatPlanas 1997, Hillmer ja Tiao 1982)

(2.4)

Kaavassa esiintyvä B on viiveoperaattori jaF sen käänteisoperaattori. Signaalin ja havain-tosarjan virhetermien varianssien suhdetta Vm/Va merkitään km:lla. Osamäärälausekkeen po-lynomit ovat puolestaan havaintosarjan, signaa-lin ja sen ulkopuolisen osan ARIMA-esityksis-tä,

(2.5)

Suotimen kaavassa (2.4) esiintyy signaalinulkopuolelle jäävän nt:n AR-polynomin osia,jotka saadaan selville (esikäsitellyn) havainto-sarjan spektrin avulla. Tässä tulee muistaa, ettähavaintosarjalle muodostetun ARIMA-mallinAR-polynomi voidaan jakaa tulomuotoon φ(B)= φm(B)φn(B). Kukin AR-polynomin juuri nä-kyy havaintosarjan spektrikuvaajan huippuna.Tutkimalla huippujen esiintymistaajuuksia,voidaan juuret jakaa esimerkiksi trendi- ja kau-sijuuriin. Jälkimmäisten avulla saadaan selvillesignaalin ulkopuolisen osan AR-polynomin ra-kenne. Tämän jälkeen myös yhtälön MA-osatovat selvitettävissä (Maravall 2004).

Edellä mainittu suodinkaava muodostaakuitenkin äärettömän määrän kertoimia ehdol-lisen odotusarvon lineaarikombinaatioon. Käy-tännössä suotimen υ(B,F) antamien termienlukumäärää rajoitetaan. Koska Wiener-Kolmo-gorov -filtteri antaa tarkentuvia estimaatteja,on turvallista ajatella, että signaalin oleellisindynamiikka tiivistyy äärelliseen määrään aika-sarjahavaintoja (Kaiser ja Maravall 2000).Tämä oletus on tärkeä jo sen vuoksi, että useintarkasteltavien aikasarjojen pituus on rajalli-nen. Jos signaalille saatu esitysmuoto katkais-taan L:n periodin jälkeen, on signaalin esti-maattorin esitysmuoto

(2.6)

jossa havainnot zt voidaan korvata niiden en-nusteilla, mikäli signaalin estimointiin tarvitaantermejä, jotka ovat havaintohorisontin ulko-puolella. Näiden ennusteiden muodostamises-

475

A r t o K o k k i n e n j a F a i z A l s u h a i l

sa käytetään TRAMO-vaiheessa muodostettuahavaintosarjan ARIMA-esitystä sekä Burman-Wilson algoritmia (Burman 1980).

Signaalin estimointi on luonnollisesti sitätarkempaa, mitä parempia ennusteita aikasar-jan tuleville ja menneille havainnoille saadaan.Jos havaintoja ei tarvitse korvata niiden ennus-teilla, on signaalin estimointi Wiener-Kolmo-gorov -suotimella tarkkaa. Tämä pätee erityi-sesti aikasarjan keskimmäisille havainnoille.

3. Empiirinen sovellus: tavaroidenviennin volyymin ARIMA-mallipohjainen jakokomponentteihin

Seuraavassa tarkastellaan kansantalouden nel-jännesvuositilinpidon mukaisen tavaroidenviennin volyymin (mrd. € vuoden 2000 hin-noin) kausitasoitusta ja komponentteihin jakoaTRAMO/SEATS-menetelmällä.

Kuviosta 1 havaitaan (kausivaihtelun lisäk-si) tavaraviennin varianssin kasvavan ajan ku-luessa. Tämä viittaa multiplikatiiviseen kompo-nenttien suhteeseen (zt = pt * st * ut). Logarit-moimalla alkuperäinen sarja päästään kaavan(2.1) summamuotoiseen esitystapaan (log zt =log pt + log st + log ut).

Alkuperäisen sarjan mallinnus onnistuu täs-sä tapauksessa logaritmointia lukuun ottamat-ta ilman muita esipuhdistustoimenpiteitä (työ/kauppapäiväkorjaus, outlier-käsittely jne). Mal-linnus ja dekomponointi on toteutettu Euro-statin nettisivuilta löytyvällä DEMETRA-käyt-töliittymällä.4 Esimerkkimme tapauksessa vali-

taan malli5 (0,1,1) x (0,1,1)4 joka saa alhaisenBIC-kriteerin arvon, jäännökset (sekä neliöidytjäännökset) ovat tilastollisten testien perusteel-la satunnaisia, jäännökset noudattavat normaa-lijakaumaa otoskeskiarvolla 0 ja pienellä vari-anssilla, ja malli on lisäksi vähäparametrinen(Box ja Jenkins 1976). Estimoitu malli jäännös-tarkasteluineen löytyy taulukosta 1.6

Aikaulottuvuuden lisäksi aikasarjaa voidaantarkastella myös taajuusalueella, jolloin tutki-taan aikasarjan spektriä. Spektrianalyysissa ta-voitteena on usein määrittää, kuinka suuren

4 Vastaavasti voitaisiin käyttää esim. Tramo/Seats Win(TSW) -ohjelmaa, joka on niin ikään ladattavissa interne-tistä. Komponenttien mallit on saatu Demetran log-tiedos-tosta. (Vastaava log-tiedosto löytyy myös TSW:ssä, sillä De-

metra käyttää samaa ohjelmarunkoa kuin TSW – ainoa mer-kittävä ero lienee vain Demetrassa mukana olevat EU-mai-den kalenterit kalenterikorjauksien lomapäiväkorjauksiavarten esipuhdistusosassa. Ohjelman tekijät päivittävätuusilla hienosäädöillä TSW:a useammin).

5 Mallinnuksessa voidaan käyttää apuna ohjelman auto-maattimallinnustyökalua, jonka mallinvalinta perustuuBIC-kriteerin minimointiin. Automaattimallinnuksessa es-timoidaan kaikki (3,2,3)x(1,1,1)4-mallia vähäparametrisem-mat mallit (mukaan lukien mainittu malli), ja valitaan pie-nimmän BIC-arvon saanut malli lisäehtona se, että malli ondekomponointia ajatellen hyväksyttävä. BIC-kriteeriä mini-moitaessa minimoidaan käytännössä mallin jäännösvarians-sia, mutta kriteeri rankaisee lisäparametrien käytöstä.

6 Mallivalinnan voi tehdä myös täysin itse käyttäen hyväk-si ohjelmasta tulostettavia autokorrelaatio- ja osittaisauto-korrelaatiofunktioita sekä AIC- ja BIC-informaatiokritee-reitä. Myös parametrit on määrättävissä itse. Yleensä ottaenei ole tarkoituksenmukaista nojata vain automaattimallin-nukseen käsiteltävien aikasarjojen osalta, vaan automaatti-mallinnuksen ehdotusta (ml. sen ehdottamat esipuhdistus-tekijät) on pidettävä yhtenä mahdollisena vaihtoehtona jakenties hyvänä lähtökohtana aikasarjan mallinnustarkaste-lussa. Muun muassa esipuhdistustekijöiden osalta on mal-lintajan käytettävä omaa harkintaa ja pohdittava myös ai-kasarjan sisältöä (haluttaessa esipuhdistukset voi myös kiel-tää). Malli ja valitut esipuhdistustekijät kiinnitetään esim.kalenterivuodeksi (mallin parametrit voi estimoida ainauuden havainnon myötä uudestaan). Vuoden päästä mallin-valinta yleensä tarkistetaan.

476

A R T I K K E L E I T A KAK 4 / 2005

osan eri taajuuksilla esiintyvät toistuvat syklitselittävät aikasarjan koko vaihtelusta. Suhdan-neaikasarjoja dekomponoitaessa spektritarkas-telua voidaan käyttää komponenttien identi-fioimiseen aikasarjan spektristä.

Spektrianalyysin avulla voidaan myös ar-vioida aikasarjan dekomponoinnin onnistu-mista. Mikäli vaihtelut eri taajuuksilla halu-taan mallintaa eri komponentteihin, estimoi-tujen komponenttien mallien spektritarkas-telusta nähdään, onko kuhunkin komponent-tiin onnistuttu mallintamaan vain juuri siihenyhdistettävä vaihtelu, erityisesti jos kompo-nenttien vaihtelun halutaan summautuvan esi-puhdistetun alkuperäisen sarjan koko vaihte-luun. 7

Taajuustarkastelu on esitettävissä myös pe-rioditarkasteluna, jolloin piikit kertovat kuin-ka monta periodia kyseinen vaihtelu vaatii käy-däkseen läpi kaikki vaiheensa eli koko syklin.

Kuviossa 2 on esitetty esipuhdistusvaiheen jäl-keisen, (TRAMO-osan tuloksen) tässä tapauk-sessa vain logaritmoidun, aikasarjan estimoi-tuun malliin (0,1,1) x (0,1,1)4 perustuva spektriperiodeittain. Mikäli kyseessä olisi puhtaastivalkoisen kohinan sarja, spektrissä näkyisi vainvaakasuunnassa suora viiva ilman piikkejä. Lo-garitmoidun neljännesvuosittaisen tavaroidenviennin volyymin tapauksessa havaitaan piikitperiodeilla 2 ja 4 sekä lähellä ääretöntä. Mal-lilla (0,1,1) x (0,1,1)4 (mukaan lukien valkoisenkohinan jäännös at) on mallinnettu koko ku-vion 2 spektrin vaihtelu.

Piikit periodeilla 2 ja 4 assosioituvat sarjas-sa esiintyvään vuoden sisäiseen kausivaihte-luun. Periodin 2 piikki tulkitaan siten, että ai-kasarjassa esiintyy syklinen vaihtelu, joka käyläpi oman vaihekiertonsa kahdessa periodissa(esim. neljännekset IV ja I muodostavat talvi-kuukaudet ja neljännekset II ja III kesäkuukau-det, toisaalta neljännekset I ja II muodostavatkevätkuukaudet ja III ja IV syksykuukaudet).Piikki periodilla 4 tulkitaan sellaiseksi syklisek-si vaihteluksi, joka kestää neljä periodia kerral-laan (sama kausi toistuu kerran vuodessa, ky-

Taulukko 1. Esipuhdistetun alkuperäisen sarjan malli ja jäännöstarkastelu.

7 Niin kutsuttua gain-funktiota ja sen neliötä voidaan myöskäyttää suotimen toimivuuden arvioinnissa, ts. voidaan tar-kastella onko onnistuttu suodattamaan vain ao. komponen-tin taajuuksiin liittyvä vaihtelu (ks. Rahiala, 1994).

477

A r t o K o k k i n e n j a F a i z A l s u h a i l

seessä siis kuhunkin neljännekseen assosioitu-va kausivaihtelu).

Piikki lähellä periodia ääretön kuvaa vaih-telua, joka vaatii oman vaihekiertonsa (syklin-sä) läpikäymiseen lähes äärettömän määrän pe-riodeja. Tällainen vaihekierto ei toistu läheskoskaan, joten sen sisältämä vaihtelu assosioi-tuu trendiin. Mitä lähempänä ääretöntä piikkion, sitä tasaisempi mallinnettu trendi on. Ku-viosta 2 voidaan havaita myös, ettei alkuperäi-sen logaritmoidun sarjan spektrin kuvaaja olekorkeussuunnassa alaosastaan aivan kiinni vaa-ka-akselissa. Ilman piikkejä alaosaan voidaanhahmottaa piirrettäväksi vaakasuora viiva kor-keussuunnassa hyvin lähelle vaaka-akselia. Tä-män alapuolinen alue kuvaa aikasarjassa esiin-tyvää valkoisen kohinan vaihtelua.

Jaettaessa esipuhdistetun alkuperäisen ARIMA-mallinnetun sarjan vaihtelua ARIMA-mallejanoudattaviin komponentteihin SEATS:ssa, yk-sikäsitteiseen dekomponointiin päästään nou-dattamalla periaatetta, jonka mukaan mallinepäsäännöllisen komponentin varianssi maksi-moidaan ja muiden komponenttien pseudoin-novaatioiden (taulukon 2 apt ja ast) varianssitminimoidaan. Tätä kutsutaan kanoniseksi de-komponoinniksi. Kuviossa 2 tämä tarkoittaasitä, että lähelle vaaka-akselia hahmottamam-me vaakasuoran viivan alapuolella oleva valkoi-sen kohinan vaihtelu imetään trendin ja kausi-komponentin mallien pseudoinnovaatioistaminimiin ja siirretään epäsäännölliseen kompo-nenttiin.

Kuvioiden 3 ja 4 estimoitujen trendin ja

Kuvio 2. Logaritmoidun (esipuhdistetun) sarjan vaihtelu spektri-esityksenä perustuen estimoituun malliin (0,1,1)x (0,1,1)4.

478

A R T I K K E L E I T A KAK 4 / 2005

Taulukko 2. Komponenttien sekä kausitasoitetun sarjan (SAt) ARIMA-mallit ja innovaatioiden keskihajonnat.

Kuvio 3. Estimoidun mallin trendisykli-komponentin spektri.

kausikomponentin spektreistä havaitaan näintapahtuneen. Kuvioista havaitaan, että trendiinja kausikomponenttiin on mallinnettu vain juu-ri ao. komponenttiin assosioituva vaihtelu ai-

kasarjan koko vaihtelusta. Trendin ja kausi-komponentin mallien avulla kummallekin voi-daan muodostaa oma optimaalinen suotimen-sa, jolla kyseinen komponentti voidaan suodat-

479

A r t o K o k k i n e n j a F a i z A l s u h a i l

taa esikäsitellystä alkuperäisestä sarjasta.8

Komponenttien suotimet perustuvat esipuh-distetun alkuperäisen sarjan omaan autokova-rianssirakenteeseen. Kuviosta 5 nähdään, ettäaikasarjan muu vaihtelu muilla taajuuksilla onmallinnettu epäsäännöllisen vaihtelun kompo-nenttiin.

On huomattava, että spektrin piikkien jaesipuhdistetun alkuperäisen sarjan ARIMA-

mallin AR-polynomin epästationaaristen juur-ten välillä on yhteys. Mallin (0,1,1)x(0,1,1)4

epästationaarisen AR-osan viivepolynomi voi-daan jakaa seuraavasti:

(1–B)(1–B4) = (1–B)2(1 + B + B2 + B3)= (1–B)2S. (3.1)

Yleisesti ottaen aikasarjan spektritarkaste-lussa nähdään, että kerrottaessa aikasarja teki-jällä (1–B)2 (ts. differensoitaessa sarja kahdes-ti) poistetaan aikasarjan spektristä trendin pe-rustaajuudet eli piikki hyvin lähellä taajuuttanolla (tai periodia ääretön) poistuu. Vastaavastikerrottaessa neljännesvuosiaikasarja tekijällä(1 + B + B2 + B3) poistetaan spektristä perusta-

Kuvio 4. Estimoidun mallin kausikomponentin spektri (tämä komponentti näine taajuuksineen poistetaan kausitasoitetustasarjasta).

8 Myös kausitasoitetulle sarjalle muodostetaan oma malli jaoptimaalinen sarjakohtainen suodin vastaavasti. Kausitasoi-tetun sarjan estimaattorin spektri näyttää muutoin samaltakuin trendin spektri, mutta se sisältää kuvion 2 alaosaanjäävän valkoisen kohinan vaihtelun. Toisin sanoen senspektri näyttää samalta kuin kuvion 2 alkuperäisen sarjanspektri, kun kausipiikit on poistettu.

480

A R T I K K E L E I T A KAK 4 / 2005

vaa laatua olevat kausitajuudet (ja kausipiikit).Tätä jälkimmäistä tekijää kutsutaan usein aggre-gointioperaattoriksi, ja sitä merkitään S:llä.

Mikäli vuosittaisen kausivaihtelun oletettai-siin olevan täysin determinististä ja summau-tuvan joka vuosi nollaksi, kausivaihtelu st ja sentaajuudet spektrissä voitaisiin poistaa täysinoperaatiolla S siten, että Sst = 0. Vastaavasti mi-käli trendi ajateltaisiin täysin deterministisek-si, trendi (ja sen taajuudet spektrissä) voitaisiinpoistaa kaksinkertaisella differensoinnilla jaoperaatio (1–B)2 pt tuottaisi myös vakioisennollasarjan.

TRAMO/SEATS lähtee kuitenkin siitä, ettäkausitekijöiden summa voi poiketa hieman nol-lasta, ja kausitekijä voi myös muuttua ajassa.Siksi kausikomponentti mallinnetaan S:n sisäl-

tämien epästationaaristen AR-juurten lisäksiMA-juurilla (sekä mahdollisilla stationaarisillaAR-juurilla) ja hyvin pienivarianssisella inno-vaatiolla, siis Sst = θs(B)ast. Kausikomponentinmalliksi saadaan usein ARIMA (3,0,3) -malli.Täysin deterministinen trendisykli ei lienemyöskään realistinen suhdannesarjojen analyy-sissä, ja näin ollen trendisyklille mallinnetaanepästationaaristen (ja mahdollisten stationaa-risten) AR-juurten lisäksi myös MA-osa sekäpienivarianssinen innovaatio, siis esimerkkim-me tapauksessa (1–B)2 pt = θp(B)apt. Useimmi-ten TRAMO/SEATS:n trendin malli onkinmuotoa (0,2,2).

Kuten kaavasta 3.1 havaitaan, esipuhdiste-tun alkuperäisen sarjan AR-osa jakaantuu esi-merkkimme tapauksessa täsmälleen kompo-

Kuvio 5. Estimoituun malliin perustuvan epäsäännöllisen vaihtelun spektri.

481

A r t o K o k k i n e n j a F a i z A l s u h a i l

nenttien AR-osien tuloksi. Vastaavalla tavallakomponenttien MA-juuria ja lopullisia mallejamääritettäessä dekomponoinnin lähtökohta onMA-osien summautuminen esikäsitellyn sarjanMA-osaksi. Komponenttien mallit pyritäänmyös saamaan tasapainoon ARI- ja MA-osien-sa suhteen.9 Komponenttien mallit mukaan lu-kien kausitasoitetun sarjan (SAt) malli on esi-tetty taulukossa 2.

Kausitasoituksen ja trendimallinnuksen on-nistumista on mallinnuslogiikan ja mm. jään-nösten tilastollisten testien lisäksi syytä tarkas-tella aina myös graafisesti mielellään samassa

kuvassa alkuperäisen sarjan kanssa. Lopullisettrendin ja kausitasoitetun sarjan kuvaajat aika-ulottuvuudessa löytyvät kuviosta 6 yhdessä al-kuperäisen tavaroiden viennin volyymin kans-sa. Esimerkkimme tapauksessa trendisykli- jakausitasoitettu sarja esittävät alkuperäisen sar-jan informaation ilmiön kehityksestä varsin kii-tettävästi ilman vuoden sisäistä kausivaihtelua.Mallinnukseen liittyvien jäännöstarkastelujenlisäksi komponentteihin jako ja kausitasoituson syytä hyväksyä myös graafisen tarkastelunperusteella.

4. Lopuksi

Vuotta tiheämmin havaintoja sisältävän aika-sarjan tarkastelu hankaloituu usein vuoden si-

Kuvio 6. Tavaroiden viennin volyymin alkuperäisen, trendin ja kausitasoitetun sarjan kuvaajat.

9 Epästationaaristen AR- ja stationaaristen AR-juurten lu-kumäärän summa on tällöin yhtä suuri kuin MA-polynominjuurten lukumäärä.

482

A R T I K K E L E I T A KAK 4 / 2005

säisten havaintojen voimakkaan kausivaihteluntakia. Mikäli halutaan tarkastella muuttujanmuutosta edellisestä havainnosta ja havaitakäännepisteet tarkasteltavassa ilmiössä, kausi-vaihtelu on tasoitettava aikasarjasta. Vaikkakausivaihtelu koetaan usein muuta aikasarjananalysointia häiritseväksi tekijäksi, komponen-tin tasoittamiseen ja muiden komponenttienidentifioimiseen on syytä suhtautua vakavasti.Aina kun tavalla tai toisella identifioitu kausi-komponentti tasoitetaan, puututaan alkuperäi-sen aikasarjan ajassa toistuvia ominaisuuksiakuvaavaan autokorrelaatiorakenteeseen.

Koska aikasarjan dynaamisia ominaisuuksiakuvaava autokorrelaatiorakenne on kullekinsarjalle ominainen, kaikkien sarjojen kausita-soittaminen yhdenlaisella suotimella ei lienerealistista. Yleissuotimella voidaan toki saadaestimoitua karkeasti kausitasoitetun aikasarjan(ja trendin) kehitys. Tällöin on kuitenkin vaa-rana rikkoa aikasarjan yksilöllinen autokorre-laatiorakenne. Näin ollen yleissuodatetun sar-jan (tai trendin) mallintamista on syytä välttääesim. pyrittäessä ennustamaan havaintosarjankuvaamaa ilmiötä. Tällaisessa tilanteessa onpyrittävä käyttämään välineitä, joissa aikasar-jan itsenäinen autokorrelaatiorakenne mallin-netaan komponentteihin ortogonaalisesti.

Tässä kirjoituksessa esittelimme ARIMA-mallipohjaisen dekomponoinnin ja kausitasoi-tuksen periaatteet TRAMO/SEATS-menetel-mällä ratkaisuna em. ongelmaan. ARIMA-mal-lipohjaisessa lähestymistavassa (esipuhdiste-tun) havaintosarjan autokorrelaatiorakennemallinnetaan ensin ARIMA-mallin avulla. Saa-tua mallia ja sen autokorrelaatiorakennettakäytetään hyväksi, kun aikasarjan vaihtelu jae-taan taajuusaluetarkastelun avulla trendiin,kausikomponenttiin ja epäsäännöllisen vaihte-lun komponenttiin. Komponentteihin jako teh-

dään siten, että systemaattisen vaihtelun kom-ponentit kuvaavat kukin juuri ao. komponen-tille ominaista osaa koko aikasarjan autokorre-laatiorakenteesta. Komponentit ovat esitettä-vissä ARIMA-malleina.

Historian kuvauksen ja analysoinnin lisäk-si alkuperäisen sarjan ja sen komponenttienennustaminen samanaikaisesti on tämän jäl-keen mahdollista. Tämä voidaan tehdä käyttä-en mallien lisäksi hyväksi kullekin komponen-tille konstruoituja luottamusvälejä sekä mah-dollisia esipuhdistusvaiheen työ/kauppapäivä-vaikutusten ennusteita.

Aikasarja-analyysin teoria ja sen käytännönsovellukset etenevät koko ajan. Tulevaisuudenhaasteina ja mahdollisuuksina lienevät mm. ai-kasarjan aikajakson eri osien mallintaminen eriARIMA-malleilla (seka-ARIMA-mallit) ja mah-dollisesti näihin perustuva aikasarjan dekom-ponointi sekä epälineaariseen aikasarjan mal-lintamiseen pohjautuva dekomponointi. �

Kirjallisuus

Bell, W.R. (1984): ”Signal extraction for nonstation-ary time series”, The Annals of Statistics, vol. 12,s. 646–664.

Bell, W.R. ja S.C. Hillmer (1983): ”Modeling timeseries with calendar variation”, Journal of theAmerican Statistical Association, vol. 78, s. 526–534.

Box, G., Hillmer, S. ja G. Tiao (1978): ”Analysisand modeling of seasonal time series”, teokses-sa Zellner, A. (toim.), Seasonal Analysis of Eco-nomic Time Series, s. 309–334, U.S. Departmentof Commerce, Bureau of the Census, Washing-ton D.C.

Box, G.E.P. ja G.M. Jenkins (1976): Time SeriesAnalysis: Forecasting and Control, rev. ed. SanFrancisco: Holden-Day.

483

A r t o K o k k i n e n j a F a i z A l s u h a i l

Burman, J.P. (1980): ”Seasonal Adjustment by Sig-nal Extraction”, Journal of the Royal StatisticalSociety, A 143, s. 321–327.

Chen, C. ja L.M. Liu (1993): ”Joint estimation ofmodel parameters and outlier effects in time se-ries”, Journal of the American Statistical Associa-tion, vol. 88, s. 284–297.

Gomez, V. ja A. Maravall (1994): ”Estimation, pre-diction and interpolation for nonstationary timeseries with the Kalman filter”, Journal of theAmerican Statistical Association, vol. 89, s. 611–624.

Gomez, V. ja A. Maravall (1996): Programs TRAMOand SEATS. Instructions for the User, (with someupdates). Working Paper 9628, Servicio de Es-tudios, Banco de España.

Gomez, V. ja A. Maravall (2001): ”Seasonal Adjust-ment and Signal Extraction in Economic TimeSeries”, Ch. 8 teoksessa Peña D., Tiao G.C. jaR.S. Tsay (toim.), A Course in Time Series Anal-ysis, NewYork: Wiley.

Hillmer, S.C ja G.C. Tiao (1982): ”An ARIMA-Model Based Approach to Seasonal Adjust-ment”, Journal of the American Statistical Asso-ciation, 77, s. 63–70.

Kaiser, R. ja A. Maravall (2000): Notes on TimeSeries Analysis, ARIMA Models and Signal Ex-traction, http://www.bde.es/servicio/software/papers.htm, 25.10.2005.

Leskinen, E. (2004): Aikasarja-analyysin jatkokurs-sin luennot. Signaalihajotelmia, ARIMA-pohjais-ta dekomponointia ja TRAMO/SEATS:a koske-vat osat. Jyväskylän yliopisto, Matematiikan jatilastotieteen laitos.

Manna, M. ja R. Peronaci (toim.) (2003): SeasonalAdjustment, European Central Bank, November2003.

Maravall, A. (1987): ”On Minimum Mean SquaredError Estimation of the Noise in Unobserved

Component Models”, Journal of Business andEconomic Statistics 5, s. 115–120.

Maravall, A. (2004): Notes on Programmes Tramoand Seats, Part III Signal Extraction in ARIMATime Series, luentomoniste; saatavissa pyydet-täessä tekijältä sähköpostitse maravall@bde.es

Maravall, A. (1995): ”Unobserved Components inEconomic Time Series”, teoksessa Pesaran, H.ja M. Wickens (toim.), The Handbook of AppliedEconometrics, vol. 1, Oxford: Basil Blackwell.

Maravall, A. ja D.A. Pierce (1987): ”A prototypicalseasonal adjustment model”, Journal of Time Se-ries Analysis, vol. 8, s. 177–193.

Maravall, A. ja C. Planas (1999): ”Estimation Errorand the Specification of Unobserved Compo-nent Models”, Journal of Econometrics, 92, s. 325–353.

Planas, C. (1997): Applied Time Series Analysis:Modelling, Forecasting, Unobserved Compo-nents Analysis and the Wiener-Kolmogorov Fil-ter, http://forum.europa.eu.int/Public/irc/dsis/eurosam/library, ---> Documents of methodo-logical studies, 25.10.2005.

Rahiala, M. (1994): ”Käytetyimmät kausitasoitusme-netelmät”, teoksessa Suhdannekäänne ja talou-delliset aikasarjat, s. 105–128, Tilastokeskus. Tut-kimuksia 210, Helsinki.

Takala, K. (1994): ”Kahden kausipuhdistusmenetel-män vertailua; X11 ja STAMP”, teoksessa Suh-dannekäänne ja taloudelliset aikasarjat, s. 67–103, Tilastokeskus. Tutkimuksia 210, Helsinki.

White, P. (1963): Prediction and Regulation by theLinear Least Squares Method, English Universi-ty Press, Lontoo.

Öller, L.E. ja J. Nyblom (2002): Tilastokeskuksenkausitasoitusmenetelmät. Pyydetty lausunto Ti-lastokeskuksen kausitasoitusmenetelmistä 9.10.2002.

top related