時系列グラフ -...

13
10-1-1 10 第1章 時系列グラフ 1.1 時系列グラフとは ■目的 一般に,データは,大きく分けて,クロスセクションデータと時系列データに分類されるといわれます.クロスセクシ ョンデータとは,時点を固定して同質と考えられる複数の対象集団から観測されたデータをいいます.一方,時系列 データとは,時間(空間)軸上で等間隔に観測される系列的なデータをいい,ここでの観測対象(サンプル,ケース) は,年(四半期,月,日)別のような時点系列が対応します.クロスセクションデータに対して“系列”ということばを使う 理由は,データの出現順序が意味を持つため,サンプルの並び(出現順序)を崩せないことにあります. クロスセクションデータ (Cross section data) 時系列データ (Time series data) ・今月の支店別売上高データ ・今期の業種別鉱工業生産データ ・過去5年間の月別売上高データ ・10年間の月別鉱工業生産指数データ ここでは時系列データを扱います.時系列データは,主に下記の要素で構成されますが,それらが合成されて表 れているとも考えられます. ・長期変動(トレンド) :経済成長などの長期的変化 ・循環変動(サイクル):景気変動などの循環的変動で周期が1年を越す場合を指し,季節変動と区別. ・季節変動 :年周期の循環変動 ・不規則変動 :上記以外の変動で,期待値は 0 と仮定される. そのため,時系列データに発生する固有の問題として系列相関があります.つまり,各サンプルの観測値は独立 であるという通常の統計手法の仮定が成立しないことになります.その他にも,時間軸上での構造的変化や周期的変 動の問題などがあるため,これらを考慮した特有の分析手法(時系列分析法)が必要になってきます. 時系列グラフでは,横軸を時点変化を示す時間軸とし,縦軸に分析対象としている変数の値を対応させ,生の値や その加工指標の値の時間軸上における変化のパターンを解釈します.さらに,1 つの時系列データの自己相関や,2 つの時系列データの相互相関をラグ(遅れ)を交えて確認することができます. ■活用場面 ・広告投入量と売上高の関係をグラフ化し,広告投入量がどれぐらいのラグ(遅れ)をもって売上高に効いて いるかを検討する 等 ■データ入力形式 サンプル名が1個(0 個可),量的変数・質的変数合わせて1~256 個までです. (週) [サンプル名] (売上高) [量的変数] (広告投入量) [量的変数] 1 6 7 2 10 8 3 7 27 : : : 1.1 時系列グラフとは

Upload: others

Post on 05-Sep-2019

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-1-1

時系列グラフ

PART

10

第1章

第1章 時系列グラフ

1.1 時系列グラフとは

■目的

一般に,データは,大きく分けて,クロスセクションデータと時系列データに分類されるといわれます.クロスセクシ

ョンデータとは,時点を固定して同質と考えられる複数の対象集団から観測されたデータをいいます.一方,時系列

データとは,時間(空間)軸上で等間隔に観測される系列的なデータをいい,ここでの観測対象(サンプル,ケース)

は,年(四半期,月,日)別のような時点系列が対応します.クロスセクションデータに対して“系列”ということばを使う

理由は,データの出現順序が意味を持つため,サンプルの並び(出現順序)を崩せないことにあります.

クロスセクションデータ

(Cross section data)

時系列データ

(Time series data)

例 ・今月の支店別売上高データ

・今期の業種別鉱工業生産データ

・過去5年間の月別売上高データ

・10年間の月別鉱工業生産指数データ

ここでは時系列データを扱います.時系列データは,主に下記の要素で構成されますが,それらが合成されて表

れているとも考えられます.

・長期変動(トレンド) :経済成長などの長期的変化

・循環変動(サイクル):景気変動などの循環的変動で周期が1年を越す場合を指し,季節変動と区別.

・季節変動 :年周期の循環変動

・不規則変動 :上記以外の変動で,期待値は 0と仮定される.

そのため,時系列データに発生する固有の問題として系列相関があります.つまり,各サンプルの観測値は独立

であるという通常の統計手法の仮定が成立しないことになります.その他にも,時間軸上での構造的変化や周期的変

動の問題などがあるため,これらを考慮した特有の分析手法(時系列分析法)が必要になってきます.

時系列グラフでは,横軸を時点変化を示す時間軸とし,縦軸に分析対象としている変数の値を対応させ,生の値や

その加工指標の値の時間軸上における変化のパターンを解釈します.さらに,1つの時系列データの自己相関や,2

つの時系列データの相互相関をラグ(遅れ)を交えて確認することができます.

■活用場面

・広告投入量と売上高の関係をグラフ化し,広告投入量がどれぐらいのラグ(遅れ)をもって売上高に効いて

いるかを検討する 等

■データ入力形式

サンプル名が1個(0個可),量的変数・質的変数合わせて1~256個までです.

(週)

[サンプル名]

(売上高)

[量的変数]

(広告投入量)

[量的変数]

1 6 7

2 10 8

3 7 27

: : :

1.1 時系列グラフとは

Page 2: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-1-2

■機能構成

機能 解析操作 内容

変数の指定 解析に用いる変数を指定する.

時系列グラフ

ラグ

(1.3.1) 変数ごとに,グラフのサンプル(X軸)方向に目盛りをずらす.

拡大 反転指定した量的変数のグラフを,1つのウィンドウにまとめた折れ線

グラフを描く.

相関

(1.3.2~

(1.3.4)

量的変数が2つ以上存在する場合に,指定された変数の相互相関,相関

係数行列,偏相関係数行列を表示する.

値表示 時系列グラフで用いているデータを一覧表示する.

オプショ

・グラフに表示するデータ数や,X軸のタグ名,Y軸目盛を設定する.

・データを指数化し,基準点をもとにした比率を確認する.

・回帰線や規格線(ワークシートで規格値を設定していた場合)を表示

する.

1.2 手法の選択

選択方法 [手法選択]-[時系列解析]-[時系列グラフ]

1.3 時系列グラフ

1.3.1 ラグ

ツールボタン「ラグ」をクリックすると,ある

項目に対して任意の時点分をずらし表示すること

ができます.項目をクリックし,ラグの数nを入力

しますが,その時どの程度ずらしたらよいか「相

互相関」のボタンをクリックし,相互相関係数の

値を参考にラグの数nを入力します.nは正なら

右方向,負なら左方向に,初期グラフと比べて時

点を移動させます.

1.3.2 相互相関

ツールボタン「相関」の「相互相関」をクリッ

クすると,指定した変数を固定して,それ以外の

変数のラグ(時差)をとり,それぞれの時点での

時差相関係数を求めます.

1.1 時系列グラフとは

1.2 手法の選択

1.3 時系列グラフ

Page 3: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-1-3

時系列グラフ

PART

10

第1章

ここで,サンプル数が n,ラグが s の時の時差相

関係数は

と求められます.

1.3.3 相関係数行列

ツールボタン「相関」の「相関係数行列」をクリ

ックすると,2 変数の組み合わせによる直線的な

関係の強さを求めます.

なお,時系列(回帰)残差は時間 tを説明変数と

し,回帰式を求めた場合の残差です.時系列(回

帰)残差の相関が高い場合は,その項目以外の要

因が効いている可能性があります.

1.3.4 偏相関係数行列

ツールボタン「相関」の「偏相関係数行列」を

クリックすると,2 つの変数間に影響を及ぼす他

の変数がある場合に,その変数の影響を除いて求

めた実質的な相関係数を求めます.変数が 3つ以

上ある場合に偏相関係数を見ると有用です.

時系列(回帰)残差の偏相関係数が高い場合は,

時系列(回帰)残差の相関係数と同様に,その項

目以外の要因が効いている可能性があります.

1.3 時系列グラフ

Page 4: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-2-1

循環図

PART

10

第2章

第2章 循環図

2.1 循環図とは

■目的

循環図とは,2 つの時系列データの時点に対応する値を散布図上にプロットしたものを,時間経過の推移が分かる

ように,線で結んだものです.時点の推移の方向で先行指標と遅行指標を確認することができます.

(時系列データについては「時系列グラフ」の章を参照してください)

方向 特徴 先行指標 遅行指標

時計回り

Y軸の系列データが+方向に上昇した後で,X軸の系列デー

タが+方向に上昇,その後,Y 軸の系列データが-方向に下

降した後で,X軸の系列データが-方向に下降

Y軸の系列

データ

X 軸の系列

データ

反時計回り

X軸の系列データが+方向に上昇した後で,Y軸の系列デー

タが+方向に上昇,その後,X 軸の系列データが-方向に下

降した後で,Y軸の系列データが-方向に下降

X 軸の系

列データ

Y 軸の系列

データ

■活用場面

・生産量と在庫量について,その関連性(先行指標/遅行指標)を検討する

・経済指標を見る 等

■データ入力形式

サンプル名1個(0個可),量的変数2個.

(サンプル名を指定すると,散布図上に表示できます)

(年・四半期)

[サンプル名]

(生産前年同期比)

[量的変数]

(在庫前年同期比)

[量的変数]

90Ⅰ 1.904 5.775

90Ⅱ 3.180 3.694

90Ⅲ 5.046 -0.472

: : :

■機能構成

機能 解析操作 内容

変数の指定 解析に用いる変数を指定する.

循環図

データ探索

(2.3.1)

選択した範囲内にあるプロットの番号の表示/非表示やマスク,マーキン

グを設定する.

層別 質的変数を指定し,層別散布図で各カテゴリの特徴を把握する.

対数変換 目的変数をLog変換し,新たにウィンドウを開いて,散布図を表示する.

変数登録 Log 変換した目的変数をワークシート上に登録する.(層別散布図のみ

で使用可)

周辺分布拡

周辺分布を表示している場合に,周辺分布を選択した状態で押すと,拡

大表示する.

結線の範囲 線で結ぶプロットの範囲を指定する.

2.1 循環図とは

Page 5: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-2-2

オプション ・回帰線や確率楕円,モデル式を表示する.

・Y軸とX軸の目盛を設定する.

・規格値を設定し,グラフ上に表示する.

2.2 手法の選択

選択方法 [手法選択]-[時系列解析]-[循環図]

2.3 循環図

2.3.1 データ探索

散布図上で探索したいデータを矩形で囲み,ツ

ールボタン「データ探索」をクリックします.

矩形で囲まれた範囲内にあるデータの座標(x,y)

が表示されます.そのデータのサンプル番号を表示

したい場合は「番号表示/解除」を押します.

番号ではなくサンプル名称を表示したい場合は,さ

らに「名称/番号」切替ボタンを押します.

2.1 循環図とは

2.2 手法の選択

2.3 循環図

Page 6: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-3-1

回帰による要因分解

PART

10

第3章

第3章 回帰による要因分解

3.1 回帰による要因分解とは

■目的

時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

変動を説明できません.むしろ,結果(目的)系列に対して複数の要因系列のデータが存在し,それらが相互に関係

し合っていると考えられます.

たとえば目的変数(系列データ)がある場合に,その時系列的yの変動に他の要因変数(系列データ)がどのような影

響を与えているかを解明するために用います.

(時系列データについては「時系列グラフ」の章を参照してください)

「変数選択」,「選択履歴」,「回帰係数」,「カテゴリスコア」,「予測」画面は,多変量解析の重回帰分析・数量化Ⅰ類

と同様の機能となります.

■活用場面

・国内総支出をいくつかの要因に分解し,それらがどのように国内総支出に影響を与えているかを検討する 等

■データ入力形式

サンプル名1(0可),目的変数 1(量的変数のみ),説明変数 1~255(量,質混在可.総計 600アイテムカ

テゴリ内).

(サンプル名)

[サンプル名]

(民間需要)

[量的変数]

(公的需要)

[量的変数]

(海外需要)

[量的変数]

(国内総支出)

[量的変数]

2000/Ⅰ 3936241 1243894 134237 5314372

2000/Ⅱ 3910874 1269934 140223 5321031

2000/Ⅲ 3924694 1224036 135676 5284406

: : : : :

■機能構成

機能 解析操作 内容

変数の指定 解析に用いる変数を指定する.

変数選択 残差の検討

「重回帰分析・数量化Ⅰ類」の章を参照.

変数選択方法

選択履歴 SE変化グラフ

変数確定

回帰係数

残差の検討

平均性向

時系列データに回帰式をあてはめた場合に,得られた統計量より経

済学的な特性値を求める.時系列データにあてはめたy=ax+b

の回帰式を(y/x)=a+(b/x)に変形し,目的変数yに対

して取り込まれた説明変数xの求める割合をサンプルごとに求め

る.求めた平均性向の基本統計量などを確認し,特徴を把握する.

(説明変数を1つ取り込んだ場合のみ使用可)

カテゴリスコア カテゴリ統合

「重回帰分析・数量化Ⅰ類」の章を参照. スコアグラフ

予測 計算開始

3.1 回帰による要因分解とは

Page 7: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-3-2

データクリア

オプション

寄与度・寄与率

(3.3.1) 目的変数の伸び率に対して,説明変数がどのように影響しているか

をグラフで表示する.

計算表 寄与度・寄与率の値や弾力性の値を確認する.

オプション X軸Y軸の目盛や,誤差項の表示/非表示を設定する.

3.2 手法の選択

選択方法 [手法選択]-[時系列解析]-[回帰による要因分解]

3.3 回帰による要因分解

3.3.1 寄与度・寄与率

寄与度・寄与率は,全体の時系列を構成する部

分系列のデータが与えられている場合に,全体系

列の伸び率に対して,各部分系列の変化がどのよ

うに寄与しているのかを示す指標のことです.

項目 Aの寄与度(t年)

= (項目 Aの需要(t年)-項目 Aの需要(t-1年))/

全体系列(t-1年)

・全体系列の伸び率 (t年)

= (全体系列(t年)-全体系列(t-1年))/全体系列

(t-1年)

と計算されます.

寄与度グラフでは,目的変数の伸び率に対して,

説明変数がどのように影響しているかを各サンプ

ルごとに棒グラフで表示し,目的変数の伸び率を

折れ線グラフで表しています.目的変数に正の方

向で寄与しているのか,負の方向で寄与している

のかを視覚的に確認をすることができます.

寄与率は寄与度の絶対値をとった全体に占める比

率です.寄与率グラフは目的変数の伸び率に対し

て各説明変数の寄与度が占める割合を積み上げ棒

グラフで表示しています.

項目 Aの寄与率(t年)

= (項目 Aの寄与度(t年) /全体系列の伸び率

と計算されます.

3.3.2 弾力性

弾力性は,説明変数が1%増加するときの目的

変数の増加率を意味します.偏回帰係数を用いて,

サンプルごとに計算します.

例えば

2000/I期の民間需要の弾力性=(偏回帰係数 1.000

×2000/I 期の民間需要×1%÷2000/I 期の国内総

支出)×100

となります.

データから直接計算した弾力性は,偏回帰係数を

用いずにデータから直接,弾力性を求めます.

寄与率・寄与度は全体系列に対する部分系列の相

対的な大きさを見る指標であるのに対し,弾力性

は部分系列(説明変数)の変化について,どれ位,

全体系列(目的変数)が敏感かを見る指標で,マ

ーケティング分野などに使われています.

1 1

1 1

/

/

i i i

i i i

y y y

x x x

弾力性

3.1 回帰による要因分解とは

3.2 手法の選択

3.3 回帰による要因分解

Page 8: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-4-1

ARIMAモデル

PART

10

第4章

第4章 ARIMAモデル

4.1 ARIMAモデルとは

■目的

ARIMA(Autoregressive Integrated Moving

Average:自己回帰和分移動平均)モデルは,

Box&Jenkins(1976)によって最初に導出された

モデルであり,3 つのパラメータ(自己回帰パラ

メータ(p),差分の階数(d),移動平均パラメー

タ(q))を持っています.すなわち,ARIMAモデ

ルを時系列データに適用するためには,ある

時点のデータはそれ以前のデータで推定できるという自己回帰(AR)モデル(自己回帰パラメータ p をとる),各デー

タは以前のデータのランダムな誤差に影響されるという移動平均(MA)モデル(移動平均パラメータqをとる),それに

特定のラグ(遅れ)に対してデータの差をとり原系列を定常状態にするための階差変換(階差の階数 d をとる)や分散

安定化変換などを適用します.通常ARIMAモデルでは,循環変動と季節変動を区別せず,周期を指定した下で,単

に季節変動として取扱い,予測をすることができます.また,ここでデータが定常である場合では,移動平均パラメー

タが 0の場合には自己回帰モデル AR,自己回帰パラメータが 0の場合には移動平均モデルMRに対応します.時

系列データを分析する上では通常,時系列の統計的性質が時間の推移によって変化しない定常過程(通常,定常化

とよぶ)を前提として分析します.定常化とは平均値や分散,自己相関が観測時刻によらず一定値である時系列デー

タで,事前に差分変換,対数変換などを行います.ARIMAモデル分析では,定常化処理,モデルの推定,モデルの

評価,診断のステップの順に実行します.

(時系列データについては「時系列グラフ」の章を参照してください)

ARIMAモデル解析の主なステップは

① 時系列データを定常化する.非定常な場合は次の階差をとり,トレンドをなくす

② 自己相関,偏自己相関コレログラムをみてpと qを決定する.

③ ARIMA(p,d,q)モデルの診断

④ 求めたARIMA(p,d,q)モデルの予測

の順で行います.

■活用場面

・経済(株価,為替,売上高や顧客数など),医療,気象,工程管理,工業生産の分野でのデータ構造の特定や予測

モデルの構築 等

■データ入力形式

サンプル名1個(0個可),量的変数1個.

(サンプル名)

[年月]

(入場者数の推移)

[量的変数]

1995第1四半期 363

1995第2四半期 386

1995第3四半期 433

: :

■機能構成

機能 解析操作 内容

変数の指定 解析に用いる変数を指定する.

No 自己回帰パラメータ(p) 移動平均パラメータ(q)

1 1 0

2 2 0

3 0 1

4 0 2

5 1 1

4.1 ARIMAモデルとは

Page 9: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-4-2

時系列プロット

(4.3.1) 時系列プロットを見て,データの平均値,分散,自己相関が一定で

あるかどうかを確認し,必要に応じて差分変換や対数変換を行う.

式当てはめ

(4.3.2) プロットされたデータについて1次式や2次式などを当てはめる.

差分変換

(4.3.3)

時系列データが非定常(一定の傾向(トレンド)や周期性がある)

の場合に,データの差分をとり,定常化する.

推定

(4.3.5) 定常化したデータにARIMA(p,d,q)モデルをあてはめて推定する.

変数の指定 解析に用いる変数を再指定する.

オプション

・Y軸の目盛を設定する

・X軸に表示するデータ数やタグ名を設定する

・結線処理や推定法を設定する

自己相関コレロ

グラム

(4.3.4) 自己相関係数とその標準誤差をグラフ化することにより,時系列データ

に周期があるかどうか判断する.

オプション 1画面に表示するデータ数やタグ名を設定する.

偏相関コレログ

ラム

(4.3.4) 偏自己相関とその標準誤差をグラフ化することにより,時系列データに

周期があるかどうか判断する.

オプション 1画面に表示するデータ数やタグ名を設定する.

時系列統計量

データ,自己相関,統計量等を表示する.

時系列データ,変換後データ(データの差分がある場合にはその差分

データ),自己相関係数,自己相関係数の標準誤差,B-L検定量Q,有

意確率p,偏自己相関係数,偏自己相関係数SE(PAC)の標準誤差を

表示する.

B-L検定量Qは,Box-LjungによるQ統計量を意味し,この検定量は

データのランダム性を検定するのに用いられる検定量で近似的にχ2分布に近似する.P値が有意水準(例えば,α=0.05など)より小さ

い時, 自己相関にある特定のパターンが存在するとされる

変数登録 時系列統計量をワークシートに登録する.

(別の解析に用いることができるようになる)

4.2 手法の選択

選択方法 [手法選択]-[時系列解析]-[ARIMAモデル]

4.3 ARIMAモデル

4.3.1 時系列プロット

データがある時点を通して平均値,分散,自己相

関が一定であるかどうかを確認しながら必要に応じ

て差分変換や対数変換など定常化処理を行います.

プロットが定常に変動している(一定の傾向(トレ

ンド)や周期性がない)場合は,差分階数は 0にな

ります.差分階数に数値を入れ,定常化しているかど

うかを確認します(トレンドを除去する)

4.1 ARIMAモデルとは

4.2 手法の選択

4.3 ARIMAモデル

Page 10: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-4-3

ARIMAモデル

PART

10

第4章

4.3.2 式の当てはめ

ツールボタン「式の当てはめ」をクリックすると,プロ

ットされたデータについて式をあてはめます.放物線,

2次曲線があてはまる場合は差分の階級を2にし,1次

式に近似する場合は差分の階級dを 1にします.

種類 式 備考

1次式 Y=a+b*t

2次式 Y=a+b*t+c*t^2

単純指数曲

Y=a*b^t

ゴンペルツ曲

Y=K*a^(b^t) 0<a<1,0<b<1,

0<K

ロジスティック

曲線

Y=K/(1+a*e^(-b*t)) 0<a,0<b,0<K

4.3.3 差分変換(階差階数の指定)

ツールボタン「差分変換」をクリックすると,あるきまっ

た時間間隔をおいて観測値の差をとります.

ここでは,1階差とは,2つの隣接した観測値間の差(ラ

グ1)であり,2階差とは,1階差分をとったデータの差

分を再びとることを意味します.本システムでは,1~6

まで階差階数を指定することができます.また,周期性

のあるデータの場合には,季節差分変換を行うことが

できます.(例えば周期が1波長12の場合は季節差分

階級を 12とします.)

特定のラグk(k≠1)が必要な場合には,

一旦解析を終了し,メニューから「ワークシー

ト」-「変換」-「データ変換」-「繰り返しデ

ータの生成」-「DEF」あるいは「GAP」を行

うことをお勧めします.

4.3.4 自己相関コレログラム・偏自己相関コ

レログラム

定常化した時系列プロットに対して,自己相互コレロ

グラム,偏自己相関コレログラムを見て,ARIMA(p,d,

q)を推定します.dは階差の次数,pは自己回帰モデル

AR(p)のpで,時点tにおける変動が時点t-1 からt-p

までの過去の影響を受けているものと考えます.qは移

動平均モデルMa(q)のqで時点tの値がホワイトノイズ

(t)のΣu(t-q)で表されます.

一般にラグkの自己相関とは第i時点の観測値と第(i

-k)時点の観測値間の相関を示しており,コレログラ

ムは横軸にサンプル番号,縦軸に自己相関あるいは

偏相関値をとり,各自己相関の値を棒グラフで示して

います.コレログラムにより系列相関の様子や季節変

動の有無などがわかります.

また,グラフ上では自己相関係数の他,標準誤差×

1.96 倍の値が折れ線グラフで表示されています.自己

相関係数の大きい値をチェックする目安となります.

ここで,ラグを求めます.折れ線グラフの外側に外れ

る箇所を探します.ただし,コレログラムでは,連続した

ラグに対する自己相関係数自身が従属関係にあるた

め,まず低次の自己相関による時系列的な従属性を除

去した後,高次の自己相関を解釈する必要があると言

われています.

偏自己相関はラグ内の要素の影響を取り除いたもと

での相関係数です.偏自己相関係数と,その標準誤差

×1.96 倍の値をそれぞれ棒グラフ,折れ線グラフ上で

表示します.偏自己相関係数の大きい値をチェックす

る際の1つの目安です.

4.3 ARIMAモデル

Page 11: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-4-4

各モデルの自己相関コレログラムと自己偏相関コ

レログラムの特徴は以下の通りです.

モデル 自己相関コレ

ログラム(ACF)

の特徴の例

自己偏相関コレ

ログラム(PACF)

の特徴の例

ARIMA(1,0)

=AR(1)

指数型で減少,

もしくは,サイ

ンカーブ

ラグ 1 の時点の

み相関があり,

他のラグではな

ARIMA(2,0)

=AR(2)

サインカーブ,

もしくは,複数

個の指数型カ

ーブ

ラグ 1 と 2 の時

点のみ相関があ

り,他のラグで

はない

ARIMA(0,1)

=MA(1)

ラグ1の時点の

み相関があり,

他のラグでは

ない

サインカーブ,

もしくは,複数

個の指数型カー

ARIMA(0,2)

=MA(2)

ラグ1と2の時

点のみ相関が

あり,他のラグ

ではない

サインカーブ,

もしくは,複数

個の指数型カー

ARIMA(1,1) ラグ1の時点か

ら指数型で減

ラグ 1 の時点か

ら指数型で減少

4.3.5 推定,予測,残差分析

時系列プロットのツールボタン「推定」をクリックする

とARIMA(p,d,q)モデルを推定します.モデルを同

定(特定)し,必要に応じて差分変換し定常化したデー

タに対し,最適なモデルをあてはめ,時系列のモデル

パラメータを推定します.

モデル式については 4.3.6をご覧ください.

ここでは初期値として自己回帰パラメータ(p,d,

q),移動平均パラメータ(q)を(p,q)の典型的

な組み合わせ 5種類で示しており,比較することが

できます.例えば(1,0)は 1次の自己回帰パラメー

タと移動平均パラメータが 0であることを意味して

います.

なお,アルゴリズムは一般化モーメント法を適用し

ています.

モデル選択タブには,現在,推定されているモデル

のパラメータ数,残差,平方和,残差標準偏差,対数

尤度,AIC定常性や反転性の満足度などを表示しま

す.各モデルを評価する場合は残差平方和や残差の

標準偏差AICが小さくなるほどよいモデルとして期待

されます.

定常性とは,データがとられている各時点で平均,

分散,自己相関が一定である状態.反転性とは,移動

平均モデルが無限次数の自己回帰モデルとみなすこ

とが出来る状態を意味します.ただし,反転性の評価

には,自己回帰モデルが定常であることが条件となっ

ています.ダイアログ上では,定常性,反転性が満たさ

れている,または,それが当然の条件である場合には,

○印が表示がされます.

ここで,あてはめるモデルをマウスでクリックし,選択

します.定常性または,安定性が満たされないモデル

は選択できません.

モデル係数タブに移ると,選択したモデルでの係数

が推定されます.

さらに,このあてはめたモデルでの将来の特性値の

予測を行うには,モデル係数タブのツールボタン「予

測」を押します.

4.3 ARIMAモデル

Page 12: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-4-5

ARIMAモデル

PART

10

第4章

4.3.6 モデル式一覧

各モデルの式は以下の通りです.

4.3.7 ワークシート上での時系列データの変換

解析結果を全て閉じた状態で,メニューから「ワークシート」-「変換」-「データ変換」をクリックし,

「時系列データの変換」を選択すると,以下のような変換をおこなうことができます.

機能 説明

TSReplace 時系列データの欠

測値の補完

指定した量的変数に欠測値が存在する場合に,欠測値の補完を行いま

す.

補間方法は以下の3種類です.

両側N個のデータの平均

両側N個のデータのメジアン

全データの平均

LAG 指定された変数を

次数分下にずらしま

す.

欠測値が存在する場合には,欠測値を含んだ形でずらします.

LEAD 指定された変数を

次数分上にずらしま

す.

欠測値が存在する場合には,欠測値を含んだ形でずらします.

MA 指定された項数の

移動平均を生成し

ます.

指定した量的変数に対して一定の期間(設定した項数)で連続したデータ

の平均を求めます.時系列データを解析する場合に,多く用いられます.

設定された項数が偶数の場合には,中心化移動平均と移動平均のどちら

かを選択することができます.欠測値が存在する場合には,欠測値を除

いて計算を行います.

MADIFF 指定されたデータと

設定した項数より求

めた移動平均との

差を生成します.

指定した量的変数に対して一定の期間(設定した項数)で移動平均を求

め,指定したデータと移動平均との差を求めます.時系列データを解析

する場合に,多く用いられます.設定された項数が偶数の場合には,中

心化移動平均と移動平均のどちらかを選択することができます.欠測値

が存在する場合には,欠測値を除いて計算を行います.

MADIFFRA

TIO

指定されたデータ

に対して設定された

工数より求めた移動

平均との差の比率

(%)を生成します.

指定した量的変数に対して一定の期間(設定した項数)で移動平均を求

め,指定したデータと移動平均との乖離率(%)を求めます.時系列デー

タを解析する場合に,多く用いられます.設定された項数が偶数の場合

には,中心化移動平均と移動平均のどちらかを選択することができます.

欠測値が存在する場合には,欠測値を除いて計算を行います.

REGRES 指定された次数の

回帰式に対する残

差を生成します.

指定した目的変数(量的変数),説明変数(量的変数)に対して,指定され

た次数の回帰式を求め,残差を生成します.次数は最大2次まで設定す

ることができます.

4.3 ARIMAモデル

Page 13: 時系列グラフ - sns.dousoukai.eng.mie-u.ac.jpsns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/users/sw5u_10.pdf · 時系列データは,通常の多変量解析で使用するデータと同様に,一般には単独の系列(一変量)だけでは,その

10-4-6

DIFF 指定した階数の差

指定した量的変数に対して,指定された階差だけ差分を生成し,出力

します. 階差とは隣り合う2つの数値の差を意味します.この機能

では,最大6次まで階差を求めることができます.時系列データの分

析で,非定常な時系列データを定常化するために用いられる変換方法

のひとつです.なお,差分を求める対象となるサンプルが欠測値の場

合には,求められる差分も欠測値となります.

SDIFF 指定された階数の

季節差分

指定した量的変数に対して,指定された周期と階差から季節差分を生

成し,出力します.この機能では,時系列データに季節性がある場合

に,その季節変動を除去するために,周期と階差を指定し,データを

生成します.時系列データの分析で,非定常な時系列データを定常化

するために用いられる変換方法のひとつです.周期では,四半期別,

季節,年などの季節および年次サイクルを指定し(最大 512),階数で

は求めたい階差の数(最大4)を指定します. なお,差分を求める対

象となるサンプルが欠測値の場合には,求められる差分も欠測値とな

ります.

LN 指定されたデータ

に対して自然対数

(底:e)変換を

行います.

指定した量的変数に対して自然対数変換(底:e)を行います.なお,

指定した変数に 0 以下の値が含まれる場合には,「変換前データの処

理 」ダイアログが表示され,データを変換後,対数変換を行います.

SQRT 指定されたデータ

に対して平方根変

換を行います.

指定した量的変数に対して平方根変換を行います.なお,指定した変

数に0以下の値が含まれる場合には,「変換前データの処理 」ダイア

ログが表示され,データを変換後,平方根変換を行います.

BOXCOX 指定した変数を正

規化します.

指定した変数のデータを正規化し,量的変数として生成します.対象

となる変数は量的変数のみです.

DIFF 指定した階数の差

指定した量的変数に対して,指定された階差だけ差分を生成し,出力

します. 階差とは隣り合う2つの数値の差を意味します.この機能

では,最大6次まで階差を求めることができます.時系列データの分

析で,非定常な時系列データを定常化するために用いられる変換方法

のひとつです.なお,差分を求める対象となるサンプルが欠測値の場

合には,求められる差分も欠測値となります.

SDIFF 指定された階数の

季節差分

指定した量的変数に対して,指定された周期と階差から季節差分を生

成し,出力します.この機能では,時系列データに季節性がある場合

に,その季節変動を除去するために,周期と階差を指定し,データを

生成します.時系列データの分析で,非定常な時系列データを定常化

するために用いられる変換方法のひとつです.周期では,四半期別,

季節,年などの季節および年次サイクルを指定し(最大 512),階数で

は求めたい階差の数(最大4)を指定します. なお,差分を求める対

象となるサンプルが欠測値の場合には,求められる差分も欠測値とな

ります.

LN 指定されたデータ

に対して自然対数

(底:e)変換を

行います.

指定した量的変数に対して自然対数変換(底:e)を行います.なお,

指定した変数に 0 以下の値が含まれる場合には,「変換前データの処

理 」ダイアログが表示され,データを変換後,対数変換を行います.

SQRT 指定されたデータ

に対して平方根変

換を行います.

指定した量的変数に対して平方根変換を行います.なお,指定した変

数に0以下の値が含まれる場合には,「変換前データの処理 」ダイア

ログが表示され,データを変換後,平方根変換を行います.

BOXCOX 指定した変数を正

規化します.

指定した変数のデータを正規化し,量的変数として生成します.対象

となる変数は量的変数のみです.

4.3 ARIMAモデル