エクセルで統計分析5 マルチレベル分析のやり方
DESCRIPTION
HADで階層線形モデルを実行するための方法についてまとめています。TRANSCRIPT
エクセルで統計分析5HADによるマルチレベルモデル
清水裕士
関西学院大学社会学部
HADとは
• 清水が作ったExcelのVBAで動くプログラム– Excelのバージョンは2007以降に対応
– Macにも対応(Excel for Mac2011以降)• WinとMacを同じファイルで使いまわせる
• 主に心理統計分析ができる–大抵の心理統計分析は可能
• データハンドリング,統計的検定,多変量解析など
–マルチレベル分析もできる• 階層線形モデルや,マルチレベルSEMなど
2
HADとは
• 無償のソフトウェアです– 利用は無償です– 清水のブログからからダウンロードできます
• http://norimune.net/had• 何度でもダウンロードできます
• 自由なソフトウェアです– ソースコードを自由に閲覧・変更することができます
• 第三者への配布も自由です
– ライセンス• GNU General Public License(GPL)に則ってます• ライセンスについては「HADとは」( http://norimune.net/had)のページを参照してください。
3
マルチレベル分析
• 階層的データに対する分析法– 集団をサンプリングした後,個人をサンプリング
• 例:100学校にそれぞれ50人の生徒をサンプリング
• 入れ子構造になったデータ
• 階層的データを普通に分析すると問題– サンプルの独立性の仮定が崩れる
– 効果が個人レベルか集団レベルか区別できない
• マルチレベル分析については,こちらを参照ください– 清水のブログ:http://norimune.net/2115
HADでマルチレベル分析
• 清水裕士(2014)
–個人と集団のマルチレベル分析
–ナカニシヤ出版
• こちらも合わせてご覧ください
–理論的な話と実践的な話が
–両方書いてあります
HADで使えるマルチレベル分析
• 級内相関係数(ICC)の推定– 集団内での個人のデータの類似度を評価
• マルチレベル相関分析– 個人レベル・集団レベルの相関係数を推定
• ペアワイズ相関分析– マルチレベル相関分析のペア版
• 階層線形モデル(HLM)– 個人レベルの変数が,個人・集団レベルの説明変数によってどのように予測できるかを検討する
• マルチレベル構造方程式モデル(ML-SEM)
HADによる階層線形モデル
7
HLMにおけるHADの特徴
• フリーソフトウェアである– SPSS(とお金)がなくても,Excelがあれば使える
• 単純効果分析ができる– 簡単に単純効果とグラフの出力ができる
• 頑健標準誤差を出力できる– SPSSは出力してくれない
• 最尤法しか対応していない– 制限付き最尤法は現状,利用できない– 今後搭載の可能性も0ではない
8
HADを起動する
• 起動時に、マクロを有効にするか聞かれる
– Excelのマクロセキュリティを「中」にする
• Excel上部に下のような警告が出たら、有効化を押す
• 下の通知が出てきたら「有効にする」を押す
9
HAD12以降の注意点
• HAD12からはExcelのソルバーを使っている– ソルバー:Excelに入っているアドイン
• 最初に起動したときにエラーがでる場合– コンパイルエラーというのが出ることがある– その場合は,HADを一度閉じて,もう一度起動する。すると,ソルバーが入っていれば普通に使うことができる
• ソルバーがない場合– ソルバーオフバージョンを使う必要がある
10
HADを起動
• B列に集団を識別する変数を入れる
11
モデリングシートに読み込む
• データの読み込み–セットできたら「データ読み込み」ボタン
–データをチェックして、以下の場合に警告• データセットに空白がある場合
• 欠損値記号以外の文字列がある場合– 数式エラーの場合は、それらを欠損値に変換できる
• データが保存されているわけではない–変数名の読み込みと設定を読み込むだけ
–データセットを変えると分析結果も変わる
12
モデリングシートの機能
基本的な統計分析
新しい変数の作成多変量解析
変数情報の設定 データセット選択
使用変数の指定
13
• モデリングシートの9行目に変数名を指定
• 3通りの指定方法がある– 自分でセルに入力する → コピペでもよい– 「選択セルを使用」ボタンを押す– GUIを使う
分析に使用する変数を指定
ここに入力
ID変数はB列に入力する
14
GUIを使用する
• 「使用変数」ボタンを押すとGUIが立ち上がる
• 追加と削除で指定– ShiftやCtrlを使えば複数の変数を選択できる
• 変数の登録
– よく使う変数のセットは登録しておくと便利
– すぐにセットを呼び出せる
15
級内相関係数の算出
• 使用変数を指定して,「分析」ボタンを押す
–級内相関係数を
チェック
• OKボタンを押す
16
級内相関係数の算出
• 推定値と信頼区間,検定統計量,p値を出力
17
通常の回帰分析の方法
モデリングスペース
18
回帰分析の方法
• 「回帰分析」のラジオボタンをクリック–回帰分析用のモデリングスペースが表示される
–その中の「回帰分析」を選択
• 先に目的変数,あとで説明変数を指定–変数を選択して,「目的変数を投入」を押す
• ここでは満足度
– 「主効果を全投入」を押すと,自動的に説明変数がモデルに投入される
19
回帰分析の方法
• 「分析実行」を押す
– 「Reg」というシートで結果が出力される
20
交互作用も簡単にできる
• 交互作用項は自動的に中心化して作成
21
ステップごとの結果
22
単純効果分析も出力する
23
HLMの方法
• モデリングシートで「階層線形モデル」を選択
– HLM用のモデリングスペースに切り替わる
今回はSPSSと結果を一致させるため頑健標準誤差はオフにしておく
24
実行を押せばHLMができる
• 切片の集団間変動だけを仮定したモデル
– 「HLM」というシートに出力される
HADのHLMは,デフォルトで説明変数は全体平均で中心化される
25
説明変数の中心化
• 「変数の作成」ボタンから行う
– 「変数の作成」を押して,「尺度変換」タブの「集団平均で中心化する」をチェック
• 分析上で中心化を行う
– 「レベル1変数を集団平均で中心化」をチェックすると,自動的に中心化される
–説明変数は自動的に全体平均で中心化される
• この設定をオフにすることもできる
26
説明変数の中心化
27
集団平均値の計算
• 「変数の作成」の「尺度変換」タブ
–集団平均値にチェック → 列を選択して右クリック
28
回帰係数の集団間変動
• 「変量効果→」にレベル1変数を指定する
29
出力1
• モデル適合度
–情報量基準を参照する
–回帰係数の集団間変動を仮定すると,R2乗などの計算はできなくなる
30
出力2
• 固定効果
–集団平均で中心化した変数・・・wcがつく
–全体平均で中心化した変数・・・gmがつく
31
出力3
• 変量効果の分散成分
–検定方法はSPSSと異なる(HLM7と同じ)
32
交互作用項の投入
• 交互作用項を「*」を挟んで投入する
33
交互作用項の投入
• 「交互作用を全投入」ボタン
–説明変数すべての交互作用項が投入される
• Shiftキー+「交互作用を全投入」ボタン
–交互作用項を作りたい説明変数を選択した状態で,Shiftキーを押しながらボタンを押すと,その変数だけの交互作用項が投入される
–今回は,「発話量」と「集団成績」の交互作用項だけを投入
34
交互作用項の投入
• 分析結果
–交互作用項が有意
–情報量基準も小さくなった AIC:777→764
35
単純効果分析
• 「スライス→」に群分け変数を指定
– ここでは集団成績をスライスに指定
36
• 集団成績±1SDの単純効果を推定
単純効果分析
37
単純効果分析発話量 発話量-1SD +1SD
集団成績_-1SD 3.230 3.097集団成績_+1SD 3.350 4.057 **
2.5
3
3.5
4
4.5
-1SD +1SD
満足度
発話量
集団成績_-1SD
集団成績_+1SD
38