エクセルで統計分析2 hadの使い方
DESCRIPTION
Excelで動くフリーの統計分析プログラム、HADの解説です。 プログラムは、以下のサイトからダウンロードできます。 http://norimune.net/had エクセルで統計分析 HADについて http://slidesha.re/10ARA0k エクセルで統計分析2 HADの使い方 http://slidesha.re/RsVBp7 エクセルで統計分析3 回帰分析のやり方 http://slidesha.re/XVATPV エクセルで統計分析4 因子分析のやり方 http://slidesha.re/YWUGNYTRANSCRIPT
エクセルで統計分析2HADの使い方 基礎編
清水裕士
関西学院大学社会学部
HADの使い方
HADの使用手順
• 0.HADを起動する
• 1.データをデータシートにセットする
• 2.モデリングシートに変数を読み込む
• 3.モデリングシートで変数情報の設定
• 4.分析に使用する変数を指定する
• 5.分析法を選んで実行
0.HADを起動する
• 起動時に、マクロを有効にするか聞かれる
– Excelのマクロセキュリティを「中」にする
• Excel上部に下のような警告が出たら、有効化を押す
• 以下のような通知が出てきたら「有効にする」を押す
HAD12以降の注意点
• HAD12からはExcelのソルバーを使っています。
– ソルバーとは,Excelに入っているアドインです。非線形方程式を解くためのツールです。
• 最初に起動したときにエラーがでる場合
– コンパイルエラーというのが出ることがあります。その場合は,HADを一度閉じて,もう一度起動して
みてください。すると,ソルバーが入っていれば普通に使うことができます。
それでもエラーが出る場合
• ソルバーが有効になってない,あるいは入っていない可能性があります。
–参考URL:
• http://office.microsoft.com/ja-jp/excel-help/HP010021570.aspx
• ソルバーオフバージョンもあります
– ソルバーを使わないバージョンです。構造方程式モデルは実行できませんが,それ以外の分析はすべて可能です。そちらをダウンロードしてください。
1.データのセット変数名
1行目が空白セルになるまで読み込む
ID変数B列に個人を識別するID変数を必ず入力する
データは数値のみID変数は文字でも可欠損値はピリオド”.”(変更可)
2.モデリングシートに読み込む
• データの読み込み–セットできたら「データ読み込み」ボタン
–データをチェックして、以下の場合に警告• データセットに空白がある場合
• 欠損値記号以外の文字列がある場合– 数式エラーの場合は、それらを欠損値に変換できる
• データが保存されているわけではない–変数名の読み込みと設定を読み込むだけ
–データセットを変えると分析結果も変わる
モデリングシートの機能
基本的な統計分析
新しい変数の作成多変量解析
変数情報の設定 データセット選択
使用変数の指定
3.変数情報の設定
• フィルタの設定– 分析で除外したいサブジェクトを指定できる– グループごとの分析も設定可能
• 値ラベルの設定– HADは数値しか入力できないが、値にラベルを付けておくと、出力で反映される
• 変数ラベルの設定– 分析のときに同時に出力できる
• 得点化のコードを保存– 因子得点や尺度得点の得点化方法を保存できる– 違うデータで同じ得点かを再現したい場合に便利
フィルタの設定
• 「フィルタ」ボタンをクリック–変数名を指定する
–基準となる値を入力
–削除方法を選択
• セルから直接編集も可能– “1”の人を削除・・・”1”と入力
– “1”より大きい人を削除・・・”>1”と入力
– “1”の人だけを分析に使う・・・”*1”と入力
値ラベルの設定
• 「値」ボタンをクリック–設定したい値を入力
–その値のラベルを入力
– 「追加」をクリック
• セルから直接編集も可能– 1=セトサ, 2=バーシカラー・・・
• という感じで入力
–値と”=“と”,”は半角で
変数ラベルの設定
• 「ラベル」ボタンをクリック
–変数名を指定して、ラベルを入力
–ボタンをクリックするときにあらかじめ変数名のあるセルを選択しておくと便利
• セルから直接編集も可能
–調査票からコピペしたいときに
グループごとの分析
• 「フィルタ」ボタンをクリック– 変数名を指定する
– 「この変数をグループ分け変数にする」をチェック
• セルから直接編集も可能– グループ分けしたい変数のところに”by”と入力
– ただし、設定できるグループ分け変数は一つだけ
• モデリングシートの9行目に変数名を指定
• 3通りの指定方法がある– 自分でセルに入力する → コピペでもよい– 「選択セルを使用」ボタンを押す– GUIを使う
4.分析に使用する変数を指定
ここに入力
ID変数はB列に入力する
「選択セルを使用」ボタン
セルをドラッグして・・・ ボタンをクリックすると 変数が投入される
• Shiftキーを押しながらクリックすると・・・– 既に入力している変数の左側に追加される– 押さない場合は上書きで入力される
• 隣の「統制変数を投入」を押すと・・・– 統制変数が”$”の後に入力される
GUIを使用する
• 「使用変数」ボタンを押すとGUIが立ち上がる
• 追加と削除で指定– ShiftやCtrlを使えば複数の変数を選択できる
• 変数の登録
– よく使う変数のセットは登録しておくと便利
– すぐにセットを呼び出せる
5.分析法を選んで実行
• 基本的な統計分析– 「分析」ボタンを押して、分析法を選択
• 新しい変数の作成– 「変数の作成」ボタンを押して、方法を選択
• 多変量解析– 「回帰分析」か「因子分析」から選択
• 回帰分析:回帰分析、分散分析、一般化線形モデル,HLM
• 因子分析:因子分析、クラスタ分析、対応分析,SEM
分析ボタン
• 簡易モード
–よく使う分析法だけを表示
–見やすくて,初心者には使いやすいかも
• 詳細モード
–実行可能な分析のすべてを表示
–チェックボックスが多くて,最初は使いづらいかも
簡易モードと詳細モード
基本的な統計分析
• 基礎的な分析は、「分析」ボタンから– データの要約、表やグラフ、基本統計分析はすべてここから選択できる
• 複数の分析を同時に実行– チェックした分析を一度に出力することができる
• 出力は分析単位で別シート– 同じ分析は上書きされる– 上書きしないようにすることもできる
• 一部のデータセットの出力– 変数を指定して、サブデータセットを出力することもできる
分析例:ヒストグラム
• idtのヒストグラムを表示
使用変数に変数を投入
分析例:相関分析
• Idtとtalkとperの相関係数を算出
使用変数に変数を投入
注意:入力順序が意味を持つ分析
• 直線回帰– 目的変数を先に入れる(つまり、セルC9に指定)– 説明変数はそのあと(D9)で指定
• 対応がない平均や順位の差の検定– 目的変数を先(C9)に、説明変数(要因)を後(D9)に入力
• 散布図– 先(C列)の変数がY軸、後に入れた変数がX軸
– グループ別の散布図は、グループを分ける変数を二つの変数の後に指定(つまり、E9に指定)
• 相関係数の差の検定– 先に相関係数を計算する変数を指定し、最後に群分け変数を指定
基本的に、「目的変数が先、説明変数が後」というルール
分析例:平均値の差の検定の場合
目的変数(C9) 説明変数(D9)
種を要因とした一要因分散分析
分析例:相関係数の差の検定(詳細モードに入ってます)
• Idtとtalkの相関係数が、con(0と1のデータ)で差があるかを検定
群分け変数
新しい変数の作成
• 「変数の作成」ボタンをクリック– 先に作成に使う変数を選択しておく
• 変数の合成– 平均値や合計値を算出
• 尺度変換– 標準化や中心化
• 数値変換– 変数の逆転、非線形変換
• 値の再割り当て– 特定の値を別の値に変える
• ダミー変数– 変数を0,1に2値化する
分析例:尺度の平均値を算出
• v1-v5の平均値を算出する
使用変数に項目を投入
分析例:値の再割当て
• 最小値から5点を0,それ以上を1にする
新しい変数をデータセットに移動
• データシートに移動する方法
–データに追加したい変数を選択
–右クリック
• 「変数をデータセットに追加」
– この方法で追加すると
• 分析コードが保存される
列を選択して右クリック
便利機能
ラベルで結果を表示
• 変数名がわかりにくいときに便利
–変数ラベルで結果を表示する
– 「HADの設定」ボタンを押す
–表示設定タブを選択
– ラベルで結果を出力をチェック
• 分析結果をラベルで表示
シートの出力と管理
• シートはデフォルトでは上書きされる– 同じ分析の場合に上書きされる
– 「出力を上書きしない」をチェックすると別の名前で出力される
• 出力シートが多い・・・– 「シート管理」のボタンを押す
• 選択シートの表示• 選択シートの削除• シートの名前の変更• 新規ブックへシートを移動などができる
統制変数の指定
• 偏相関を計算したい場合
–変数を指定した後、$マークをつける
– $マークの後に統制変数を指定する
統制変数
統制変数の指定
• この状態で、相関分析を実行してみると・・・
–偏相関分析の結果が出力される
統制変数の利用
• 統制変数はいろんな分析で利用できる– 相関分析
– 因子分析
– 回帰分析
– 多変量回帰分析
• カテゴリカル変数を使う分析では利用できない– 順位相関分析・ポリコリック相関分析
– 分散分析
– ロジスティック回帰分析
分析履歴の保存
• HADで分析した履歴を表示
– 「HADの設定」→「表示設定」→「分析履歴表示」
• Ctrl+Rでも表示可能
–デフォルトでは100個まで保存
–分析日時と分析コード,分析の要約を表示
分析コード
• 履歴に保存された分析を再現
– コードを右クリックすると,その分析を再現できる
その他の設定
表示設定
• HADの分析結果や履歴の表示設定
分析設定
• 欠損値の設定など
グラフ設定
• 分散分析や回帰分析のグラフ表示設定
ショートカット設定
• Ctrlキーを使ったショートカット
システム設定
• HADのバージョン確認と読み込み
–古いバージョンのHADのデータや設定,出力を新しいバージョンに読み込むことができる
詳細はWebサイトで
• 清水のWebサイトに詳細があります
– http://norimune.net/had
• HADの操作について質問はこちらまで
– http://ask.fm/simizu706