u-toyama.ac.jp to comfirm normality...created date 12/30/2017 12:27:25 pm

3
π′ Z″%α ιθι動″ (薬 理 と治療)vol.45 no.12 2017 Cotutvttu 規性 確認法 正規性 (noHndity)の 確認には ,ま ヒス トグラ ムを描 いて 目視 する。次 に ,正 規分位点プ ット (Q― Qプ ロツト:Quantilc― Quandlc plot)を いて 目視す る。 また ,歪 (skcwness)・ 尖度 (ku■ osis) とい う指標 を参考 にす る。最後 に ,い くつか提 案 され て い る検 定 を用 い る。 この 4通 りの確 認 法が知 られてい る。 まず ヒス トグラム (図1)を 見て ,い わゆる ルシェイプ (釣 鐘型)の 正規分布 に近 いか どうか を目視 す る。 じつ は ,図 1の 左右は同じデ で作 られたが , どち らか とい う と右 の ほ うが正 規 分布 に合 つて い る と感 じるか も しれ ない の よ うに ,な か なか 目視 だ けで は正 し く判 断す ることはできない そ こで,次 に正規分位点プ ッ トも描 いてみ (図2)。 左 手 に は横 向 きの ヒス トグ ラム ,中 dt 15 25 35 45 55 65 75 85 95 105 120 20 40 1 スケールの違いで正規性判定が異なる 右図のほうが正規分布のように見えるが, じつは同 じデータである。 60 80 100 120 140 16 115 110 105 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 2 正 規 分 位 点 プ ロ ッ トに よ る 正規性の確認 MPOで 一変量の分布」 変数名左 の▼から 正規分位点 プロッ ト」を選 ぶ と出力 され る。 直線 に載 って いれ ば正規と判断する。両端でやや正規 性から外れているが,中 間は大丈夫 そうである。 0.45 0.8 0,985 0.0002 0.06 正規分位点プロット 1993

Upload: others

Post on 07-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: u-toyama.ac.jp to comfirm normality...Created Date 12/30/2017 12:27:25 PM

ルπ′Z″%αιθι動″ (薬理と治療)vol.45 no.12 2017

Cotutvttu

正規性の確認法について正規性 (noHndity)の 確認には,ま ずヒストグラ

ムを描いて目視する。次に,正規分位点プロット

(Q― Qプロツト:Quantilc― Quandlc plot)を 描いて

目視する。また,歪度 (skcwness)・ 尖度 (ku■osis)

という指標を参考にする。最後に,い くつか提

案されている検定を用いる。この 4通 りの確認

法が知られている。

まずヒストグラム(図 1)を 見て,いわゆるべ

ルシェイプ (釣鐘型)の正規分布に近いかどうか

を目視する。じつは,図 1の左右は同じデータ

で作られたが, どちらかというと右のほうが正

規分布に合つていると感じるかもしれない。こ

のように,なかなか目視だけでは正 しく判断す

ることはできない。

そこで,次 に正規分位点プロットも描いてみ

る(図 2)。 左手には横向きのヒス トグラム,中

・ dt

15 25 35 45 55 65 75 85 95 105 120 20 40

図 1 スケールの違いで正規性判定が異なる

右図のほうが正規分布のように見えるが, じつは同じデータである。

60 80 100 120 140 160

11511010510095908580757065605550454035302520

図 2 正規分位点プロッ トによる

正規性の確認

」MPOで 「一変量の分布」→変数名左

の▼から「正規分位点プロット」を選

ぶと出力される。直線に載っていれ

ば正規と判断する。両端でやや正規

性から外れているが,中 間は大丈夫

そうである。

0.45 0.8 0,9850.0002 0.06

正規分位点プロッ ト

1993

Page 2: u-toyama.ac.jp to comfirm normality...Created Date 12/30/2017 12:27:25 PM

ル%彫α″%αθθι動″ (薬理 と治療)vol.45 no.12 2017

間に箱ひげ図,そ して右手に正規分位点プロッ

トが見られる。直線上に実データ点が載ってい

れば,正規分布に適合 していると判断する。両

端で反れていること以外は,合つているように

見えるだろう。

正規性からの「ずれ」はもともと定性的なもの

であり,確実な判定はできないが, もう少 し定

量的な方法を見てみよう。それが歪度 と尖度 と

いう指標である。Kd Pcarsonが 1900年 にカイ

ニ乗検定を提唱したことは有名だが, これらの

指標 もKtt Pearsonが 提案 したものである。算

術平均は 1次モーメント,標準偏差は 2次モー

メントと言われるが,じ つは歪度は 3次モーメ

ント,尖度は4次モーメントなのである。算術

平均は中心位置を示す尺度であり,標準偏差は

散布度を示す尺度であることは皆さんご存知だ

ろう。一方,歪度 というのは対称性を示す尺度

であり,尖度は分布の裾の広が りを示す尺度で

ある。なお,歪度は「わいど」と読み,歪みは「ゆ

がみ」や「ひずみ」と読むが,非対称性のことな

ので「ゆがみ」と言ったほうがわか りやすい。尖

度は「せんど」と読み,尖 りは「とが り」と読む。

このように読むと少 し誤解を招 く。尖度 とは尖

りの程度を表すのではなく,分布の裾 (両端)が

薄いか厚いかを示す尺度なのである。

正規分布は左右対称なので,歪度の値は0(ゼロ)に なる。右に裾を引いた分布では正の値,左に裾を引いた分布では負の値をとる。対数正規

分布は右に裾を引いているので,歪度は正の値

を示す。どのあたりが線引きの目安かというと,

± 1よ り絶対値が大きいとき「ひどく歪んでいる

(highly shwed)」 ,± 0。5か ら±1ま での絶対値

だ と「やや歪んでいる(moderately skcwed)」 など

と言われる。絶対値が 0.5未満だ とほぼ正規だ

と判断してよさそうである。

一方,尖度の値は正規分布では 3に なる。わ

かりやすくするため,通常は 3を 引いた値 (excess

kurtosisと 呼ばれる)と して表す。 したがって,

正規分布であれば尖度のほうも0(ゼロ)に なる。

尖度が 0よ り大きい正の値では裾が厚 く,正の

値方向へ長 く続 く。外れ値 (outlier)が あるとき

も尖度は正の値をとる。一方,尖度が 0よ り小

さい負の値では裾が薄 く,す ぐに途切れる。た

とえば,一様分布では尖度は負の値をとる。

尖度は漢字から「とが り度」を想像するが,本来は分布の端 (t五1)に関係 している。端が長 く続

くような (厚 い)場合,尖度は正の値をとる。長

く続 くということは外れ値が想定されるので,

外れ値の存在を伺わせる。この場合に中心が尖

る傾向があるので,「 とがり度」というのも完全に

誤 りというわけでもなさそうだ。尖度が正の値

を示すLaplacc分布は,実際すごく尖って見える。

逆に,分布の端が途切れる(薄い)と ,分布の中

心は平坦 (た とえば一様分布のように)に なる。

歪度については正規性の基準が示されている

が,尖度についてはそれが示されていない。そ

こで,通常は歪度の指標を参考にするとよいだ

ろう。表 1は ,図 1,2の データに関する計算結

果である。歪度は -0。 547であり,負の値なので

左に裾を引 く分布だとわかる。また,そ の絶対

値は0.547なので,上に示した基準でみると「や

や歪んでいる」と判断される。なお,尖度は 0.567

表 1 歪度 (非対称性の指標)に よる正規性の確認

JMPOで は「一変量の分布」→下部の「要約統計量」左の▼

から「要約統計量のカスタマイズ」を選ぶ→「歪度」と「尖

度」をクリックすると,下記のように出力される。

平均の標準誤差 0.1109862平均の上側95% 69.927528平均の下側95% 69.492404

69.709966

標準偏差 9.8877415

7937

歪度 -0.546991

0.5674195尖度

平均

1994

Page 3: u-toyama.ac.jp to comfirm normality...Created Date 12/30/2017 12:27:25 PM

ルπ彫″zαιθι ttι″(薬理 と治療)vol.45 no.12 2017

と正の値なので,外れ値の存在が疑われる。

最後に,正規性の検定について述べておきた

い。統計ソフトJMP①では,Shapiro¨Wilkの検定

とKolmogoЮv¨Smimov¨Lilliefors(KSL)検 定 が

示される (表 2)。 JMP①では,例数≦2000で は

ShttiЮ―Wilkの 検定,例数 >2000で はKSL検定が示される。 このサンプルデータは例数が

7937例のため,KSL検定の結果だけが示され

ている。P=0.0100だから,5%水準で統計学的

有意である。つまり,正規性が否定されること

になる。ただし, これらの検定は多数例データ

では有意になる傾向がある。300例以上のとき

には過検出になるとも言われるので,多数例で

は参照しないほうがよいだろう。

一方,例 数 に影響 され ない検定 として D'

Agostino¨ Pcarsonの検定がある(D'Agostino RB,

Stephcns MA.Goodncss― of― Fit Tcchniques.Marccl

Deはer;1986。 p.390… 1.)。 時に,D'Agostinoの で

検定 とも言 う。 これは,歪度 と尖度に基づ く統

計量を用いる。正規性の検定 とは言 うが,歪度

と尖度に関する検定である。 この検定では,逆に例数<20の ような少数例には適用すべきでは

ないとされる。

最後にまとめておこう。正規性を前提とした

検定は多いが,多 くは中心極限定理があるため,

ある程度の例数があれば正規性をそんなに心配

する必要はない。しかし, ヒストグラムや正規

分位点プロットなどで目視確認はしておいたほ

うがよいだろう。歪度の絶対値が 0.5未満かど

うかも確かめておくとよいだろう。目視でも歪

度でも正規性が疑われる場合には,正規性の検

定をしておくとよいだろう。300例 を超えるよ

うな多数例だと,Shapiro¨Willく の検定や KSL検

定よりも,D'Agostino¨Pcarsonの検定を参照し

たほうがよいだろう。

富山大学大学院医学薬学研究部

バイオ統計学・臨床疫学

折笠 秀樹0.056249 < 0.0100*

月直(Prob>D)D

1995

表 2 JMP①による正規性の検定結果「一変量の分布」→変数名左の▼から「連続分布のあては

め」→「正規」を選ぶ→下部の「正規のあてはめ」左の▼から「適合度」を選ぶと出力される。標本サイズが2,000例 以下

のときはShapiro―W‖ kの検定,標本サイズが2,000例 より

大きいときはKSL検 定結果が表示される。この例では

7,937例 なのでKSL検定結果である。

P=0.0100であり,統計学的有意のため,正規分布ではな

いと読む。