j ày þu - 中央大学c-faculty.chuo-u.ac.jp/~kfukuda/yachin.pdf[1 4 ] u> þ uvu\ # c¾ þt (2)...
TRANSCRIPT
家賃の分析
多摩モノレール万願寺駅の
一人暮らし用の賃貸マンション 11 物件
[1]データ
物件 家賃(千円) 面積(平方M) 駅徒歩(分) 築年数(年)
A 24 18 3 27
B 25 16 4 30
C 35 17 5 25
D 45 20 7 14
E 47 18 3 15
F 50 20 5 24
G 46 23 9 21
H 52 32 4 26
I 50 27 2 19
J 55 24 4 17
K 55 27 9 13
平均 44 22 5 21
万願寺の賃貸家賃(1R, 1K, 1DK, 駅10分以内)
※2017.7.12現在. SUMMOによる検索結果.
[2] 直線の式: y = a + b x
家賃を分析するには、直線の式: y = a + b x を
復習する必要があります。
x
y
xbay
a
0
1
b
[3]データを図にする
★面積を横軸に、家賃を縦軸にして
11件の物件の1つ1つを点にした散布図が
次頁にあります。
●また、11 個の点をなぞるように1本の
直線を引きます。この直線を回帰直線といいます。
[4]散布図と回帰直線
回帰直線:y = 9.5 + 1.57 x ⇐前の頁の図の直線は y = a + b x
たとえば物件 Aは面積が 182m なので y = 9.5 + 1.57×18 = 38 千円なのに
家賃は 24 千円だから誤差 = 24-38 = -14千円(図の点線)が発生。
0
10
20
30
40
50
60
0 5 10 15 20 25 30 35
面積
家賃
物件A
y
x
誤差
[5]回帰直線と誤差
●直線と点との縦の距離を誤差と呼びます。
家賃 = 9.5 + 1.57 面積 + 誤差 が成り立ちます。
〇たとえば物件 A(面積 182m で家賃 24千円)では
誤差 = 24-(9.5+1.57×18)= -14千円(図の点線)
★物件 Aは面積だけで考えると 14 千円割安です。
[6]回帰直線の求め方
★「散布図において各点をできるだけなぞる」ように
1本の直線を引きました。
◎図から明らかなように誤差はプラスになったり
マイナスになったりするので、11 個の誤差の
和ではなく、誤差を2乗した和を最小にすることに
よって回帰直線を求めることができます。
●「散布図において各点をできるだけなぞる」ということと
「誤差の2乗和を最小にする」ことは同じことです。
[6a] ちょっとした記号の説明
※統計入門には記号が少々登場しますが、便利なので
使用されているわけで、なければ非常に不便です。
★たとえば高校で習うシグマ記号は以下です。
N
i
Ni xxxx1
21
●変数 xの平均は
N
i
iN x
NN
xxxx
1
21 1)(
[7]回帰直線の傾き
★ xを面積、 y を家賃とすると、傾きbと切片 aは
次式で求めることができます。
,
)(
))((
1
2
1
N
i
i
N
i
ii
xx
yyxx
b .xbya
※教科書『経営のための統計学入門』pp.215-216 に証明があります。
●難しい式のようですが、次頁に計算例があるので大丈夫!
[8]家賃の事例における計算結果
y 家賃 x 面積
A 24 18 -20 -4 16 80
B 25 16 -19 -6 36 114
C 35 17 -9 -5 25 45
D 45 20 1 -2 4 -2
E 47 18 3 -4 16 -12
F 50 20 6 -2 4 -12
G 46 23 2 1 1 2
H 52 32 8 10 100 80
I 50 27 6 5 25 30
J 55 24 11 2 4 22
K 55 27 11 5 25 55
平均or合計 44 22 0 0 256 402
xxi yyi 2)( xxi ))(( yyxx ii
[9]計算結果
回帰直線の傾き
57.1256
402b
回帰直線の切片
5.957.12244 a
[10]回帰分析の解釈
この事例では、
家賃 = 9.5 + 1.57 面積 + 誤差 なので
(家賃の単位は千円、面積の単位は2m )
面積が12m 増えると家賃が 1570 円アップすると
いうことがわかります。
[11]単回帰分析
★先の分析を単回帰分析と呼びます。単回帰分析とは、
説明したいと思う変数(ここでは家賃ですが、
一般に被説明変数と呼びます)を
説明できると思う変数(ここでは面積ですが、
一般に説明変数と呼びます)で
近似する(散布図に直線を引く)ことです。
※被説明変数は従属変数あるいは目的変数ということもあります。
また、説明変数を独立変数ということもあります。
[11a]単回帰分析と重回帰分析
したがって、単回帰分析では、
被説明変数 = a + b 説明変数 + 誤差 という形をとり、
事例では被説明変数が家賃、説明変数が面積です。
●しかしながら、家賃を面積だけで説明するのは
おかしいわけで、それ以外にも駅徒歩時間や
築年数が関係しています。
〇このように複数の説明変数を用いた回帰分析を
重回帰分析と呼びます。
[12]重回帰分析の難しさ
★重回帰分析は図示することは困難で、電卓で
計算するのが難しく Excel 等のソフトを用います。
※説明変数が1個のときは散布図のように2次元で考えますが、
2個のときは3次元になり空間に平面を描くことになり、
さらに3個のときには4次元になり、もはや想像すらできません。
●また、複数の説明変数の中でどれが有力な
ものかを判断しなくてはなりません。
[12a] 重回帰分析の楽しさ
図の横軸に物件名、縦軸に平均を除いた家賃( yyi )がとってあります。
詳細は次頁から解説するので、わからなくて OK です。 図を見て、たとえば物件 F は
面積 と築年数 から考えると割高な物件になっていることがわかります。
-25
-20
-15
-10
-5
0
5
10
15
20
A B C D E F G H I J K
家賃(万願寺)の変動要因分解
面積 駅徒歩 築年数 誤差 家賃
[13]回帰分析における変動要因分解(1)
●先の事例の単回帰分析では次式が成り立ちます。
,nnn exbay .11,...,2,1n
先の事例では 1y は物件 A の家賃、 11x は物件 K の
面積です。 ne は誤差です。
★ここで2つの説明変数 x と y、そして
被説明変数 zからなる以下の回帰式を考えます。
nnnn ecybxaz
(たとえば z を家賃、x を面積、y を築年数とします)
[14]回帰分析における変動要因分解(2)
●回帰式: nnnn ecybxaz において
さきほどと同様に、誤差を二乗した和を小さくすることで
aやbそして cを求めることができます。
※実際には Excel 等が計算してくれます。
★このとき次式が成り立ちます。
nnnn eyycxxbzz )()( ⇐これが図を作成した式です!
なぜなら誤差の合計が0になり次式が成り立つからです。
ycxbaz ※証明は教科書 126 頁にあります。
[15]回帰分析における変動要因分解(3)
nnnn eyycxxbzz )()(
この式を用いることで、被説明変数( zzn )家賃を
)( xxb n の部分(面積)と )( yyc n の部分(築年数)と誤差 ne に
分けることができます。次頁で各要因の大きさを色で示しています。
[16]回帰分析における変動要因分解(4)
[17]回帰分析における変動要因分解(5)
図から次のことがわかります。
①家賃を面積要因 や築年数要因 そして誤差 などに分解。
※折れ線グラフが家賃ですが、正確には「平均を除いた家賃」です。
②家賃には面積 と築年数 が大きく影響するが、
駅徒歩 はほとんど影響しない。
③物件 H は誤差 がほとんどなく、広い面積 が家賃を上げ、
築年数 が古いことが家賃を下げていることがわかる。
④逆に物件 F は面積 が狭く築年数 も古いことから安い家賃に
なっているはずだが、誤差 (その他の要因)で家賃は高い。
[18]回帰分析における注意点
①今回の事例では物件数(観測数)が 11個と非常に
少ないので、たとえば別の物件の情報を加えたり、
別の説明変数に変更したりすると、分析結果が大きく
変わる可能性がある。
②本格的な分析をするには観測数は少なくとも百個は必要。
※専門的な学術論文では1万個以上も珍しくない。