7 散らばりの統計量 - pre-step(3)統計データ全体で散らばりを表現する...

12
クイズ 7 散らばりを測ろう それぞれ 10 発の射撃結果をア,イ,ウに表します。これら 3 つの射撃結果のうち,弾の散らばりが 最も小さいのは明らかにウで,つづいてア,イの順です。ウの射撃結果は的の中心ではなく偏ってい ますが,アやイに比べて弾は集中しています。 弾の射撃結果である着弾点を統計 データとして,的の中心を原点に(xi, yi),i=1,2, ,10 で表します。こ のとき,着弾点の散らばりを統計 データの中心からの距離として測る ことを考えます。つぎの A,B,C の距離のうち,どれが適切であると 思いますか(解答は 82 ページ) 79 7 散らばりの統計量 第 5 章では,統計データの中心の位置の統計量として,平均値と中央値につ いて学びました。この章では,統計データの散らばりの統計量について学び ます。統計データの散らばりはどのように測るとよいのでしょうか。散らば りの統計量は,中心の位置の統計量に関する性質と深い関係があります。 -10   -5   0   5   10 10 8 6 4 2 0 -2 -4 -6 -8 -10 -10   -5   0   5   10 10 8 6 4 2 0 -2 -4 -6 -8 -10 -10   -5   0   5   10 10 8 6 4 2 0 -2 -4 -6 -8 -10 A B C A:的の中心からの距離 xi 2 +yi 2 B:統計データの中心からの絶対偏差 xix+ yiy C:統計データの中心からの距離 (xix) 2 +(yiy) 2 この章で学ぶこと 統計データの散らばりをどのように測るのかを考えます。 散らばりの統計量として,分散と標準偏差があります。 分散と標準偏差の計算方法を習得します。

Upload: others

Post on 07-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

クイズ● 7 散らばりを測ろう

それぞれ 10 発の射撃結果をア,イ,ウに表します。これら 3つの射撃結果のうち,弾の散らばりが

最も小さいのは明らかにウで,つづいてア,イの順です。ウの射撃結果は的の中心ではなく偏ってい

ますが,アやイに比べて弾は集中しています。

弾の射撃結果である着弾点を統計

データとして,的の中心を原点に(xi,

yi),i=1,2,…,10 で表します。こ

のとき,着弾点の散らばりを統計

データの中心からの距離として測る

ことを考えます。つぎの A,B,C

の距離のうち,どれが適切であると

思いますか(解答は 82 ページ)。

第 7章●散らばりの統計量

79

第7章 散らばりの統計量

第 5章では,統計データの中心の位置の統計量として,平均値と中央値につ

いて学びました。この章では,統計データの散らばりの統計量について学び

ます。統計データの散らばりはどのように測るとよいのでしょうか。散らば

りの統計量は,中心の位置の統計量に関する性質と深い関係があります。

-10    -5    0    5    10

1086420-2-4-6-8-10

-10    -5    0    5    10

1086420-2-4-6-8-10

-10    -5    0    5    10

1086420-2-4-6-8-10

A

B

C

A:的の中心からの距離

xi2+yi

2

B:統計データの中心からの絶対偏差

xi−x+yi−y

C:統計データの中心からの距離

(xi−x)2+(yi−y)2

この章で学ぶこと

● 統計データの散らばりをどのように測るのかを考えます。

● 散らばりの統計量として,分散と標準偏差があります。

● 分散と標準偏差の計算方法を習得します。

Page 2: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

統計データの散らばりをどのように測るか

Point

統計データの散らばりを測る統計量について考える。

絶対偏差の和は中央値,偏差平方の和は平均値と対応関係にある。

散らばりの統計量として,分散と標準偏差を定義する。

(1) 統計データの散らばりは統計データの中心からの距離で表す

統計データの散らばりを統計データの中心からの距離で表現することに

ついて異論はないと思います。しかし,統計データの中心の位置として,平

均値と中央値のどちらを採用すればよいのでしょうか。ひとまず,平均値

と中央値のどちらを採用するのかについては決定せずに,中心からの距離

を考えてみましょう。

(2) 2 つの距離候補:絶対偏差と偏差平方

表 7-1 には,小さい値から順に並べた統計データ(表 5-2 参照)別に,中

心の位置の統計値からの偏差と絶対偏差,偏差平方を示します。表 7-1 の

ように,中心の位置からの偏差は正と負(+と−)の値が混在しています。

この偏差を距離としてそのまま使用するのは問題があります。

距離は,つねに正をとる値であり,かつ距離の大きさが中心から離れてい

ることを示す必要があります。このため,距離の候補として,偏差の絶対値

である絶対偏差と偏差の二乗(自乗と書くこともあります)である偏差平方

(平方は二乗と同じ意味です)が考えられます。絶対偏差と偏差平方は,つ

ねに正の値であり,大きい値をとるほど中心から離れていることを表現し

ています(表 7-1 を参照)。先ほどのクイズにおける選択肢でも絶対値によ

る距離(クイズの選択肢B)と平方を用いた距離(クイズの選択肢C)の 2

つを挙げました。また,絶対偏差と偏差平方では距離の大小関係が異なる

ことはありません。つまり,a ≤b であれば a2≤b2が成り立ちます。

80

中央値からの偏差

−2.0 のとき

絶対偏差は −2.0=2.0

偏差平方は(−2.0)2=4.0

となりますね。

1.15−3.85平均値からの偏差

6.858.03.0統計データ x(i)

平均61 83

注:統計データは小さい値から順に並べている。また,平均値は 6.85,中央値は 5.0 である。

表 7-1 統計データ別 中心の位置の統計値からの偏差,絶対偏差,偏差平方

0.81

80.107.56

8.95−2.75

15.84.1

19.919.004.00中央値からの偏差平方

16.491.3214.82平均値からの偏差平方

0.00

11.222.729.92

0.003.35−1.65−3.15

54.8010.25.23.7

合計752

116.64

平均値からの絶対偏差

2.9523.6010.805.203.000.200.901.302.00中央値からの絶対偏差

159.2627.040.041.69

131.88

5.203.000.20−0.90−1.30−2.00中央値からの偏差

3.3626.908.953.351.151.652.753.153.85

0.04

4.20

0.20

2.05

−0.20

−2.05

4.8

4

1.8514.8010.80

Page 3: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

(3) 統計データ全体で散らばりを表現する

距離で散らばりを表現する際の問題は,中心からの距離は統計データの

大きさ n個分存在するということです。平均値や中央値といった中心の位

置の統計量は,それぞれの統計データに対して 1つの統計値が得られます。

散らばりの統計量も 1 つの統計値で表した方が統計データを要約すること

になります。統計データ全体で散らばりを表現するには,中心からの距離

の和を計算して統計データの大きさで割る(平均の計算方法と同じです)こ

とが最も簡単な方法です。

ここで,決定を保留していた絶対偏差と偏差平方に関する和を比べます。

まず,第 5章の問題 5-1 から,絶対偏差の和 ∑n

i1xi−a を最小にする aは中

央値であることがわかっています。例題 7-1 において,偏差平方の和 ∑n

i1

(xi−a)2に関する性質を確認してみましょう。

第 7章●散らばりの統計量

81

点 a別 偏差平方とその和

第 5章において,偏差の和 ∑n

i1(xi−a)を 0にする aは平均値であり,絶対

偏差の和 ∑n

i1xi−aを最小にする aは中央値であるということがわかりまし

た。それでは,偏差平方の和はどのような性質をもつのでしょうか。偏差平

方の和 ∑n

i1(xi−a)2を関数 h(a)としたとき,特別の場合を除いて h(a)=0 と

なる点は存在しません(すべての観測値が同じ値のときのみ h(a)=0 となり

ます)。点 aと h(a)との関係を表 7-2 に示します。表 7-2 を用いて図 7-1 に

グラフを描き,関数 h(a)の最小値を求めます。

例題7-1

68.895.297.5

x5=15.8x1=5.2

偏差平方の

和 h(a)偏差平方(xi−a)2

a

∑(xi−a)2

表 7-2 点 aを変化させたときの偏差平方(xi−a)2と偏差平方の和 h(a)

0.25

18.490.00

14.440.25

x7=3.7x3=8.0

153.753.2910.898.5

142.560.847.848.0

135.3

4.8425.0015.21

7.297.2920.2511.56

x8=4.8x6=10.2x4=3.0x2=4.1

23.04

6.5

132.14.8410.8910.2477.4416.001.008.413.247.0

13.692.8930.2519.36

10.24

17.6496.049.004.003.610.646.0

132.92.897.8413.6986.4912.252.255.761.69

0.810.045.0

146.50.493.2422.09106.096.256.251.960.095.5

137.71.445.29

0.090.6432.49127.692.2512.250.160.494.5

159.30.041.6927.04116.644.009.00

196.90.640.0938.44139.241.0016.000.011.444.0

176.1

Page 4: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

(4) 絶対偏差の和と中央値,偏差平方の和と平均値という対応関係

第 5 章における平均値と中央値の性質と例題 7-1 の結果は表 7-3 のよう

に整理することができます。表 7-3 から,絶対偏差の和は中央値,偏差平方

の和は平均値と対応関係にあることがわかります。

82

6.85

4.0  4.5  5.0  5.5  6.0  6.5  7.0  7.5  8.0  8.5a

220

200

180

160

140

120

100

f (a)

図 7-1 偏差平方の和 h(a)

図 7-1 から,関数 h(a)が最小値をとるのは a

が 6.85 のときであることがわかります。つま

り,偏差平方の和∑ni1(xi−a)2を最小にする a

は平均値です。また,ここで示した内容を数

式で解く方法については 90 ページの付録 2を

参照してください。

x(エックスバー)は

平均値のこと

でしたね。

偏差の和 ∑n

i1(xi−a)を 0に

する aは平均値。

∑n

i1(xi−x)=0 が成り立つ。

偏差の和

中央値平均値

表 7-3 中心の位置の統計量と偏差の和,絶対偏差の和,偏差平方の和との関係

偏差平方の和 ∑n

i1(xi−a)2を

最小にする aは平均値。

偏差平方の和

絶対偏差の和 ∑n

i1xi−aを

最小にする aは中央値。

絶対偏差の和

クイズ 7の解答

C(またはB)

的の中心からの距離では統計データの中心からの距離を測ることはできません。た

とえば,ウのように集弾が偏っている場合,的の中心は統計データの中心とは言えま

せん。このため,Aは適切ではありません。距離としては,B,Cのどちらの距離で

も問題ありません。ただし,Bを用いるよりも Cを用いる方が一般的でしょう。C

はユークリッド距離と呼ばれる距離です。

Page 5: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

(5) 散らばりの統計量として,偏差平方の平均を採用する

統計データの中心の位置を平均値と考えると,絶対偏差の和よりも偏差

平方の和の方が中心の位置と対応していると考えられます。また,偏差平

方の和は統計データの大きさ nに依存して大きくなるため,統計データの

大きさ nで割った統計量を採用します。この統計量を分散(variance)と呼

び,S 2xと表します。S 2xの下添え字の xは,変数 xの分散という意味で使用し

ています。

Sx2=1n∑i1

n

(xi−x)2

分散は,その計算方法から,偏差平方に関する平均値であると考えること

もできます。このように,平均値の計算に基づいて,散らばりの統計量であ

る分散を定義することからも,中心の位置として平均値を用いることに統

一性があると考えられます。また,分散の単位は統計データの二乗です。

たとえば,統計データの単位が「万円」の場合には,分散の単位は「万円2」

となることに注意しなければなりません。

(6) 統計データの単位に合わせるために,分散の正の平方根をとる

分散の単位は統計データの単位の二乗になりますので,統計データの単

位に合わせた統計量として標準偏差(standard deviation)Sxを定義します。

標準偏差は分散の正の平方根をとった統計量です。

Sx= Sx2=

1n∑i1

n

(xi−x)2

(7) 整理:分散の考え方

これまでに説明してきた散らばりの統計量の考え方を整理すると以下の

ようになります。

第 7章●散らばりの統計量

83

分散 S 2x

標準偏差 Sx

2 つをペアで覚えて

しまえばいいのね!

❶統計データの中心からの距離で散らばりを表す。距離として,絶対

偏差と偏差平方の 2つの候補が考えられる。

❷統計データ全体で 1つの値として散らばりを表現する。絶対偏差の

和を最小にするのは中央値であり,偏差平方の和を最小にするのは

平均値であるという対応関係がある。

❸平均値を中心の位置として,偏差平方の平均を散らばりの統計量と

して定義する。この統計量を分散と呼ぶ。

❹統計データの単位と合わせるために,分散の正の平方根をとる。こ

の統計量を標準偏差と呼ぶ。

重要なポイントです。

わからなかったらあい

まいにしないで,前に

戻って確かめてから次

に進んでくださいね。

Page 6: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

分散と標準偏差の計算

Point

分散の計算は表を用いて行う。

偏差の和が 0であることを確認することにより計算間違いが少なくなる。

分散と標準偏差の計算方法について解説します。ここで示すのは,表を

用いて筆算により統計値を求める方法です。

(1) 表に統計データを記入して,合計と平均値を計算する

統計データをすべて表に記入します。このと

き,統計データの番号 iもあわせて記入してくだ

さい。また,統計データを記入したのち,それら

の合計と平均値を計算します。

(2) 平均値からの偏差を計算する

平均値からの偏差(xi−x)の記号を表頭に記入

してから,(xi−x)を計算します。この例では平

均値が 6.85 ですので,少数点以下 2 桁まで求め

ます。平均値が割り切れない場合で筆算を行うと

きには,有効桁数よりも 1桁以上多い桁数で計算

してください。この場合,有効桁数は 2桁(たと

えば 5.2 は 2 桁)ですので,3 桁以上で筆算を行

います。

84

4.12

5.21

(xi−x)2xi−xxii

4.88

6

3.77

6.85平均値

54.8合計

8.03

3.04

15.85

10.2

−2.754.12

−1.655.21

(xi−x)2xi−xxii

4.88

6

−3.153.77

−2.05

6.85平均値

54.8合計

1.158.03

−3.853.04

8.9515.85

3.3510.2

Page 7: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

(3) 平均値からの偏差を合計して 0となることを確認する

平均値からの偏差を合計して 0となることを確

認します。この確認を行うと,分散に関する計算

間違いが少なくなります。平均値からの偏差を暗

算する場合,計算を間違える可能性があります。

平均値からの偏差の合計が 0であれば,ここまで

の計算は間違っていないことになります。もし,

この計算において 0にならなければ,計算結果を

確認しましょう。ただし,平均値が割り切れない

場合は,丸めた位置で多少の計算誤差が生じるこ

とがあります。

(4) 偏差平方を計算する

平均値からの偏差に関する計算が間違っていな

いことを確認したのち,偏差平方を計算して合計

を求めます。この過程では電卓を用いた方が簡単

です。

また,平方の計算では,桁数を多めにとってお

きましょう。このときに桁数を有効数字と同じ桁

数に丸めてしまうと,合計による丸めの誤差が大

きくなってしまいます(丸めの誤差については 88

ページ,数値の丸め方は 74 ページのコラム参照)。

(5) 分散の定義式を記述してから,統計値を代入して分散と標準偏差を求

める

表を用いた計算結果と数式との関係を以下のように記述してから数値を

代入します。このような筆算の癖をつけると,問題を解くことにより定義

式を覚えるようになりますし,計算間違いを減らすことができます。

n=8, ∑i1

n

(xi−x)2=131.88,

Sx2=1n∑i1

n

(xi−x)2=18×131.88=16.485

Sx= Sx2= 16.485=4.0601724≈4.1

第 7章●散らばりの統計量

85

−2.754.12

−1.655.21

(xi−x)2xi−xxii

4.88

6

−3.153.77

−2.05

6.85平均値

0.0054.8合計

1.158.03

−3.853.04

8.9515.85

3.3510.2

−2.754.12

2.7225−1.655.21

(xi−x)2xi−xxii

4.88

6

9.9225−3.153.77

4.2025−2.05

6.85平均値

131.88000.0054.8合計

7.5625

1.32251.158.03

14.8225−3.853.04

80.10258.9515.85

11.22253.3510.2

Page 8: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

86

842

681

(xi−x)2xi−xxii

725

表 7-4 分散と標準偏差の計算表(1)

3

724

74.4平均値

372合計

76

脈拍に関する分散と標準偏差の計算

第 5章の例題 5-2(62 ページ)の統計データを用いて,分散と標準偏差の計

算を実施します。脈拍数の統計データとして 5つの観測値 68,84,76,72,72

があります。表 7-4 の空欄に,記号や数値を記入して計算を行ってください。

表 7-4 には平均値の計算までの途中経過を記入しておきます。先ほど説明し

た計算の手順通りに実施してください。 (解答は p. 158)

Q問題7-1

PC で計算ソフトを

使えば答えはすぐ出

るけど,自分で計算

すると意味がよくわ

かるのね!

「分散と標準偏差の計算(5)」(85 ページ)と同様に定義式を記述してから,統計値を代入して分散と標準偏差

を求めてください。

Page 9: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

(6) 統計データを平行移動しても分散は変わらない

問題 7-1 と問題 7-2 の分散はまったく同じ値となります。このことを数

式で表現すると,以下のようになります。仮の平均による平均値の計算で

は,元の観測値 xiから仮の平均 bを引いた yiを用いました。xiと yiとの関係

は,仮の平均 bにより yi=xi−bと y=x−bになります。いま,変数 yの分

散を S 2yとおきますと,つぎのように展開することができます。このように,

それぞれの分散は等しいこと(S 2y=S 2x)がわかります。

Sy2=1n∑i1

n

(yi−y)2

=1n∑i1

n

{(xi−b)−(x−b)}2

=1n∑i1

n

{xi−b−x+b}2

=1n∑i1

n

(xi−x)2

=Sx2

第 7章●散らばりの統計量

87

つぎの第 8 章では,標

準偏差のさまざまな利

用方法について説明し

ます。

仮の平均を用いた分散と標準偏差の計算

第 5 章の例題 5-2 では,仮の平均を用いて平均値の計算を行いました。こ

こでは,問題 7-1 の統計データを仮の平均 70 からの偏差 yiとして表し,表 7-

5 における平均値からの偏差(yi−y)を計算してください。そして,偏差の計

算結果を問題 7-1 での計算と比較しましょう。平均値からの偏差(yi−y)は y

=4.4 からの偏差として計算してください。 (解答は p. 158)

Q問題7-2

142

−21

yi−yyii

5

表 7-5 分散と標準偏差の計算表(2)

3

24

2

4.4平均値

22合計

6

Page 10: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

88

分散や標準偏差を計算するうえでの問題は,丸めた数値による計算誤差と有効桁数

の 2 点を考慮しなければならないことです。計算機(電卓や PC)は多くの桁数を保

存できるため,特殊な場合を除いて問題はないのですが,筆算の場合,計算誤差は問

題となります。(数値の丸め方は 74 ページのコラム参照)

筆算の経験則としてつぎに示すものがあります。

「1回の計算で解を出すことができないとき,計算の各過程において数値を有効桁数

に丸めることはしない。有効桁数+1 桁以上の桁数をとった計算を行う。」このとき,

「+1 桁以上」としたのは,偏差平方を計算する際に,桁数が多くなるからです。厳密

には,値の範囲(たとえば,5.2 ならば,5.15≤5.2<5.25 の範囲)を考慮することで

桁数を決定するのですが,統計データに応じて考慮することはたいへん厄介です。こ

のため,計算の桁数は有効桁数よりも多めにとって計算してください。

分散や標準偏差の計算において最も気をつけるのは,平均値を有効桁数に四捨五入

してから計算を行わないことです。問題 7-1 の場合,平均値を 74.4 ではなく四捨五

入して 74 とすると,分散は 29.44 ではなく 29.6 になってしまいます。これは,経験

則の「計算の各過程において数値を有効桁数に丸めない」に反した例です。

有効数字と丸めた数値による計算誤差

c lumn

842 9.6

40.96681 −6.4

(xi−x)2xii

▶有効桁数+2 桁での計算

Sx2=1n∑i1

n

(xi−x)2=15×147.20=29.44

5

xi−x

0.0

5.76724

−2.4 5.7672

74.4平均値

−2.4

147.20372合計

1.6

92.16

2.56763

842 10

36681 −6

(xi−x)2xii

▶途中で数値を有効桁数に丸めた計算

Sx2=1n∑i1

n

(xi−x)2=15×148=29.6

5

xi−x

2

4724

−2 472

74平均値

−2

148372合計

2

100

4763

Page 11: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

Q確認テスト (1) 統計データは質的データと量的データに分類されます(第 2章)。散らばりの

統計量を計算できるのは,どちらのデータでしょうか。

(2) 脈拍数の統計データとして 5 つの観測値 668,830,763,714,725 がありま

す。問題 7-1 では 1分間計測したのに対して,ここでは 10 分間脈拍数を計測

した観測値を用います。標準偏差を計算してください。計算の際には下記の

表を活用してください。 (解答は p. 158)

第 7章●散らばりの統計量

89

1 散らばりの統計量として分散と標準偏差を学びました。

2 平均値からの偏差平方の平均を分散(variance),分散の正の平方根を標準

偏差(standard deviation)と呼びます。

3 分散の計算は表を用いて行います。

講 義 の ま と め

(xi−x)2xi−xxii

分散と標準偏差の計算表

平均値

合計

Page 12: 7 散らばりの統計量 - PRE-STEP(3)統計データ全体で散らばりを表現する 距離で散らばりを表現する際の問題は,中心からの距離は統計データの

1010

付 録2

90

h(a)=∑(xi−a)2を最小にする aは xであることを証明しましょう。

h(a)は aに関する 2次関数です。これを展開すると以下のようになります。

h(a)=∑i1

n

(xi−a)2

=∑i1

n

(xi2−2axi+a2)

=(x12−2ax1+a2)+(x2

2−2ax2+a2)+…+(xn

2−2axn+a2)

=(x12+x2

2+…+xn

2)−2a(x1+x2+…+xn)+(a2+a2+…+a2)

=∑i1

n

xi2−2a∑

i1

n

xi+na2

このとき,aに関する 2次関数 h(a)を最小にする aを求めます。aの 2次の

係数は nと正であるため(na2が aの 2次の項であり,係数は nである),この 2

次関数は極小値を持ちます。

h(a)=∑i1

n

xi2−2a∑

i1

n

xi+na2

=na2−2a∑i1

n

xi+∑i1

n

xi2

=na2−2a1n∑i1

n

xi+1n∑i1

n

xi2

=na−1n∑i1

n

xi2

−1n∑i1

n

xi2

+1n∑i1

n

xi2

=na−1n∑i1

n

xi2

−nx2+n1n∑i1

n

xi2

=na−x2+∑

i1

n

xi2−nx2

=na−x2+∑

i1

n

xi−x2

∑i1

n

xi−x2=∑

i1

n

xi2−2xi x−x2

=∑i1

n

xi2−2x∑

i1

n

xi−nx2

=∑i1

n

xi2−2nx2−nx2

=∑i1

n

xi2−nx2

h(a)はこのように展開することができますので,a=xのとき h(a)は最小に

なります。つまり,∑n

i1(xi−a)2≥∑n

i1(xi−x)2が成り立ちます。また,h(a)を a

で微分して 0とおいても同様に証明できます。

偏差平方和を最小にするのは平均値で

あることの証明