草薙 nagoyar11 エクセルでrライクな図示

35
エクセルRライクな図⽰ 散布図・箱ひげ図・ヒストグラム

Upload: kusanagi-kunihiro

Post on 11-Jun-2015

1.225 views

Category:

Technology


1 download

DESCRIPTION

草薙邦広「エクセルでRライクな図示」NagoyaR #11 2013/12/7

TRANSCRIPT

Page 1: 草薙 Nagoyar11 エクセルでrライクな図示

エクセルでRライクな図⽰散布図・箱ひげ図・ヒストグラム

Page 2: 草薙 Nagoyar11 エクセルでrライクな図示

概要• Rがいいとかエクセルがいいとか• 両⽅でやってみよう

– 散布図– 箱ひげ図– ヒストグラム

• まとめ

Page 3: 草薙 Nagoyar11 エクセルでrライクな図示

草薙邦広Nagoya R #11 LT, 2013/12/7

[email protected]

Page 4: 草薙 Nagoyar11 エクセルでrライクな図示

Rがいいとかエクセルがいいとか• Rでしかできないことって?• エクセルでしかできないことって?

• 仕様の違い• デフォルトの違い

– デフォルトに拘泥して⽐較するのは…?

Page 5: 草薙 Nagoyar11 エクセルでrライクな図示

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.2 0.4 0.6 0.8 1 1.2

系列1

0

2

4

6

8

10

12

14

16

18

系列1

Page 6: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• 散布図

– plot関数を使おう!– plot(rnorm(30), rnorm(30))

• ベクトルか,または⼆つ指定する• 主なオプション

– xlim=c( , ), ylim=c( , )– col=“red”– xlab = “”, ylab=“”, main = “”

Page 7: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• 散布図

– plot関数を使おう!– plot(rnorm(30), rnorm(30), xlab=“X”, ylab=“Y”, col=“red”,

xlim=c(-2,2), ylim=c(-2.2))– abline(0,1)

Page 8: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• 散布図

– エクセルでやろうず!

– ・・・。

Page 9: 草薙 Nagoyar11 エクセルでrライクな図示
Page 10: 草薙 Nagoyar11 エクセルでrライクな図示
Page 11: 草薙 Nagoyar11 エクセルでrライクな図示

0.00

0.25

0.50

0.75

1.00

0.00 0.25 0.50 0.75 1.00

Y

X

Page 12: 草薙 Nagoyar11 エクセルでrライクな図示

0.00

0.25

0.50

0.75

1.00

0.00 0.25 0.50 0.75 1.00

Y

X

-2 -1 0 1 2

-2-1

01

2

X

Y

Page 13: 草薙 Nagoyar11 エクセルでrライクな図示

0.00

0.25

0.50

0.75

1.00

0.00 0.25 0.50 0.75 1.00

Y

X

-2 -1 0 1 2

-2-1

01

2

X

Y

Page 14: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• 散布図

– エクセルだって⾒分けがつかないようなのは作れる

– ちょっと設定が多くてめんどい– ただGUIで細かく決められる

Page 15: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• ただエクセルは…

– pairs(dat)

Page 16: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• 箱ひげ図

– boxplot()– 主なオプション

• horizontal = T

– boxplot(dat, ylab=“Score”, col=“lightgray”)

Page 17: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• 箱ひげ図

– エクセルでやろうず!– 実は⼯夫次第で作れる!

Page 18: 草薙 Nagoyar11 エクセルでrライクな図示
Page 19: 草薙 Nagoyar11 エクセルでrライクな図示
Page 20: 草薙 Nagoyar11 エクセルでrライクな図示
Page 21: 草薙 Nagoyar11 エクセルでrライクな図示

0

20

40

60

80

100

120

140

data 1 data 2

Sco

re

Page 22: 草薙 Nagoyar11 エクセルでrライクな図示

0

20

40

60

80

100

120

140

data 1 data 2

Sco

re

AB

CD

0.0 0.2 0.4 0.6 0.8 1.0

Score

Page 23: 草薙 Nagoyar11 エクセルでrライクな図示

0

20

40

60

80

100

120

140

data 1 data 2

Sco

re

AB

CD

0.0 0.2 0.4 0.6 0.8 1.0

Score

Page 24: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• 散布図

– エクセルだって箱ひげ図⾃体は作れる…ただ⼿間を考えると…

Page 25: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• ただエクセルはこのようなデータのばら

つきの可視化はできない

Page 26: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• ヒストグラム

– Rでやってみようず!• hist(dat)• 主なオプション

– xlab =“”– main =“”– col =“”– breaks=10

» デフォルトはスタージェスの公式によるもの» あまりいじらなくてもよい

Page 27: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• ヒストグラム

– Rでやってみようず!• hist(rnorm(100), xlab=“Score”, main=“”, col=“red”)

Page 28: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• ヒストグラム

– これは⾯倒だ!!• スタージェスの公式から最適な階級数を求める• 「分析ツール」→ヒストグラムで度数分布を計算

する• 棒グラフにする• ⾊々と調整

Page 29: 草薙 Nagoyar11 エクセルでrライクな図示

0

5

10

15

20

25

‐3 ‐2 ‐1 0 1 2 3

Freq

uency

Score

Page 30: 草薙 Nagoyar11 エクセルでrライクな図示

0

5

10

15

20

25

‐3 ‐2 ‐1 0 1 2 3

Freq

uency

Score

Page 31: 草薙 Nagoyar11 エクセルでrライクな図示

0

5

10

15

20

25

‐3 ‐2 ‐1 0 1 2 3

Freq

uency

Score

Page 32: 草薙 Nagoyar11 エクセルでrライクな図示

0

5

10

15

20

25

‐3 ‐2 ‐1 0 1 2 3

Freq

uency

Score

Score

Freq

uenc

y

-3 -2 -1 0 1 2 3

05

1015

Page 33: 草薙 Nagoyar11 エクセルでrライクな図示

0

5

10

15

20

25

‐3 ‐2 ‐1 0 1 2 3

Freq

uency

Score

Score

Freq

uenc

y

-3 -2 -1 0 1 2 3

05

1015

Page 34: 草薙 Nagoyar11 エクセルでrライクな図示

両⽅でやってみよう• ヒストグラム

– やはり⾒分けがつかないようなものはできる– ただ本当に⼿間が…

Page 35: 草薙 Nagoyar11 エクセルでrライクな図示

まとめ• エクセルだって頑張ればよいとされるような作図がで

きる– 実際に折れ線グラフならエクセルの⽅が楽…?– ただ確かにRでなければできないことはある

• 無批判にRのしかもただのデフォルトをよいとするのではなくて,どのような点がよい可視化か⾒極める

• ⽬的とするのは優れたデータの可視化であって,Rを使うことではない

• ただ,殆どの場合Rの⽅が楽である• ⼤抵の場合「エクセルのお化粧は⼤変」