草薙 nagoyar11 エクセルでrライクな図示
DESCRIPTION
草薙邦広「エクセルでRライクな図示」NagoyaR #11 2013/12/7TRANSCRIPT
エクセルでRライクな図⽰散布図・箱ひげ図・ヒストグラム
概要• Rがいいとかエクセルがいいとか• 両⽅でやってみよう
– 散布図– 箱ひげ図– ヒストグラム
• まとめ
草薙邦広Nagoya R #11 LT, 2013/12/7
Rがいいとかエクセルがいいとか• Rでしかできないことって?• エクセルでしかできないことって?
• 仕様の違い• デフォルトの違い
– デフォルトに拘泥して⽐較するのは…?
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 0.2 0.4 0.6 0.8 1 1.2
系列1
0
2
4
6
8
10
12
14
16
18
系列1
両⽅でやってみよう• 散布図
– plot関数を使おう!– plot(rnorm(30), rnorm(30))
• ベクトルか,または⼆つ指定する• 主なオプション
– xlim=c( , ), ylim=c( , )– col=“red”– xlab = “”, ylab=“”, main = “”
両⽅でやってみよう• 散布図
– plot関数を使おう!– plot(rnorm(30), rnorm(30), xlab=“X”, ylab=“Y”, col=“red”,
xlim=c(-2,2), ylim=c(-2.2))– abline(0,1)
両⽅でやってみよう• 散布図
– エクセルでやろうず!
– ・・・。
0.00
0.25
0.50
0.75
1.00
0.00 0.25 0.50 0.75 1.00
Y
X
0.00
0.25
0.50
0.75
1.00
0.00 0.25 0.50 0.75 1.00
Y
X
-2 -1 0 1 2
-2-1
01
2
X
Y
0.00
0.25
0.50
0.75
1.00
0.00 0.25 0.50 0.75 1.00
Y
X
-2 -1 0 1 2
-2-1
01
2
X
Y
両⽅でやってみよう• 散布図
– エクセルだって⾒分けがつかないようなのは作れる
– ちょっと設定が多くてめんどい– ただGUIで細かく決められる
両⽅でやってみよう• ただエクセルは…
– pairs(dat)
両⽅でやってみよう• 箱ひげ図
– boxplot()– 主なオプション
• horizontal = T
– boxplot(dat, ylab=“Score”, col=“lightgray”)
両⽅でやってみよう• 箱ひげ図
– エクセルでやろうず!– 実は⼯夫次第で作れる!
0
20
40
60
80
100
120
140
data 1 data 2
Sco
re
0
20
40
60
80
100
120
140
data 1 data 2
Sco
re
AB
CD
0.0 0.2 0.4 0.6 0.8 1.0
Score
0
20
40
60
80
100
120
140
data 1 data 2
Sco
re
AB
CD
0.0 0.2 0.4 0.6 0.8 1.0
Score
両⽅でやってみよう• 散布図
– エクセルだって箱ひげ図⾃体は作れる…ただ⼿間を考えると…
両⽅でやってみよう• ただエクセルはこのようなデータのばら
つきの可視化はできない
両⽅でやってみよう• ヒストグラム
– Rでやってみようず!• hist(dat)• 主なオプション
– xlab =“”– main =“”– col =“”– breaks=10
» デフォルトはスタージェスの公式によるもの» あまりいじらなくてもよい
両⽅でやってみよう• ヒストグラム
– Rでやってみようず!• hist(rnorm(100), xlab=“Score”, main=“”, col=“red”)
両⽅でやってみよう• ヒストグラム
– これは⾯倒だ!!• スタージェスの公式から最適な階級数を求める• 「分析ツール」→ヒストグラムで度数分布を計算
する• 棒グラフにする• ⾊々と調整
0
5
10
15
20
25
‐3 ‐2 ‐1 0 1 2 3
Freq
uency
Score
0
5
10
15
20
25
‐3 ‐2 ‐1 0 1 2 3
Freq
uency
Score
0
5
10
15
20
25
‐3 ‐2 ‐1 0 1 2 3
Freq
uency
Score
0
5
10
15
20
25
‐3 ‐2 ‐1 0 1 2 3
Freq
uency
Score
Score
Freq
uenc
y
-3 -2 -1 0 1 2 3
05
1015
0
5
10
15
20
25
‐3 ‐2 ‐1 0 1 2 3
Freq
uency
Score
Score
Freq
uenc
y
-3 -2 -1 0 1 2 3
05
1015
両⽅でやってみよう• ヒストグラム
– やはり⾒分けがつかないようなものはできる– ただ本当に⼿間が…
まとめ• エクセルだって頑張ればよいとされるような作図がで
きる– 実際に折れ線グラフならエクセルの⽅が楽…?– ただ確かにRでなければできないことはある
• 無批判にRのしかもただのデフォルトをよいとするのではなくて,どのような点がよい可視化か⾒極める
• ⽬的とするのは優れたデータの可視化であって,Rを使うことではない
• ただ,殆どの場合Rの⽅が楽である• ⼤抵の場合「エクセルのお化粧は⼤変」