sabr metrics(web展開用)
TRANSCRIPT
プロ野球を観るのが100100100100倍面白くなる雑学
~セイバーメトリクス入門~
2014/05/172014/05/172014/05/172014/05/17(SSSSatatatat)@なんでも勉強会
nnnnimoimoimoimo
本⽇の⽬的
�セイバーメトリクスとはどういうものか皆さんに
知ってもらう。
�セイバーメトリクスについて体系的に纏め、理解する。
※個⼈的な想い
�上記関連データを「R⾔語」で分析する。今回は断念!!!!!!!!
アジェンダ
�セイバーメトリクスとは?
�セイバーメトリクスの歴史
�セイバーメトリクスの各種指標
�セイバーメトリクスの応⽤事例
�今後の展開
諸注意!
�今回セイバーメトリクスについてやや説明を
端折っています。
�もし興味を持たれたら、ご⾃分でも調べて下さい。
セイバーメトリクスとは?
セイバーメトリクス概要①
�セイバーメトリクス(SABRMetrics)とは野球においてデータを統計
的⾒地から客観的に分析し、選⼿の評価や戦略を考える分析⼿法のこと。
※”SABRMetrics”はアメリカ野球学会(Society for American Baseball Research)と
測定基準(Metrics)を合わせた造語です。
??「私は関係ありませんよ」
セイバーメトリクス概要②
�野球には「打率」「防御率」など様々な指標が存在しますが、セイバー
メトリクスではこれらの重要性を数値から客観的に分析しています。
�セイバーメトリクスは本来、常識として考えられてきたバントや盗塁を
否定するなど野球の従来の伝統的価値観を覆すものとなっています。
野球と数理学①
� 野球には数字がたくさん出てきます。
� プロ野球のサイトを⾒ても「打率」「防御率」「出塁率」など「率」がつく数字が
たくさん出てきます。
� これは野球が「”静”のスポーツ」と⾔われていることと関係しています。野球は
『投⼿がボールを投げ、プレーが開始し、何らかの結果が出る』スポーツであるた
め、1つのアクションを確率と結び付けやすいのです。
野球と数理学②
�しかし、得られた結果がそのまま選⼿の能⼒と直結するかといえば、
そう断⾔することはできません。
ex)①芯でとらえた打球が相⼿のファインプレーに阻まれる。
②打ち取られた当たりが野⼿のいないところに⾶び、ヒットになる。
�そのため野球は「偶然」や「運」の影響を受けやすいスポーツであると⾔えます。
野球と数理学③
�ここで偶然と実⼒の区別をつけるため「統計学」を使⽤します。
�「Aの作業をn回やってBという結果がm回出た」という現象について「n回」の数
(つまり分⺟数)を増やすことで偶然の要素を減らすというのが統計学の考え⽅です。
�セイバーメトリクスの理論は確率と統計を使った分析より成り⽴って
います。
セイバーメトリクスの歴史
セイバーメトリクスの誕生
�セイバーメトリクスは⽸詰⼯場の警備員であった退役軍⼈である
”ビル・ジェームス”が夜間の暇つぶしに始めたことで誕⽣しました。
�1977年に”ビル・ジェームス”より「野球抄(Baseball Abstract)」が
⾃費出版されたことが、セイバーメトリクスが世に出た最初と⾔われて
います。
異端だったセイバーメトリクス
� セイバーメトリクスは1980年代以降、PCの普及とともに少しずつ信奉者を増やし
ていきます。
� しかし、MLBのデータ管理会社やMLBから異端の扱いを受け、データを使⽤したビ
ジネス展開がなかなか発展しませんでした。
� そこでMLBのコアなファンに向けてデータを売ることで、セイバーメトリクスは
ヒットしていきました。
マネーボール①
�2000年代に⼊り、1冊の本が話題になり、セイバーメトリクスは海を
越え、⽇本でも普及するようになります。
�その本こそ皆さんご存知(?)の「マネーボール」です。
�「マネーボール」は2003年に出版され、2011年には”ブラッド・
ピッド”主演で映画化されました。
マネーボール②
�「マネーボール」は、かつてドラフト1巡⽬でMLB選⼿としてデビュー
したものの、活躍できないまま引退を余儀なくされた“ビリー・ビーン”が、
資⾦難の球団であるオークランド・アスレチックスのGMに就任し、セイ
バーメトリクスを球団経営に取り⼊れて、球団を強くしていくと
いう話です。
マネーボール③
� “ビリー・ビーン”はこれまで球界で重視されてこなかった「出塁率」な
どの指標を重視し、安価で勝利への貢献度の⾼い選⼿を発掘し、チーム
を強くしました。俗に⾔う「選⼿ではなく勝利を買う」という考えです。
セイバーメトリクスの各種指標
セイバーメトリクスの各種指標
�これよりセイバーメトリクスの各種指標について、
以下のアプローチから説明していきます。
・打者指標
・投⼿指標
・守備指標
主な打者指標指標 説明
OPSOPSOPSOPS OPS = 出塁率+長打率
出塁率や長打率そのものより得点相関が高い。0.8を超えると一流。
BABIPBABIPBABIPBABIP BABIP =(安打数 – 本塁打数)/(打数 + 犠⾶ – 本塁打 – 三振)
本塁打以外でフィールドに⾶んだ打球の安打になる割合。
BB/KBB/KBB/KBB/K BB/K=四球/三振
四球と三振の割合から打者の選球眼を⾒る指標。
RCRCRCRC 計算がややこしいので割愛。http://ja.wikipedia.org/wiki/RC_(%E9%87%8E%E7%90%83)得点を⽣み出す能⼒を評価する総合指標。得点でのチームへの貢献度を⽰す。
RCWINRCWINRCWINRCWIN 計算がややこしいので割愛。http://ja.wikipedia.org/wiki/RC_(%E9%87%8E%E7%90%83)リーグの平均打者と⽐較してどれだけの勝利をもたらしたかを表す指標。
攻撃における出塁の重要性①
�よく”打率3割”が打者としての合格点とされていますが、「打率」は四
死球を全て投⼿側の失敗とみなし、打者の能⼒とみなしていません。
�しかし、四死球で出たランナーも当然、得点には関与します。
攻撃における出塁の重要性②
�MLBによる分析結果によれば、「出塁率」の得点相関は
打率よりも⾼いことが明らかとなっています。
�そのため「得点」に関係の深い「出塁」という
観点に⽴てば、より重要なのは「出塁率」
ということになります。
Correlation with Runs ScoredCorrelation with Runs ScoredCorrelation with Runs ScoredCorrelation with Runs ScoredTeam-Level Data ('00-'09)Team-Level Data ('00-'09)Team-Level Data ('00-'09)Team-Level Data ('00-'09)
Index CorrelationStrikeouts -.068
Stolen Bases +.057
Walks +.548
Home Runs +.685
Batting Avg +.779
Hits +.783
On-base pct +.859
Slug pct +.892
OPS +.947
主な投手指標指標 説明
QSQSQSQS 先発投⼿が6イニング以上を投げ、⾃責点を3以内に抑えたときに記録される。
結果的にどれだけ試合を作れたかを表す指標。
WHIPWHIPWHIPWHIP WHIP =(安打 + 四球)/ 回数
1イニングあたり何⼈の⾛者を出したかを表す指標。1.2未満ならエース級。
FIPFIPFIPFIP FIP =(被本塁打 × 13 +(与四球 + 与死球 - 敬遠四球)× 3 - 奪三振 × 2)/ 投球回数 + 3.12野⼿による影響を受けない結果(被本塁打、三振、四死球など)のみで投⼿の能⼒を評価した指標。投⼿の能⼒が反映されやすい。
RSAARSAARSAARSAA RSAA =(リーグ失点率 - 失点率)/ 9 × 投球回
リーグ平均の失点率と個⼈の失点率を⽐較し、リーグ平均に⽐べどれくらいの失点を防いでいるかを⾒る指標。 プラスであればあるほど優秀。
LOB%LOB%LOB%LOB% LOB% =(安打 + 四死球 - 得点)/(安打 + 四死球 - 1.4 × 本塁打)
出塁した⾛者に得点を許さなかった割合。
先頭打者への四球はダメなの?①
�打者編で述べた通り、四死球は得点に繋がるため、投⼿側からみれば失
点に繋がります。
�ところで、よく『先頭打者への四死球は失点になる確率が⾼い』と⾔う
解説者がいますが、これは本当でしょうか?
先頭打者への四球はダメなの?①
� 打者編で述べた通り、四死球は得点に繋がるため、投⼿側からみれば失点に繋がり
ます。
� ところで、よく『先頭打者への四死球は失点になる確率が⾼い』という解説者がい
ますが、これは本当でしょうか?
� 実は、先頭打者を四球で出そうがヒットで出そうが、失点する確率には、
有意な差はありません。
先頭打者への四球はダメなの?②
�実はこの格⾔は「レアケース記憶」によるものになります。
�「レアケース記憶」というのは、⼈は特に印象に残ったことを強く感じてしまうと
いうことを意味します。
※昔、テツ&トモが「カラオケボックスで間違って⼊れた曲が⼤体演歌なのなんでだろう。」というネタに対して、
『トータル楽曲では、やはりポップス系が主流なため、演歌が出る確率は極めて低い。レアケース記憶だろう。』とネタを
しっかり分析されちゃってました(笑)
先頭打者への四球はダメなの?③
� 先頭打者を出すということによる失点確率は安打であろうと、四死球であろうと統
計的に差は出ません。40%前後になります。
� ただしプロの投⼿は簡単には四死球を出さない(コントロールがいい)ので、安打
を打たれる場合に⽐べて「レアケース」となるのです。
� よって得点されないためには安打、四死球に関係なく、出塁をさせないことが重要
となってきます。
主な守備指標指標 説明
RFRFRFRF RF =(刺殺 + 補殺)/ 守備イニング数 × 9
9イニングでいくつアウトを奪えるかという指標。守備時における選⼿の貢献度を数値的に理解できる。
UZRUZRUZRUZR ZR = (受け持ちのゾーンの打球処理数 + ゾーン外での処理数)/ 受け持ちのゾー
ンの打球総数
ボールが球場のどこに⾶んだかを記録し、そのデータから守備範囲を含めた能⼒を評価する。※MLBのデータ統計会社によって算出される。
Plus/MinusPlus/MinusPlus/MinusPlus/Minus SystemSystemSystemSystem
打球の性質をビデオ映像などで記録し、各ポジションの野手の平均的な守備範囲を算出し、平均値に対して個々の野手の打球処理率が高いか低いかを数値化した指標。※MLBのデータ統計会社によって算出される。
(参考)守備範囲の算出
�あるショートの選⼿(T選⼿)の守備範囲を算出するとします。
zonezonezonezone““““AAAA””””
zonezonezonezone““““BBBB””””
(参考)守備範囲の算出�受け持ちのゾーン(その選⼿の担当範囲と定められているゾーン)をzone”A”とします。
�zone”A”外で打球処理したことの
あるゾーンをzone”B”とします。
zonezonezonezone““““AAAA””””
zonezonezonezone““““BBBB””””
(参考)守備範囲の算出�「zone”A”の打球処理数」と「zone”B”の打球処理数」を
受け持ちのゾーンの打球総数で
割ることで守備範囲を算出できます。
zonezonezonezone““““AAAA””””
zonezonezonezone““““BBBB””””
更に、エラー数や、 zonezonezonezone””””BBBB””””での打球の定位置からの距離を元に複雑な処理を⾏い、その選⼿の総合的な守備⼒を算出することもできます。
セイバーメトリクスの応⽤事例
ケース①:オークランド・アスレチックス(2000200020002000)
�前述のとおり、資⾦⼒のないアスレチックスは「セイバーメトリクス」
を元に、以下の観点から根本的なチーム改⾰を施しました。
・ドラフト
・トレード
・試合采配
ケース①:オークランド・アスレチックス(2000200020002000)�【ドラフト】
⇒これまでドラフトの慣習となっていた「背の⾼さ」「球の速さ」など
の要素を全て無視し、セイバーメトリクスの指標が⾼く、その上で他
球団が取りたがらない選⼿を獲得しました。
(例)ジェレミー・ブラウンに代表される、アマチュアでの成績はいい
が、極端に太っている選⼿をドラフト1巡⽬で指名。
ケース①:オークランド・アスレチックス(2000200020002000)�【トレード】
⇒セイバーメトリクスでは評価されない「打率は⾼いが、出塁率の低い
選⼿」を元⼿に、「打率は低いが、出塁率の⾼い選⼿」を⾦銭と合わせ
て獲得するなど。トレードでできる限り利益を出す⽅法を模索しました。
(例)怪我明けの捕⼿、スコット・ハッテバーグを格安で獲得。
⼀塁⼿にコンバート。主⼒選⼿として活躍させます。
ケース①:オークランド・アスレチックス(2000200020002000)
�【試合采配】
⇒セイバーメトリクスの考えを元に、野⼿は四死球を多く取れるよう、
ボールをよく⾒るようにし、盗塁は厳禁としました。
投⼿は逆に四死球を減らすよう、できるだけストライクをとるような
配球を⼼がけました。
ケース①:オークランド・アスレチックス(2000200020002000)
�結果、A’sは2000年から2003年までの4年間全てでプレーオフに出場
する、MLBを代表する強豪チームとなりました。
�しかしセイバーメトリクスが他球団に知れ渡るようになり、以降の年は
資⾦⼒の⾼い球団にノウハウが渡った影響から、チーム成績が再び悪化す
るようになりました。
ケース②:東京都⽴程久保⾼校野球部(2010201020102010)�弱⼩⾼校で知られる都⽴程久保⾼校野球部ですが、マネージャーの川島
さんによるマネジメントにより、 「ノーバント・ノーボール戦術」の
導⼊など、⾰新的なチーム作りに成功。甲⼦園進出を果たしました。
�本校の快進撃については、以下の書籍、映画をご確認ください。
今後の展開
日本人選手の価値の見積もり
�2014年現在、多くの⽇本⼈選⼿がMLBで活躍していますが、⽇本時代
の実績とMLBで残す成績に未だ相関性が⾒いだせていません。
�そこで今後もMLBに挑戦する⽇本⼈の移籍前後の成績をプロットし、
セイバーメトリクスの指標を中⼼に相関性を⾒出すことで、選⼿への投
資額を正しく⾒積もることができるようになると考えます。
日本人選手の価値の見積もり
�ただし定性的観点からは、活躍する選⼿像が明確になっています。
�以下、現ヤンキースの⽥中将⼤投⼿を例にとります。
FalkFalkFalkFalkBallBallBallBall
communicommunicommunicommunicationcationcationcation
commcommcommcommandandandand
StrikeStrikeStrikeStrikeOutOutOutOut
AdaptaAdaptaAdaptaAdaptabilitybilitybilitybility
marriedmarriedmarriedmarried
【番外編】選挙戦予測
�MLBではセイバーメトリクスを⽤いた成績予測システムが開発されて
いますが、そのロジックを選挙選にあてはめることも可能だといいます。
�野球のゲームは極めて複雑にできているため、セイバーメトリクスを⽤
いたシステムの精度が上がれば、今後は他分野にもロジックを応⽤でき
る⾒通しが⽴つでしょう。
FinFinFinFin