pydata で見るサンフレッチェ広島 〜...
TRANSCRIPT
:PyCon mini Hiroshima 2016 開催記念:
PyData でみるサンフレッチェ広島
~ 強いのはカープだけじゃないんだからね・秋 ~
2016-10-31
Takahiro Ikeuchi
Agenda
1st Half : サッカーにおけるデータ とは
ポゼッション? スプリント? 指標 = Stats の紹介
Half Time : PyData の紹介
PyData とは
2nd Half : PyData でみるサンフレッチェ広島
チームの魅力
特集:佐藤寿人
Additional Time : 質疑応答
2
今日のゴールサッカーのデータ分析を始めるにあたり、データソースの勘どころをつけられるようになる
PyData ツールのさわりを知る
サンフレッチェ広島の魅力を知る
サンフレッチェ広島の魅力を知る
サンフレッチェ広島の魅力を知る
3
君の名は。 お前誰よTakahiro Ikeuchi @iktakahiro
Company / Community
eurie Inc. Founder & CEO
SQUEEZE Inc. Tech Adviser
PyData.Tokyo Organizer
Specialties (or just a dabbler :-D
Go lang, Python, React.js, TypeScript
Cloud Infrastructure, UI Design etc...
4
共著本↑
5
eurie Inc.カスタマーサポート支援クラウドサービスeurie Desk (https://eurie.io) の開発と運営
パブリック・ベータ提供中
Go言語 4割, TypeScript (React) 4割, Python 2割 くらい
イルカのロゴがかわいい。
6
データ分析とわたし - かつては2011年 ~ 2015年データ分析コンサルティング企業の技術部門におりまして
AWS 導入事例: 株式会社ALBERT(アルベルト) | AWS
import pytest
def test_who_am_i(): actual = who_am_i() assert actual != "Data Scientist"
expect = "Software Engineer & Architect" assert actual == expect # ???
7
データ分析とわたし - いまではメインは Web アプリケーションの開発をしてます
PyData 的には...
サービスで取り扱うデータがテキストメッセージであるため、テキスト解析がおも
自然言語処理 による重要語抽出などを活用した機能を準備中
8
広島東洋カープ リーグ優勝おめでとうございます!
9
本日は サンフレッチェ広島 特集!!
10
なお正装画像は CC BY 4.0 でお使いいただけます
11
広島とわたし
特に縁なし(出身: 神奈川県横浜市)
本日の NG ワード
横浜・F・マリノス
お願い
ピッチ内にものを投げ込まないでください
12
1st Half : サッカーにおける データ とは
13
サッカーデータ = Stats
14
最も代表的な指標
ゴール数
シュート数
ファール数
警告、退場数
コーナーキック数
フリーキック数
ポゼッション
15
ポゼッションとは
ゲーム時間中、ボールをどの程度保持していたかを示す割合で、ゲーム支配率とも呼ばれることがある。
一定以上のレベルでは、多くて6割台。7割近くなると相当なワンサイドゲームだったと言える。
ボール保持率を高めてゲームを自分たちのペースで運ぶ戦略=> ポゼッションサッカー
16
ポゼッションが高い = 強いチーム?スペイン代表やクラブチーム・バルセロナのイメージから、ポゼッションサッカーに対する信仰は根強い
日本国内においては、日本代表が比較的ポゼッションサッカーを目指しているため、関心が持たれやすい数値の1つになっている
17
ポゼッションと強さ
必ずしもそうとはいえない
チームのスタイルに依存する = カウンターサッカー
15/18 イングランドプレミアリーグ・レスターシティ
※ 後半で Jリーグのデータを見ます
18
サッカーのデータはチームから個人へ
19
走行距離
選手が1試合を通じてどの程度走ったのかを示す数値。10km を超えると運動量が多いと言われる。
ポジションによって意味合いが異なる。
サイドバックの場合 : 攻守に渡って貢献している
中盤の場合 : ピッチのさまざまな場所に顔を出している
攻撃的選手の場合 : 守備への貢献が大きい
20
スプリント回数
いわゆる「ダッシュ」を何回行ったかという数値。基準がリーグにより異なる。
Jリーグ 24km/h 以上の走行
イングランド・プレミアリーグ 25.2km/h 以上の走行
21
パス成功率
パス成功数 / パス数
中盤の選手やゲームメイク担当選手の評価によく用いられる。
(母数や状況によるが) 9割を超えていると高い。
22
シュート成功率ゴール数 / シュート数
Shot on Target (枠内シュート)ゴール枠を捉えたシュート数 / シュート数
シュート精度の指標として利用される。
23
ほか
セーブ率
PK 阻止率
1対1 勝率
などなど
24
"Stats" を見る
25
欧州サッカーと OptaOpta Sports
Opta の情報は欧州サッカー中継の解説のなかでも頻繁に引用される=> リアルタイムでデータ収集と解析が行われている
Web Page : FourFourTwo - Stats ZONE
App Store : Stats Zone: Live scores & soccer statistics
26
27
28
公式サイトでも Stats を閲覧可
Bundesliga - Matchday 8 | FCインゴルシュタット04 - ボルシア・ドルトムント
29
Shinji Okazaki Statistics | Premier League
31
Valencia Club de Fútbol SAD | Team of LaLiga Santander
32
そろそろ PyData を使ってデータを見てみましょう
33
※ Notebook へ
http://nbviewer.jupyter.org/github/iktakahiro/football-hack/blob/develop/bpstudy-
110/EuropeSoccerAnalytics.ipynb
34
1st Half のまとめ
サッカーのデータ = Stats は個人データまで収集、利用されるようになってきている
欧州サッカーデータを見る・知るには Opta にお世話になる
サッカーはゴールの入らない酢ポート
ゴールの分布はポアソン分布
35
Half Time : PyData とは
36
PyData とはデータ分析やデータ活用に Python ならびに Python Library を利用しようという人類の営みの総称
http://pydata.org/
37
PyData ConferencesOctober 7-9, 2016 WASHINGTON DC
August 26-28, 2016 CHICAGO
June 14-15, 2016 PARIS
May 6-8, 2016 LONDON etc...
38
SessionsBayesian Network Modeling using R and Python
Open Data Dashboards & Python Web Scraping
Data Transformation: A Framework for Exploratory DataAnalysis
Python + Data にまつわるさまざまな Presentation や Tutorial が行われている
39
PyData Libraries
行列計算 : NumPy - http://www.numpy.org/
科学計算 : SciPy - https://www.scipy.org/
データ処理 : pandas - http://pandas.pydata.org/
データ可視可 : matplotlib - http://matplotlib.org/
機械学習 : scikit-learn - http://scikit-learn.org/
深層学習 : Tensor�ow - https://www.tensor�ow.org/
深層学習 : Keras https://keras.io/
40
今回利用しているおもなライブラリ / ツール
実行環境 : Jupyter Notebook - http://jupyter.org/
データ処理 : pandas
可視化 : Bokeh - http://bokeh.pydata.org/en/latest/
Python 環境 : Anaconda - https://www.continuum.io/anaconda-overview
41
42
43
Half Time のまとめ
PyData は Python + Data の人類の営み
世界的に PyData Conference が開催されているよ!
PyData.Tokyo もよろしく (・ω<)
Python は伝統的に分析系ツールが充実していた
深層学習のニーズ拡大や Tensor�ow の登場により 一層のCommodity 化が進んでいる
44
2nd half : PyData でみるサンフレッチェ広島
45
サンフレッチェ広島とは
46
サンフレッチェ広島
ホームタウン : 広島県広島市
三 + frecce (イタリア語で矢) => 三本の矢
1992年 Jリーグ発足時の10チームのうちの1つ
前身は東洋工業 (現マツダ) サッカー部
48
J1 年間優勝3回(2012年, 2013年, 2015年)
天皇杯 準優勝1回
49
著名な在籍選手
佐藤 寿人
浅野 琢磨(現日本代表)
森崎 浩司/和幸
槙野 智章 (現日本代表)
柏木 陽介 (現日本代表)
西川 周作 (現日本代表)
青山 敏弘
など
50
主力級移籍の歴史
2008年 駒野 友一 => ジュビロ磐田
2009年 柏木 陽介 => 浦和レッズ
2012年 李 忠成 => 同上
2012年 槙野 智章 => (※ FCケルン経由) => 同上
2013年 森脇 良太 => 同上
2014年 西川 周作 => 同上
51
そこはかとなく ただよう 既視感
52
2012年 ペトロヴィッチ監督 => 浦和レッズ
53
_人人人人人人人人人人人_
> ペトロヴィッチ監督 <
 ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y ̄
54
とはいえ移籍はつきものですし、サンフレッチェ広島も下位チームから有力選手を積極的に獲得したりしているので
55
なんかちょっと特定のチーム多いなーと思うだけで(他|悪|敵)意はありません
56
(・ω<)
57
特集 : 佐藤 寿人
58
佐藤 寿人 とは
ポジション : FW
身長 : 170cm
出身 : 1982年3月12日 埼玉県春日部市
利き足 : 左
憧れの選手 : Filippo Inzaghi
59
佐藤 寿人 とは
歴代通算 J1リーグ得点数 : 2位 (161点)
(1位 大久保 嘉人, 3位 中山 雅史)
J1ハットトリック : 6回
J1リーグ得点王 : 1回 (2012年)
J1リーグ MVP : 1回 (2012年)
10年連続 J1二桁得点 (記録保持者)
出典 : https://ja.wikipedia.org/wiki/佐藤寿人,http://www.jleague.jp/club/hiroshima/player/detail/2709/
60
そろそろ PyData を使ってデータを見てみましょう
61
……の前に Jリーグの Stats について
62
Jリーグの StatsFootball LAB(フットボールラボ)とは | Football LAB ~サッカーをデータで楽しむ~
J. League Data Site
Stats Stadium | 試合分析
63
J. League Data Site
https://data.j-league.or.jp/SFTD09/search?selectFlag=3&competition_frames=1&competition_year_from=2005&competition_year_to=2015&player_name= 64
※ Notebook へ
http://nbviewer.jupyter.org/github/iktakahiro/football-hack/blob/develop/bpstudy-
110/J1SoccerAnalytics.ipynb
66
2nd Half のまとめ
寿人ーーーーーーーーッ!!!!
2010年~ のサンフレッチェ広島はとても強い (優勝 3回)
広島県は選手育成力が高い(???)
67
強いのはカープだけじゃないんだからねっ (タイトル回収)
68
Additional Time
69
推薦図書
70