北海道コンサドーレ札幌ベガルタ仙台鹿島アントラーズ浦和レッズ大宮アルディージャ柏レイソルFC東京川崎フロンターレ横浜F・マリノスヴァンフォーレ甲府アルビレックス新潟清水エスパルスジュビロ磐田ガンバ大阪セレッソ大阪ヴィッセル神戸サンフレッチェ広島サガン鳥栖
モンテディオ山形水戸ホーリーホックザスパクサツ群馬ジェフユナイテッド千葉東京ヴェルディFC町田ゼルビア横浜FC湘南ベルマーレ松本山雅FCツエーゲン金沢名古屋グランパスFC岐阜京都サンガF.C.ファジアーノ岡山レノファ山口FCカマタマーレ讃岐徳島ヴォルティス愛媛FCアビスパ福岡V・ファーレン長崎ロアッソ熊本大分トリニータ
グルージャ盛岡ブラウブリッツ秋田福島ユナイテッドFC栃木SCY.S.C.C.横浜SC相模原AC長野パルセイロカターレ富山藤枝MYFCアスルクラロ沼津ガイナーレ鳥取ギラヴァンツ北九州鹿児島ユナイテッドFCFC琉球FC東京U−23ガンバ大阪U−23セレッソ大阪U−23
HOME » 2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(1)
RSS
Column
2017 2/23 [Thu.]

2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(1)

富士ゼロックススーパーカップが終わり、いよいよ2/25から明治安田生命J1リーグが開幕する。

本稿では、データスタジアムが保有する、2016年のJ1リーグ全出場選手の試合ごとのスタッツデータ※401項目を、機械学習手法を駆使して解析、各チームの勝敗予測モデルを作成することによって、2017年のJ1リーグの展望をデータから予測してみる。

※ここでのスタッツデータとは、選手の走行距離やスプリント回数といったトラッキングデータと、インターセプト、パスやシュート、ドリブルの回数といったプレーデータを指す。

 

サッカーの勝敗予測はどのように行えばよいだろうか。サッカーは、ゴールが対戦相手よりも多いチームが勝利するスポーツだ。サッカーにおけるゴール数は、野球やバスケットボールなど他のスポーツと比較し、一般的に少ない。2016J1リーグでは805ゴールが生まれたが、1試合における、各チームのゴール数は平均1.3ゴールであった。また、1試合における両チームあわせたゴール数が3ゴール以内だった試合は全体の71.6%となった。

さてこのような滅多に起きない事象は、ポワソン分布と呼ばれる確率分布に従うことが知られている。ポワソン分布とは、いわゆる左右対称の正規分布ではなく、01といった小さい値となる確率が大きい確率分布となり、事象の平均値から求められる。


2016J1リーグ全試合における実際の各チームのゴール数の分布(青い棒グラフ)と、平均値1.32016J1リーグの1試合あたりの平均ゴール数)に従うポワソン分布(赤い棒グラフ)は下記の通りとなる。

横軸:ゴール数、縦軸:頻度(各ゴールとなった試合数)

 

たしかにJ1リーグのゴール数の確率分布は、ポワソン分布で近似できそうだ。各チームの1試合平均ゴール数を用いれば、チームごとのゴール数を確率的に予測することができる。たとえば、川崎フロンターレ(1試合平均ゴール数:2.0)と浦和レッズ(1試合平均ゴール数:1.7)におけるポワソン分布に従うゴール数ごとの確率は下記の通りとなる。

横軸:ゴール数、縦軸:発生確率

青の棒グラフ:川崎フロンターレのゴール数の確率分布

赤の棒グラフ:浦和レッズのゴール数の確率分布

 

ゴール数が多いチームが勝ちとなるので、両者のゴール数確率を比較することで、勝敗を予測することができる。たとえば、上記のポワソン分布からの勝敗確率は下記の通りとなる。

 

川崎フロンターレ勝利:43.7%

引き分け:34.7%

浦和レッズ勝利:21.6%

 

これがもっともシンプルなモデルだが、精度向上のために、いくつかの重要なことを考慮しなければならない。サッカーはゴールが対戦相手よりも上回ればよい。すなわち、多くのゴールを目指すのではなく、まずは対戦相手にゴールさせず、少ないゴールで勝利する、堅守をベースにしたチームがある(得失点があるのでゴールが多いことにこしたことはないが)。また、ゴール数は対戦相手によって異なることが予想され、上位チーム、下位チームとの対戦では期待されるゴール数は異なると思われる。

 

そこで、試合ごとに、自チームおよび対戦相手チームの様々なスタッツデータとゴール数を機械学習し、異なる相手によって異なる平均ゴール数の期待値を予測し、その値を用いてポワソン分布からのゴール数確率分布を比較することが考えられる。

 

STEP.1: 試合ごとの自チーム・対戦チームのスタッツデータとゴール数の関係を機械学習

STEP.2: STEP.1のモデルを用いて、予想したい自チーム・対戦チーム(のスタッツデータ)から(平均)ゴール数を予測

STEP.3: STEP.2の平均ゴール数からポワソン分布によって、ゴール数を確率的に予測し、両チームで比較、勝敗予測とする。

STEP.2のゴール数自体を比較して勝敗予測としていないのは、確率としての幅をもたせるため。

※ポワソン分布を、対戦チームごとにもとめるアプローチも考えられるが、スタッツデータを機械学習

 することで、選手の移籍などで自チーム・対戦チームのパラメータが変化した際にも対応できるモデル

 とした。(今オフは主力選手の移籍はホットトピックである※詳細後述)


「2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(2)」に続く

このページをツイートして、フォロワーに広めよう!
Archive
コンサドーレ札幌, ベガルタ仙台, 鹿島アントラーズ, 浦和レッズ, 大宮アルディージャ, 柏レイソル, FC東京, 川崎フロンターレ, 横浜Fマリノス, ヴァンフォーレ甲府, アルビレックス新潟, 清水エスパルス, ジュビロ磐田, ガンバ大阪, セレッソ大阪, ヴィッセル神戸, サンフレッチェ広島, サガン鳥栖, モンテディオ山形, 水戸ホーリーホック, ザスパクサツ群馬, ジェフユナイテッド千葉, 東京ヴェルディ, FC町田ゼルビア, 横浜FC, 湘南ベルマーレ, 松本山雅FC, ツエーゲン金沢, 名古屋グランパス, FC岐阜, 京都サンガF.C., ファジアーノ岡山, レノファ山口, カマタマーレ讃岐, 徳島ヴォルティス, 愛媛FC, アビスパ福岡, V・ファーレン長崎, ロアッソ熊本, 大分トリニータ, J1, J2, J3, 日本代表, 五輪代表, ルヴァンカップ, ワールドカップ, レビュー, プレビュー, ACL, ベストイレブン, グルージャ盛岡, ブラウブリッツ秋田, 福島ユナイテッドFC, 栃木SC, Y.S.C.C.横浜, SC相模原, AC長野パルセイロ, カターレ富山, 藤枝MYFC, ガイナーレ鳥取, ギラヴァンツ北九州, 鹿児島ユナイテッドFC, FC琉球, Jリーグ・アンダー22選抜, FC東京U-23, ガンバ大阪U-23, セレッソ大阪U-23, ロンドン五輪, 海外日本人選手, トラッキングデータ, 選手指標開発
Jリーグスタジアム
順位表
勝点試合得点得失
1 神戸 12 4 6 5
2 FC東京 9 4 6 3
3 鹿島 9 4 5 2
4 仙台 9 4 3 1
5 G大阪 8 4 8 5
6 浦和 7 4 10 4
7 横浜FM 7 4 7 3
8 川崎F 7 4 5 0
9 清水 6 4 5 1
10 C大阪 5 4 3 -1
11 磐田 4 4 2 -1
12 鳥栖 4 4 3 -2
13 札幌 4 4 3 -3
13 甲府 4 4 3 -3
15 3 4 5 -2
16 新潟 2 4 3 -3
17 広島 1 4 2 -3
18 大宮 0 4 1 -6
攻撃CBP
1 浦和 98.82
2 広島 93.42
3 川崎F 85.54
4 鹿島 76.59
5 G大阪 64.21
6 62.15
7 C大阪 58.93
8 清水 57.61
9 大宮 57.29
10 仙台 57.19
11 横浜FM 57.17
12 神戸 57.07
13 鳥栖 53.04
14 札幌 51.51
15 FC東京 50.86
16 磐田 42.89
17 甲府 38.56
18 新潟 35.63
守備P
1 C大阪 238.49
2 甲府 226.10
3 川崎F 225.63
4 札幌 205.64
5 202.18
6 磐田 197.38
7 新潟 197.14
8 神戸 195.19
9 横浜FM 193.66
10 清水 189.16
11 鹿島 186.78
12 広島 186.30
13 鳥栖 186.20
14 仙台 184.10
15 浦和 182.85
16 G大阪 174.30
17 大宮 170.98
18 FC東京 151.47
順位表
勝点試合得点得失
1 湘南 10 4 5 4
2 横浜FC 10 4 5 3
3 東京V 9 4 7 6
4 徳島 9 4 5 3
5 福岡 9 4 7 2
6 長崎 7 4 8 3
7 松本 7 4 4 2
8 千葉 7 4 5 1
8 名古屋 7 4 5 1
10 山形 6 4 4 1
10 大分 6 4 4 1
12 熊本 5 4 5 0
13 町田 5 4 4 0
14 愛媛 5 4 3 0
15 岡山 5 4 4 -1
16 讃岐 3 4 5 -1
17 水戸 3 4 5 -2
18 京都 3 4 4 -2
19 岐阜 2 4 4 -2
20 山口 1 4 3 -5
21 金沢 1 4 1 -6
22 群馬 0 4 1 -8
攻撃CBP
1 岐阜 119.53
2 山口 81.57
3 千葉 79.28
4 湘南 78.30
5 徳島 69.16
6 名古屋 63.20
7 大分 61.05
8 愛媛 59.87
9 東京V 58.94
10 岡山 56.13
11 福岡 55.94
12 京都 55.57
13 水戸 55.38
14 讃岐 51.06
15 金沢 47.36
16 町田 47.11
17 松本 46.38
18 熊本 46.32
19 横浜FC 46.28
20 山形 44.83
21 群馬 41.98
22 長崎 41.68
守備P
1 讃岐 248.31
2 徳島 238.68
3 長崎 227.96
4 東京V 226.93
5 町田 225.37
6 金沢 224.49
7 岐阜 223.31
8 大分 222.51
9 湘南 221.24
10 福岡 217.71
11 名古屋 217.62
12 愛媛 215.28
13 水戸 213.19
14 山形 210.64
15 松本 207.35
16 京都 200.90
17 岡山 200.61
18 千葉 198.91
19 群馬 193.69
20 山口 193.27
21 熊本 189.29
22 横浜FC 183.96
#footballlab
HOME » 2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(1)
Team Select close