北海道コンサドーレ札幌ベガルタ仙台鹿島アントラーズ浦和レッズ大宮アルディージャ柏レイソルFC東京川崎フロンターレ横浜F・マリノスヴァンフォーレ甲府アルビレックス新潟清水エスパルスジュビロ磐田ガンバ大阪セレッソ大阪ヴィッセル神戸サンフレッチェ広島サガン鳥栖
モンテディオ山形水戸ホーリーホックザスパクサツ群馬ジェフユナイテッド千葉東京ヴェルディFC町田ゼルビア横浜FC湘南ベルマーレ松本山雅FCツエーゲン金沢名古屋グランパスFC岐阜京都サンガF.C.ファジアーノ岡山レノファ山口FCカマタマーレ讃岐徳島ヴォルティス愛媛FCアビスパ福岡V・ファーレン長崎ロアッソ熊本大分トリニータ
グルージャ盛岡ブラウブリッツ秋田福島ユナイテッドFC栃木SCY.S.C.C.横浜SC相模原AC長野パルセイロカターレ富山藤枝MYFCアスルクラロ沼津ガイナーレ鳥取ギラヴァンツ北九州鹿児島ユナイテッドFCFC琉球FC東京U−23ガンバ大阪U−23セレッソ大阪U−23
HOME » 2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(3)
RSS
Column
2017 2/23 [Thu.]

2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(3)

※本コラムは2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(2)」の続きです

 

では、いよいよ機械学習を用いて、スタッツデータからゴール数を予測するモデルを作成していく。

今回は、XGboost(EXtreme Gradient boosting)という手法を用いて機械学習した。XGboostの説明の前に、その元となる決定木について説明する。


決定木とは、(ジニ係数などの)分岐基準を用いて、“もっとも良くデータが分かれる”パラメータを選択し続けていくモデルとなる。決定木は一般的に下記のようなアウトプットが得られるため、解釈が容易というメリットがある。

※下記は横浜F・マリノスのゴール数予測の決定木

一方で、決定木はパラメータが多い場合、必ずしも最適なパラメータが選択されるとは限らない、という欠点がある。たとえば、異常値や影響の大きいパラメータの存在などによって、最初の分岐が(最適なものではなく)誤って決まると、以降の分岐は、その前提で進んでいくことになる。

 

そこで、ある決定木で、誤った分類をされた結果(今回だと、ゴール数予測を誤った試合)に特に重みをつけて、その結果を当てるように次の決定木を作り、さらにその決定木で誤った分類を、その次の決定木で当てるよう、決定木の予測精度を改善していく、ということを繰り返すGradient Boosting Treeという手法が考察された(正確に言うと、Gradient Boostingという逐次的学習手法があり、そのモデルに決定木を用いたGradient Boosting Treeがある)XGboostは、Gradient Boosting Treeの一種(の実装方法)となる。

※ちなみにboosting treeは、XGboostのほか、FastBDTlightGBMなどの実装が開発されている。

 

では、XGboostによって、各チームのゴール数を予測してみる。クロスバリデーション(全試合を任意の数に分割して、ある試合群を学習データとし、残りの試合のゴール数を予測する、ことを繰り返す)をかけて、最適なパラメータチューニングをした。

たとえば、鹿島アントラーズにおける予測モデルの結果が下記の通りとなる。概ね、実際のゴール数に対して、スタッツデータからゴール数を正しく予測できている。

※横軸:実際のゴール数、縦軸:XGboostによってスタッツデータから予測したゴール数

 

2016年の年間順位上位3チームにおける、XGboostによってゴール数予測に重要とされたスタッツデータは下記の通りとなった。

※下記の重要度は、あくまでゴール数予測のための判断に重要な指標ということであり、必ずしも高い方

 がゴールにつながるということではないことに留意。(ある値以下だとゴールにつながる、という意味で判断に重要となるケースもある)

前述の、ゴール数との相関が高い項目とは、違う項目が上位にきている。単純に1つの項目でゴール数を予測するなら相関が高いものに着目することも考えられるが、複数の項目の組み合わせからゴールを予測するなら、上記の項目が重要ということになる。

 

たとえば、鹿島アントラーズにおける上記項目で、ゴール数を予測する決定木を作成すると、下記のとおりとなる。

1試合における鹿島アントラーズの全選手のドリブルキープ時間合計が44秒以内で、セットプレーから3タッチ以内のシュートが4.5以上であれば平均3.5得点が期待できる。(2016年シーズンでいうと、上記条件にあてはまる試合は、1stステージ第14節:広島戦4-12ndステージ第2節:広島戦4-22nd ステージ第3節:名古屋戦3-02nd ステージ第4節:甲府戦3-3、が該当する。)一方で、鹿島アントラーズの全選手のドリブルキープ時間合計が44秒以上、かつトラップキープ時間が558秒以上、かつGKからのミドルフィードの成功が2.5回以下だった場合、ゴールは0.2点しか期待できない。(実際、2016年シーズンで上記条件にあてはまる試合は、10試合あり、そのうち8試合は0点である。※残り2試合は1)鹿島アントラーズにおいては、ドリブルで切り込んでいくタイプの選手からチャンスメイクする、というよりは、11人のキープ時間はできるだけ少なくして、ボール離れよく展開できたときにゴールにつながったということだろう。(金崎夢生、カイオ、遠藤康のドリブルからのチャンスメイクは印象的であったものの)

対照的に、前述の横浜F・マリノスのゴール予測の決定木(実はXGboostによって重要度の高い項目に絞っていた)を見てみると、ドリブルキープ時間が高いことがゴールにつながっていることがわかる。(最初の分岐のみ、ドリブルキープ時間が短くてもセットプレーから得点できた試合を表す)実際、2016年シーズンの横浜F・マリノスは、セットプレーに加えて、齋藤学、マルティノス、前田直輝などの、ドリブルからのチャンスメイクが多かった。

 

2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(4)」へ続く

このページをツイートして、フォロワーに広めよう!
Archive
コンサドーレ札幌, ベガルタ仙台, 鹿島アントラーズ, 浦和レッズ, 大宮アルディージャ, 柏レイソル, FC東京, 川崎フロンターレ, 横浜Fマリノス, ヴァンフォーレ甲府, アルビレックス新潟, 清水エスパルス, ジュビロ磐田, ガンバ大阪, セレッソ大阪, ヴィッセル神戸, サンフレッチェ広島, サガン鳥栖, モンテディオ山形, 水戸ホーリーホック, ザスパクサツ群馬, ジェフユナイテッド千葉, 東京ヴェルディ, FC町田ゼルビア, 横浜FC, 湘南ベルマーレ, 松本山雅FC, ツエーゲン金沢, 名古屋グランパス, FC岐阜, 京都サンガF.C., ファジアーノ岡山, レノファ山口, カマタマーレ讃岐, 徳島ヴォルティス, 愛媛FC, アビスパ福岡, V・ファーレン長崎, ロアッソ熊本, 大分トリニータ, J1, J2, J3, 日本代表, 五輪代表, ルヴァンカップ, ワールドカップ, レビュー, プレビュー, ACL, ベストイレブン, グルージャ盛岡, ブラウブリッツ秋田, 福島ユナイテッドFC, 栃木SC, Y.S.C.C.横浜, SC相模原, AC長野パルセイロ, カターレ富山, 藤枝MYFC, アスルクラロ沼津, ガイナーレ鳥取, ギラヴァンツ北九州, 鹿児島ユナイテッドFC, FC琉球, Jリーグ・アンダー22選抜, FC東京U-23, ガンバ大阪U-23, セレッソ大阪U-23, ロンドン五輪, 海外日本人選手, トラッキングデータ, 選手指標開発
Jリーグスタジアム
PICK UPmore
2017 8/8 [Tue.] 新開発の「チームスタイル指標」が示す、今Jリーグで見ておくべきチームとは。 今季のJリーグでは、“ハイプレス&ハイライン”戦術で評判となったフアン エスナイデル監督が率いるジェフユナイテッド千葉や、ポゼッションサッカーを信条とする大木 武監督が就任して改革が進むFC岐阜などが面白いサッカーをするチームとして話題に上ることが多い。また、Jリーグを日常的に追い掛けているあなたは、Jリーグをあまり見ない友人にこんな質問をされた経験があるかもしれない。「今、どのチームの試合を見に行けばいい?」「どのチームのサッカーが面白い?」と。データスタジアムが運営するFootball LABでは、当社で取得しているプレーデータとトラッキングデータ(J1のみ)を組み合わせた解析により、これまで定性的に語られていたチームのプレースタイルを可視化することを目的として「チームスタイル指標」を開発。簡単に説明をすると、全試合のプレーデータからいくつかの種類に攻撃パターンを分類し、それぞれのパターンにおける攻撃の試行回数を素にしたリーグ内での偏差値をはじき出している。トラッキングデータを取得しているJ1では、各シチュエーションにおける走行距離やポジショニングから、攻守の切り替えや守備陣形といった守備データを扱うことも可能となった。「チームスタイル指標」における各項目の詳細な説明は割愛するが、どんな項目があり、その項目はどういったプレーを指すのか。気になるあなたは、『チームスタイル指標とは』のページをご覧いただきたい。
2017 7/14 [Fri.] 終盤の失点が大幅に減少。躍進するセレッソ大阪
2017 6/2 [Fri.] 勝ち抜くためには縦ポン推奨? ~J3というカテゴリー~
Column more
2017 8/8 [Tue.] 新開発の「チームスタイル指標」が示す、今Jリーグで見ておくべきチームとは。 今季のJリーグでは、“ハイプレス&ハイライン”戦術で評判となったフアン エスナイデル監督が率いるジェフユナイテッド千葉や、ポゼッションサッカーを信条とする大木 武監督が就任して改革が進むFC岐阜などが面白いサッカーをするチームとして話題に上ることが多い。また、Jリーグを日常的に追い掛けているあなたは、Jリーグをあまり見ない友人にこんな質問をされた経験があるかもしれない。「今、どのチームの試合を見に行けばいい?」「どのチームのサッカーが面白い?」と。データスタジアムが運営するFootball LABでは、当社で取得しているプレーデータとトラッキングデータ(J1のみ)を組み合わせた解析により、これまで定性的に語られていたチームのプレースタイルを可視化することを目的として「チームスタイル指標」を開発。簡単に説明をすると、全試合のプレーデータからいくつかの種類に攻撃パターンを分類し、それぞれのパターンにおける攻撃の試行回数を素にしたリーグ内での偏差値をはじき出している。トラッキングデータを取得しているJ1では、各シチュエーションにおける走行距離やポジショニングから、攻守の切り替えや守備陣形といった守備データを扱うことも可能となった。「チームスタイル指標」における各項目の詳細な説明は割愛するが、どんな項目があり、その項目はどういったプレーを指すのか。気になるあなたは、『チームスタイル指標とは』のページをご覧いただきたい。
2017 7/14 [Fri.] 終盤の失点が大幅に減少。躍進するセレッソ大阪
2017 6/2 [Fri.] 勝ち抜くためには縦ポン推奨? ~J3というカテゴリー~
順位表
勝点試合得点得失
1 鹿島 49 23 38 15
2 C大阪 45 23 46 20
3 川崎F 45 23 43 18
4 45 23 36 14
5 横浜FM 44 23 30 13
6 磐田 39 23 35 14
7 浦和 36 23 50 11
8 G大阪 36 23 36 11
9 鳥栖 34 23 27 3
10 FC東京 33 23 30 4
11 神戸 30 23 25 -4
12 仙台 29 23 26 -13
13 清水 25 23 28 -9
14 甲府 20 23 12 -13
15 札幌 20 23 21 -15
16 大宮 19 23 21 -21
17 広島 18 23 22 -15
18 新潟 9 23 14 -33
攻撃CBP
1 川崎F 531.15
2 浦和 486.35
3 広島 452.89
4 鹿島 427.98
5 G大阪 396.87
6 389.31
7 C大阪 384.15
8 神戸 368.54
9 仙台 365.78
10 FC東京 348.12
11 横浜FM 321.27
12 札幌 311.93
13 清水 307.47
14 鳥栖 303.74
15 磐田 298.66
16 大宮 283.31
17 甲府 254.81
18 新潟 237.18
守備P
1 鹿島 1153.17
2 1140.44
3 C大阪 1096.88
4 甲府 1095.57
5 大宮 1088.57
6 清水 1081.41
7 札幌 1061.50
8 G大阪 1052.21
9 川崎F 1046.78
10 浦和 1030.88
11 鳥栖 1025.51
12 新潟 1013.26
13 横浜FM 1005.47
14 広島 1002.02
15 仙台 989.02
16 FC東京 960.31
17 神戸 916.26
18 磐田 907.88
順位表
勝点試合得点得失
1 湘南 60 29 34 13
2 福岡 55 29 39 15
3 名古屋 52 29 57 12
4 徳島 50 29 49 23
5 長崎 47 29 35 3
6 東京V 46 29 42 9
7 横浜FC 45 29 39 10
8 松本 43 29 42 14
9 千葉 43 29 46 5
10 水戸 43 29 33 2
11 岡山 43 29 32 1
12 大分 42 29 38 2
13 山形 42 29 30 -5
14 愛媛 40 29 38 -4
15 町田 39 29 40 4
16 京都 37 29 38 1
17 岐阜 31 29 37 -5
18 金沢 30 29 28 -22
19 熊本 28 29 28 -13
20 讃岐 26 29 32 -12
21 山口 22 29 30 -17
22 群馬 15 29 20 -36
攻撃CBP
1 岐阜 705.02
2 名古屋 630.49
3 千葉 600.71
4 徳島 523.65
5 東京V 507.16
6 大分 499.35
7 湘南 476.34
8 福岡 471.50
9 山口 455.09
10 山形 440.16
11 愛媛 425.48
12 松本 406.74
13 横浜FC 396.18
14 京都 368.85
15 岡山 362.03
16 群馬 355.54
17 水戸 353.32
18 金沢 351.18
19 熊本 342.26
20 町田 340.02
21 讃岐 318.33
22 長崎 311.98
守備P
1 群馬 1614.98
2 町田 1604.54
3 山形 1577.68
4 岐阜 1514.52
5 湘南 1507.40
6 岡山 1501.44
7 愛媛 1495.65
8 徳島 1490.89
9 東京V 1490.71
10 金沢 1484.10
11 千葉 1474.61
12 讃岐 1473.41
13 熊本 1458.50
14 水戸 1452.20
15 松本 1442.08
16 山口 1429.58
17 大分 1402.73
18 福岡 1370.02
19 横浜FC 1357.54
20 長崎 1356.55
21 名古屋 1355.55
22 京都 1339.21
#footballlab
HOME » 2016年のJ1リーグ全試合データを機械学習し、2017年の展望を予測する(3)
Team Select close