big-data- and data- science-day 2018download.hdm-server.eu/bdd18/bdds18-funke.pdf · 2018. 5....

Post on 16-Oct-2020

0 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Big-Data- and Data-Science-Day 2018KONZEPTION EINES TRACKING-BASIERTEN SYSTEMS ZUR SPIELERBEWERTUNG IM FUßBALL

Agenda1. Einführung

2. Opta Daten

3. Methoden

4. Designprinzipien

5. Implementierung der Artefakte

6. Ergebnisse

7. Evaluation

8. Limitationen

9. Fazit und Ausblick

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

EinführungZiel der Arbeit:

▪ Erstellung eines Systems zur individuellen Spielerbewertung

▪ Top 10 Spieler identifizieren

Datenbasis:

▪ Opta Event Daten

Verwendete Technologien:

▪ RapidMiner

▪ Tableau

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Opta Daten

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ 306 Spiele der 1. Bundesliga Saison 2016/17

▪ Je Spiel 1500 bis 2200 Events

▪ → 575.078 aufgezeichnete Events

MethodenExpected Goals:

▪ Reines XG-Modell

▪ Zonenbasiertes XG-Modell

Expected Possession Value:

▪ Bewertung ob ein Ballbesitz sich positiv oder negativ ausgewirkt hat

▪ Problem: Nur die Position des aktuellen Spielers des Events bekannt

▪ Lösung: XG-Zonenmodell als Bewertungskriterium

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Methoden – Expected Goal

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Reines XG-Modell:

▪ Tore ÷ Schüsse

▪ Wird häufig auf Teamebene verwendet

Zonenbasiertes XG-Modell:

▪ Einteilung des Spielfelds

▪ Bewertung der einzelnen Zonen (nicht Spieler)

Bildquelle: Cronin, B. (2017): An analysis of different expected goals models

Methoden – Expected Possession Value

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ Kommt ursprünglich aus dem Basketball

▪ Bewertet Aktion bezüglich der Veränderung der potentiellen Wahrscheinlichkeit zu Punkten

Bildquelle: Cervone, D.; D‘Amour, A.; Bronn, L.; Goldsberry, K. (2014):POINTWISE: Predicting Points and Valuing Decisions in Real Time with NBA Optical Tracking Data

Expected Goal Zonen

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

XG-Modell erstellen:

▪ Schüsse & Tore den Zonen zuweisen

▪ Zonenwert = Tore/Schüsse

Expected Goal Berechnung

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Eigentore

Schüsse & ToreSchüsse & Tore

Inklusive Zonen

Tore

Inklusive Zonen

Rekonstruktion des Laufwegs

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ Es handelt sich beim ersten Event um ein Event vom Typ Pass

▪ Der Startpunkt des zweiten Events ist ungleich dem Zielpunkt des ersten Events

▪ Beide Events werden vom gleichen Team durchgeführt

▪ Der Ausgang des ersten Events war positiv

Designprinzipien1. Extraktion der Zielkoordinaten

2. Generierung der Zonen

3. Elfmeter und Eigentore entfernen

4. Erstellung Expected Goal Modell

5. Erstellung Expected Possession Value Modell

6. Kombination XG-Modell, EPV-Modell & Zonen

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Implementierung - Einlesen

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ Über alle 306 Spiele iterieren

▪ Umwandeln der XML Struktur in tabellarische Form

→ Pro Event 50 Attribute

Ergebnis:

Collection mit 306 Example Sets

Implementierung - Qualifier▪ Loop über alle

Example Sets

▪ Entfernen von nicht benötigten Attributen

▪ Passzielkoordinaten und Elfmeter als eigene Attribute aus den Qualifiern erzeugen

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Implementierung - Qualifier

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Implementierung – Zonen hinzufügen▪ Startkoordinaten eines

Events mit Zonenraster abgleichen

→ Attribut: Startzone

▪ Bei Events, die Zielkoordinaten besitzen diese ebenfalls abgleichen

→ Attribut: Zielzone

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Implementierung – XG Werte der Zonen▪ Prozess wird zwei mal in

unterschiedlicher Parametrisierung durchlaufen

1. Schüsse + Tore

2. Tore

▪ Anzahl je Zone ermitteln und abspeichern

▪ Die XG Werte der einzelnen Zonen können mit den Outputs dieses Prozesses berechnet werden

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Implementierung – individuelle Spielerbewertung 1

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Implementierung – individuelle Spielerbewertung 2

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ Zuvor errechnete XG Werte für Start- und Zielzonen als neue Attribute hinzufügen

▪ Lag einbauen → damit aufeinanderfolgende Events verglichen werden können

▪ Berechnen der Differenz von Start- und Zielzone, wenn es sich um Dribbel handelt

Implementierung – individuelle Spielerbewertung 2

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Bedingung:

▪ Start ≠ Ziel

▪ Team ID identisch

▪ Outcome = 1

▪ Type_id = 1

→ Differenz Start- und Zielzone Spieler aus E2 zuschreiben

Implementierung – individuelle Spielerbewertung 3

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ Schleife iteriert so häufig über den Subprozess, wie es Attributausprägungen für die Spieler ID gibt

▪ Filtern auf aktuelle Spieler ID

▪ Summieren aller XG Veränderungen

▪ Hinzufügen der Spieler ID zu neuem „Example“

Ergebnisse – Top 10 Spieler

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Evaluation – Abgleich mit den Bewertungen von Kicker und LigaInsider

Vorgehensweise:

▪ Mapping der Bewertungen: Kicker 215 Spieler, LigaInsider 274 Spieler

▪ Normalisieren der Daten → Skala von 0 – 100

▪ RMSE und MAE des Zonenmodells und Kicker bzw. LigaInsider berechnen

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

𝑧𝑖 = 100 ∗𝑥𝑖 −min 𝑥

max 𝑥 − min 𝑥

σ𝑖=1𝑛 |𝑦𝑖 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑒𝑑 𝑣𝑎𝑙𝑢𝑒 − 𝑦𝑖(𝑎𝑐𝑡𝑢𝑎𝑙 𝑣𝑎𝑙𝑢𝑒)|

𝑛MAE =

σ𝑖=1𝑛 𝑦𝑖 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑒𝑑 𝑣𝑎𝑙𝑢𝑒 − 𝑦𝑖 𝑎𝑐𝑡𝑢𝑎𝑙 𝑣𝑎𝑙𝑢𝑒

2

𝑛RMSE =

Evaluation – RMSE & MAE

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Kennzahl Vergleichsbewertung Wert

RMSE Kicker 26,10

RMSE Kicker gefiltert auf offensiv 22,22

RMSE LigaInsider 23,48

MAE Kicker 22,55

MAE Kicker gefiltert auf offensiv 19,18

MAE LigaInsider 21,00

Evaluation – Designprinzipien

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Kicker RMSE LigaInsider RMSEKicker mittlerer absoluter Fehler

LigaInsider mittlerer absoluter Fehler

Zonenmodell - bereinigt 26,10 23,48 22,55 21,00

Zonenmodell - nicht bereinigt 34,69 29,92 31,57 35,32

reine XG Werte 39,18 33,22 36,25 33,98

Evaluation – Abgleich Top 15Kicker LigaInsider Zonenmodell

A. Robben T. Alcântara A. Robben

F. Ribery A. Robben O. Dembélé

R. Lewandowski R. Lewandowski F. Ribéry

E. Forsberg E. Forsberg P. Aubameyang

P. Lahm M. Kruse T. Alcântara

T. Alcântara H. Çalhanoğlu P. Lahm

O. Dembelé P. Aubameyang T. Werner

M. Kruse F. Ribéry A. Kramaric

T. Werner N. Keita E. Forsberg

N. Keita M. Ferreira de Souza T. Müller

S. Rudy A. Vidal J. Brandt

M. Reus O. Dembélé S. Zuber

K. Demirbay P. Lahm Wendell

A. Modeste X. Alonso M. Gómez

M. Javi T. Werner S. Wagner

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Kicker +Zonenmodell= 7 Übereinstimmungen

LigaInsider +Zonenmodell= 8 Übereinstimmungen

Limitationen

▪ Modell eignet sich nur für offensive Spieler

▪ Daten sind beschränkt auf eine Saison

▪ Spielzeit wurde nicht miteinbezogen

▪ Opta Daten:

▪ Nur die Position des Spielers, der das aktuelle Event durchführt ist bekannt

▪ Beschränkung der Bewertungsfaktoren auf Ballbesitz

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Fazit und AusblickFazit:

▪ Modell eignet sich als Indikator für die Bewertung von offensiven Leistungen

▪ Für eine umfassendere Bewertung muss das Modell angepasst oder ergänzt werden

Ausblick:

▪ Zonenmodell verbessern:▪ Feinere Zonen

▪ Geschwindigkeit und Distanz eines Sprints miteinbeziehen

▪ Modell für Defensivleistungen▪ Zonenmodell erweitern

▪ Separates Modell

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Vielen Dank für Ihre Aufmerksamkeit

top related