Nach 17 Spieltagen befindet sich die österreichische Bundesliga in der Winterpause und wir nehmen dies wieder einmal zum Anlass, um euch einige interessante Statistiken... Kommentar: Der SK Rapid und die Expected-Points-Tabelle

Nach 17 Spieltagen befindet sich die österreichische Bundesliga in der Winterpause und wir nehmen dies wieder einmal zum Anlass, um euch einige interessante Statistiken zu präsentieren. Wir starten heute mit der Expected-Points-Tabelle, die in dieser Saison mehr als jemals zuvor im Mittelpunkt der Öffentlichkeit stand. Deswegen findet ihr an dieser Stelle statt dem gewohnten „Statistiken zur Winterpause“-Artikel einen Kommentar, der die Bedeutung von xP-Tabellen einzuordnen versucht. Wie sinnvoll sind Metriken wie die Expected Goals und Expected Points wirklich und welche Schlüsse lassen sich aus ihnen schließen?

Im Mainstream angekommen

Statistiken wie die Expected-Goal-Werte und weiterführende Metriken wie die Expected-Points-Tabelle sind längst im Mainstream angekommen. Wir verwenden diese Daten seit vielen Jahren in unseren Analysen und auch bei Fernsehübertragungen ist es mittlerweile, beispielsweise bei Sky-Übertragungen der deutschen Bundesliga, selbstverständlich, dass die xG-Werte zur Halbzeit und nach Spielende eingeblendet werden.

Dieses Jahr gab es auch in Österreich viele Diskussionen über die Expected Goals und die Expected-Points-Tabelle, was in erster Linie am SK Rapid lag. Zoran Barisic, der nach einer 0:1-Niederlage in der 14. Runde gegen den TSV Hartberg die Grün-Weißen verlassen musste und von Neo-Trainer Robert Klauss abgelöst wurde, stand nämlich zum Zeitpunkt seines Abgangs auf Platz 1 der xP-Tabelle.

Es entbehrt nicht einer gewissen Ironie, dass der ehemalige Rapid-Trainer, der eher auf Intuition und Bauchgefühl statt auf Datenanalyse setzt, ausgerechnet durch Statistiken wie die Expected-Points-Tabelle in einem positiven Licht erscheint. Wohl auch aus diesem Grund zog der Coach es vor, sich bei Pressekonferenzen oder Interviews nach Liga-Spielen nicht auf diese Statistiken zu berufen, die stattdessen vermehrt von Medienvertretern angeführt wurden, um die Notwendigkeit eines Trainerwechsels angesichts der positiven Werte in Frage zu stellen. Bei Sportdirektor Markus Katzer konnte man indes auf Nachfrage hören, dass der Verein mehrere ähnliche Modelle verwendet, die Erkenntnisse aus der Expected-Points-Tabelle bestätigen und den SK Rapid in vielen Bereichen ganz weit vorne sehen.

Keine exakte Abbildung der Realität

Nun ist es wichtig zu verstehen, dass eine Expected-Points-Tabelle nicht den Anspruch hat die Realität abzubilden. Das xG-Modell und die daraus entwickelten Metriken haben ihre Stärken und Schwächen und sind immerhin einmal ein großer Fortschritt im Vergleich zu traditionellen Statistiken wie simple Schussverhältnisse.  Die xP-Tabelle ist aber keine „wahre oder gerechte Tabelle“ per se, sondern bietet einfach einen weiteren Blickwinkel auf die Geschehnisse, den man richtig interpretieren und einordnen muss, womit sich viele Fans schwertun, wenn man die Social-Media-Kommentare zu diesem Thema liest.

Dies ist für mich manchmal erstaunlich, da die xG-Werte in den ersten 17 Runden durchaus die subjektiven Eindrücke, die man als Zuschauer von den Partien des SK Rapid in dieser Saison hatten, bestätigten – nämlich, dass die Hütteldorfer im Verhältnis zu ihren Chancen sehr viele Punkte liegengelassen haben.

Regression zur Mitte

Warum überhaupt diese lange Einleitung? Weil der SK Rapid auch nach 17 Spieltagen knapp vor RB Salzburg auf Platz 1 dieser Tabelle steht und wir hoffen, dass unsere Leser dies richtig einordnen werden. Diese Statistik ist ein starkes Indiz dafür, dass der SK Rapid statistisch gesehen deutlich unter der Erwartung lief und mehr Punkte auf dem Konto haben müsste. Es bedeutet normaler Weise auch, dass es eher wahrscheinlich ist, dass der SK Rapid im Laufe der Saison einen höheren Punkteschnitt einfahren wird. Das Konzept dahinter wird den meisten als „Regression zur Mitte“ bekannt sein: Dieses statistische Konzept beschreibt das Phänomen, dass wenn eine Variable in einem Extremwert gemessen wird, sie bei späteren Messungen dazu tendiert, näher am Durchschnitt zu liegen. Das bedeutet, dass außergewöhnlich hohe oder niedrige Messwerte tendenziell zu weniger extremen Werten hin korrigieren, wenn die Messungen wiederholt werden.

Hier muss aber angemerkt werden, dass aufgrund der Aufteilung in ein oberes und unteres Playoff nach 22 Runden der Punkteschnitt aus dem Grunddurchgang nicht mit dem Schnitt in einem der beiden Playoffs verglichen werden kann.

Abstraktion ist eine Bedingung

Diese xP-Tabelle bedeutet jedoch nicht automatisch, dass die Hütteldorfer in den ersten 17 Runden die beste Mannschaft der Liga waren. Es handelt sich nämlich um ein abstraktes Modell und diese Abstraktheit wird auch benötigt, um funktionieren zu können. Dies beschrieb unser Autor Alexander Semeliker bereits vor rund zehn Jahren in einem lesenswerten Beitrag, aus dem ich nun zitieren möchte:

Die Vorteile der „Expected Goals“ scheinen überwältigend zu sein und es hat den Anschein, als würde man damit den Fußball vollständig beschreiben können, wenn man nur weit genug ins Detail gehen würde. Allerdings ist genau das das große Problem, denn dann würde man wieder zum Ausgangspunkt zurückkehren. Zerlegt man nämlich jeden Schuss rein theoretisch bis ins letzte Detail, ist jeder für sich einzigartig. Welcher Spieler hat geschossen? Mit welchem Fuß hat er geschossen? Seinem starken oder schwachen? Wer war der Torhüter? Wurde seine Reaktionsfähigkeit in irgendeiner Weise beeinträchtigt? Hätte ein anderer Spieler in der Nähe den Schuss blocken können? Das Ganze könnte so weit gehen, dass man sogar nach der Tagesform der Spieler fragt. Zu viele Details würden dieses Modell also wieder in seinen Ursprung zurückführen. Eine gewisse Abstraktion muss also gegeben sein, um es sinnvoll einsetzen zu können.“

Seit dem Verfassen dieses Beitrags hat sich druchaus einiges geändert und das xG-Modell wurde von den Datenanbietern sinnvoll weiterentwickelt. Statsbomb lässt beispielsweise einfließen, wie wahrscheinlich es anhand der Position des Schützen und der Gegenspieler ist, dass der Schuss geblockt wird. Wir verwenden das Modell von Wyscout, das auch zahlreiche Top-Klubs benutzen, das aber im Vergleich zum wesentlich teureren Statsbomb-Modell die gerade erwähnte sinnvolle Statistik der Wahrscheinlichkeit eines geblockten Schusses nicht aufweist.

Wir befinden uns am Anfang

Dennoch kann ich unseren Lesern versichern, dass auch die internationalen Top-Klubs Modelle verwenden und schätzen, die auf dem xG-Modell basieren. Sevilla-Sportdirektor Victor Orta sagte mir in einem Gespräch, dass er natürlich auch Statistiken wie die xP-Tabelle in die Entscheidungen bei möglichen Trainer-Entlassungen einfließen lässt. Ein Datenanalyst des Chelsea FC zeigte meinem Kollegen Daniel Mandl und mir ausführlich, wie der Verein automatisch xG-Werte für die verschiedenen Spielsituationen wie Konterangriffe und Standardsituationen generiert. D

Es gibt kaum einen anderen Bereich im Fußball, der sich so rasant weiterentwickelt wie die Datenanalyse und in Zeiten von Big Data und KI-gestützten Systemen werden die Vereine automatisch immer mehr zu datengesteuerten Entscheidungsfindungen kommen. Diese Entwicklungen beschränken sich natürlich nicht nur auf den Fußball, sondern auf viele Bereiche unseres täglichen Lebens.

Der FC Sevilla leistet sich beispielsweise ein Research & Development Team mit rund zwanzig Angestellten, die in drei verschiedenen Abteilungen an zukünftigen Innovationen arbeiten, um den Verein in der Spitze der technologischen Entwicklung im Fußball zu positionieren.

Die xP-Tabelle zur Winterpause 2023/24

Die Tabelle lässt sich per Klick vergrößern; Quelle: Wyscout S.p.a.

Ganz rechts findet ihr die Expected-Points der zwölf Bundesligisten. Der SK Rapid läuft laut dem xP-Modell von Wyscout um 9.4 Punkte unter der Erwartung und hat auf RB Salzburg, das 6.1 Punkte über der statistischen Wahrscheinlichkeit laufen, einen halben Punkt Vorsprung.

Auch der SCR Altach sollte laut dem xP-Modell in der Tabelle weiter oben stehen und kommt auf einen besseren xP-Wert als Hartberg und Austria Klagenfurt. Bedenklich sieht die Lage für Austria Lustenau aus, das nach 17 Spieltagen nur 3 Punkte und nur 7.8 Expected Points zu Buche stehen hat. Die Vorarlberger liefen zwar unter der Erwartung, was bei drei Punkten aus 17 Runden auch schwer anders sein könnte, weisen aber auch deutlich weniger Expected Points als die Konkurrenz auf.

Fazit

Wir hoffen, dass wir mit unserer langen Einleitung ein wenig helfen konnten, die Sinnhaftigkeit einer xP-Tabelle besser einordnen zu können. Man sollte diesen Statistiken weder zu viel noch zu wenig Bedeutung zukommen lassen, sondern sie als das interpretieren was sie sind: Hilfsmittel, die versuchen zu quantifizieren, was wir als Beobachter oftmals intuitiv erfassen, und uns gleichzeitig daran erinnern, dass im Fußball Zahlen eine Geschichte erzählen, aber niemals das ganze Bild – zumindest bis zukünftige, verfeinerte Modelle die Realität immer präziser einfangen.

Stefan Karger