Datenanalyse im Fußball: Ein Blick hinter die Kulissen
„All diese Datenanalyse im Fußball ist doch Quatsch, oder?“, fragte Ian Graham, als er eingestellt wurde, um das Rekrutierungsteam von Tottenham Hotspur zu unterstützen.
Sein erstes Treffen mit Michael Edwards, seinem Chef und zukünftigem Sportdirektor bei Liverpool, verlief jedoch nicht gut. „Es war lang und aggressiv“, erklärt Graham. „Ich rief meinen Chef bei Decision Technology, einem Analyseunternehmen, nach dem Treffen an und sagte, ich glaube, Spurs werden uns fallen lassen, weil sie uns offensichtlich für Idioten halten. Aber er wollte die Antwort herausfinden. Die Art, wie er sie fragte, ließ mich denken, er wollte mich dumm aussehen lassen, aber er versuchte ehrlich, die Qualität dessen, was wir taten, zu beurteilen.“
Unter Edwards und Jürgen Klopp bei Liverpool half Grahams Arbeit, den Verein in Premier League- und Europameister zu verwandeln und die Mannschaft dabei zu transformieren. Seine erste Erfahrung war jedoch typisch für viele der ersten Datenpioniere des englischen Fußballs. Sie haben mittlerweile durchgebrochen – ihre Arbeit ist im Bereich Rekrutierung, Trainingsmethodik und sogar im Dialekt des Sports zum Mainstream geworden.
„Als ich anfing, war die Vorgabe realistisch: ‚Wir haben viele Daten, wir denken, es gibt einen Wert darin, kannst du etwas finden?‘“, sagt Sam Green, ein ehemaliger Datenanalyst bei Opta, der später bei Aston Villa arbeitete. „Das war es. Es war nicht so, dass wir den Fußball verändern wollten.“
„Man sieht, wie Fans online über erwartete Tore (xG) und das Alter von Spielern diskutieren“, fügt Graham hinzu. „Aber zumindest sind das Argumente über Dinge, die Sinn machen – Dinge, um die sich die Vereine tatsächlich sorgen, anstatt um das alte ‚Wer ist der Beste in der Kabine?‘ Zeug.
Die Anfänge der Datenrevolution
Im Allgemeinen wird die Geburt der Datenrevolution im Fußball auf die Mitte der 2000er Jahre datiert, obwohl Unternehmen wie Opta und Prozone seit den späten 1990er Jahren Daten sammelten. Damals, selbst wenn die Ideen solide waren, war der Kampf, dem sich ihre Befürworter gegenübersahen, die Menschen davon zu überzeugen, daran zu glauben. Ein Teil des Problems waren die Einschränkungen der bestehenden Daten. Baseball, das Aushängeschild der Analysebewegung, hatte einen Datensatz, der Jahrzehnte zurückreichte – im Gegensatz dazu hatte Graham, als er bei Spurs anfing, nur zwei Saisons zur Verfügung, wobei viele ausländische Ligen völlig unzugänglich waren.
„Fußball ist einer der komplexesten Sportarten zu analysieren, nur wegen der schieren Anzahl der beteiligten Personen“, erklärt Green, einer der Hauptakteure bei der Erfindung von xG. „Man muss sich um die Dynamik kümmern, wie diese 22 Spieler interagieren, und das macht es viel schwieriger. Nachdem man die einfachen, ereignisbasierten Daten berechnet hat, stößt man nicht auf eine Wand, aber es wird immer teurer, und die Anzahl der Personen mit Zugang wird immer kleiner und weit weniger öffentlich.“
„Was ist ein Pass, was ist ein Luftduell, was ist eine Klärung?“, fragt Sarah Rudd, eine der ersten Vollzeit-Datenanalysten bei Arsenal.
„Es ist tatsächlich ziemlich schwierig. Hat dieser Spieler versucht zu flanken oder zu schießen? Es gibt viel Mehrdeutigkeit bei diesen Dingen, sodass es schwierig ist, eine Einigung unter den Datensammlern zu erzielen. Und das schafft dieses ganze Durcheinander, wo wir nicht einmal wirklich einen Pass oder einen Schuss definieren können und jetzt versuchen, komplexe Modelle darauf aufzubauen.“
Die Herausforderungen der Datenanalyse
Viele Analysten in den 2000er Jahren fanden sich durch den Ruf von Charles Reep belastet – einem Visionär in vielerlei Hinsicht mit seiner mühsamen, handschriftlichen Analyse von Spielmustern in den 1950er Jahren – der letztendlich weitgehend für seine Schlussfolgerungen kritisiert wurde, weil er das lange Ballspiel über alle anderen Stile predigte. In seinem Buch „Wie man die Premier League gewinnt“ beschreibt Graham, wie der ehemalige Liverpool-Trainer Brendan Rodgers dieses Beispiel anführte.
Aber zu diesem Zeitpunkt hatte Graham einen Unterstützer in Edwards, der begonnen hatte, den Wert seiner Arbeit zu erkennen. „Ein Teil des Grundes, warum Michael zunächst skeptisch war, war, dass er als Prozone-Analyst angefangen hatte, wo er angestellt war, um statistische Berichte für die Trainer von Portsmouth zu erstellen“, erklärt Graham. „Aber er wusste, dass Harry Redknapp und seine Assistenten ihn aus dem Raum geworfen hätten, weil der Bericht irgendwie nutzlos war – er zeigte die Anzahl der Sprints und die Gesamtdistanz. Michael war ein Jugendspieler; er wusste aus seiner Fußballintuition, dass es nichts über das Spiel aussagte.“
„Ein Teil seiner Skepsis war, weil er gesehen hatte, dass es vorher schlecht gemacht wurde. Wir hatten eine sehr frühe Version der erwarteten Bedrohung (die Chance zu scoren basierend auf dem aktuellen Standort des Balls) und er begann, alle Annahmen darin zu hinterfragen.“
„Luka Modric war der Spieler, über den wir uns am meisten stritten (als beide bei Spurs waren). Wir sagten, er sei ein überdurchschnittlicher Spieler, aber nicht unter den Top 10 der Premier League. Michael bestand darauf, dass er bei weitem der beste Spieler in unserem Kader war, und er hatte recht, denn seine Fähigkeiten kamen in den Ereignisdaten nicht sehr gut zur Geltung.“
Die soziale Dimension der Datenanalyse
Es spricht für eine nahezu universelle Erfahrung, die diese frühen Analysten gemacht haben. Trotz der Kategorisierung als „Zahlenmenschen“ war manchmal ihre wichtigste Fähigkeit eine soziale – die Fähigkeit, ihre Arbeit innerhalb eines Vereins zu kommunizieren, um ihren Wert zu zeigen. „Soziale Fähigkeiten könnten es ein wenig übertreiben; wir sind alle Introvertierte – das ist dein Standard-Persönlichkeitstyp“, sagt Graham. „Aber man muss kommunizieren.“
Bei Arsenal arbeitete Rudd für ein frühes Analyseunternehmen namens StatDNA, das 2012 vom Premier-League-Verein übernommen wurde, um die Spielerrekrutierung zu verbessern. Sie arbeitete eng mit dem Management des Teams, zunächst Arsène Wenger und seinem Trainerstab, über 10 Jahre zusammen. „Wir haben immer auf Video als Kommunikationsmittel vertraut“, erklärt sie. „Es ist nicht so, dass alles den Augentest bestehen musste, aber wenn du versuchst zu behaupten, dass etwas eine gute Aktion war, und es nicht so aussah, werden die Leute zurückschlagen.“
Die Entwicklung der Datenanalyse im Fußball
Aber manchmal mussten Analysten auch wissen, wann sie ihre Kämpfe wählen sollten. Der Gründer von Statsbomb, Ted Knutson, arbeitete mehrere Jahre bei Brentford, wo seine Arbeit hoch geschätzt wurde, aber seine Erfahrungen bei anderen Vereinen ließen ihn manchmal auf demonstrative Ergebnisse angewiesen sein. „Es war eine Situation, in der man dem alten Fußballdirektor Lippenstift auf die Sau auftragen konnte“, sagt er. „Du kannst den Lippenstift hinzufügen, aber es wird sie nur wütend machen, wenn sie für diese Dinge nicht offen sind.“
Sobald sie Fuß gefasst hatten, konnten Datenanalysten zunehmend auf ihre Erfolgsbilanz als Beweis für ihren Wert verweisen. Bei Brentford war beispielsweise Daten ein zentraler Bestandteil der Philosophie des Vereins. In der League One sitzend, ohne die Ressourcen, um Topspieler zu kaufen, tauschten sie stattdessen allmählich ihren Weg durch die Ligen, generierten Erträge und reinvestierten, handelten den sprichwörtlichen roten Papierclip gegen ein Haus.
„In meinen letzten Jahren bei Arsenal gab es eine Kerngruppe für Fußballintelligenz, die wirklich gut zusammenarbeitete“, sagt Rudd. „Die Einstellung konzentrierte sich darauf, das Risiko von Verpflichtungen zwischen all diesen verschiedenen Informationsquellen zu mindern, ob sie datenbasiert oder traditionell gescoutet waren. Wenn man sich die Transferhistorie von Arsenal in dieser Zeit ansieht, von 2020 an, änderte sich das Verhältnis von Erfolgen zu Misserfolgen dramatisch.“
Die Zukunft der Datenanalyse im Fußball
Die Datenrevolution war kein linearer Fortschritt oder sogar auf nur eine Handvoll Pioniere beschränkt. Von den mid-2000er Jahren an gab es zahlreiche Entwicklungstrains, die gleichzeitig liefen – die Wettforschung von Tony Bloom und Matthew Benham, den Eigentümern von Brighton & Hove Albion und Brentford, sowie interne Forschungsteams bei Arsenal und Liverpool, plus externe Berater wie Opta und Statsbomb. Oft arbeiteten sie völlig unabhängig voneinander.
„Manchmal ging ich zu Meetings mit den kommerziellen Leuten, die unsere Arbeit verkauften“, sagt Green, der damals bei Opta arbeitete. „Und wenn ich das tat, war es oft ziemlich vorsichtig. Man hatte den Eindruck, dass die Vereine daran interessiert waren, aber niemand würde seine Karten zeigen, ob man ihnen voraus war.“
Knutson argumentiert, dass die Geschichte der Fußballdaten grob in vier Wellen unterteilt werden könnte: Früher war Greens Vorgabe bei Opta in Bezug auf Forschung und Entwicklung weitgehend experimentell. „Offensichtlich war Baseball der Vorläufer, also wussten wir, dass da etwas war“, sagt er. „Es fühlte sich also nie vergeblich an; es gab immer Leute, die engagiert waren. Aber es gab einige Arbeiten, die nirgendwohin führten, und andere, die abhebt, und oft waren sie nicht das, was ich geschätzt hätte. Es ist überraschend, was durchkommt.“
Green ist eine der zentralen Figuren hinter der Entwicklung von xG. Während Rudd gleichzeitig ein ähnliches Modell bei Arsenal privat entwickelte, hat Greens ursprünglicher Blogbeitrag zu dem Thema sich zu einer Statistik entwickelt, die bekannt genug ist, um in „Match of the Day“ verwendet zu werden.
„Es ist wie Newton und Leibniz, die zur gleichen Zeit unabhängig den Kalkül beschreiben“, scherzt Rudd.
„Es ist seltsam, denn es hat sich nicht unbedingt zu der Zeit durchgesetzt, aber später schon“, sagt Green. „Es versucht letztendlich, das Spiel zu beschreiben – zu kodifizieren, was man denkt, was tatsächlich passiert. Wenn man einen Schuss aus 25 Yards abgibt, ist es weniger wahrscheinlich, dass er reingeht als ein Kopfball aus nächster Nähe.“
„Es war also ein großer Baustein für mich. Man musste das in place bringen, um den Wert der Generierung verschiedener Schüsse und Tore zu verstehen, denn das ist die Aggregation, die jeder im Fußball zu erreichen versucht. Aber der Mainstream-Erfolg von xG ist relativ überraschend.“
Die Herausforderungen der Datenanalyse im Fußball
Aber Überraschung ist eine Schlüsselemotion, wenn es um Datenanalyse geht – das Infragestellen vorherrschender Vorurteile ist, wenn die Disziplin am mächtigsten ist. Zum Beispiel war Graham letztendlich einer der Figuren, die Liverpool überzeugten, sich für Andy Robertson zu entscheiden – aber gleichzeitig war Green daran interessiert, den linken Verteidiger von Hull City für Aston Villa zu empfehlen.
„Es gibt ein Zitat von (Baseball-Statistik-Genie) Bill James, das den 90-Prozent-Test umreißt“, sagt Green. „Wenn du eine Metrik erstellst und 100 Prozent das ist, was du erwartest, hast du nichts Nützliches gebaut. Wenn nur 50 Prozent das ist, was du erwartest, dann ist dein Modell wahrscheinlich falsch. Aber wenn du 90 Prozent erwartest, dann sind die verbleibenden Daten wirklich interessant. Oft sind das nur ein oder zwei Personen.“
„Ich erinnere mich, dass Andy Robertson in einem wirklich gut abschnitt, was mich überraschte, wegen des Abstiegs von Hull City. Auch wenn ich mich völlig von seinem Profil distanzieren sollte, ist es immer noch schwer, völlig unbeteiligt zu sein, wie sich die Situation auf die Wahrnehmung eines Spielers auswirkt.“
Die Rolle der Datenanalysten im Fußball
Diese Informationen gelangen manchmal zu Spielern oder Trainern mit Eigeninteressen. Zum Beispiel könnte ein technischer Direktor, der den Kader seines Vereins bewertet, für seine früheren Verpflichtungen kritisiert werden. Ein Spieler, der Datenanalysen zu seinem Wert in Auftrag gibt, könnte verärgert sein, wenn diese nahelegt, dass er diesen lukrativen Vertrag nicht wert ist. TransferMarkt-Geschäftsführer Thomas Lintz erzählt eine Geschichte darüber, wie Cristiano Ronaldo die Website auf Instagram blockierte, nachdem er mit seinem neuesten Wertupdate unzufrieden war.
„Die Leute mögen es, ihre Umgebung kontrollieren zu können, und es gibt Zeiten, in denen man Trainern oder Agenten Informationen gibt und sie nicht mögen, was sie hören“, sagt Knutson. „Ich verstehe es – man kämpft um alles, was man bekommen kann. Aber wir müssen versuchen, es auf Objektivität zurückzuwiegen und ihnen zu sagen, dass sie es nehmen oder lassen sollen. Es gab Zeiten, in denen wir Teamverträge gekündigt haben, weil die Leute wollten, dass wir unsere Berichte ändern. Es hat uns Geld gekostet, aber wir fühlten, dass die Alternative an Integrität mangelte.“
Die Bedeutung von Struktur und Kommunikation
In diesen Momenten wird die gesamte Struktur wichtig. Graham weist schnell auf sein Glück hin, bei Liverpool unter Klopp und Edwards zu arbeiten, wo klare Prozesse vorhanden waren. „Die Bedeutung, ehrlich mit dem Trainer zu sein, wird bei der Rekrutierung unterschätzt“, erklärt er. „Man muss ihnen sagen, dass, obwohl man denkt, dass Spieler X der beste Spieler sein könnte, sie nicht perfekt sind, und hier sind ihre Schwächen – bist du damit einverstanden?“
„Das war eine großartige Sache an Jürgen – er war bereit, Schwächen im Austausch für Stärken zu akzeptieren. Er sagte, dass, wenn ein Spieler einige Superkräfte hatte, er ihre Defizite kaschieren könnte. Als Rekrutierungsabteilung konnten wir unsere ehrliche Meinung abgeben, und dann vermeidet es, dass der Trainer verärgert ist, wenn sich herausstellt, dass sie X, Y oder Z nicht tun können.“
Bei Arsenal verbesserte sich die Struktur allmählich. „Wir waren so früh im Spiel, dass viele Leute immer noch nicht wirklich verstanden, was wir taten oder wie man uns am besten nutzt“, erklärt Rudd. „Ich denke, eine Sache, mit der wir zu Beginn zu kämpfen hatten, war, dass in der Ära vor den Sportdirektoren ein Manager für absolut alles verantwortlich war. Natürlich würden sie also nicht unbedingt viel darüber nachdenken, wie der Entscheidungsprozess aussehen sollte, was uns manchmal daran hinderte, so wirkungsvoll zu sein, wie wir könnten.“
Die Zukunft der Datenanalyse im Fußball
Jetzt hat fast jeder Premier-League-Verein einen technischen Direktor oder dessen Pendant, was den Daten ihren Platz innerhalb der Managementstruktur des Vereins gibt. Natürlich gibt es immer noch große Unterschiede zwischen den führenden Vereinen – allgemein als Manchester City, Liverpool und Arsenal angesehen – und denen weiter unten in der Tabelle. Aber einige neue Einstellungen in breiteren Fußballrollen haben sogar einen Analysehintergrund – Ben Knapper, Arsenals ehemaliger Leihmanager, und Norwicht Citys neuer Sportdirektor, kamen bei StatsDNA zusammen mit Rudd durch. Es zeigt die neu gewonnene Reichweite der Disziplin.
Was ist das nächste Argument, das sie gewinnen müssen? Eine verbleibende Grenze ist, ob sie beginnen werden, Trainer im Spiel zu beeinflussen – Vorschläge für Auswechslungen oder Systemänderungen. Bestimmte Fortschritte in der Technologie bedeuten, dass Aspekte davon theoretisch möglich sind, auch wenn die Hürde in der Praxis so hoch ist. „Einer der Gründe, warum es so schwer ist, ist, dass es mehrere Möglichkeiten gibt zu gewinnen – es ist nicht wie im Baseball, wo es eine ideale und endliche Möglichkeit gibt, Spieler um die Bases zu bewegen“, erklärt Rudd.
„Man kann das wirklich optimieren, auf eine Weise, die man im Fußball nicht spiegeln kann, denn welche Strategie man auch entwickelt, jemand wird das ausgleichen. Außerdem sind 45 Minuten nicht viele Daten, um Entscheidungen zu treffen. Um ehrlich zu sein, ist das der Punkt, an dem das menschliche Gehirn einfach einen viel besseren Job beim Finden von Mustern macht.“
Graham stimmt zu. „Ich denke nicht, dass Daten in Bezug auf Taktik bisher viel bewirkt haben, ist die einfache Antwort. Man braucht ein gutes Tracking-Modell, um etwas über Taktik zu sagen, und die meisten Teams haben das nicht – vielleicht nur die großen Premier-League-Teams und ein paar in Europa. Es hat uns zwei Jahre gedauert, eines bei Liverpool aufzubauen, und wir hatten eines der bestausgestatteten Datenwissenschaftsteams im Fußball.“
„Aber für die meisten Teams, wenn Daten Taktiken informieren, sollte es wahrscheinlich nicht sein, es sei denn, man ist sich sicher, dass man ein sehr gutes Modell hat. Man muss den Trainer auch überzeugen, es zu nutzen, und das ist eine sehr hohe Hürde.“
Stattdessen sehen einige die nächste Grenze im Training. Neunzig Prozent von Grahams Rolle betrafen die Rekrutierung, und obwohl Rudds Fokus auf Verpflichtungen nur die Hälfte ihres Jobs ausmachte, wurden Transfers als Hauptpriorität angesehen. Dies bedeutet jedoch, dass andere Bereiche niedrig hängende Früchte besitzen. „Trainingsdaten und die Verbesserung der Fähigkeiten von Spielern werden in Zukunft ein großes Thema sein“, sagt Knutson. „Die Verwendung von Geräten wie Hochgeschwindigkeitskameras und LiDAR-Radar kann helfen, das Ballspiel zu verbessern – das könnte einen großen Einfluss haben, weil besseres Ballspiel einen sehr großen Einfluss auf das Tore schießen hat.“
Fazit: Die Rolle der Daten im modernen Fußball
Datenanalysten mussten kämpfen, um ihre Rolle im Fußball zu verteidigen. Manchmal sprechen die Zahlen nicht für sich selbst, sondern brauchen jemanden, der für sie spricht. Für Graham ist dies der einzige Ort, an dem Vorurteile gerechtfertigt werden können. „Das Vorurteil, das nützlich ist, ist der Kontrarianismus“, argumentiert Graham. „Fußball ist zu risikoscheu, wenn es um irgendetwas geht. In den Spurs-Tagen gab es nicht viel Scouting von europäischen Spielern – es gab das Gefühl, dass Ausländer es in der Premier League nicht schaffen könnten. Das ist heute verrückt zu denken.“
„Und so ist es, ein Kontrarianer zu sein, zu sagen, was auch immer das Vorurteil ist, dass man bereit ist, viel zu weit in die andere Richtung zu gehen, und das wird einem einen Vorteil verschaffen. Es ist wie das Zitat von Matthew Benham, dass, wenn du in der 90. Minute 1-0 führst und auf 10 Mann reduziert bist, du weiter angreifen musst. In gewisser Weise ist es eine dumme Sache zu sagen, aber jeder ist so risikoscheu, dass sie immer in die gleiche Richtung falsch liegen. Finde die Vorurteile, sei in die andere Richtung voreingenommen, und selbst wenn du falsch liegst, weil alle anderen in die andere Richtung falsch liegen, wird das dir einen Vorteil verschaffen.