Databricks alimente l’analyse pour la meilleure ligue de football d’Espagne

Comptez la meilleure ligue de football d’Espagne parmi les organisations qui s’engagent pleinement dans l’analyse.

LaLiga, qui abrite des clubs prestigieux comme le Real Madrid et Barcelone, et des joueurs comme l’actuel meilleur buteur Karim Benzema et la star de longue date Luis Suárez, a lancé la plateforme Databricks Lakehouse en 2018. La ligue les utilise désormais pour mettre à jour ses 20 clubs sur le jeu sur le terrain, ainsi que ses fans qui suivent les matchs sur leurs téléviseurs et appareils mobiles.

Fondé en 2013 et basé à San Francisco, Databricks est un fournisseur de data lakehouse dont la plateforme basée sur le cloud combine les avantages des entrepôts de données et des lacs de données. Dans ses Lakehouses, les utilisateurs peuvent interroger et analyser des données structurées à l’aide de SQL comme dans un entrepôt de données et des données non structurées dans l’architecture flexible d’un lac de données.

La Liga, quant à elle, existe depuis 1929 et est la meilleure ligue de football d’Espagne. Le Real Madrid a été son club le plus dominant avec 34 championnats, tandis que les stars récentes incluent Cristiano Ronaldo et Lionel Messi.

Un virage vers l’analytique

Il y a un peu moins de dix ans, la ligue estimait qu’elle était à la traîne en termes d’analyse, selon Tom Woods, responsable du marketing et des communications chez LaLiga Tech.

Bon nombre des plus grandes entreprises du monde utilisent l’analytique pour prendre des décisions commerciales depuis des années. Et les organisations sportives, y compris la Major League Baseball aux États-Unis et les instances dirigeantes du tennis dans le monde – l’Association of Tennis Professionals et la Women’s Tennis Association – utilisent l’analyse pour maximiser les performances des joueurs et informer leurs fans depuis plusieurs décennies.

Par exemple, comme documenté dans le livre – et le film suivant – boule d’argentLes Oakland Athletics de baseball ont été les premiers pionniers de l’analyse dans le sport, utilisant des données au tournant du 21e siècle pour trouver la valeur des joueurs négligés par d’autres équipes et se battant pour des championnats malgré l’une des plus petites masses salariales.

Cependant, dans la deuxième décennie du 21e siècle, la première division espagnole de football n’avait pas encore commencé à utiliser l’analyse.

Lorsque Javier Tebas a finalement pris ses fonctions de président de la ligue en 2013 et a fait de l’analyse une priorité, tout a changé selon Rafael Zambrano López, responsable de la science des données de LaLiga.

“Notre président a décidé… de nous rendre plus axés sur les données, et notre division a été formée [at that time]”Nous avons commencé à tout construire à partir de zéro et nous sommes passés de là à maintenant.”

L’impulsion pour le passage à une plus grande gouvernance des données est venue d’un sentiment de responsabilité envers les clubs de la ligue, a ajouté Woods. Il a noté que si de nombreuses organisations sportives ont commencé à voir la valeur de l’analyse, le football européen dans son ensemble n’est pas encore axé sur les données.

Maintenant, cependant, la Bundesliga allemande utilise AWS pour l’analyse et la Premier League anglaise utilise Oracle Cloud, aux côtés d’autres grandes ligues de football européennes.

“Nous avons la responsabilité de gérer nos clubs et nous le voyions comme une ligue pour aider ces clubs à s’adapter à de nouvelles façons de faire”, a déclaré Woods. “Nous avons vu qu’il était nécessaire de faire en sorte que les choses fonctionnent efficacement et de garder les fans impliqués.”

Cela signifiait développer un écosystème décisionnel qui pourrait aider le produit sur le terrain, l’expérience des fans et même les clubs avec des choses comme la détection des fraudes et la prévention des matchs truqués, a-t-il poursuivi.

Tout d’abord, LaLiga a développé ses propres systèmes de gestion et d’analyse des données. Finalement, cependant, la ligue a décidé d’adopter une plate-forme de données et d’analyse et de combiner les capacités existantes de la ligue de football avec celles d’un fournisseur.

Selon Zambrano López, LaLiga a été présentée à Databricks par sa relation avec Microsoft et a choisi Databricks pour sa rapidité, sa facilité d’utilisation et son faible coût.

Un exemple de tableau de bord d'analyse de la ligue espagnole de football, LaLiga
La Liga espagnole utilise Databricks pour collecter des données et fournir des informations à ses équipes et à ses fans.

Faites-en plus avec les données

Aujourd’hui, après avoir adopté Databricks quelques années après son engagement dans l’analyse, la ligue espagnole de football collecte plus de 3 millions de lignes de données par match. Il met ces données en action, fournissant des rapports aux équipes et des statistiques aux fans en quelques secondes pendant que les matchs se déroulent sur le terrain de football.

Les caméras capturent la position des joueurs et du ballon, et nous combinons ces données avec les données de l’événement – les passes, les buts, les cartons rouges, les cartons jaunes, etc. – et cela nous permet de créer nos métriques. Il y a environ 25 métriques et nous pouvons les partager avec chaque club afin qu’ils puissent s’améliorer.

Rafael Zambrano LópezResponsable de la science des données, LaLiga

LaLiga place stratégiquement des caméras dans chacun de ses stades et grâce à ces caméras, la ligue capture toutes ces données de chaque match. Les caméras suivent les mouvements de chaque joueur à 25 images par seconde et envoient ces données à Databricks, où elles sont automatiquement intégrées dans des modèles de données développés par Zambrano López et son équipe d’analyse en temps réel.

“Les caméras capturent la position des joueurs et du ballon, et nous combinons ces données avec les données de l’événement – les passes, les buts, les cartons rouges, les cartons jaunes, etc. – et cela nous permet de créer nos métriques”, a déclaré Zambrano López. . “Il y a environ 25 paramètres et nous pouvons les partager avec chaque club afin qu’ils puissent s’améliorer.”

L’une de ces mesures est la probabilité d’objectif.

Si un joueur tire un tir dans les 30 secondes environ – qu’il aboutisse ou non à un but – la combinaison de databricks et de modèles de données développés par LaLiga peut déterminer la probabilité que le tir aboutisse à un but, et les équipes, les diffuseurs et les fans partagez ces informations avec eux pendant que le jeu se déroule.

Les équipes peuvent immédiatement utiliser ces informations pour déterminer si les joueurs aident ou blessent l’équipe avec un jeu intelligent – par exemple, en effectuant des tirs qui ont peu de chances d’atteindre la cible alors qu’une passe aurait donné une meilleure opportunité de marquer. Pendant ce temps, les fans sont mieux informés tout au long du gameplay.

Mais les capacités d’analyse de Databricks permettent aux équipes de la ligue de savoir bien plus que les chances de marquer lors d’un match de football.

En suivant les mouvements des joueurs – combien ils courent pendant un match, comment leur rythme change et comment leur démarche diffère d’un match à l’autre en raison de la fatigue – les clubs peuvent essayer de prévoir et de prévenir les blessures des joueurs avant qu’elles ne surviennent.

Dans l’ensemble, LaLiga utilise Databricks pour fournir à chaque équipe un rapport de 150 pages après chaque match.

“Ils obtiennent une énorme quantité de données qu’ils peuvent ensuite analyser en interne”, a déclaré Woods. “Nous leur donnons quelques conseils sur la façon de bien analyser les informations, mais de nombreux clubs investissent désormais dans leurs propres équipes d’analyse. Et beaucoup d’entre eux attribuent désormais des victoires ou des saisons particulièrement bonnes à une meilleure compréhension de la compétition.

Il a ajouté que si tous les clubs ont été réceptifs à l’analyse, environ cinq ont investi le plus agressivement. Séville, actuellement à égalité de points derrière le Real Madrid à la deuxième place, en est un exemple.

Il y a plus à venir

En septembre 2021, la ligue a lancé LaLiga Tech pour apporter les capacités d’analyse que LaLiga a co-développées avec Databricks et ses autres partenaires technologiques, dont Microsoft, à d’autres organisations sportives – pas seulement dans le football.

«Nous sommes au début du lancement d’une toute nouvelle entreprise au sein de LaLiga, où tout ce que nous avons créé jusqu’à présent sera repris par des tiers à travers le monde. [sports] Industrie”, a déclaré Woods. “Nous constatons maintenant un peu plus de prise de conscience du passage à un modèle numérique, mais c’est au coup par coup. Nous sommes en mesure d’offrir ces services au reste de l’industrie et Databricks en est un élément clé.”

En attendant, l’équipe centrale des données de la ligue rencontre les clubs environ toutes les deux semaines pour obtenir des commentaires sur les données qu’elle fournit aux clubs et travaille à l’ajout de nouveaux outils pour analyser le jeu. Selon Zambrano López, LaLiga expérimente des outils Databricks comme MLflow et Delta Lake.

“Nous explorons toujours de nouvelles choses à faire avec les databricks”, a-t-il déclaré.

Leave a Comment