Machine Learning : du rugby à la Formule 1

Six nouveaux « F1 Insights » arrivent à partir de juillet pour les spectateurs de Grands Prix. AWS profite de cette collaboration avec la Formule 1 pour appliquer ses outils prédictifs, comme il l’a fait avec le Tournoi des VI Nations en début d’année.

En début d’année, AWS avait musclé les statistiques qu’il fournit aux organisateurs du Tournoi des VI Nations en ajoutant des prévisions (probabilité de réussir une pénalité, etc.) et des analyses plus poussées (zone des rucks, etc.) aux indicateurs classiques (occupation du terrain, poids des packs, etc.) auquel le rugby était habitué.

Le géant de l’IT va faire de même dans la Formule 1.

Partenaire depuis deux ans de Formula One Group (l’organisateur du Championnat du monde de F1), AWS promet six nouvelles statistiques, en temps réel, pour analyser les courses de la saison 2020.

Une problématique de visualisation de données

Le premier de ces nouveaux indicateurs sera communiqué aux spectateurs dès le Grand Prix d’Autriche, qui se déroulera du 3 au 5 juillet 2020. Il s’agira d’une synthèse d’éléments sur chaque voiture, des « Car Performance Scores », pour « isoler les performances de chaque Formule 1 en course et permettra aux fans de les comparer », explique AWS.

Un des problèmes bien connus de l’analytique en entreprise est d’arriver à présenter de manière lisible et compréhensible les résultats de la Data Science, des analyses avancées qui passent souvent par des cheminements complexes et qui creusent dans des jeux de données pléthoriques.

La Formule 1 ne fait pas exception et AWS souligne le travail qu’il a dû effectuer sur cette présentation – de la Data Visualisation en quelque sorte – pour rendre ces statistiques intelligibles et claires aux téléspectateurs. Pour y arriver sans trop perdre de complexité en cours de route, ASW a fait le choix de découper son score en quatre sous-scores.

Indicateurs de performance du Formule 1
Indicateurs d'AWS qui synthétisent la performance d'une Formule 1 en virage et en ligne droite
Des monoplaces qui génèrent 1,1 million de données par seconde.

« Le “Car Performance Scores” s’affichera sous la forme d’une représentation qui donnera aux fans une ventilation complète des performances globales d’une voiture en la résumant par quatre données clefs : la performance dans les virages lents, dans les virages rapides, en ligne droite et la maniabilité de la voiture ».

Sous le capot, AWS remontera en temps réel les données de chaque voiture. Les Formules 1 sont chacune équipées de 300 capteurs et génèrent plus d’un million de données. Par seconde.

Comparaison de la performance globale de deux voitures concurrentes
Comparaison de la performance globale de deux voitures concurrentes

« La Formule 1 est un sport “data-driven” par excellence [N.D.R. : où la donnée est centrale] ; une grande partie de l’émotion vient de la capacité à extraire des informations passionnantes depuis les données brutes de performance », vante AWS qui entend faire la promotion de ses outils maisons de collecte (Kinesis), de stockage (S3) et d’analyse de données (dont SageMaker pour le Machine Learning – lire ci-après) en étant capable de proposer plus d’indicateurs – et donc plus « d’émotions ».

Focus sur la performance de la voiture de Lewis Hamilton dans les virages lents
Focus sur la performance de la voiture de Lewis Hamilton dans les virages lents

Machine Learning sur les machines

AWS avait déjà proposé six nouveaux indicateurs « avancés » : vitesse de sortie des virages (Exit Speed), prévision des arrêts aux stands en course par écurie (Predicted Pit Stop Strategy), évaluation des fenêtres de ravitaillement (Pit Window), prévision sur les duels entre pilotes en course (Battle Forecast) et dans leurs stratégies d’arrêts au stand (Pit Strategy Battle), et synthèse en temps réel des performances des pneus (Tyre Performance).

Prévision sur les passages aux stands de deux Formules 1
Prévisions à base de Machine Learning sur les temps d'arrêt aux stands de deux concurrents avec la probabilité du suiveur de repartir en tête

Plusieurs de ces indicateurs exploitent des algorithmes prédictifs de Machine Learning, exactement sur la même logique que ce qu’AWS a commencé à faire dans le rugby en début d’année, en suscitant quelques sarcasmes immérités de la part des commentateurs de France Télévision.

Prévision sur un prochain duel sur la piste
Prévision sur un prochain duel sur la piste avec le moment attendu de la jonction et le degré de difficulté de dépassement pour le poursuivant

Six nouveaux indicateurs « F1 Insights powered by AWS » s’y ajouteront d’ici décembre.

En plus du Car Performance Score, AWS sortira début août « Ultimate Driver Speed Comparison » pour comparer les pilotes actuels aux grands noms de l’histoire automobile depuis 1983, comme Alain Prost ou Ayrton Senna, pour déterminer « le plus rapide de tous les temps » (sic).

« Notre analyse de l'aérodynamique en course est même en train d'influencer la conception des voitures pour la saison 2022. »
Mike ClayvilleAWS

Au Grand Prix de Belgique arrivera « High-Speed/Low-Speed Corner Performance » pour mieux voir comment chaque pilote aborde les virages les plus rapides (plus de 175 km/h) et les plus lents (moins de 125 km/h) par rapport à ses concurrents.

À la rentrée, trois autres indicateurs suivront. Le Driver Skills Rating calculera pour chaque pilote des sous-catégories de performances – en compilant les données des tours de qualification, les départs, les vitesses en course, la gestion des pneus et les styles de dépassement/défense – pour établir un classement général parallèle des pilotes en fonction de leurs compétences (et non de leurs résultats).

Le « Car/Team Development & Overall Season Performance » synthétisera quant à lui la progression de chaque écurie et de ses différentes voitures. Enfin, « Qualifying and Race Pace Predictions » compilera les données des essais et des qualifications pour prédire quelle équipe est la mieux placée pour remporter la course du dimanche. « Ces prédictions ajouteront encore plus d’intérêt et une ambiance supplémentaire aux séances de qualification du samedi », se félicite AWS.

70 ans de données compilées

Pour synthétiser ces nouveaux indicateurs, les Data Scientists de la fédération (FIA) et d’AWS vont s’appuyer sur un historique de soixante-dix années de données, qu’ils combineront avec celles remontées en temps réel pendant la course depuis les capteurs IoT des voitures et des paddocks.

Modélisation de deux stratégies d’arrêts aux stands
Modélisation de deux stratégies d’arrêts aux stands avec un choix de pneus différents pour un concurrent en course

Ces statistiques et ces modélisations seront diffusées en direct à la télévision et sur la plateforme F1.tv. « Elles aideront les fans à encore mieux comprendre les décisions prises en une fraction de seconde par les pilotes ou leurs changements de stratégies en course », vante Mike Clayville, Vice President Worldwide Commercial Sales chez AWS qui se félicite de cette co-opération qu’il qualifie de fructueuse. « Notre analyse de l’aérodynamique en course est même en train d’influencer la conception des voitures pour la saison 2022 », lance-t-il.

La donnée, moteur narratif de la course

« Cette année, nous sommes ravis d’aller encore plus loin dans la puissance de l’analyse et de tirer de nouvelles connaissances des données de la F1 qui aideront les fans à mieux comprendre la richesse et la complexité de ce sport », continue-t-il.

Synthèse visuelle des performances des pneus de deux concurrents
Synthèse visuelle des performances des pneus de Lewis Hamilton comparées à celles de Max Verstappen

Il est vrai que pour certains observateurs, des monoplaces plus puissantes, mais avec moins de dépassements en courses et moins de rivalités entre de très fortes personnalités hors courses ont fait de la Formule 1 un spectacle moins attractif, forcé à se réinventer (même si les audiences témoignent d’un intérêt très fort pour ce sport). La donnée et le machine learning (avec l’analytique prédictif) ont, semble-t-il, réussi à insuffler une nouvelle tension narrative et à participer à son renouveau.

« Les données racontent des histoires qui jusqu'ici ne sortaient pas des paddocks. »
Rob SmedleyChief Engineer Formula 1

« Les éclairages que nous proposons ensemble (avec les F1 Insights powered by AWS) rapprochent les fans de la piste comme jamais auparavant », ne s’y trompe d’ailleurs pas Rob Smedley, ancien ingénieur chez Ferrari et responsable de la performance chez Williams, aujourd’hui Chief Engineer (conseiller technique pour la Formula 1).

« [Ces Insights] racontent les histoires et dévoilent les réflexions qui jusqu’ici ne sortaient pas des murs des paddocks des écuries […] Ils montrent aussi avec plus de finesse comment les nombreuses interactions entre les pilotes et leurs équipes – et la manière dont ils travaillent ensemble – conditionnent leurs succès ».

En résumé : un exemple parfait de l’importance d’un bon Data Storytelling.

Pour approfondir sur Big Data et Data lake

Close