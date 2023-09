Une institution. Des siècles d’histoire. Les courses hippiques, autrefois objets de discordes royales, portent désormais des enjeux sportifs et financiers.

Créée en 1996, Equidia, nommée France Courses avant son rachat par le PMU en 1999, est une chaîne de télévision thématique bien connue des parieurs et des fondus de chevaux. La chaîne diffusée sur le satellite, par les opérateurs télécoms et sur le Web appartient dorénavant à France Galop, LeTrot (SEFT) – les deux principaux organisateurs de courses hippiques en France –, et en minorité à l’opérateur de paris PMU.

Après avoir diversifié son offre entre 2011 et 2017 avec la création des chaînes Equidia Live (consacrée aux courses) et Equidia Life (dédiée à la pratique équestre), la direction s’est recentrée sur la course hippique avant de lancer une offre multicanal en 2019.

C’est dans ce contexte que David Deschamps a pris la tête de l’équipe digitale d’Equidia en tant que directeur technique. Elle comprend cinq personnes en interne, dont le CTO et un Data scientist.

« Cette équipe a été créée il y a deux ans pour répondre aux problématiques liées à la diffusion de flux vidéo sur Internet », relate le CTO. « Nous diffusons dix heures de direct par jour, tous les jours de l’année », renseigne-t-il.

Soumise aux aléas météo et aux potentiels incidents, Equidia diffuse tout de même 12 000 courses par an.

La chaîne principale agrège les flux vidéo en provenance de plusieurs hippodromes, tandis que le site Web permet de visionner le direct et les replays des courses par hippodrome à travers l’onglet Equidia Régions.

« Il y a six ans, Equidia a commencé la diffusion de courses en streaming sur le Web », informe David Deschamps. « L’entreprise a créé des chaînes spécifiques à chaque hippodrome. Si un parieur expert souhaite visionner une seule réunion, il peut le faire ».

Depuis deux ans, certains petits hippodromes diffusent des flux vidéo afin d’élargir l’audience des parieurs.

Une gestion complexe des flux vidéo Outre la gestion de ces flux de plus en plus nombreux, l’équipe digitale d’Equidia souhaite affiner la gestion des données de course. « C’est quelque chose qui est effectué à petite échelle sur la chaîne principale, mais que l’on peut étendre grâce au Web ». En effet, l’équipe digitale doit se plier aux règles imposées par l’ARCOM (ex CSA). Le flux diffusé sur la chaîne principale et son habillage – l’ensemble des données de courses et de pronostics affichés – doivent être les mêmes pour tous les téléspectateurs. « Nous ne pouvons pas faire ce que nous voulons sur les flux et nous ne sommes pas les propriétaires des droits d’image : elles appartiennent aux sociétés mères [LeTrot, France Galop, N.D.L.R] », rappelle le CTO. Techniquement, sur le Web, Equidia pourrait habiller les flux vidéo en fonction des préférences des utilisateurs, mais « nous n’avons pas le droit de le faire d’un point de vue légal », note David Deschamps. Il est toutefois possible d’accompagner les parieurs dans la préparation du pari, le suivi de la course et l’obtention des résultats. Si Equidia.fr fournissait depuis un bon moment des articles sur les pronostics et les résultats, des rediffusions, ainsi que des entretiens avec les entraîneurs, les jockeys et les drivers, l’information était jusqu’alors dispersée. Sur la page d’accueil du site Web, David Deschamps et son équipe ont décidé de recentrer l’expérience autour du lecteur vidéo. « Nous déléguons la plupart de nos développements dits “faciles”, comme le maintien du site Web, mais nous conservons en interne les projets Big Data, analytiques, IA et l’évolution de l’UX », résume David Deschamps. Hormis les éléments présents sur la page, la cote, les pronostics et les interviews filmés le jour même sont à retrouver dans l’onglet mode expert, tandis qu’un mode mosaïque permet d’afficher jusqu’à quatre flux simultanément. « Comme nous ne pouvons pas habiller les flux différemment, nous avons commencé par découper toutes les séquences afin de pouvoir mettre des timelines et revenir en arrière. Cela permet de visionner les interviews du jockey avant une course, de consulter les enquêtes ou les pronostics ». La disponibilité des enquêtes en VOD est importante pour les parieurs : un cheval vainqueur lors d’une journée de course peut avoir été disqualifié. Par exemple, les courses au trot sont très codifiées et les écarts d’allure particulièrement surveillés. Equidia propose par ailleurs des analyses post-course. Si l’architecture de diffusion repose principalement sur les infrastructures d’un « partenaire externe » dont David Deschamps tait le nom, le site Web et une partie des traitements adjacents sont hébergés sur AWS. « Au cours des trois dernières années, nous avons migré une grande partie de notre SI vers AWS. Nous avons pris la décision d’adopter un maximum de services serverless. Nous ne voulions pas gérer les pics de trafic », déclare David Deschamps. En outre, le trafic est partagé entre les pages vues et les lecteurs embarqués sur le site Web avant d’appeler les flux diffusés par l’hébergeur. « Si notre site ne répond pas, les flux ne sont pas redistribués. Nous sommes obligés de répondre », affirme David Deschamps. « Il y a une course phare par jour. Une course dure trois minutes, mais peu de gens se connectent quinze minutes avant le début de l’épreuve. Généralement, ils le font quelques minutes avant », indique-t-il. Equidia doit également répondre aux exigences des parieurs et des opérateurs de paris agréés, à savoir PMU, Betclic, genybet, France-pari, Unibet et Zeturf. « La prise de paris est ouverte jusqu’au départ de la course. Sur le Web, nous avons entre 6 et 8 secondes de latence entre le départ et la diffusion, ce que nous tentons d’optimiser ». L’une des pistes étudiées consiste à changer de technologie d’encodage vidéo pour les adapter au mieux aux différents flux. De la bonne gestion des coûts d’infrastructure Pour l’instant, Equidia n’a pas décidé de basculer la gestion de ses flux vidéo sur AWS Media Live. « Nous avons effectué des tests, mais il y a une problématique de coût. Aujourd’hui, l’infrastructure en place nous coûte beaucoup moins cher que de passer sur AWS », relate le CTO. « Nous avons énormément de flux, mais pas un très gros trafic en proportion : cela ne permet pas d’obtenir une économie d’échelle en migrant vers le cloud », précise-t-il. Cela ne veut pas dire qu’Equidia n’est pas intéressé par l’offre Media d’AWS. Certains hippodromes diffusent une à deux réunions par an. « Au lieu d’équiper les hippodromes en fibre et en caméras, nous étudions la possibilité d’utiliser des AWS Elemental Link, des appareils d’encodage vidéo associés à des bulles de réseaux privés quand le contenu n’est diffusé que sur les plateformes digitales ».

Un découpage de séquences semi-automatique propulsé par AWS Rekognition L’équipe a d’autres enjeux liés aux rediffusions. Par exemple, les éléments disponibles en replay « quasi immédiats » réclament par un montage manuel, mais le CTO met en place des processus pour en automatiser une partie. Le procédé revient à traiter 42 000 images par jour. Pour éviter les effets de latence liés au CDN, l’équipe digitale a préféré utiliser une machine en régie équipée d’une carte d’acquisition embarquant elle-même un algorithme qui effectue un prétraitement. Equidia utilise tout particulièrement Tesseract, un algorithme d’OCR écrit en Python permettant de sélectionner les images. « Tesseract indique l’endroit où il faut chercher une information dans une image. Nous avons essayé de l’entraîner, mais il y avait trop d’erreurs pour que ce soit fiable au moment de reconnaître des numérotations », relate-t-il. Ces numérotations sont utilisées pour identifier un cheval. « Le premier traitement que nous effectuons consiste à saturer les couleurs et à passer l’image en noir et blanc pour que le chiffre en blanc soit identifiable », détaille David Deschamps. Environ 1 000 images sont d’abord stockées sur S3 puis envoyées vers AWS Rekognition à l’aide d’une fonction Lambda. Il s’agit d’identifier les interviews et les chevaux concernés. Ces images servent également de vignette pour retrouver une émission ou un entretien dans le flux du replay. Ces détections sont effectuées en temps réel, puis le découpage du flux est proposé quelques minutes après la fin d’une émission ou d’un interview. Les détections sont listées à des fins de supervision et d’archivage, en complément des huit heures de direct consacrées à une réunion. Par exemple, l’équipe digitale découpe l’émission Ticket gagnant. Durant celle-ci, deux présentateurs et un parieur détaillent leurs pronostics pour chaque cheval susceptible de faire partie du Quinté. « Plutôt que d’analyser une image toutes les secondes, nous avons établi des mosaïques pour trouver l’identifiant des chevaux à partir de 20 frames. Cela permet de réaliser des économies d’échelle ». Si le responsable loue la puissance de l’outil de reconnaissance d’images AWS Rekognition, il considère qu’il est trop cher pour ses besoins. D’où le recours à Tesseract en régie. « Nous effectuons ces traitements 365 jours par an et AWS Rekognition coûte environ 70 dollars par jour par flux », précise-t-il. « Ma problématique, c’est que tout ce que nous faisons ne génère pas de ROI direct : nous ne faisons pas de la prise de pari, nous n’avons pas de clients ».

La data science au service des pronostics L’autre volet important pour l’équipe digitale concerne le traitement de données des courses hippiques. Elle a mis en place un produit statistique permettant de comparer les performances des chevaux et de leurs cavaliers. À partir de sept critères, des scripts Python produisent des notes de confiance (de 0 à 20) attribuées aux participants avant le départ d’une course. « Nous sommes en train de tester des algorithmes développés à l’aide de SageMaker pour élargir le dispositif. La première version a été développée en collaboration avec la rédaction d’Equidia », avance David Deschamps. Cette note présentée sous la forme d’un diagramme de Kiviat (la fameuse toile d’araignée) permet d’évaluer le score d’un cheval et de son jockey sur « des critères objectifs ». Présenté en décembre dernier, le dispositif prend en compte les pronostics, les précédents chronomètres ou l’état du terrain, les aptitudes du cheval (quels types de fer portent-ils s’il en porte, comment performe-t-il suivant sa position à la corde ?), les bruits d’écurie (les entretiens menés par les journalistes d’Equidia), la forme du cheval, les conditions et le tandem cheval-driver. Les critères les plus objectifs – ceux liés aux réussites passées du cheval – comptent davantage dans la note. Pour l’instant, les notes des différents participants d’une course sont présentées sous la forme d’un carnet afin d’évaluer les chances de victoire d’un tandem.

Enia, « l'intelligence artificielle » pour commenter les notes attribuées aux chevaux Au lancement du projet, ces notes étaient commentées par les journalistes, mais ceux-ci avaient tendance à douter des critères objectifs. « Il ne s'agit pas de comparer les humains et la machine », souligne David Deschamps. Le carnet de notes est désormais présenté sur YouTube par une « intelligence artificielle », Enia. « Cet avatar commente les notes en s'appuyant sur des phrases préconstruites qui sont réarrangées », explique le CTO. « Ces vidéos sont parmi les plus vues de notre chaîne YouTube. Ça aide beaucoup les parieurs qui n'ont pas le temps de faire toutes les combinatoires de statistiques possibles ». Le recours à des algorithmes développés à l'aide de SageMaker permettrait de prédire la grille d'arrivée des cinq premiers, un exercice compliqué. « Ce n'est pas le cheval le plus rapide qui gagne : il y a différentes stratégies au sein des pelotons, la forme du cheval compte, les conditions également », indique le CTO. Cet exercice ne plait pas forcément aux institutions qui organisent les courses et les paris. « Leur avis est mitigé : il y a la peur que cela fausse le jeu et des experts le font déjà en partie manuellement ». L'équipe digitale exploite aussi des modèles de vision par ordinateur pour analyser la forme des chevaux à partir des entraînements filmés le matin. « Un cheval qui fait une faute au trot ou au galop se repère assez facilement avec un modèle de computer vision », note le CTO. « Un cheval qui a l'air stressé, qui donne des coups de tête, qui mord, les humains peuvent le repérer, donc nous pensons que la machine peut le faire ». L'étape suivante est d'afficher sur le flux vidéo un marqueur au-dessus des chevaux pendant la course en direct. « Nous travaillons avec des sociétés dont les infrastructures sont également sur AWS. C'est très compliqué : cela dépend beaucoup de la météo et des angles de caméra ».