Comment Canal+ diffuse et supervise les grands matchs à l’international

Le groupe multimédia aux 400 millions d’utilisateurs a mis en place une infrastructure Edge afin d’optimiser la diffusion des événements sportifs en dehors de la Métropole. Son directeur des technologies explique comment il supervise ce dispositif d’envergure.

Un milliard d’euros de budget IT par an. C’est le deuxième pôle d’investissement du groupe Canal+ après les contenus (sport, cinéma, séries). Pas moins de 5 000 personnes animent les activités technologiques.

« Nous travaillons sur différents modèles de diffusion : TNT, satellite à travers une dizaine de positions orbitales, en OTT [les applications des smart TV et des box des fournisseurs, N.D.L.R.] et en IPTV », déclare Stéphane Baumier, directeur des technologies et des systèmes d’information chez Canal+.

La société de Vincent Bolloré diffuse 2 000 chaînes de TV linéaires dans le monde et en édite plus de 200. Canal+ opère dans 52 pays en Europe, en Afrique, en Asie Pacifique et en Amérique. Aussi, il agrège les contenus de Netflix, d’Apple TV, de Max (Warner Group), de Dailymotion (Canal+), BeIN Sports, Paramount et Eurosport.

Ajoutons le fait que Canal+ vient de prendre le contrôle de MultiChoice, une multinationale sud-africaine leader de la TV payante en Afrique subsaharienne. Avant cette OPA, Canal + gérait déjà 15 000 serveurs et 17 000 machines clientes.

« Cela vous donne une idée du nombre d’événements que nous devons collecter et observer », commente Stéphane Baumier.

Projet Cortex : l’Edge computing au service de la qualité de la diffusion des événements sportifs

D’autant que la société opère une partie des contenus en « glass-to-glass ».

« Nous sommes capables d’effectuer une captation dans un stade, un circuit de Formule 1 et de l’emmener jusqu’à l’appareil de l’utilisateur », traduit le CTO.

L’entreprise gère ainsi deux chaînes « lives » en 24x7 (4K HDR) auxquelles s’ajoutent plus de 50 000 heures de direct par an, toutes chaînes confondues.

Canal+ a fait sa renommée sur le sport. Or, les événements sportifs posent des défis techniques d’envergure à un groupe international.

Pour la diffusion des matchs de football en streaming, l’équipe Tech de Canal + a mis en place le projet Cortex.

« Quand nous diffusons un match de la Ligue des champions, nous le faisons en France, mais aussi en Nouvelle-Calédonie, aux Antilles, en Côte d’Ivoire et un peu partout dans le monde », justifie Stéphane Baumier.

Auparavant, les usagers en dehors de la métropole subissaient des problèmes de latence et de qualité. Surtout, cela représentait un coût économique important pour les opérateurs locaux. Ils devaient récupérer le flux vidéo sur Internet, depuis Paris, autant de fois qu’il y avait de téléspectateurs près d’eux. « Le projet Cortex consiste en la transformation de ces flux multiples en un seul qui est directement envoyé à chaque FAI », explique Stéphane Baumier. « Nous l’envoyons vers des serveurs Cortex que nous installons chez ces opérateurs ».

C’est à partir de ce flux unique que les FAI locaux peuvent servir le contenu aux internautes dans une qualité optimisée. Aussi, ce mode de diffusion ne consomme pas autant de bande passante que les opérations multiflux.

Pour ce faire, Canal + a déployé une centaine de serveurs Edge. « Nous devons bien évidemment superviser ces serveurs répartis partout dans le monde », ajoute le directeur des technologies.

Observabilité : le rôle de la « War Room » les jours de match

C’est d’autant plus important pendant une compétition telle que la Ligue des champions de l’UEFA. Comme pour la plupart des diffuseurs d’événements sportifs, Canal + doit faire face au phénomène de salle d’attente. Les internautes se connectent simultanément vingt minutes avant la rencontre. Cela crée un « mur de connexion » qu’il faut surpasser sans que les serveurs flanchent.

Il n’est pas possible de mettre en place une file d’attente. Et si cela ne fonctionne pas, les téléspectateurs « zappent et reviennent », ce qui provoque un « effet boule de neige ».

« Un jour de match, nous mettons en place une “War Room” : 20 à 40 ingénieurs supervisent un ensemble de services, d’équipements et de processus », relate Stéphane Baumier.

Et de prendre l’exemple de la demi-finale retour PSG/Arsenal FC du 7 mai 2025. Un match record en matière de diffusion pour la chaîne. Les équipes techniques ont dû gérer 3 millions de connexions simultanées, 70 000 abonnés par minute et 600 000 requêtes de streaming par seconde. « C’est comme si l’on remplissait un Stade de France par minute », illustre le CTO.

Et le tout en devant maintenir la qualité d’image attendue (4K HDR).

L’équipe Tech de Canal+ a adopté Datadog au cours de la transformation de certains de ses SI sur AWS. Le groupe était déjà client de Logmatic, une société française rachetée par Datadog en 2017. Il utilisait également Elasticsearch et Graylog. Avant cela encore, le monitoring était souvent manuel.

« Pour les plus anciens comme moi, lorsqu’il y avait une erreur, nous allions voir dans la base de données à quoi elle correspondait. De l’erreur, nous trouvions le service. Du service, nous retrouvions le serveur, puis nous nous y connections pour aller consulter les logs », se rappelle l’ancien administrateur des bases de données de Canal+ Caraïbes.

Dans Datadog, les pics de trafic sont représentés visuellement. « En cliquant sur ce pic, automatiquement les logs apparaissent », ajoute-t-il.

Ce ne sont pas des logs natifs. Les équipes de Canal+ utilisent un parser Grok (une syntaxe inventée à l’origine par Elastic pour logstash) afin d’en simplifier la lecture et de retrouver les informations essentielles. « Malgré tout, nous savons instantanément ce qu’il se passe ».

Toutes les erreurs ne sont pas visibles par les usagers. Ces couacs silencieux « permettent d’anticiper les futurs problèmes », selon le CTO.

« Cela nous permet de savoir s’il faut augmenter la capacité de nos machines, “fine-tuner” la bande passante ou prévenir les FAI que l’infrastructure commence à être juste. »
Stéphane BaumierDirecteur des technologies et des systèmes d’information, Canal+

« Malheureusement, comme les erreurs se répètent, nous définissons des seuils et des déclencheurs afin de l’attribuer directement aux personnes concernées », poursuit-il. Les ingénieurs utilisent pour cela les Monitors de Datadog. Ces éléments doivent, selon l’éditeur, permettre une « détection proactive et une réponse en temps réel aux problèmes de performance et d’interruption de service ». Ici, le système s’appuie sur l’identification des patterns d’erreurs connus.

Voilà pour les usages depuis la « War Room ». Mais la plateforme d’observabilité est également mise à contribution le lendemain d’un match. Et cela concerne directement le projet Cortex.

Il s’agit d’étudier le comportement des appareils, des serveurs, des machines clientes et de celles installées chez les FAI. « Cela nous permet de savoir s’il faut augmenter la capacité de nos machines, “fine-tuner” la bande passante ou prévenir les FAI que l’infrastructure commence à être juste », décrit Stéphane Baumier.

C’est cette approche de la supervision qui a permis de constater la pertinence du projet Cortex. Le temps de réponse moyen tombe de 376 à 338 millisecondes quand le flux vidéo n’est pas mis en cache. Une fois que cela est fait, les serveurs Edge permettent de faire chuter la latence à 82 ms au lieu de 272 ms.

La supervision de l’IA et l’IA pour la supervision

L’avenir ? La plateforme de Datadog aura potentiellement son rôle à jouer dans la supervision des agents IA, anticipe Stéphane Baumier.

« Nous allons déployer des dizaines, voire des centaines d’agents IA pour monter et diffuser des contenus sur les réseaux sociaux, pour assister nos commerciaux, etc. », expose-t-il. « Nous avons besoin de savoir exactement ce que ces agents font, s’il y a des problèmes. Pour cela, nous allons essayer Datadog ».

La suite d’observabilité pourrait également être mise à contribution afin d’évaluer les grands modèles de langage disponibles sur le marché. « Cela nous permettrait de choisir le meilleur LLM pour le bon processus ».

Enfin, les outils d’IA et d’analytique de Datadog, censés faciliter la recherche de logs sources d’un incident, sont en cours de déploiement.

Propos recueillis lors du Datadog Summit Paris, le 30 septembre 2025.

Pour approfondir sur Administration de systèmes