Monitoring : comment FM Logistic a fiabilisé ses activités

L’entreprise de transport de marchandises veut doter ses clients d’applications toujours plus intelligentes pour le suivi des produits. Mais encore fallait-il pouvoir monitorer le fonctionnement de ces applications elles-mêmes.

Comment s’assurer que les systèmes qui remontent en temps réel la position d’une marchandise fonctionnent en permanence ? Telle est la problématique qui s’est posée à FM Logistic, une entreprise qui assure le transport de marchandises entre les entrepôts des marques et les derniers de relais de distribution dans quatorze pays d’Europe, d’Asie et d’Amérique latine. Pour la résoudre, FM Logistic a fait le choix de s’équiper du logiciel de supervision Centreon. Celui-ci prévient immédiatement les équipes de maintenance en cas de panne, où qu’elle arrive dans le système d’information, et rend possible une intervention dans les plus brefs délais pour remettre les systèmes en opération.

« L’avènement du e-commerce, le commerce omnicanal et les exigences croissantes en matière de développement durable ont transformé le métier de la logistique », raconte Olivier Hamel, responsable de l’architecture technique, du support et de la production pour les 183 sites du groupe.

« Ce qui a changé, c’est la notion de traçabilité et de temps réel qui repose sur la disponibilité de la donnée et notre capacité à lui donner de la valeur. Nous devons être en mesure de fournir à nos clients la bonne donnée au bon moment, afin qu’ils l’intègrent à leur SI et qu’ils la partagent avec leurs clients finaux. En clair, l’IT fait à présent partie intégrante de notre offre de services. 

L’enjeu d’apporter des services de suivi qui fonctionnent

En 2021, FM Logistic s’est lancé dans un vaste plan stratégique qui doit lui permettre de devenir le champion de la « supply chain durable ». Ce plan stratégique passe par de nombreuses modernisations : automatisation, robotisation, entrepôts urbains plus écologiques, véhicules électriques. Ces équipements sont tous susceptibles de produire des données en temps réel et pas uniquement en ce qui concerne la géolocalisation : elles peuvent servir à prouver la conformité réglementaire, à tracer la fraîcheur d’un produit, etc.

L’idée de FM Logistic est de collecter ces données pour les traiter avec des applications d’IA afin d’apporter divers renseignements aux clients. Mais ce déploiement applicatif n’est qu’une partie de l’enjeu.

« Avant même de savoir produire des informations en temps réel pour nos clients, il nous fallait déjà garantir le bon fonctionnement du SI qui traite ces données et être en mesure de connaître la disponibilité des applications pour nos clients de sorte à leur proposer une bonne expérience utilisateur », ajoute Olivier Hamel pour expliquer combien un monitoring du SI devenait dès lors critique.

En l’occurrence, le SI à surveiller se compose de 3000 ressources informatiques réparties sur 150 sites. Elles vont des machines virtuelles qui exécutent les applications – de collecte et traitement des données métiers – aux baies de disques – pour les stocker – en passant par toute une succession de switches et de routeurs réseau, notamment ceux qui interconnectent les sites.

Parmi les applications dont le fonctionnement doit être surveillé, on trouve notamment celles qui gèrent les entrepôts et les transports, particulièrement critiques pour la performance globale de FM Logistic.

Centreon pour sa simplicité

Les réflexions sur cette modernisation de l’activité commencent dès les années 2016-2017 et la question d’un outil de monitoring du SI se pose d’emblée.

« Nous avons toujours utilisé des outils de supervision. À cette date, nous venions d’acheter une solution leader sur le marché, mais qui était compliquée à mettre en œuvre. Il s’agissait d’un conglomérat d’outils compliqués à assembler, avec des interfaces différentes pour les parties systèmes et réseaux. Avec la modernisation de notre SI, notamment en passant par des ressources en cloud, façonner des vues orientées business était devenu impossible. »

En 2018, Olivier Hamel et son équipe testent des solutions alternatives plus simples, c’est-à-dire qui ne demandent pas qu’on installe un agent d’observation sur chacune des ressources à monitorer. Les solutions SaaS, vendues pour savoir gérer nativement les ressources en cloud, sont rapidement écartées, car elles sont en vérité assez compliquées à personnaliser. Au bout de trois mois d’essais, c’est finalement la solution de Centreon qui est retenue.

« L’avantage de Centreon est sa simplicité. Il s’agit juste de rédiger un fichier texte avec les IP ou les noms des machines que l’on souhaite monitorer, d’importer cette liste dans Centreon, de définir les métriques optimales et, ensuite, tout se fait tout seul. Centreon envoie des requêtes SNMP à toutes les machines du réseau, ou des scripts aux applications et bases de données. Il les envoie avec des intervalles dont nous définissons la fréquence, car des dispositifs ont par exemple besoin d’être interrogés toutes les 5 minutes et d’autres non », témoigne notre interlocuteur.

Consolider différentes alertes techniques en une seule vue métier

La mise en place de la solution prend moins de quatre mois. La seule difficulté consiste à rédiger la liste des ressources et des règles de monitoring. Outre les ordres SNMP, simples, il s’agit par exemple d’écrire les scripts qui interrogent des bases de données, ou qui intègrent les métriques produites en cloud Le logiciel Centreon en lui-même est installé sur trois serveurs au siège de FM Logistic, desquels partent toutes les requêtes pour obtenir des métriques.

Ces serveurs étant susceptibles d’interroger des sites situés dans des régions plus ou moins éloignées, ils sont secondés par des « pullers », à savoir des instances déportées de Centreon qui font office de nœuds de collecte. Un nœud de collecte suffit par grande région géographique. « Le puller permet d’avoir une souplesse, un équilibrage dans le flot des requêtes. Il est important que l’architecture de monitoring soit élastique », précise Olivier Hamel.

Mais le plus important reste la visualisation de métriques dans un contexte métier, une fonction exécutée par le module BAM de Centreon (Business Activity Monitoring).

« BAM sert à consolider différentes alertes en une seule vue qui permet de comprendre si un service fonctionne ou non. Le design de ces vues est réalisé métier par métier afin de connaître le niveau d’impact d’un incident sur un service. Ce design peut être très long à faire, car il faut définir ce qui est critique et ce qui ne l’est pas, il faut modéliser la manière dont les services fonctionnent. Mais au bout du compte, les métriques remontées dans ces vues nous servent à réparer plus efficacement, ainsi qu’à améliorer l’existant. »

À date, l’équipe d’Olivier Hamel a réalisé 180 vues, dont certaines sont imbriquées dans d’autres. « Notre but est d’avoir dix grandes vues, une par application critique (entrepôt, transport...) et de les subdiviser en vues techniques, concernant plus particulièrement la connectivité réseau ou le fonctionnement des serveurs. »

Des décisions prises trois fois plus rapidement

Depuis la mise en place de Centreon, FM Logistic a renforcé son pôle monitoring. « Avant, deux personnes de chez nous surveillaient nos infrastructures de 7h00 à 19h00. Mais comme nous souhaitons à présent une surveillance en 24/7, nous passons par un prestataire externe qui trie pour nous les faux positifs remontés par Centreon nous écrit via notre système de ticketing quand une alerte mérite notre attention. À ce moment-là, nous regardons l’indicent au travers des vues que nous avons dessinées. »

Dans 95% des cas, les pannes sont évidentes, il s’agit typiquement d’une absence de courant électrique. Mais dans les autres cas, cette supervision permet d’élaborer un diagnostic précis a posteriori. « La vue nous aide à identifier les comportements anormaux des éléments, d’investiguer sur celui qui est à la source d’un problème. »

Olivier Hamel n’attend pas de recevoir des alertes pour consulter les vues dans Centreon. « Je les regarde aussi pour obtenir rapidement des métriques métier, des graphes quand j’ai une question sur nos infrastructures. Cela me permet d’aller plus vite dans mes décisions d’achat, par exemple. J’estime pouvoir mener des réflexions trois fois plus rapidement qu’à l’époque où nous n’avions pas ces vues. »

Il se souvient d’anecdotes lors desquelles Centreon lui a aussi servi à faire de la maintenance préventive : « nous avions un jour constaté sur Centreon un fonctionnement anormal au niveau des logs d’Oracle. La vue nous a permis d’approfondir la recherche de la cause et nous avons découvert un bug applicatif. Si nous ne l’avions pas identifié à ce moment-là, nous aurions eu une panne. »

« Avant, nous pouvions arriver le lundi matin et constater qu’une panne avait eu lieu durant le week-end. Depuis que nous avons déployé Centreon, cela n’est plus jamais arrivé », conclut-il.

Pour approfondir sur Continuité d’activité, Sécurité physique

Close