De la « Data » à l’IA industrielle : une accélération jugée stratégique chez TotalEnergies
Après avoir bâti ses fondamentaux à travers son entité Digital Factory, TotalEnergies engage une phase d’amplification de la gestion de données et de l’IA directement pilotée par la direction du groupe. Mais de nouveaux défis émergent.
Au cours des cinq dernières années, TotalEnergies juge avoir franchi un cap important dans sa transformation numérique. Après une première phase dédiée à la construction des fondamentaux au sein de sa Digital Factory, la compagnie est entrée dans une ère qualifiée d’« amplification stratégique » par son CDO.
Ce changement, impulsé par le plus haut niveau de direction, représente une reconnaissance fondamentale. La gestion de données et l’IA ne sont plus des fonctions de support, mais un moteur central de la transformation métier, souligne Michel Lutz, Chief Data Officer Group, dans un entretien réalisé en 2025.
L’approche résolument « top-down » qui en découle vise à aligner directement les initiatives avec les enjeux les plus critiques de l’entreprise. Elle succède à une logique « bottom-up » où les projets émergeaient du terrain.
Cette nouvelle orientation est structurée autour de six programmes de recherche stratégiques prioritaires. La modernisation des sites industriels (IoT, robotique, drone), la sécurisation des opérations et le soutien des engagements, ainsi que la modélisation des chaînes de valeur de l’entreprise (prédiction de la demande, analyse météo, optimisation de la grille, etc.) revêtent une composante « IA et Data » prépondérante.
Les trois autres programmes ont également besoin de briques numériques de pointe. Ils concernent le « Near Zero Emission Plant » (ingénierie pour des usines à faibles émissions), la « biomasse » et la « capture, le stockage et l’utilisation du carbone », notamment via les « e-fuels » ou « e-molécules ».
Clairement, l’approche initiée en 2025 tranche avec la démarche précédente. Elle vise une transformation profonde des métiers, bien au-delà des améliorations incrémentales. Cette nouvelle ambition repose sur des fondations de plus en plus matures en matière de gestion des données, et industrialisées à l’échelle du groupe.
La gouvernance des données : le socle du passage à l’échelle
La capacité de TotalEnergies à concrétiser ses projets dépend directement de la maturité de sa gouvernance des données. L’entreprise a formalisé et aligné ses pratiques à travers toutes ses branches, créant un socle commun, considéré comme indispensable au passage à l’échelle.
Une gouvernance fédérée est orchestrée par le Data Officer Council. Il réunit les Data Officers de chaque branche et la direction informatique pour définir les standards communs et choisir les outils partagés. Cette structure garantit la cohérence d’ensemble tout en laissant à chaque branche, comme celle pilotée par Philippe Landreau (Marketing & Services), l’autonomie nécessaire pour définir ses priorités opérationnelles.
L’un des changements majeurs est la systématisation de l’approche Data Product. Inspirée de la philosophie du Data Mesh, elle marque une rupture avec une logique de projet pour évoluer vers une exposition de la donnée au service de multiples usages.
Pour accélérer l’exposition de la donnée industrielle, TotalEnergies s’est associé aux éditeurs Cognite et AspenTech. Le groupe a également déployé Collibra comme catalogue de données unifié, avec l’ambition de construire une véritable « marketplace » de données internes.
La ligne adoptée en matière de gestion de données est directement connectée à la performance des IA les plus avancées. Via les « Data Contracts », TotalEnergies enrichit ses produits de données d’un contexte essentiel (métadonnées, traçabilité, sémantique métier).
Ce contexte explicite est crucial pour les grands modèles de langage (LLM). Il permet de réduire significativement les imprécisions et d’améliorer la pertinence des réponses, comme l’a démontré leur utilisation dans le cadre de la collaboration avec Mistral AI, justifie Michel Lutz.
Ces fondations Data soutiennent la stratégie de la compagnie sur l’IA générative, une politique à double détente.
L’IA Générative : une stratégie à double vitesse
Dans une interview accordée en décembre 2023, le géant mondial des énergies faisait de 2024 l’année de l’IA générative et du low-code/no-code. Ses développements dans ces domaines prioritaires se sont poursuivis en 2025 et même accentués, souligne Michel Lutz.
C’est ainsi qu’en matière d’IA générative, TotalEnergies combine démocratisation de masse et innovation de pointe. D’une part, elle vise à donner plus d’autonomie (« empowerment ») à tous les collaborateurs via les fameux outils low-code/no-code.
D’autre part, elle s’appuie sur une approche experte destinée aux chercheurs pour résoudre des cas d’usage industriels complexes qui ne peuvent être adressés par des solutions sur étagère.
Le premier volet s’est traduit par un déploiement massif de Microsoft Copilot (plus de 30 000 licences distribuées, 23 000 collaborateurs formés en octobre 2025). Cette démarche d’accompagnement a été clé dans l’adoption par les salariés, estime Michel Lutz, qui annonce un taux d’adoption de 70 %.
La démocratisation ne repose pas exclusivement sur Copilot. Elle se fonde aussi sur un portail sécurisé, le « LLM Hub ». Il donne accès à une quarantaine de modèles validés, via un chatbot interne développé par TotalEnergies.
La démarche de démocratisation s’étend en outre aux outils low-code/no-code, principalement via la Power Platform de Microsoft et Alteryx pour la « citizen data science ».
L’autonomie des collaborateurs est également rendue possible par la philosophie « Data Product ». En s’appuyant sur des produits de données fiables et documentés, les métiers développent notamment leurs propres agents avec une agilité nouvelle, évitant le chaos d’un self-service non gouverné, considère le CDO.
Par exemple, un agent achat connecté à SAP peut créer et valider les demandes. Un agent de maintenance catégorise 90 % plus rapidement les ordres de travail en respectant la norme ISO 14424.
Le second volet de cette politique GenAI s’incarne notamment dans le partenariat stratégique avec Mistral AI, dont les axes techniques ont été présentés lors de Big Data & AI Paris 2025. Ensemble, TotalEnergies et Mistral ont mis en place un « Innovation Lab ». Il vise à déployer les cas d’usage les plus complexes (IA agentique, fine-tuning, recherche profonde, etc.).
Gérer plus de 10 000 « objets d’IA » en production
Comme dans beaucoup d’entreprises, chez TotalEnergies, l’industrialisation du machine learning et du deep learning, n’a pas attendu l’émergence de l’IA générative. Mais il convient de nuancer les chiffres affichés par le groupe.
Lors de Big Data Paris 2025, TotalEnergies revendiquait plus de 10 000 modèles d’IA en production. Il faudrait plutôt parler de plus de 10 000 « objets d’IA » en service.
Il ne s’agit pas de cas d’usage uniques, mais de déclinaisons d’algorithmes à gérer, comme « un même modèle dupliqué sur plusieurs machines de production ». Cela reste un exercice difficile. Le passage à l’échelle a nécessité une stratégie articulée autour de trois axes.
Le premier axe consiste à structurer l’IA pour mieux accélérer. Les équipes de data science ont créé des patrons (« templates ») de flux de travail MLOps, réutilisables. En s’appuyant sur des squelettes de code et des éléments techniques partagés, qui incluent même une « documentation scientifique » standardisée et gérée directement via le code, les équipes garantissent à la fois vitesse et traçabilité.
Le deuxième axe n’est autre que celui de la gouvernance de l’IA. Elle repose sur deux piliers. L’IA Cockpit, un catalogue interne, assure la traçabilité de tous les modèles en production. En parallèle, l’outil Naaia est utilisé pour garantir la conformité réglementaire, notamment vis-à-vis de l’AI Act européen.
Le troisième axe concerne la performance et la supervision. Pour optimiser la gestion de l’exécution (du « run »), TotalEnergies a développé Scale AI. La plateforme interne centralise le suivi des métriques de performance de tous les modèles (dérives, précision, etc.). Il s’agit là de mutualiser et d’optimiser les processus de maintenance des modèles.
Là encore, l’IA agentique pourrait avoir son rôle à jouer. Michel Lutz évoque la vision d’un agent « AI Ops » qui pourrait interroger et analyser l’ensemble des informations provenant de ces trois axes pour faciliter le diagnostic et la résolution d’incidents. Le concept reste au stade du test pour le moment.
Prochains défis : entre connaissance humaine et intelligence machine
Malgré une nouvelle maturité acquise, de nouveaux défis émergent à la croisée de la technologie, de la science et des compétences humaines.
Michel Lutz évoque la nécessaire refonte de la gestion des connaissances pour l’IA. La contextualisation des données via les métadonnées et les « data contracts » devient un actif stratégique pour améliorer la performance des LLM.
De même, l’un des grands enjeux est d’hybrider les modèles « data-driven » avec la connaissance scientifique (lois de la physique, équations différentielles) pour créer des systèmes décisionnels plus robustes. C’est également la voie prise par Nvidia et AMI Labs, la startup de Yann Le Cun sur le volet de l’IA physique.
Enfin, le MLOps « traditionnel » ne suffit plus. L’industrialisation de l’IA générative soulève des difficultés nouvelles, notamment la mesure objective de la performance et l’importance cruciale des boucles de feed-back utilisateur.
Alors que les modèles de fondation deviennent progressivement des commodités, Michel Lutz affirme avec conviction que le véritable avantage compétitif durable reposera sur deux piliers.
Le premier est la qualité et l’unicité des données propriétaires, enrichies d’un contexte métier profond. Le second, encore plus crucial, est l’expertise des collaborateurs.
La clé du futur ne résiderait ainsi pas seulement dans la technologie, mais dans la capacité à former des experts des domaines métier qui utilisent l’IA de manière intelligente et créative. L’objectif ? Préserver de cette manière l’intuition et la connaissance qui ne se trouvent pas dans les données.
