IA frugale : le Crédit Agricole fait valider ses bonnes pratiques par l’Afnor
Face aux défis environnementaux et sociétaux que représente l’IA, le DataLab du Crédit Agricole s’est engagé dès 2022 dans une démarche de labellisation et de certification de ses pratiques RSE.
Créé en 2016 pour porter les projets Big Data du groupe, le DataLab du Crédit Agricole a connu de multiples évolutions. Il est aujourd’hui responsable des solutions IA pouvant générer de la valeur pour la banque « verte ». C’est en 2022 qu’une démarche de labellisation et de certification a été initiée auprès du LNE (Laboratoire National de Métrologie et d’Essais) pour la certification IA de confiance. « Celle-ci porte notamment sur la qualité des données, des développements, ainsi que la façon dont le DataLab gère les biais présentés par les IA », explique Matthieu Capron, Responsable Design Authority IA au Crédit Agricole.
Cette première démarche a ensuite été complétée par une certification axée sur le volet environnemental de sa stratégie RSE. La banque veut s’assurer que les IA auront un impact positif sur la société tout en limitant les effets nocifs sur l’environnement. « Nous avons obtenu ces certifications et labellisations en 2023, mais ce n’était qu’une première étape », indique Matthieu Capron. « Ce n’était alors que le début de la démocratisation de l’IA générative. Depuis, nous avons mis en place beaucoup de choses pour rester à la page et ne pas nous reposer sur ces acquis. »
En ce sens, le DataLab mène des travaux de R&D en cycle court pour optimiser ses projets du point de vue opérationnel. Par exemple, il s’essaye à l’exécution de grands modèles de langage sur des infrastructures plus frugales. Il mène aussi des actions à plus long terme pour lever certains verrous technologiques avec la création d’une chaire en 2023 avec l’école polytechnique.
Le numérique responsable tout au long du cycle de vie des IA
La méthode mise en œuvre par le DataLab pour concevoir et exploiter des IA de confiance et responsables porte sur l’intégralité de leur cycle de vie. Depuis la phase initiale de cadrage jusqu’au maintien en conditions opérationnelles en production. « Notre démarche a été d’intégrer le numérique responsable dans toutes les étapes, car chaque décision est importante. C’est le seul moyen d’obtenir un changement significatif », affirme Raphaël Uzan, Lead Data & AI Engineer au DataLab. Il mène des actions d’acculturation des acteurs dans le groupe, avec des webinaires, de newsletters et des points réguliers avec certaines entités.
« Si l’impact du projet est déraisonnable par rapport à son ROI, nous prendrons immédiatement la décision de ne pas le démarrer ».
Raphaël UzanLead Data & AI Engineer, DataLab, Groupe Crédit Agricole
Le critère du numérique responsable est désormais intégré en amont d’un projet, dès la phase de cadrage. « Si l’impact du projet est déraisonnable par rapport à son ROI, nous prendrons immédiatement la décision de ne pas le démarrer », explique Raphaël Uzan. « Si nous actons son lancement, nous évaluons son impact et les différents scénarios possibles. Ce n’est pas le seul critère qui entre en jeu, mais la question est posée systématiquement. »
En phase de conception, c’est un changement de cap pour les data scientists. Leur objectif est habituellement de maximiser la performance des modèles et d’exploiter toutes les données à leur disposition. Aujourd’hui, ils doivent tenir compte de l’impact environnemental de leurs modèles. « Avec ce critère environnemental, nous tentons de réduire la taille des modèles et la volumétrie des données pour atteindre un compromis », déclare Raphaël Uzan. « Par exemple, un modèle peut présenter une performance de 91 % avec 150 variables en entrée. Si avec les 30 variables les plus signifiantes la performance ne tombe qu’à 90 %, c’est un compromis qui peut être tout à fait acceptable. »
Des outils d’écoconception intégrés à la chaîne CI du Crédit Agricole
De nouveaux critères ont aussi été introduits sur la chaîne d’intégration continue (CI). Le Crédit Agricole a souhaité mettre à disposition de ses développeurs des outils pour tester leur code en phase de développement et valider sa qualité. « Outre la vérification du code source, nous avons des scanners qui détectent les vulnérabilités dans le code et s’assurent de sa qualité », explique Raphaël Uzan.
Jusque-là, le rapport avec une démarche écoresponsable n’est pas évident.
« Notre idée a été d’ajouter à ces dispositifs des critères d’écoconception », ajoute le responsable IA & Data. Pour y parvenir, la banque s’appuie sur l’outil Open Source CreedenGo (ex-EcoCode). Les ingénieurs de la société contribuent également à cette librairie. « CreedenGo vient s’intégrer dans SonarQube qui est l’outil d’analyse de code standard utilisé par les développeurs du Crédit Agricole », explique Raphaël Uzan. « Il donne un feed-back sur les problèmes d’écoconception que présente le code par rapport aux règles prédéfinies ».
Les développeurs disposent de cette information directement dans son environnement. Il peut modifier son code immédiatement sans que cela impose une modification plus coûteuse si celle-ci est détectée plus tard dans le processus de production. L’outil CodeCarbon – à la base du projet AI Energy Score – a été déployé en complément. Il permet de chiffrer l’impact environnemental d’une application en kilogramme équivalent carbone (KgCO2). CodeCarbon donne un équivalent pour un trajet en voiture.
« Cela permet aussi de suivre l’évolution de cette empreinte », indique Raphaël Uzan. « Si vous changez des dépendances dans votre code ou si vous ajoutez des fonctionnalités, vous connaissez immédiatement les conséquences de ces modifications. Dans l’autre sens, si le développeur fait des efforts d’écoconception, il peut constater si ses efforts sont fructueux », précise l’ingénieur.
Des tableaux de bord pour le bon dimensionnement des infrastructures
Enfin, le projet « Reporting Infra » vise à réduire les ressources consommées par l’infrastructure de production. Ce tableau de bord affiche en temps réel des métriques telles que les espaces disques, la mémoire vive, les ressources CPU et GPU consommés par les infrastructures, avec une granularité globale et par projet.
« L’outil assure un dimensionnement initial plus précis et une adaptation progressive grâce à un suivi en temps réel de l’utilisation ».
Raphaël UzanLead Data & AI Engineer, DataLab, Groupe Crédit Agricole
« Le premier intérêt se situe dans la planification des capacités », avance Raphaël Uzan. « Cela permet l’allocation optimale des ressources pour un nouveau projet, en évitant le sur-dimensionnement », poursuit-il. « L’outil assure un dimensionnement initial plus précis et une adaptation progressive grâce à un suivi en temps réel de l’utilisation. De plus, il identifie les infrastructures sous-exploitées ou obsolètes, permettant ainsi leur réduction ou leur décommissionnement ».
En tout, ce sont une cinquantaine de mesures qui ont été mises en place ces dernières années. Pour vérifier que le Crédit Agricole est bien en phase avec les bonnes pratiques du marché, Matthieu Capron a présenté ces travaux au groupe de travail de l’Afnor Spec 2314. Sous cette appellation barbare se cache le référentiel général pour l’IA frugale, publié en juin 2024. « 91 % des mesures préconisées se retrouvaient déjà dans celles que nous avions déjà mises en place en 2023 », se réjouit-il. « D’autres mesures plus spécifiques à notre activité ont également été mises en place ». Les mesures du référentiel qui ne sont pas encore en place sont soit en cours d’implémentation, soit écartées lorsqu’elles sont considérées comme inadaptées aux usages et à l’environnement de la banque.
Propos recueillis lors du Tech Show Paris, en novembre 2024.
Pour approfondir sur IA Responsable, IA durable, explicabilité, cadre réglementaire