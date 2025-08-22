L’impact environnemental de l’intelligence artificielle générative (GenAI) est un sujet qui commence à s’immiscer jusque dans les comités de décision des entreprises. Le débat est d’autant plus problématique pour les fournisseurs qu’ils ne communiquent pas de chiffres – ou peu – sur les consommations réelles (énergie, eau, terres rares, etc.) de leurs LLM (grands modèles de langage, au cœur de l’IA générative). Ce qui n’aide pas à créer de la confiance dans les entreprises.

Certes, un acteur comme Mistral tente de jouer la carte de la transparence. Mais ce n’est pas encore la règle et cette opacité pourrait participer à une forme de « défiance » de la part des acheteurs.

Google en a bien conscience. C’est pour éteindre cet incendie naissant qu’il a publié ce 21 août un billet technique dans lequel il défend sa position et sa GenAI maison, Gemini.

Signée par Jeff Dean, Chief Scientist, et Amin Vahdat, vice-président chargé des systèmes IA et cloud, la publication avance que les systèmes qui font tourner Gemini seraient nettement plus sobres que ne le suggèrent les études externes.

Concrètement, selon leurs calculs, un « prompt textuel médian » dans Gemini consommerait 0,24 wattheure (Wh) d’électricité, émettrait 0,03 gramme d’équivalent CO₂ et nécessiterait 0,26 millilitre d’eau pour le refroidissement. À titre de comparaison, cela représenterait « moins de neuf secondes de télévision ».

Ces chiffres, selon les deux auteurs, se situeraient « bien en dessous » des estimations couramment relayées.

Méthode plus large, chiffres paradoxalement plus bas Google reproche à de nombreuses estimations publiques de se fonder sur une méthodologie incomplète, qui ne tiendrait compte que de l’énergie consommée par les puces de calcul (GPU ou TPU) au moment de l’exécution des requêtes. Ces études devraient donc sous-estimer l’empreinte des LLMs… Pourtant, affirme Google. C’est l’inverse qui se passe. Malgré cette approche partielle, les chiffres relayés seraient finalement exagérés par rapport à la consommation réelle observée en production chez Google. Le groupe avance que ses propres mesures – bien qu’avec un périmètre plus large, car intégrant l’ensemble de l’infrastructure (machines allumées mais inactives, CPU, RAM, refroidissement, distribution électrique, et eau utilisée) – aboutissent paradoxalement à des résultats bien plus faibles. En ne considérant que les composants actifs (à périmètre équivalent avec les estimations indépendantes donc), Google affirme que la consommation par prompt tomberait même à 0,10 Wh. Un scénario que le géant de la tech ne retient pas, et qu’il qualifie lui-même de « trop optimiste » pour mieux vanter son estimation « haute » (mais bien plus basse que les estimations externes).

Des gains d’efficacité revendiqués Face au critique sur le fait que les LLM seraient particulièrement énergivores (ce qu’ils sont), Google avance par ailleurs que, sur un an, l’empreinte carbone et la consommation d’énergie par prompt de Gemini auraient été divisées respectivement par 44 et 33. Ces résultats ne sont pas forcément étonnants, l’optimisation de la consommation des LLMs était anticipée par les experts. Plus concrètement, ces chiffres sont le résultat d’une approche qui combine à la fois optimisation logicielle, architectures de modèles plus efficaces (notamment avec l’approche Mixture-of-Experts qui n’active qu’une sous-partie d’un modèle si un prompt n’a pas besoin de la totalité de la puissance de celui-ci), compression (distillation), et évolution matérielle (avec la dernière génération de TPU, baptisée Ironwood). Par ailleurs, Google met en avant l’efficacité énergétique de ses centres de données (avec un PUE moyen de 1,09), ses efforts de décarbonation, le recours à des sources d’énergies renouvelables, ou encore sa politique de reconstitution de l’eau dans les bassins en tension hydrique.

Des chiffres non audités par des tiers Bref, Google veut montrer qu’il est vertueux. Mais le groupe ne montre pas pour autant patte blanche, et sa transparence reste relative. Les deux auteurs du billet reconnaissent eux-mêmes que les données citées proviennent d’une analyse ponctuelle, issues de l’usage de Gemini en mai 2025. Et sans vérification indépendante. Google précise également que ces chiffres ne sont pas représentatifs de tous les cas d’usage de son IA générative et qu’ils pourraient évoluer selon les modèles ou les comportements utilisateurs.