
European Space Agency
TerraMind : l’IA générative de l’ESA pour mieux comprendre la Terre
IBM et l’Agence spatiale européenne (ESA) ont conçu un modèle d’intelligence artificielle générative multimodale pour observer la Terre. Disponible en open weight, il doit aider les chercheurs et les entreprises à mieux surveiller les écosystèmes et les ressources naturelles.
TerraMind. C’est le nom modèle d’intelligence artificielle générative dédié à l’observation de la Terre que viennent de dévoiler IBM et l’Agence spatiale européenne (ESA). Ce modèle de fondation (un LLM préentraîné), qualifié par ses concepteurs de plus performant dans son domaine, a été développé en collaboration avec KP Labs, le centre de supercalcul Jülich (JSC) et l’agence spatiale allemande DLR.
Il est accessible sur Hugging Face en open-weight.
Conçu pour traiter et croiser neuf types de données géospatiales, TerraMind est issu d’un préentraînement sur TerraMesh, un des plus vastes jeux de données géospatiales du monde. Il s’appuie notamment sur des données satellitaires, des informations topographiques, climatiques, végétales et textuelles, réparties à l’échelle mondiale.
IBM explique que le modèle repose sur une architecture de type codeur-décodeur symétrique à base de transformeurs, capable de traiter des entrées multiples (pixels, séquences, jetons) tout en optimisant l’efficacité énergétique.
Une IA optimisée pour les cas d’usage concrets
TerraMind a été conçu pour répondre à des enjeux concrets, comme la détection des changements dans la couverture terrestre, la surveillance environnementale, la gestion des ressources en eau, ou encore l’analyse d’événements climatiques extrêmes.
« Pour moi, ce qui distingue TerraMind [d’autres modèles d’observation de la Terre], c’est sa capacité à aller au-delà du simple traitement des observations terrestres […]. Il a une compréhension intuitive des données géospatiales et de notre planète », affirme Juan Bernabé-Moreno, directeur d’IBM Research UK & Ireland.
Simonetta Cheli, directrice des programmes d’observation de la Terre de l’ESA, souligne pour sa part l’importance de cette avancée pour la communauté scientifique. « La capacité à intégrer intuitivement des informations contextuelles et à générer des scénarios inédits est une étape essentielle pour exploiter la valeur des données de l’ESA », se réjouit-elle.
Un modèle « auto-améliorant »
TerraMind possède également des capacités de « self-tuning ». Grâce à une technique baptisée TiM tuning (« Thinking-in-Modalities »), le modèle peut générer ses propres données d’entraînement pour un problème particulier et ainsi améliorer ses performances.
« Cela peut générer une précision sans précédent […], par exemple en demandant au modèle de “penser” à l’occupation des sols lorsqu’il s’agit de cartographier des masses d’eau », illustre Johannes Jakubik, chercheur chez IBM Research.
L’IA générative peut (aussi) protéger l’environnement
Ce niveau de spécialisation ouvrirait de nouvelles perspectives pour les prévisions environnementales, la gestion de la biodiversité, ou encore la planification des territoires. Des applications que les modèles antérieurs peineraient à traiter, notamment du fait de la dispersion des données.
« Ce projet est un exemple parfait de collaboration réussie entre la communauté scientifique, les grandes entreprises technologiques et les experts pour exploiter le potentiel de la technologie au service des sciences de la Terre », conclut Nicolas Longépé, data scientist à l’ESA.
IBM avait déjà collaboré avec une grande institution de l’espace, la NASA, sur un modèle d’IA générative et des modèles géospatiaux qui s’appuient sur son LLM Granite. Le fruit de ces travaux – baptisés Prithvi – est également disponible publiquement.
L’IA générative fait souvent parler d’elle en mal pour ses effets sur l’environnement (énorme consommation énergétique, d’eau pour le refroidissement des serveurs, etc.). Ces initiatives montrent qu’appliquée aux données spatiales, elle peut (aussi) être un outil pour mieux protéger notre planète.