Definition

Qu'est-ce que l'IA causale ?

L'IA causale est une forme d'intelligence artificielle (IA) conçue pour identifier et comprendre les relations de cause à effet entre les données.

Contrairement aux grands modèles linguistiques et à l'IA générative, qui se limitent à reconnaître et à analyser les corrélations entre les données, l'IA causale promet une explicabilité plus approfondie et une réduction des biais en tirant parti de l'inférence causale pour identifier les causes profondes dans n'importe quel ensemble de données et, par conséquent, modéliser des hypothèses précises.

L'inférence causale, méthodologie fondamentale de l'IA causale, utilise les données pour déterminer l'effet indépendant d'un événement et tirer des conclusions de cause à effet, ou causales. Au-delà des données d'observation, l'IA causale utilise des techniques telles que les algorithmes de découverte causale et les modèles causaux structurels pour apprendre et déduire la relation de cause à effet entre différents points de données, surpassant ainsi les capacités traditionnelles de l'apprentissage automatique (ML). L'IA causale peut générer des réponses précises aux questions concernant l'impact sur un calcul si une variable spécifique change.

Certaines des premières bases de l'IA causale ont été définies en 2000 par Judea Pearl dans une étude intitulée « Causality: Models, Reasoning and Inference » (Causalité : modèles, raisonnement et inférence), publiée par Cambridge University Press en 2003.

Comment fonctionne l'IA causale ?

L'IA causale exploite les techniques d'inférence causale sur des données d'observation pour modéliser les dépendances et les relations causales entre différents événements et variables. Les modèles causaux qui en résultent fournissent une explicabilité en capturant les mécanismes qui déterminent les résultats. L'IA causale utilise ces modèles pour répondre à des questions hypothétiques de type « que se passerait-il si ? » (appelées questions contrefactuelles) et estimer les effets des interventions.

Du point de vue du ML, l'IA causale s'appuie sur plusieurs méthodologies, telles que l'inférence causale et l'analyse par arbre de défaillance, une forme d'analyse des causes profondes, pour modéliser les relations causales entre différents événements et variables dans les données.

L'IA causale utilise la découverte causale, qui analyse les modèles dans les données afin d'identifier les relations et de construire des modèles. Ces modèles représentent les dépendances de cause à effet entre les variables. L'IA causale utilise également des modèles causaux structurels qui estiment les effets des interventions en modélisant des hypothèses et des contrefactuels.

Par exemple, l'IA causale applique l'analyse par arbre de défaillance, qui utilise la logique booléenne et une approche descendante, pour identifier la séquence d'événements ayant causé une défaillance du système. Le processus commence par l'événement de défaillance du système, puis examine minutieusement les événements précédents afin d'en trouver les causes profondes. L'arbre de défaillance cartographie les relations entre les défaillances des composants et les défaillances globales du système.

Les modèles d'IA causale intègrent parfois une expertise dans un domaine particulier, combinant la modélisation basée sur les données et les connaissances humaines afin de mettre au jour les mécanismes causaux précis qui sous-tendent les tendances observées dans les données.

Voici une explication étape par étape du fonctionnement de l'IA causale :

1. Collecter des données d'observation

Les systèmes d'IA causale commencent par collecter de grandes quantités de données d'observation qui capturent des événements, des comportements et des mesures au fil du temps. Ces données servent de base pour mettre en évidence les relations causales.

2. Découvrir les relations causales

Les algorithmes analysent les modèles et les connexions dans les données d'observation afin de détecter les relations causales potentielles entre les variables. Des techniques telles que la découverte causale identifient ces connexions afin de construire un modèle causal.

3. Construire des modèles causaux

Ces relations causales constituent le cadre des modèles causaux, tels que les réseaux bayésiens ou les modèles causaux structurels. Ces modèles représentent les dépendances et les relations causales entre les variables sur la base des modèles découverts.

4. Intégrer l'expertise du domaine

Les experts du domaine apportent une contribution supplémentaire aux modèles causaux en limitant ou en précisant les relations causales connues, combinant ainsi la modélisation basée sur les données avec l'expérience et les compétences humaines.

5. Estimer les effets causaux

Les modèles causaux utilisent des techniques telles que l'analyse contrefactuelle pour estimer les effets causaux d'interventions hypothétiques. Des questions complémentaires permettent de déterminer l'impact de la modification des variables.

6. Tester les interventions

Les organisations utilisent des modèles causaux pour tester des interventions potentielles à petite échelle ou dans des environnements simulés afin de prédire leur efficacité avant une mise en œuvre à plus grande échelle.

7. Répéter

Au fur et à mesure que de nouvelles données sont disponibles, les modèles causaux itératifs sont affinés au fil du temps afin d'améliorer leur précision et leur valeur, offrant ainsi une explicabilité continue.

Outils de développement de l'IA causale

Les techniques d'IA causale comprennent les algorithmes de découverte causale, les modèles causaux structurels et l'analyse contrefactuelle. De nombreux outils commerciaux et bibliothèques open source prennent en charge le développement de l'IA causale.

Les projets open source répertoriés ci-dessous comptent parmi les projets d'IA causale les plus populaires sur le référentiel de code GitHub. Les fournisseurs répertoriés ont été trouvés grâce à des recherches approfondies sur le Web et se concentrent clairement sur la fourniture d'outils commerciaux pour l'IA causale.

  • CausalML : bibliothèque open source développée par Uber qui offre des capacités d'inférence causale.
  • CausalImpact : projet open source mené par Google et écrit en langage de programmation R pour l'inférence causale de séries chronologiques.
  • Causal-learn : une bibliothèque open source dédiée à la découverte causale.
  • CausaLens : fournisseur proposant des outils et des services commerciaux pour l'IA causale.
  • Causely : fournisseur commercial proposant des outils.
  • Causica : initiative open source soutenue par Microsoft fournissant des outils pour la découverte causale et l'inférence.
  • DoWhy : bibliothèque open source d'inférence causale écrite en Python.

Comment l'IA causale traite les données manquantes

La fiabilité de l'IA causale exige que ses modèles disposent de données aussi précises et complètes que possible. L'IA causale gère le problème des données manquantes à l'aide des approches suivantes :

  • Imputation de données. L'imputation de données est une technique de science des données utilisée dans différents modèles d'apprentissage automatique pour saisir les valeurs manquantes. Il existe de nombreuses techniques d'imputation de données, notamment K Nearest Neighbor, Missing Value Prediction, Most Frequent Value et Moving Average. Chacune d'entre elles fournit une approche mathématique pour déterminer les valeurs manquantes.
  • Imputation multiple. L'imputation multiple, une forme avancée d'imputation de données, combine plusieurs ensembles de données imputées afin de créer un ensemble de données plus complet.
  • Pondération par probabilité inverse (IPW). L'IPW est une méthode statistique qui ajuste les pondérations des données existantes dans un modèle ML afin de tenir compte des données manquantes.

En quoi l'IA causale diffère-t-elle des autres IA et en quoi les améliore-t-elle ?

L'IA causale va plus loin que les autres IA dans la recherche de relations de cause à effet entre les données. Voici quelques-uns de ses points forts :


Principales différences entre l'IA causale et les autres formes d'IA.

Selon le cas d'utilisation, l'IA causale offre des avantages et des bénéfices spécifiques par rapport à d'autres formes d'IA, tels que les suivants :

  • Explicabilité approfondie grâce à l'identification des causes profondes à l'origine des résultats.
  • Réduction des biais dans les ensembles de données ML en révélant les relations causales plutôt que les corrélations superficielles.
  • Réponse à des questions hypothétiques par des scientifiques des données, telles que l'estimation de l'effet des interventions, afin d'évaluer leur efficacité avant leur mise en œuvre dans le monde réel.
  • Optimisation améliorée en allant au-delà de l'analyse prédictive pour alimenter de nouvelles applications telles que l'analyse des causes profondes et la planification de scénarios.

Applications concrètes de l'IA causale

L'IA causale n'est pas seulement une technologie hypothétique. Elle trouve des applications dans de nombreux secteurs verticaux.

Les applications d'IA causale cherchent à comprendre les raisons du désengagement des clients afin d'améliorer leur fidélisation et à identifier les causes du déclin des transactions afin de stimuler les conversions.

  • Santé. Apprenez les effets causaux des traitements afin de déterminer les interventions optimales pour les patients.
  • Finance. Analyser les causes profondes des risques liés aux investissements afin d'atténuer les pertes.
  • Détection des fraudes. Identifiez la chaîne d'événements et les conditions qui favorisent la fraude. Cela permet d'élaborer des mesures ciblées de prévention de la fraude.
  • Fabrication. Effectuer une analyse des causes profondes des défaillances de la chaîne de production ou optimiser les opérations de la chaîne d'approvisionnement.
  • Gouvernement. Évaluer l'impact des politiques potentielles à l'aide de simulations. La quantification des effets de différentes interventions favorise l'élaboration de politiques fondées sur des données probantes.

Les effets commerciaux de l'IA causale

Les entreprises peuvent tirer parti des avantages et des applications de l'IA causale de nombreuses façons.

  • Élimination des biais. En révélant les véritables relations causales, l'IA causale réduit les biais générés par les corrélations fallacieuses qui peuvent exister dans les données.
  • Parcours client. L'IA causale examine minutieusement le parcours client afin de comprendre les causes profondes des faibles taux de conversion ou de l'abandon des clients à différents points de contact. Elle fournit des explications qui aident les entreprises à optimiser le parcours des consommateurs.
  • Prévention du taux de désabonnement (churn). En identifiant les facteurs à l'origine du désabonnement des clients, les modèles d'IA causale simulent des interventions afin de déterminer les stratégies optimales pour améliorer la fidélisation.
  • Ressources humaines. L'IA causale analyse les facteurs conduisant à des résultats tels que le roulement du personnel. Elle fournit des recommandations explicables pour améliorer la fidélisation.
  • Analyse des risques liés à l'investissement. L'IA causale aide à analyser les mécanismes causaux qui sous-tendent les risques liés à l'investissement afin d'élaborer des stratégies d'atténuation et de saisir de nouvelles opportunités.
  • Optimisation des opérations commerciales. En simulant des changements au niveau des prix, des promotions et des stratégies marketing, les entreprises exploitent l'IA causale pour estimer les impacts sur les indicateurs et améliorer leurs stratégies.
  • Comprendre les causes profondes. L'IA causale fournit des explications en révélant les causes profondes sous-jacentes des événements et des résultats commerciaux.

Bien que l'IA générative présente de nombreux avantages, elle comporte également des inconvénients, notamment les hallucinations de l'IA et l'incapacité à prédire les relations causales.

Alors que les organisations continuent d'intégrer l'IA dans leurs opérations, les capacités de l'IA causale à mieux comprendre les causes profondes et à modéliser des scénarios potentiels stimuleront sa croissance et son adoption. En effet, quelques mois avant le lancement de ChatGPT, Gartner avait identifié l'IA causale comme une technologie émergente clé.

Pour approfondir sur IA appliquée, GenAI, IA infusée