Definition

Recherche cognitive

La recherche cognitive (ou « cognitive search » en anglais) est une nouvelle génération de moteurs de recherche qui s’appuie sur l’intelligence artificielle pour mieux comprendre les requêtes des utilisateurs et mieux cibler les informations pertinentes dans des jeux de données multiples et éparses.

La recherche cognitive va plus loin qu’un moteur de recherche classique : elle peut intégrer plusieurs sources dans les réponses, et elle assure automatiquement le tagging des bases de connaissances.

Grâce à ces avancées, les salariés d’une entreprise peuvent accéder plus efficacement aux informations dont ils ont besoin.

Les outils de recherche cognitive s’appuient sur des algorithmes sémantiques de NLP (traitement du langage naturel) pour « comprendre » les données indexées. Les développeurs peuvent par la suite intégrer des moteurs cognitifs dans les applications métier (moteur de recherche pharmaceutique, portail client par exemple) ou à l’inverse, intégrer les données des applications dans un moteur (sur un portail par exemple).

Importance et avantages de la recherche cognitive

Les moteurs de recherche qui s’appuient sur des mots-clefs sont presque devenus obsolètes en raison de la diversité et de la quantité croissante des données. Ils renvoient tellement de résultats – ou des résultats trop approximatifs – qu’il faut ensuite les trier pour dénicher la bonne information recherchée.

En intégrant de l’IA, un moteur cognitif retourne des informations, mais il en extrait aussi « le sens ». Ces moteurs s’affinent également au fil du temps en apprenant des requêtes passées.

Voici quelques avantages de la recherche cognitive :

  • Gains de productivité : une fonction de recherche centralisée et unifiée (capable de s’interfacer à plusieurs dépôts de données) permet de ne plus naviguer entre applications. Cette unification simplifie les processus métier.
  • Meilleure adoption de l’outil : les algorithmes d’apprentissage statistique (Machine Learning) donnent des suggestions plus personnalisées en fonction de l’utilisateur. Grâce à ces capacités, l’expérience s’améliore ce qui incite à utiliser les outils de manière plus systématique.
  • Baisse des coûts opérationnels : la centralisation des informations (même si les sources restent éparses) et la découverte des connaissances se font plus rapidement. De ce fait, une entreprise optimise sa productivité et réduit ses coûts opérationnels. Cet aspect est particulièrement vrai pour les services juridiques, ou la santé, ou tout domaine qui manipulent des volumes gigantesques de données non structurées ou semi-structurées (jurisprudences, appels d’offres, études médicales, recherche scientifique, etc.).

Fonctionnement des outils de recherche cognitive

Même si une étape d’intégration et d’apprentissage est nécessaire, les entreprises n’ont pas à repenser l’organisation de leurs informations (IT, bases de données, etc.) pour pouvoir utiliser la recherche cognitive. L’IA « s’ajoute » à ce socle.

Cette IA infusée est principalement de deux types.

Le NLP permet de « comprendre » les données qu’elles soient textuelles (courriers électroniques, documents, études de marché) ou des contenus médias complexes (vidéos ou enregistrements). Le Machine Learning, lui, améliore en continu la pertinence des résultats proposés en fonction de la réaction des employés aux résultats. Il est également derrière les moteurs de recommandation (vous avez cherché « ceci », « cela » peut aussi vous intéresser).

Voici quelques-uns des algorithmes couramment utilisés dans la recherche cognitive :

  • Clustering: cet algorithme segmente un jeu de données en sous-ensembles, en fonction de similarités qu’il détermine lui-même (non supervisé). Quand l’utilisateur ne souhaite pas lancer des recherches sur l’ensemble de l’index, cet algorithme limite l’exploration à un groupe spécifique ou à des documents dans chaque groupe.
  • Classification : cet algorithme (supervisé) crée un modèle qui permet de taguer les nouvelles données, en fonction d’un jeu de données prétagué sur lequel il a été formé.
  • Régression : ce type algorithmes s’appuie sur la relation entre les variables d’entrée et de sortie pour prédire des valeurs numériques futures à partir des nouvelles données. C’est avec cette technologie qu’il est possible d’affiner les résultats au fil du temps, en modifiant les paramétrages de l’algorithme quand un résultat de sortie – output – n’est pas conforme (par exemple la non-consultation du premier résultat mis en avant par le moteur) à la prévision issue de l’input – l’input étant ici la requête d’un utilisateur.
  • Recommandation : l’algorithme – souvent un ensemble d’algorithmes – extrapole des recommandations personnalisées d’après les éléments d’un document (description et attributs) qui coïncident avec les centres d’intérêt de l’utilisateur.

En parallèle à ces algorithmes, un calcul savant de similarité permet d’élaborer une matrice synthétisant les interactions entre les échantillons de données.

Principaux outils de recherche cognitive

La recherche cognitive n’en est encore qu’à ses balbutiements. Ceci étant, plusieurs éditeurs sont déjà bien installés sur le marché. Forrester Research a en identifié six majeurs :

  • Le Français Sinequa (« Insight Platform »)
  • Le Québécois Coveo
  • Watson Explorer d’IBM
  • Attivio (« Cognitive Search and Insight »)
  • Lucidworks
  • Mindbreeze

On peut ajouter à cette liste Dassault Systèmes (avec Exalead).

Application concrète de la recherche cognitive

Les cabinets d’avocats utilisent de plus en plus la recherche cognitive. En intégrant des modules propres à leur secteur, elle les aide en effet à trouver des expertises et des informations clefs dans des domaines juridiques précis.

Autre domaine d’application privilégié : le service client. Les agents peuvent accéder en temps réel et simultanément à une multitude d’applications et à un volume colossal de données (des informations de livraison aux détails du produit) depuis une seule interface. Ils peuvent ainsi répondre plus rapidement aux demandes et trouver des solutions aux problèmes des clients.

Mais les usages sont très nombreux.

Dans la sécurité, par exemple, l’Autorité de Sûreté Nucléaire (ASN) l’utilise pour parcourir plus de 22 000 documents d’inspection d’établissements équipés d’installations nucléaires.

Dans l’ingénierie, Eurocopter l’utilise pour centraliser les données techniques – qu’elles soient dans des documents ou échangées dans des mails. Un projet similaire a été déployé chez Siemens.

La NASA utilise également la recherche cognitive pour, par exemple, compulser des rapports de conception et de recherche stockés depuis plusieurs décennies (ces documents concernent par exemple des équipements et des pièces, qui sont et seront envoyés dans l’espace). Et dans le marketing et la vente, Pernod-Ricard a unifié ses informations entre pays grâce à cette technologie.

Cette définition a été mise à jour en septembre 2020

Pour approfondir sur GED, signature électronique et partage de fichiers

Close