NLP : des attentes fortes, une réalité contrastée

Introduction

Le traitement du langage naturel, ou NLP, suscite un engouement important, tout comme les concepts connexes que sont le text mining, le NLU, le Speech to text ou text to speech. Les spécialistes de la grande distribution y voient un moyen pour faciliter le commerce conversationnel, c’est-à-dire les échanges avec leurs clients via des chatbots intégrés dans de nombreux canaux de communications.

Ces échanges à l’écrit et à l’oral doivent être compris par des algorithmes reliés à des systèmes experts qui doivent recommander les clients vers les bons produits. Des solutions comme l’assistant (virtuel et physique) Amazon Alexa ont prouvé que cela était possible. Les éditeurs de CRM et de l’analytique s’en inspirent dans le but de faciliter la vie des métiers. Seulement, les véritables cas d’usage en entreprise sont avant tout spécialisés. Là encore, AWS a compris cette attente en présentant un moteur de recherche d’entreprise alimenté par des algorithmes de NLP, entraînés sur des jeux de données dédiés à des verticaux spécifiques (assurance, industrie pharmaceutique, chimie, RH, etc.).

Une grande partie des cas d’usage présentés dans ce guide essentiel en témoigne : le traitement du langage naturel est beaucoup plus efficace quand il est dédié à une tâche particulière. Si ce problème est observable dans la grande majorité des projets de machine learning et de deep learning, le NLP et les technologies connexes introduisent des défis supplémentaires.

Comme l’explique Otman Manad, data scientist chez l’ESN Umanis, « Le NLP est à l’intersection de la linguistique et de l’intelligence artificielle. […] Nous avons beaucoup de données, [mais] ce dont nous avons besoin, c’est du sens ». Pour réaliser une bonne application qui embarque du traitement du langage naturel, il faudrait idéalement associer les compétences d’un data scientist, d’un expert métier… et d’un linguiste.

Et c’est toute la difficulté que pose cette technologie, car un simple mot peut avoir différents sens suivant son contexte. Les data scientists doivent recourir à un ensemble de techniques pour que les algorithmes et les modèles soient en mesure d’interpréter ces nuances.
En la matière, des groupes comme Google, Facebook ou OpenAI développent des modèles de langages comme BERT (Bidirectional Encoder Representations from Transformers), GPT-3 ou RoBERTa qui doivent simplifier la phase de développement des applications.
Puis, ils sont évalués à l’aide de benchmarks développés par des groupes ou des universités : SQuaD, GLUE, RACE, SWAG. Ceux-ci doivent permettre d’évaluer leur performance sur des jeux de données généralistes.

De plus, les modèles et les benchmarks sont principalement consacrés à la langue de Shakespeare. Si l’on prend le cas du français, il y a bien des adaptations comme CamemBERT et le projet FQuaD de la société Illuin Technology, mais ils n’atteignent pas encore le niveau de performance de leurs cousins anglophones. Par ailleurs, ces évaluations de performances sont effectuées à partir de pages Wikipédia : une utilisation de ces projets en entreprise demande de les optimiser pour leur cas d’usage.

Le recours à une ESN, à un cabinet de conseils ou aux services d’un fournisseur comme IBM pour ses solutions NLP basées sur Watson, semble nécessaire pour la plupart des entreprises. Surtout, l’annotation détaillée de documents pour guider les algorithmes et les modèles est une tâche manuelle obligatoire. Voilà tous les aspects évoqués dans ce guide essentiel qui, humblement, effleure la portée, mais aussi la complexité du NLP.

1Effets de mode-

Haro sur le NLP

Actualités

Kendra : AWS veut simplifier la recherche d’entreprise grâce au NLP

Présenté en décembre dernier, AWS Kendra est en disponibilité générale. Ce service de recherche d’entreprise dans le cloud doit simplifier l’accès aux données dans les silos des entreprises. Lire la suite

Actualités

Proxem : Dassault Systèmes croque la crème de la crème du NLP

En mettant la main sur le champion français de la compréhension sémantique de textes, Dassault Systèmes envisage de nouvelles applications dans l’IoT industriel, pour Exalead, et la création de nouvelles offres. Lire la suite

Actualités

BI et NLP : ThoughtSpot plonge dans les données vocales

En passant un accord stratégique avec VoiceBase, l’éditeur de BI plébiscité par Gartner et récemment arrivé en France se dote de nouvelles capacités d’analyse des enregistrements audio. Cible première : les centres d’appels et le support clients. Lire la suite

Actualités

Conversational AI : la vision du chatbot par SAP

SAP veut infuser des agents conversationnels dans l'ensemble de ses produits. Pour ce faire, elle compte sur son bras armé : Conversational AI. Après le rachat de la startup française Recast.AI en janvier 2018, l'entité est enfin en ordre de marche. Lire la suite

2Centre de contacts-

NLP et Chatbot, une combinaison prometteuse

Actualités

Le NLP et les chatbots, les piliers du commerce conversationnel

Depuis des années, le secteur du e-commerce se concentre sur l’adoption du commerce conversationnel pour stimuler les ventes en ligne. La COVID-19 pourrait bien être le catalyseur d’une généralisation de l’usage. Lire la suite

Actualités

NLP : l'avenir des assistants vocaux passera par la vraie conversation

Pour que les assistants vocaux soient à la hauteur des attentes qu'ils suscitent, ils vont devoir s'améliorer pour échanger avec l'utilisateur et pas simplement comprendre une seule phrase. Mais s'ils y arrivent, un autre problème pourrait surgir. Lire la suite

Actualités

AlloCovid relève le défi de la compréhension naturelle par téléphone

Alors que le gouvernement se penche sur le cas de StopCovid, de nombreux agents conversationnels voient le jour pour informer le grand public et le guider les personnes potentiellement atteint du coronavirus. AlloCovid est l’un d’entre eux. Lire la suite

Conseils IT

Comment développer un chatbot bien adapté à votre service client ?

Compréhension du contexte, intelligence émotionnelle, personnalité du bot, exploration de la voix, analyse des différents moteurs sont autant de critères qui conditionnent le succès d’un projet de chatbot, selon une expertise de Devoteam. Lire la suite

Projets IT

EasyJet lance une recherche vocale 100 % conversationnelle

En s'appuyant sur le Machine Learning de DialogFlow, la compagnie low-cost propose de « fluidifier » la recherche d'informations sur ses vols. A terme, elle souhaite que toutes les étapes du parcours voyageurs puissent se faire à la voix. Lire la suite

3Performances-

Les benchmarks et la complexité du NLP

Actualités

FQuAD : la langue française a elle aussi besoin de benchmarks NLP

La startup Illuin Technology mise sur FQuAD, un jeu de données de 60 000 questions-réponses réservé au français, pour égaler les performances des algorithmes NLP en anglais. Lire la suite

Actualités

NLP : les benchmarks GLUE et SQuAD ne sont pas conçus pour les développeurs

Bien que très utiles pour déterminer l’efficacité d’un modèle de traitement du langage naturel, les benchmarks NLP sont conçus originellement à des fins scientifiques. Heureusement, ils évoluent rapidement. Lire la suite

Conseils IT

NLP : ciblez les utilisateurs, pas les records sur les benchmarks

Alors que les frameworks d’évaluations standardisées du NLP gagnent en popularité, les experts invitent les data scientists à se concentrer sur des métriques personnalisées pour assurer le succès de leurs applications NLP. Lire la suite

Conseils IT

NLP : les techniques et les algorithmes préférés des data scientists

Quels sont les algorithmes et les techniques d’entraînement les plus populaires dans le traitement du langage naturel ? Cet article revient sur les outils d’entraînement les plus appréciés des data scientists spécialistes du NLP. Lire la suite

Actualités

IA : où en est-on avec la traduction automatique ?

La traduction automatique a reçu un coup de pouce des technologies comme le deep learning, mais elle se heurte encore aux complexités et aux nuances des langues humaines. Lire la suite

4Cas d'susage-

En entreprise, priorité au texte

Projets IT

La BRED engage Watson pour gérer les e-mails de ses conseillers

Après un pilote concluant, les e-mails des conseillers de la BRED sont maintenant traités à l’aide de Watson, le moteur de traitement du langage naturel d’IBM. Objectif : leur faire gagner du temps. Lire la suite

Projets IT

Comment le Crédit Agricole CIB utilise l’IA pour améliorer la conformité

Pour aider ses experts en conformité financière, Crédit Agricole CIB a déployé un outil NLP pour analyser des rapports financiers et détecter de potentiels risques pour sa sécurité financière. Lire la suite

Projets IT

L’ESN Umanis recrute ses chargés de mission IT grâce au NLP

La R&D de l’ESN Umanis a mis au point un moteur de recommandation, afin de faciliter le choix du candidat idéal pour une mission IT donnée. Après quatre ans de développement et d’utilisation en interne, cet outil basé sur le NLP et le text mining devient un produit à part entière. Lire la suite