IA générative et droit : dans les coulisses de l’assistant juridique de LexisNexis
Le spécialiste de l’information juridique mise sur plusieurs modèles de langage, sur le chiffrement et sur l’effacement des prompts. LexisNexis prévoit aussi un hébergement européen pour répondre à des professions du droit, très concernées par la confidentialité.
Cet été, le spécialiste d’origine britannique de l’information juridique LexisNexis a lancé en France un assistant juridique motorisé à l’intelligence artificielle générative (GenAI).
Cette IA cible les « professions du droit et du chiffre » (avocats, notaires, juristes du privé et du public, magistrats, experts-comptables, etc.) pour reprendre l’expression de la société qui est également, de facto, un éditeur.
L’outil a un champ d’action large puisque LexisNexis couvre le droit privé et le droit public, mais aussi des domaines comme la compliance, les ingénieries sociétaires, immobilières et patrimoniales, ainsi que le droit rural, médical et pharmaceutique, ou encore la RSE et les énergies.
Concrètement, Lexis+ AI se présente comme un « bot » qui permet d’interagir, sur un mode de conversation, avec la base documentaire de LexisNexis. Dans la pratique, l’utilisateur pose des questions et le bot renvoie des réponses en citant ses sources (avec des liens directs vers les documents de référence).
En plus des requêtes, l’outil sait résumer des jurisprudences, analyser des documents et se propose d’aider à rédiger certains documents juridiques.
L’éditeur a accepté de dévoiler au MagIT les coulisses de sa solution, une architecture technologique qui mélange des modèles d’IA et qui utilise plusieurs techniques pour sécuriser les données et les prompts des juristes.
Une approche multimodèle et transparente
La solution repose sur plusieurs modèles d’IA générative, principalement ceux d’OpenAI (éditeur de ChatGPT) et ceux d’Anthropic (éditeur de Claude).
« Notre système est conçu pour router l’intention utilisateur vers le LLM (N.D.R. : grand modèle de langage) le plus pertinent », explique un porte-parole de l’éditeur.
Cette approche multimodèle s’intègre dans une architecture RAG (Retrieval Augmenterd Generation), propriétaire, qui fait que les réponses sont générées exclusivement en s’appuyant sur la base documentaire de LexisNexis.
Celle-ci est composée de 26 millions de documents juridiques (revues, encyclopédies, formulaires, contenus pratiques, modèles d’actes, jurisprudences, BOFIP, législation) et d’analyses. Plus d’une centaine de juristes et un réseau de 8 000 experts travaillent pour la maintenir.
Pour éviter les hallucinations – même si le risque est plus limité sur une RAG – l’IA de LexisNexis est encadrée par une équipe qui contrôle quotidiennement les combinaisons prompts-réponses. « Des barèmes de tests rigoureux sont appliqués pour garantir la qualité des réponses générées », certifie l’éditeur.
« Nous sommes transparents dans l’utilisation des techniques d’IA. Nous nous engageons à rendre les processus décisionnels compréhensibles pour nos clients », ajoute par ailleurs l’éditeur.
Vers une infrastructure cloud en Europe
Côté infrastructure, l’hébergement actuel de l’assistant s’appuie sur des instances dédiées privées dans Microsoft Azure et Amazon Web Services.
Une évolution est cependant prévue. « Toute la partie IA sera prochainement hébergée en Europe », confie LexisNexis au MagIT.
Cette migration prochaine vise à « répondre de façon optimale aux problématiques de souveraineté que nous rencontrons de plus en plus chez nos clients », explique l’éditeur. « Elle renforcera encore la protection des données et la conformité avec les réglementations européennes ».
À noter sur ce point que la définition française, très stricte, de la « souveraineté » ne se limite pas à la localisation des données (elle ajoute l’immunité aux droits extraterritoriaux étrangers, avec un hébergement sur un cloud européen comme OVH, Scaleway, Outscale ou T-Systems). Cette approche diffère de la conception européenne, exigeante, mais plus souple – à laquelle se réfère LexisNexis.
Un dispositif de sécurité multicouche
La sécurité justement. La protection des données des juristes s’articule autour de plusieurs axes.
Le premier concerne les prompts. L’historique des conversations et des demandes est stocké dans un environnement chiffré (AES-256), au maximum 90 jours (et elles sont supprimées dès que l’utilisateur les efface).
Les documents sont, eux, effacés dès la fin de la session.
« Les prompts sont stockés et cryptés, donc même s’ils étaient volés ou s’il y avait une fuite, ils seraient illisibles », assure l’éditeur au MagIT.
LexisNexis précède également à des tests de pénétration permanents par des tiers et assure une surveillance continue 24h/24, 7j/7.
Enfin, aucun identifiant ne serait conservé.
Concurrence accrue, investissement massif
L’assistant de LexisNexis – qui a d’abord été lancé en Grande-Bretagne, en Australie et aux États-Unis – arrive en France alors que la concurrence sur le marché des assistants juridiques à base d’IA générative grandit. En France, Lefebvre Dalloz a récemment sorti une fonctionnalité similaire (GenAI-L), tout comme Jus Mundi (Jus Ai Assistant)
Dans ce contexte, LexisNexis promet d’enrichir sa solution en 2025 avec des fonctionnalités de personnalisation qui permettront aux clients d’intégrer leurs propres contenus.
La société travaille également sur des capacités plus avancées de « rédaction assistée » (d’aide à l’écriture de documents juridiques).
L’IA de LexisNexis s’inscrit en tout cas dans une stratégie d’investissement massive de la part du groupe international britannique qui prévoit de consacrer pas moins de 1,7 milliard de dollars dans la technologie.
Un signe de plus (s’il en fallait un) que le droit est un des secteurs qui change en profondeur, et le plus rapidement, avec l’IA.