Prostock-studio - stock.adobe.co

Cinq cas d’usages de l’IA dans un workflow de traduction

Les traducteurs en ligne à base d’intelligence artificielle sont entrés jusque dans les mœurs du grand public. Dans les entreprises, l’IA a aussi grandement automatisé cette tâche. Une bonne pratique consiste à mettre en place un workflow pour prendre en charge tous les documents et capitaliser sur l’historique de traductions.

Cet article est extrait d'un de nos magazines. Téléchargez gratuitement ce numéro de : Applications & Données: Bosch mise un demi-milliard sur l’IA

Dans ce processus de workflow de traduction, l’IA a bien d’autres bénéfices que la seule « Machine Translation ». En voici quelques-uns, partagés par une experte française du secteur, Peggy Santerre.

Sur sa carte de visite, son titre n’est pas courant. Mais il est clair. Peggy Santerre est « experte en stratégie de traduction ». Professeure à l’Université d’Aix-en-Provence et co-dirigeante de l’agence Six Continents, elle fait très régulièrement appel à l’Intelligence Artificielle, dans ces « stratégies » qu’elle met en place dans les entreprises.

Photo de Peggy Santerre, fondatrice Six ContinentsPeggy Santerre,
co-dirigeante Six Continents

Évidemment, on pense tout de suite à la fameuse « Machine Translation ». Mais l’IA va bien plus loin que cela dans ces projets de grande envergure qui impliquent de mettre en place un workflow.

Car non, l’IA ne sert pas qu’à automatiser la traduction elle-même ou à la préparer (lire par ailleurs notre article sur les différences entre la traduction automatique, la traduction hybride et la « transcréation »). L’IA peut aussi « augmenter » les phases en amont et en aval, c’est-à-dire automatiser ou optimiser ces étapes du workflow avec des techniques allant du machine learning à la compréhension sémantique.

« Aujourd’hui, quand on parle IA et traduction, on pense tout de suite à “traduction automatique” (ou Machine Translation). Mais il y a plein d’autres applications », confirme Peggy Santerre. L’experte a expliqué à LeMagIT où et comment l’IA pouvait concrètement servir.

Qu’est-ce qu’un workflow de traduction ?

Avant d’aborder les usages de ces technologies dans un workflow de traduction, il faut déjà bien comprendre ce qu’est… un « workflow de traduction ».

« Un groupe [ou une entreprise] qui a un volume régulier de traductions ne doit pas juste réfléchir à “consommer” de la traduction », avertit Peggy Santerre. « Il faut avoir une “stratégie de traduction” qui couvre plusieurs aspects ».

Cette stratégie permet en premier lieu de capitaliser et de garder en mémoire les documents qui ont déjà été traduits, peu importe la langue, ou le fournisseur (qu’il soit interne ou externe) pour de prochaines traductions (les mémoires de traduction). Elle fait aussi en sorte de détecter de nouveaux contenus à traduire. Et surtout, elle crée un écosystème pour un travail collaboratif – par exemple entre les rédacteurs, les traducteurs, et les éventuels relecteurs – qui puisse réellement générer des mémoires de traduction.

Un workflow de ce type – qui va de la sélection des textes à l’évaluation de leurs qualités par le client en passant par la constitution des lexiques spécifiques grâce à ces aller-retour – évite de passer par des e-mails, des PDF commentés ou des documents à annoter « qu’il faut ensuite réintégrer [dans le système] », vante Peggy Santerre.

Cette collaboration – avec des outils comme MemSource ou SDL Trados Studio – est à la traduction ce qu’est un combo Teams/Office 365 au travail de bureau. « Il ne s’agit plus de proposer une traduction où l’on prend vos fichiers (PowerPoint, InDesign, etc.) et où on vous les rend, et puis c’est fini. Les clients veulent un service complet et pas juste recevoir une traduction », constate Peggy Santerre.

La manière traditionnelle et historique d’acheter de la traduction réduisait l’interaction à une relation à un client-fournisseur. Avec à la clef le danger d’un verrouillage des clients par une technologie ou par la détention des mémoires de traduction par le prestataire, sans partage avec l’entreprise.

D’où ces workflows de traduction pour éviter les traductions isolées, sans pérennité réelle (car sans boucle de rétroactions), ou verrouillées.

1 – Catégoriser les contenus

Un premier cas d’usage de l’Intelligence Artificielle se trouve dans une des étapes en amont du workflow. Une IA peut parcourir le corpus de textes à traduire et déterminer les sujets dont traite chacun d’eux.

« L’IA peut catégoriser les contenus », synthétise Peggy Santerre. « Par exemple, un outil peut passer sur 1 000 articles à traduire et dire lesquels traitent de l’IT, de l’économie, ou du droit ». Certains systèmes permettent même de résumer en deux pages le contenu d’une série de documents, toujours en catégorisant l’information.

L’intérêt de ce « tagging » sémantique automatisé est d’aider à aiguiller l’agence vers le bon traducteur en fonction de sa spécialité.

Mieux, au sein d’un seul document, une IA peut affiner l’analyse en déterminant quel pourcentage de contenu est sur tel domaine ou sur tel autre. Là encore, le but est de trouver un profil de traducteur hybride ou – autre option – de lancer une collaboration entre plusieurs traducteurs spécialisés.

2 – Choisir un traducteur

Une fois le contenu catégorisé arrive l’étape du ou des meilleurs traducteurs à mobiliser. Là encore, l’Intelligence Artificielle peut faciliter ce choix.

« On sait par exemple qu’un traducteur a déjà traité l’année dernière, pour tel client, dans tel domaine, un document similaire à celui qu’on a aujourd’hui », illustre Peggy Santerre. L’outil va donc parcourir la base des traducteurs et de leurs traductions et présélectionner les mieux placés pour le nouveau travail en recoupant ces informations.

Pour les responsables de projet, « c’est un gain de temps énorme », constate la co-dirigeante de Six Continents.

3 – Comparer les moteurs de traduction

Aujourd’hui, plus aucune traduction – ou presque – ne se fait sans l’aide d’un moteur d’Intelligence Artificielle (le Machine Translation).

Systran (qui vient de sortir des moteurs préentraînés par secteurs d’activité), DeepL, Google Traduction (ou sa version personnalisable AutoML), Reverso ou tous les services cloud accessibles par API sont devenus des outils couramment utilisés, pour ne pas dire « la norme ».

Faire une première passe de traduction avec ces outils, avant une deuxième passe de relecture par des « humains », est même le propre de la traduction « hybride ».

Mais peut-on savoir si un moteur est meilleur qu’un autre pour chaque sujet et chaque texte ?

Oui, répond Peggy Santerre. « L’IA est aussi capable d’estimer la qualité des moteurs dans un cadre de traduction hybride. Elle peut comparer, pour un texte donné, les trois ou quatre moteurs de traduction que vous avez et recommander le meilleur ». En résumé, une IA score d’autres IA.

4 – Contrôle qualité

Toujours pendant la traduction elle-même, un responsable de projet doit pouvoir évaluer la « qualité » d’une grande quantité de textes qui lui sont remis avant de les communiquer au client pour avoir ses retours.

Pas simple lorsqu’il s’agit de le faire à très grande échelle. Mais là encore l’IA peut jouer un rôle de facilitateur dans ce « contrôle qualité ».

« L’IA peut sortir une analyse en comparant ce qui est traduit par différents traducteurs – ou en traduction hybride – et souligner les choses qui ne sont pas cohérentes » assure Peggy Santerre.  « Par exemple, vous avez traduit une fois un chiffre par un autre chiffre et une autre fois vous l’avez écrit en lettres », illustre-t-elle. Une application qui n’est pas sans rappeler les correcteurs évolués comme Antidote.

5 – RPA pour l’extraction des textes

Un autre usage de l’IA – qui n’est pas évoqué au premier abord par Peggy Santerre, mais qu’elle confirme comme une autre potentialité d’optimisation du workflow – est à chercher du côté du RPA.

Une des applications les plus populaires de ces « robots logiciels » est en effet l’extraction intelligente d’informations contenues dans des documents papier scannés (facture, contrats, etc.) ou aux formats divers (mail, PDF, etc.). En résumé, de transformer des données non structurées en données structurées.

Cet usage repose sur de l’OCR intelligent, qui à la différence de l’OCR classique, ne se contente pas de reconnaître les caractères, mais étend sa compréhension aux champs et aux expressions.

Ces technologies peuvent donc préparer les textes pour les mettre aux bons formats et les importer ensuite dans les outils des traducteurs.

Conclusion : l’IA augmente, mais ne remplace pas

Ces approches de l’IA ne sont évidemment pas destinées à remplacer l’humain. Elle ne le pourrait de toute façon pas.

Car tout comme le deep learning ne remplace pas les traducteurs qui ont la faculté d’interpréter le texte original et d’écrire avec style pour transposer du sens et des émotions, l’IA ne remplace pas non plus les chefs de projets. Mais elle leur ouvre de nouvelles perspectives.

« Nous, on s’est toujours dit que la valeur ajoutée d’un chef de projet – qui reçoit les commandes du client et qui va les allouer aux traducteurs – n’est pas dans ce type de tâches », insiste Peggy Santerre. « Ces tâches [administratives] peuvent être automatisées et faites par l’IA ; donc on le fait pour l’aider ». En résumé, pour lui libérer du temps et pour qu’il puisse se concentrer sur des tâches à plus forte valeur ajoutée qui apporteront plus aux traductions et aux clients finaux.

Pour approfondir sur Intelligence Artificielle et Data Science