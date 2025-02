Les éditeurs et les fournisseurs de LLM ont largement mis en avant leurs assistants propulsés à l’IA générative. Mais faut-il les utiliser de manière systématique ? In fine, est-ce que certaines tâches ne sont pas moins coûteuses et tout aussi efficaces une fois traitées à l’aide de modèles d’IA plus traditionnels ?

Non et oui, répond Florian Arthur, directeur data science, responsable des pratiques NLP et LLM chez Quantmetry, une filiale de Capgemini Invent.

En le paramétrant en fonction des sujets et des besoins, et en l’intégrant directement dans Teams ou d’autres outils de l’entreprise, cette option faciliterait considérablement le processus de création et d’adaptation des contenus.

Il est également possible d’héberger sur site ou dans le cloud les modèles sur des serveurs dotés de GPU. Cet usage s’avère plus complexe.

« Chez Capgemini, nous disposons d’accélérateurs sous forme d’interfaces de type chatbot ou assistant, que nous déployons et adaptons en fonction des besoins de nos clients. Je les appelle souvent des “ChatGPT privés” », déclare Florian Arthur. « En essence, ce sont des assistants basés sur différents LLM. Selon les demandes, nous pouvons choisir d’utiliser un modèle plus léger ou, au contraire, un modèle spécialisé, par exemple pour la traduction vers le chinois », poursuit-il. « Si le besoin inclut une analyse documentaire ou un traitement multimodal, nous opterons pour un modèle plus puissant. Cette approche nous permet d’être plus précis et adaptés aux usages spécifiques ».

Déployer une interface maison et la connecter aux services API s’avèrent donc plus intéressant dans le cas décrit plus haut.

Supposons que 7000 collaborateurs utilisent cet assistant et que 1000 d’entre eux l’exploitent quotidiennement. Cela représenterait un volume de 5000 requêtes par jour. Environ 70 % des requêtes sont liées à de la traduction et à de la reformulation, tandis qu’environ 30 % d’entre elles sont consacrés à l’extraction d’informations dans des documents ou des textes.

« Déployer un copilote à l’échelle d’une entreprise de 100 000 salariés représente un coût mensuel très élevé, même en tenant compte des réductions liées aux accords et à l’infrastructure cloud », déclare-t-il. « La question est donc : qui en a réellement besoin et pour quels usages ? ».

En revanche, les LLM pourraient être utiles pour accélérer l’annotation des mails utilisés lors de l’entraînement du modèle BERT. Il se peut que la classification évolue. Par exemple, un assureur pourrait vouloir segmenter plus précisément les réclamations. Cela demande de réannoter des dizaines de milliers de mails. Un travail aisé pour un LLM une fois qu’il a accès en entrée aux bonnes descriptions de classes. Florian Arthur et son équipe n’ont pas encore pu tester ce cas d’usage.

Puisqu’ils sont utilisés lors de l’entraînement d’autres modèles de langage, les LLM sont également « de très bons discriminateurs », évoquait Alexandre Combessie, cofondateur et CEO de Giskard , auprès du MagIT. Ils peuvent être utilisé dans des scénarios type « LLM as a judge » où ils servent généralement à identifier la pertinence ou la toxicité (par exemple) des réponses d’autres modèles. Dans un scénario multiagent, ils peuvent également « router » des tâches vers des LLM. Tous ces usages ont attrait à de la classification. Sur le papier, donc, un modèle d’IA générative peut servir à catégoriser des mails et à les faire parvenir aux bons destinataires.

Il existe un entre deux, sous la forme des services managés comme Azure AI Document Intelligence (ex-Azure Form Recognizer). Celui-ci combine des capacités d’OCR et plusieurs algorithmes de machine learning pour extraire des données de documents. « Là encore, tout dépend du coût. Lors des derniers tests que j’ai menés, ce service coûtait 9 euros pour 1000 pages ». Dans certains cas d’usage, c’est trop, signale le responsable. « Dans ces cas-là, il vaut mieux se tourner vers des solutions “customs” et les modèles ouverts, comme LayoutLM ».

« L’illisibilité de l’écriture manuscrite en milieu médical n’est malheureusement pas une légende. Les modèles de reconnaissances de textes manuscrits, même les plus performants, ne fonctionnaient pas très bien dans ce contexte », évoque-t-il. « En identifiant les premières et dernières lettres, des modèles comme Pixtral peuvent reconnaître des mots qu’un humain n’arriverait pas à reconnaître à la lecture ».

« Il y a plus simple, tout aussi performant et ce n’est pas l’ambition du groupe de pousser un usage massif de l’IA générative quand il n’y a pas besoin, surtout quand l’on connaît les consommations énergétiques que cela représente », poursuit-il.

« Nos clients sont au courant qu’il est possible de faire de l’OCR avec de l’IA et extraire tous les montants d’une note de frais. Nous aimons mener des missions liées à la GenAI, mais dans ce cas là il faut éviter de l’utiliser ». Florian Arthur Directeur data science, responsable des pratiques NLP et LLM, Quantmetry, Capgemini Invent

« C’est mon combat quotidien », lance-t-il. « Nos clients sont au courant qu’il est possible de faire de l’OCR avec de l’IA et extraire tous les montants d’une note de frais. Nous aimons mener des missions liées à la GenAI, mais dans ce cas là il faut éviter de l’utiliser », assure-t-il.

« Build » ou « Buy » ?

De manière plus générale, le responsable des pratiques NLP et LLM chez Capgemini Invent estime que les LLM sont utiles quand le rapport performance-coût est positif. « Il faut également prendre en compte l’enjeu environnemental et énergétique que l’usage de l’IA générative représente », ajoute-t-il. « Ce n’est pas juste plus performant et plus cher, c’est aussi plus énergivore ».

Quant à la décision d’acheter (« buy »), de faire (« build »), de « faire faire » (« outsource ») ou de « faire avec » (« build with »), elle dépend classiquement de l’échelle du projet et du niveau de personnalisation requis. « Quand les volumes de données à traiter sont importants, que les usagers sont nombreux et tiennent des rôles variés, et quand l’on a besoin de personnalisation, il vaut mieux se tourner vers des solutions conçues par des spécialistes ou des options sur mesure », déclare Florian Arthur.

De son côté, Aurélien Fenard, directeur de la transformation numérique et des données RH chez France Travail, encourage les entreprises à créer des « bibliothèques de fails » de l’IA générative. « Un cas d’usage peut être lancé en POC, mais ne pas fonctionner. Il faut documenter les raisons de cet échec. L’idée reviendra sur la table, toujours, et il faut pouvoir rapidement l’écarter » si la genAI n’est pas la solution.