sarayut_sy - stock.adobe.com

Conseil

Data Science : quatre conseils de Gartner pour réussir son projet IA

Les entreprises aimeraient se reposer sur la Data Science, mais elles sont confrontées à des difficultés telles que les projets ne dépassent pas souvent la phase du PoC. Gartner recommande de suivre quatre bonnes pratiques pour passer ces projets en production.

par

Gaétan Raoul, LeMagIT

Publié le: 26 févr. 2020

Les entreprises espèrent dans un premier temps moderniser leurs pratiques BI, puis lancer des projets d’intelligence artificielle.

Toutefois le Gartner prédit dans une note que jusqu’en 2021, 75 % des projets d’IA ne dépasseront pas la phase du prototype. Selon le cabinet d’analyse, la raison principale de ce (futur) camouflet tient dans le fait que les experts de l’IA et les dirigeants des organisations n’engageraient pas « un dialogue productif ».

Ce problème de communication s’accompagne d’un lot de défis techniques inhérents à la pratique de la data science. Tout comme la plupart des acteurs avec qui nous avons l’occasion de nous entretenir, Gartner remarque que les entreprises doivent gérer les biais dans les jeux de données, faire face à la complexité des modèles, sélectionner les bons outils, rendre disponibles les infrastructures, gérer les allers-retours avec l’IT, mesurer les impacts tout en maintenant les modèles dans le droit chemin.

Après de nombreux entretiens avec les entreprises, le cabinet constate que les PoC n’aboutissent pas pour ces raisons, mais aussi parce qu’il y a un manque de confiance des utilisateurs métiers ainsi que de communication entre ceux qui conçoivent les algorithmes et ceux qui les déploient.

En langage courant, les instigateurs des projets auraient tendance à mettre la charrue avant les bœufs.

Ce n’est toutefois pas rédhibitoire selon les analystes de Gartner. Ils identifient quatre bonnes pratiques pour « faire d’un projet IA un succès ».

Ces recommandations s’inscrivent à chaque étape du cycle de développement d’un projet IA.

Passer du Proof of Concept au Proof of Sale

La première d’entre elles consiste à comprendre les exigences commerciales qui sous-tendent le déploiement de modèles algorithmiques. Ce qui d’un premier coup d’œil semble être simple ne l’est pas tellement, car les équipes de data science et métiers ne répondent pas aux mêmes logiques. Il « manque une vision commune », dixit Gartner.

C’est aux dirigeants d’exprimer clairement leurs besoins en adoptant une approche concrète. De l’autre côté, « c’est le travail des responsables des pôles données et analytiques de communiquer à toutes les parties prenantes pour montrer ce à quoi ressemblera une solution en production et opérationnelle du point de vue de l’utilisateur final. Cela comprend la méthode de consommation prévue ».

Ces responsables techniques doivent expliquer les phases et les équipements nécessaires au déploiement du PoC. Ils doivent répondent à des prérequis afin, qu’au bout du compte, les modèles puissent être intégrés dans des processus métiers. « Le modèle doit-il être intégré dans une autre application et, si oui, comment ? Le modèle sera-t-il exploité comme un service et quels sont les accords SLA nécessaires à son fonctionnement ? Doit-il être développé pour une application ou doit-il être déployé dans un appareil en périphérie (Edge) ? Comment le modèle s’adaptera-t-il aux processus existants et qu’est-ce qui doit changer ? ». Voilà les questions que doivent se poser les dirigeants selon Gartner.

Pour valider tous ces processus, la seule étape du PoC ne suffit plus. Il faut ajouter une phase supplémentaire afin de prouver la valeur d’un projet en production. Celle-ci se nomme Proof of Sale (PoS) dans la langue de Shakespeare. Il s’agit de répondre aux questions posées ci-dessus dès la livraison finale du PoC/PoS afin de prouver la viabilité d’un projet sur le long terme. Il conviendrait de tester le plus rapidement possible le modèle sur des données issues de la production, de préférence obtenues en temps réel.

Une telle approche demande une documentation-cadre et une imbrication ciselée des équipes. Pour maintenir cette cohésion, Gartner propose de confier ces responsabilités à l’architecte IA. Ce chef d’orchestre des projets IA doit à la fois assimiler les exigences commerciales, « favoriser les échanges entre les équipes de data science, l’IT et les métiers » tout en s’assurant que le cahier des charges et les protocoles de vérification, puis de possibles itérations soient respectés. En ce sens, les pratiques Agile et ML Ops sont fortement conseillées par le Gartner.

Préparer un jeu de données à viabilité minimale

Ce resserrement des approches de prototypage et de mise en production, implique de commencer par un projet à la taille d’une équipe de data science souvent réduite. Or, le volume et la variété de données à disposition sont souvent considérables. D’après Gartner, cette profusion renferme une forme de complexité qui provoque parfois la vacuité d’un PoC de machine learning.

Le cabinet recommande donc de commencer par la préparation d’un jeu de données à viabilité minimale (le « minimum viable dataset » en VO ou MVD).

Dérivé du concept de MVP (Produit à viabilité minimale), une pratique très courante dans le développement logiciel, le MVD doit prendre « le moins de temps et de ressources possibles pour constituer un jeu de données dont la qualité répond aux exigences d’une organisation », explique Gartner.

Ce data set ne permet pas forcément d’obtenir un haut de niveau de précision pour le ou les modèles entraînés. En revanche, « il peut servir de référence pour les sources de données ajoutées progressivement ». Il faut donc établir un data catalog qui régisse la qualité des données, leur provenance, leur historicité ou encore leur structure. Ici, le volume et le nombre de sources comptent moins que la pertinence des informations disponibles pour entraîner un modèle.

Le Gartner conseille aux entreprises de commencer par les sources disponibles en interne, des données structurées issues des applications et des entrepôts, puis d’étendre les sources (données des clients, des partenaires, revendues par des brokers, etc.).

La constitution de ce MVD demande là encore d’appliquer des méthodes Agile et de favoriser une collaboration étroite entre ingénieurs data et data scientists. « Les outils de data preparation en self-service peuvent être utilisé pour compléter la construction du MVD », précise Gartner.

Trouver l’équilibre entre la précision et la viabilité des modèles

Développer un modèle algorithmique n’est pas une mince affaire. Longue, complexe, cette étape pose souvent des problèmes d’interprétation et de compréhension qui éloignent les équipes des objectifs commerciaux, selon le cabinet d’analyse.

Pour éviter des effets indésirables en production, il y a des outils qui facilitent l’évaluation des modèles au regard des prérequis d’une entreprise. Le Gartner prédit que ces solutions et ces plateformes vont gagner en popularité. Cependant, il recommande de mettre en place un MVM, ou modèle à viabilité minimum.

Ce MVM « peut reprendre des algorithmes qui ont fait leurs preuves afin de continuellement améliorer la précision du modèle sans altérer sa valeur pour l’entreprise ».

Comme le MVD, le MVM permet de rassurer les dirigeants sur la pérennité d’un projet de data science. Il s’agit également de faciliter la compréhension d’un modèle et sa transparence.

Miser sur le data storytelling pour favoriser la communication en interne

Justement, le maintien ou non d’une ligne de budget pour de tels projets dépend fortement de la capacité des équipes à montrer rapidement des résultats probants. Pouvoir expliquer les performances d’un modèle semble nécessaire à l’heure où les boîtes noires, les algorithmes opaques, font polémique.

À ce titre, Gartner invite fortement les entreprises à établir une « stratégie claire pour expliquer pourquoi et comment tirer parti des indicateurs analytiques. Cette stratégie doit également présenter les comportements souhaités des utilisateurs au regard des résultats obtenus par le modèle. »

Dans la même veine, l’Architecte IA devrait quantifier les indicateurs clés d’un projet IA, dont le nombre d’utilisateurs et des métriques sur l’amélioration des processus métiers ou l’augmentation des engagements commerciaux.

Gartner conseille que cet expert s’entoure d’un spécialiste du data storytelling afin d’identifier les quelques KPI qui retiendront l’attention des dirigeants, en plus de faciliter la compréhension du fonctionnement du ou des modèles en PoC, puis en production.

Data Science : quatre conseils de Gartner pour réussir son projet IA

Les entreprises aimeraient se reposer sur la Data Science, mais elles sont confrontées à des difficultés telles que les projets ne dépassent pas souvent la phase du PoC. Gartner recommande de suivre quatre bonnes pratiques pour passer ces projets en production.

Passer du Proof of Concept au Proof of Sale

Préparer un jeu de données à viabilité minimale

Trouver l’équilibre entre la précision et la viabilité des modèles

Miser sur le data storytelling pour favoriser la communication en interne

Pour approfondir sur Outils décisionnels et analytiques

Assistants d’IA générative et LLM sont-ils toujours la meilleure option ?

Comment la GenAI peut aider à diffuser la culture IA dans l’industrie

IA générative : Kiloutou a déjà sa plateforme à tout faire

OpenAI teste le marché avec un ChatGPT Pro à 200 $ par mois