Et si l’avenir de l’IA était frugal ?

Alors que les immenses réseaux de neurones conçus et opérés par les GAFAM éblouissent par leurs exploits, certains en viennent à oublier la réalité du terrain, selon Théo Alves Da Costa, Manager Data Science chez Ekimetrics. La nature même des données des entreprises et leurs objectifs, souvent bien plus rationnels, appellent à une forme de frugalité.

par

Théo ALVES DA COSTA, Manager Data Science chez Ekimetrics

Publié le: 19 nov. 2021

Au début du mois d’octobre 2021, l’Américain OpenAI démontrait que son générateur de texte GPT-3, basé sur un gigantesque réseau de neurones, était capable de résumer parfaitement un livre en quelques lignes, la plupart du temps. Une prouesse qui ouvre, d’après ses créateurs, de nouvelles perspectives aux entreprises en matière de gestion documentaire.

L’attention médiatique accordée à ces « super IA » masque en réalité les nombreuses critiques qui se forment dans le monde de l’entreprise, où les gros projets algorithmiques peinent encore à faire la preuve de leur valeur. Surtout, ils faussent la vision globale que les dirigeants ont de l’IA, qui ne peut être qu’une boîte noire, énergivore et biaisée. Il est temps d’ouvrir à l’IA une autre voie, plus fiable, plus durable, et donc, nécessairement plus frugale.

Une vision biaisée de l’IA

La vision fantasmagorique de l’IA est entretenue par les annonces retentissantes des grands acteurs du numérique, les GAFAM en tête. Au cœur de la Silicon Valley, la recherche est entièrement engagée dans les apprentissages profonds ou Deep Learning, basés sur des réseaux de neurones à plusieurs couches. Ce sont eux dont on vante à longueur de « Une » les exploits. Des IA capables de battre le champion du monde du jeu de Go, de résumer des millions de livres ou de conduire une voiture. Récemment, les modèles CLIP, DALL-E ou GPT-3 ont révolutionné notre manière d’analyser les données visuelles et textuelles. À tel point, que ces méga-modèles ont été labellisés « Foundation Models » par l’université de Stanford, supposant leur caractère inévitable dans l’évolution de l’IA et masquant les efforts de recherche sur des alternatives plus frugales.

« Le recours à ces “super IA” entraîne une perte de propriété au profit des géants du numérique, renforçant encore leur hégémonie. »

Théo Alves Da CostaManager Data Science, Ekimetrics

Mais chaque médaille a son revers et ces méga-modèles sont aujourd’hui vivement critiqués pour leurs externalités négatives. Pour fonctionner, ils ont en effet besoin d’immenses quantités de données, étiquetées comme base d’apprentissage. Leur traitement nécessite une puissance de calcul colossale, tandis que leur architecture complexe implique des entraînements très longs. Au-delà, l’augmentation de l’échelle rend plus opaque que jamais la compréhension des décisions prises par ces réseaux de neurones. Autant de caractéristiques qui en font des modèles extrêmement énergivores, coûteux et risqués, c’est-à-dire inaccessibles pour 99,9 % des entreprises. Sans compter que le recours à ces « super IA » entraîne une perte de propriété au profit des géants du numérique, renforçant encore leur hégémonie.

Certes, ces modèles offrent des résultats intéressants, voire remarquables, mais dans 90% des cas seulement. Cette insécurité oblige les entreprises utilisant tout ou partie de ces modèles, à aller chercher les 10 % manquants, souvent par le biais de traitements manuels, soit une perte de temps colossale et un coût additionnel à la clé.

Les réseaux de neurones : un modèle parmi d’autres

Si les potentialités offertes par les réseaux de neurones sont réelles et bouleversent déjà certains pans de notre vie par l’analyse d’images et de textes, ceux qui écrivent que l’IA sera bientôt capable d’évoluer comme un être humain ont pris beaucoup trop d’avance. Le terme même d’IA, rappelons-le, est déjà un fantasme, dont l’amalgame avec la notion d’intelligence humaine conduit souvent à une exagération de ses capacités et à des raccourcis trompeurs.

En attendant, ses externalités négatives continuent de polluer sa réputation et freinent son adoption dans l’entreprise. Il est donc grand temps de rappeler que les réseaux de neurones ne sont qu’un modèle algorithmique parmi d’autres. Certaines alternatives sont souvent bien plus propices aux besoins réels des entreprises.

Certes, plus la donnée sera non structurée, plus le recours à ces modèles complexes sera recommandé. Mais traiter de l’image ou du texte n’est que rarement la priorité des entreprises. Les réseaux de neurones ne sont pas nécessairement la meilleure solution pour répondre aux problématiques métiers les plus courantes : obtenir des prédictions sur les ventes, optimiser les process opérationnels et la logistique, réduire son impact environnemental, améliorer les recommandations produits, mieux connaître ses clients, adapter son marketing, etc. Des attentes qui nécessitent le recours à des données structurées, disponibles dans les systèmes d’information de l’entreprise. Lorsqu’elles sont peu nombreuses, celles-ci peuvent être intégrées dans des modèles algorithmiques performants, capables de tourner sur un simple ordinateur portable !

Vers une plus grande sobriété de l’IA et de la data

« Les modèles qui tournent sur des données structurées et peu nombreuses sont beaucoup moins énergivores, moins opaques, plus rapides, moins coûteux et surtout, ils répondent à une problématique métier précise. »

Théo Alves Da CostaManager Data Science, Ekimetrics

C’est donc bien de frugalité dont il s’agit ici : faire mieux avec moins. La première règle sera tout simplement d’éviter au maximum de recourir aux modèles complexes et de toujours viser la simplicité dans ses projets d’IA. La plupart des entreprises ne disposent pas, de toute façon, des millions de données nécessaires pour profiter pleinement d’un réseau de neurones, mais de seulement 1 000 à 100 000 points. À titre de comparaison, GPT-3 intègre 175 milliards de paramètres et a été entraîné sur 355 milliards de mots !

L’IA peut-elle alors réellement aider les dirigeants à atteindre leurs objectifs business ? La réponse est oui, bien entendu, et la solution se trouve dans cette nécessaire frugalité, que celle-ci soit forcée par manque de points de données ou de moyens, ou par choix, pour réduire son empreinte numérique ou alléger ses coûts. Les modèles qui tournent sur des données structurées et peu nombreuses sont beaucoup moins énergivores, moins opaques, plus rapides, moins coûteux et surtout, ils répondent à une problématique métier précise.

Il est temps de changer notre regard sur l’IA, de sortir d’une image fantasmée pour se diriger vers une vision très opérationnelle, dans laquelle cette technologie vient soutenir l’intelligence humaine dans tous les métiers de l’entreprise. Cette approche frugale de l’IA est aujourd’hui le meilleur moyen d’allier performance et responsabilité.

Et si l’avenir de l’IA était frugal ?

Une vision biaisée de l’IA

Les réseaux de neurones : un modèle parmi d’autres

Vers une plus grande sobriété de l’IA et de la data

Pour approfondir sur Intelligence Artificielle et Data Science

Informatique quantique : Multiverse Computing lève 215 millions $ pour compresser les LLM

Thales : voyage dans une galaxie d’IA de confiance

IA : les grands modèles consomment jusqu’à 61 000 fois plus d’énergie que les petits

GreenAI : comment réduire l’impact écologique d’une Intelligence artificielle ?