Watson, le retour. Avec l'introduction de sa nouvelle plateforme Watsonx, IBM rafraîchit la devanture de Watson, son système d'IA vieux de plus de deux décennies.

Présentée en avant-première lors de la conférence IBM Think 2023 mardi, Watsonx est une nouvelle plateforme d'IA et de données pour les modèles de fondation et l'IA générative.

IBM Watsonx : une approche MLOps de l’IA générative

La plateforme comprend Watsonx.ai, Watsonx.data et Watsonx.governance.

Watsonx.ai est un studio qui permettra aux entreprises d'entraîner, de tester et de déployer des fonctions d'IA générative alimentées par des modèles de fondation.

Le studio, dont la disponibilité est prévue en juillet prochain, comprend également une bibliothèque de modèles alimentée par les modèles de fondation entraînés par IBM. Parmi les modèles disponibles en version bêta, citons fm.code, fm.NLP et fm.geospatial.

Fm.code est une collection de modèles qui génèrent automatiquement du code pour les développeurs. Fm.NLP est une suite de grands modèles de langage pour des secteurs spécifiques. Enfin, fm.geospatial fournit des modèles fondés sur des données climatiques et de télédétection afin d'aider les organisations à mieux connaître les modèles de catastrophes naturelles, la biodiversité, l'utilisation des sols et les processus géophysiques.

Ces modèles s’appuieront eux-mêmes sur des modèles NLP/NLG aux noms de code géologiques : Granite, Sandstone, Obsidian et Slate.

Les modèles Granite sont basés sur une architecture « de type GPT ». Ils s’appuient uniquement sur le décodeur d’un transformeur pour générer du texte ou du code. Sans trop se mouiller, l’on comprend que la série fm.code a pour composant principal un modèle Granite couplé à CodeNet, un jeu de données concocté par IBM réunissant 14 millions de lignes de code et environ 4000 problèmes de programmation dans six langages (Python, Java, C, Ruby, C# et C++).

La série de modèles Sandstone a sûrement son importance dans la phase d’entraînement des modèles fmcode et fmNLP. Ceux-là reposent sur une architecture encodeur-décodeur inspiré des modèles T5 de Google et sont « bien adaptés pour les tâches d’affinage (fine tuning en VO) ».

Quant à Slate, il s’agit également de modèles encoder-only basés sur RoBERTa, une méthode de préentrainement NLP développé par Meta. Ceux-là sont bien moins efficaces pour générer du texte, mais idéale pour accomplir des tâches de compréhension : classer des textes et des mots, masquer des informations, ou encore aider à répondre à des questions. Tous les modèles « fm » sont entraînés sur son supercalculateur cloud Vela, déployé en mai 2022.

En ce qui concerne les modèles de traitements des données géospatiaux, IBM Research a plusieurs projets en cours. L’un d’entre eux implique la NASA.

Watsonx.ai studio s'appuiera sur des bibliothèques open source et proposera des milliers de modèles ouverts et d'ensembles de données disponibles sur la plateforme Hugging Face. Pour l’instant, les outils référencés sur le GitHub d’IBM sont en accès anticipé à la demande.

Watsonx.data est un data store consacré au développement de projets d’IA construit sur une architecture Lakehouse ouverte. Il s’agit plus précisément d’une version distribuée et augmentée du projet OpenDataHub. Il accueillera les données gouvernées et les charges de travail d'IA dès juillet, selon IBM. Watsonx.governance est une boîte à outils visant à atténuer les risques associés à l'IA et à protéger la vie privée des clients. Elle devrait être généralement disponible dans le courant de l'année et rassembler un ensemble d’outils proposés en open source ou soutenus commercialement par IBM.

Watsonx permet à l'entreprise de 111 ans d'entrer sur le marché florissant de l'IA générative, à la suite de géants technologiques tels que Google, Microsoft et AWS, ainsi que de fournisseurs indépendants de matériel et de logiciels d'IA tels que Nvidia et SambaNova.