Alteryx 2020.3 : modélisation automatisée des données en plat principal

Une modélisation des données en un clic et de nouvelles capacités de text mining sont au cœur de la mise à jour de la plate-forme de démocratisation du machine learning d’Alteryx, sortie ce mois-ci.

Alteryx, le spécialiste de la préparation de données et des outils pour Citizen Data Scientists afin de démocratiser le machine learning, vient de présenter sa troisième mise à jour de 2020. Ses nouveautés sont marquées par l’automatisation de la modélisation des données.

Suite de l'article ci-dessous

Alteryx proposait déjà des capacités « augmentées » de modélisation avec son outil Assisted Modeling Tool, mais Alteryx 2020.3 va un (grand) pas plus loin, avec un « mode automatique » (Automatic Mode). D’un simple clic, les utilisateurs peuvent créer un pipeline de machine learning qui détermine automatiquement les meilleurs algorithmes, les meilleurs attributs (features) – une avancée dont on se doute qu’elle est le fruit du rachat de Features Labs – et les meilleures conversions (data transformation) pour créer un modèle de données.

Pour Dave Menninger, analyste chez Ventana Research, Alteryx s’adresse à nouveau et à la fois aux utilisateurs sans formation analytique et aux experts dont le travail était déjà facilité par l’outil de modélisation assistée.

« Ils ont opté pour un positionnement qui les met entre les data scientists et les métiers ; et ils ont fait du bon travail en créant une plateforme unique que ces deux publics peuvent partager », avance-t-il à nos confrères de Search Business Analytices (groupe TechTarget, également propriétaire du MagIT). « Vous entendez plein d’éditeurs parler de l’approche no code, mais vous devez pouvoir passer du no code au code ».

La raison en est que la véritable data science – la plus avancée – se fait encore et toujours en programmant. Les personnes que cible le no code/low-code occupent généralement des responsabilités opérationnelles au sein d’une organisation – ils ne sont pas data scientists. La stratégie d’Alteryx de démocratisation des algorithmes est de permettre aux experts en analytique de reprendre le travail fait dans un environnement no code pour l’améliorer.

« Ce qu’Alteryx a fait de bien, c’est de créer une offre où vous pouvez avoir les deux approches dans une seule et même plateforme, l’approche no code s’y intègre dans une démarche analytique plus large », résume Dave Menninger. « Certains concurrents proposent les deux, mais dans des outils distincts. Alteryx est probablement l’un de ceux qui réussissent le mieux à conjuguer les deux dans une seule plateforme ».

En plus de l’Automatic Mode, Alteryx 2020.3 ajoute :

  • du text mining à partir de PDF en plusieurs langues – Alteryx supporte six langues – pour importer des données à partir d’éléments tels que des factures ou des enquêtes ;
  • des outils de recherche dans les catalogues de données, tous regroupés sur une seule page, afin que les utilisateurs qui ont besoin de passer de l’un à l’autre puissent le faire plus facilement ;
  • un outil de recherche et de remplacement dans Alteryx Designer qui permet d’échanger des mots avec une seule manipulation ;
  • une fonction d’édition par lots dans Alteryx Connect qui aidera les clients à trouver des ressources dans leurs catalogues de données et à y apporter des modifications ;
  • une extension qui permet aux utilisateurs de travailler dans leur langue, et qui convertit les formats de date et d’heure dans des outils comme DateTime, Date Time Now et Report Header.

Alteryx a rebaptisé sa suite « Alteryx APA Platform » cet été ; APA étant l’acronyme d’« Analytic Process Automation ». L’automatisation est un moyen pour l’éditeur de se rendre encore plus accessible à un public encore plus large, tout en continuant d’assurer la gouvernance des données.

« C’est une bonne stratégie », renchérit Dave Menninger. « Il y a besoin de plus de discipline [dans l’analytique avancée], nous avons aussi besoin de plus d’automatisation. Ils ont une grande expérience de tout cela dans la préparation des données, et ils la portent sur tout le spectre analytique ».

« Ils n’ont peut-être pas l’architecture la plus avancée, mais ils ont un outil très pratique pour ce processus de bout en bout », conclut-il.

Pour approfondir sur Intelligence Artificielle et Data Science

Close