Definition

Qu'est-ce que l'apprentissage automatique (AutoML) ?

L'apprentissage automatique automatisé (AutoML) est le processus automatisé qui applique des modèles d'apprentissage automatique à des problèmes concrets. L'AutoML automatise la sélection, la composition et le réglage des algorithmes. Il simplifie les tâches complexes, telles que la sélection de modèles, l'ingénierie des fonctionnalités et l'optimisation des hyperparamètres. L'automatisation du processus d'apprentissage automatique le rend plus convivial et fournit des résultats plus rapides et plus précis que les algorithmes codés manuellement.

Les plateformes logicielles AutoML rendent l'apprentissage automatique plus convivial et permettent aux organisations qui ne disposent pas de data scientists ou d'experts en apprentissage automatique spécialisés d'accéder à cette technologie. Ces plateformes peuvent être développées en interne ou achetées auprès d'un fournisseur tiers et accessibles via des référentiels open source tels que GitHub.

Les plateformes et outils AutoML sont disponibles sous forme de logiciels open source et d'offres commerciales. Ils peuvent être déployés sur site ou dans le cloud. Ces outils permettent aux entreprises de créer et de mettre en œuvre des modèles prédictifs à l'aide de workflows rationalisés et automatisés.

Comment fonctionne l'apprentissage automatique ?

AutoML est généralement une plateforme ou une bibliothèque open source qui simplifie chaque étape du processus d'apprentissage automatique, depuis le traitement d'un ensemble de données brutes jusqu'au déploiement d'un modèle d'apprentissage automatique pratique. Dans l'apprentissage automatique traditionnel, les modèles sont développés manuellement et chaque étape du processus est traitée comme une tâche distincte.

AutoML localise et utilise automatiquement le type d'algorithme d'apprentissage automatique le mieux adapté à une tâche donnée. Deux concepts permettent d'y parvenir :

  • Recherche d'architecture neuronale. Cette fonctionnalité automatise la conception des réseaux neuronaux. Elle aide les modèles AutoML à découvrir de nouvelles architectures pour les problèmes qui les nécessitent.
  • Apprentissage par transfert. Les modèles pré-entraînés appliquent ce qu'ils ont appris à de nouveaux ensembles de données, en appliquant les architectures existantes à de nouveaux problèmes qui les requièrent.

La recherche d'architecture neuronale et l'apprentissage par transfert améliorent l'adaptabilité d'AutoML en créant de nouvelles architectures de modèles et en appliquant celles pré-entraînées à de nouvelles données. Les utilisateurs ayant des connaissances minimales en apprentissage automatique et en apprentissage profond peuvent interagir avec les modèles via un langage de programmation tel que Python.

En général, AutoML fonctionne selon les étapes suivantes :

  • Définition du problème. L'utilisateur définit le problème, tel que la classification, la régression ou le regroupement.
  • Préparation des données. Cela comprend le nettoyage des données, leur mise en forme et la division du projet en ensembles d'entraînement et de test.
  • Ingénierie et sélection des caractéristiques. AutoML extrait des caractéristiques significatives à partir des données brutes et sélectionne les plus pertinentes.
  • Sélection du modèle. La plateforme identifie les algorithmes d'apprentissage automatique les mieux adaptés à la tâche.
  • Réglage des hyperparamètres. Les hyperparamètres sont ajustés pour améliorer les performances et optimiser le modèle.
  • Formation et évaluation du modèle. Le modèle est formé, validé et évalué à l'aide d'indicateurs de performance sélectionnés.
  • Déploiement du modèle. Le modèle final est déployé, souvent à l'aide d'interfaces de programmation d'applications ou en l'intégrant dans des applications.
  • Surveillance et maintenance. Les outils AutoML peuvent suivre les performances des modèles et déclencher un réentraînement si nécessaire.

Cinq étapes AutoML accélèrent le processus d'apprentissage automatique.

Cas d'utilisation d'AutoML

Les cas d'utilisation de l'AutoML sont similaires à ceux du machine learning traditionnel. Ils couvrent les secteurs de la finance, de la santé, de l'agriculture, de la cybersécurité et du marketing. Voici quelques-uns des cas d'utilisation les plus importants :

  • Classification. C'est ici qu'AutoML est utilisé pour la reconnaissance d'images et l'analyse des sentiments.
  • Régression. AutoML est appliqué aux modèles de tarification, aux prévisions météorologiques et aux prévisions d'inventaire.
  • Regroupement. Cette approche est utilisée dans la segmentation de la clientèle et les études de marché.
  • Prévision de séries chronologiques. AutoML est utilisé pour la prévision des stocks et des ventes.
  • Traitement du langage naturel. Les chatbots, les applications de synthèse et de traduction utilisent AutoML.

Composants d'AutoML

Voici plusieurs composants importants d'AutoML :

  • Prétraitement des données. Cela automatise le traitement des valeurs manquantes, l'encodage et la normalisation.
  • Ingénierie des caractéristiques. Elle sélectionne et transforme les variables d'entrée en caractéristiques utiles.
  • Sélection du modèle. Cette option permet de choisir parmi un ensemble de modèles d'apprentissage automatique candidats.
  • Optimisation des hyperparamètres. Cela permet d'ajuster les paramètres du modèle pour obtenir des performances optimales.
  • Assemblage. Cette technique combine plusieurs modèles afin d'améliorer la précision.
  • Déploiement. Cela rend un modèle utilisable dans les systèmes de production.
  • Surveillance. Elle permet de suivre et d'évaluer les performances actuelles du modèle.

Avantages d'AutoML

Les principaux avantages de l'autoML sont les suivants :

  • Efficacité. AutoML accélère et simplifie le processus d'apprentissage automatique et réduit le temps de formation lors de la création de modèles d'apprentissage automatique.
  • Réduction des coûts. Un processus d'apprentissage automatique plus rapide et plus efficace permet à une entreprise de consacrer moins de budget à la maintenance de ce processus.
  • Performances. Les algorithmes AutoML ont tendance à être plus efficaces que les modèles codés manuellement.
  • Visibilité et accessibilité. Dans certains cas, AutoML facilite le suivi de la manière dont un algorithme fournit ses résultats, offrant ainsi plus de visibilité et d'accessibilité que l'apprentissage automatique traditionnel.

Les défis de l'AutoML

AutoML présente plusieurs défis. Les plus importants sont les suivants :

  • Dépendance excessive. Le principal défi de l'AutoML réside dans la tentation de le considérer comme un substitut au savoir et au jugement humains. L'AutoML est conçu pour effectuer efficacement des tâches répétitives, libérant ainsi les employés qui peuvent alors se consacrer à des tâches plus complexes et novatrices. L'AutoML traite des tâches telles que la surveillance, l'analyse et la détection de problèmes plus rapidement qu'un être humain. Cependant, les humains doivent toujours évaluer et superviser le modèle.
  • Nouveauté. L'AutoML est un domaine nouveau, et certains des outils les plus populaires ne sont pas encore complètement développés. Il se peut qu'ils ne prennent pas en charge tous les algorithmes ou toutes les techniques d'apprentissage avancées.
  • Personnalisation limitée. Les utilisateurs avancés peuvent trouver la personnalisation limitée par des modèles prédéfinis.
  • Manque de transparence. Certaines plateformes fonctionnent comme des boîtes noires, offrant une interprétabilité limitée.

Outils et plateformes AutoML

Des outils tels que Auto-sklearn et AutoKeras sont open source. Ils peuvent être exécutés sur une infrastructure locale, ce qui permet aux utilisateurs d'éviter les coûts liés aux services cloud propriétaires. Ils s'appuient sur des architectures connues et des données qu'ils ont déjà vues, et prennent en charge, entre autres, les techniques de classification et de régression.

Des outils tels que Google Cloud AutoML et Microsoft Azure Machine Learning sont des plateformes cloud propriétaires qui offrent une grande évolutivité. Ils utilisent des réseaux neuronaux récurrents, des réseaux neuronaux convolutifs, des mémoires à court terme longues et d'autres modèles d'apprentissage automatique. Cependant, ils entraînent des coûts liés aux services cloud.

L'avenir d'AutoML

L'AutoML devrait évoluer rapidement, en mettant l'accent sur une plus grande transparence, une meilleure évolutivité et une plus grande facilité d'utilisation dans tous les secteurs. L'une des évolutions clés est l'amélioration de l'explicabilité, qui permettra aux scientifiques des données et aux utilisateurs professionnels de mieux comprendre comment les modèles d'apprentissage automatique automatisés prennent leurs décisions. Les plateformes AutoML étendront également leurs capacités pour traiter les données non structurées, notamment les textes, les images et les vidéos. Cela élargira leur champ d'application dans les secteurs de la santé, du droit et des médias.

Le déploiement en périphérie est un autre domaine en pleine croissance, où des modèles AutoML légers peuvent être formés et exécutés sur des appareils périphériques pour des analyses en temps réel. AutoML est également en cours d'intégration dans les environnements d'entreprise, offrant des approches de bout en bout qui s'alignent sur l'infrastructure et les flux de travail existants. Alors que les grandes entreprises adoptent de plus en plus l'IA pour les tâches prédictives, le rôle d'AutoML en tant que pont entre les données et la prise de décision devrait continuer à se développer de manière à soutenir à la fois les utilisateurs experts et ceux qui ont une connaissance minimale du machine learning.

Découvrez les principales tendances en matière d'apprentissage automatique et d'intelligence artificielle.

Pour approfondir sur IA appliquée, GenAI, IA infusée