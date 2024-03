Les applications propulsées par l’IA sont entraînées sur des données historiques, mais elles peuvent perdre en précision. De fait, elles sont soumises aux données du monde réel et leurs paramètres ne sont pas forcément figés.

Lorsque les données d’entrée de ces applications changent constamment dans le monde réel, des pratiques d’entraînement continu sont nécessaires. Les entreprises doivent intégrer ces pratiques dans leurs stratégies MLOps.

Un entraînement continu n’est pas toujours nécessaire. Autre exemple, une application analysant des photographies pour y trouver des drapeaux d’États américains ne s’écartera pas forcément de ses performances de base. Elle peut même s’améliorer au fur et à mesure que la qualité globale des photos qui lui sont fournies s’améliore. Cependant, un entraînement continu est généralement nécessaire à un moment ou à un autre.

Par exemple, une application de ML effectuant une analyse des sentiments sur un flux de messages de médias sociaux pour les marquer comme favorables, neutres ou défavorables au produit d’une entreprise, doit faire face à des changements dans le comportement des consommateurs et dans les informations sur les produits. Des contrôles ponctuels périodiques effectués par des analystes permettent d’évaluer ces performances. Si le taux de catégorisation erronée dépasse un certain seuil arbitraire, par exemple 5 %, cela déclenche un cycle de réentraînement.

Les avantages de cette pratique

Les applications de ML sont souvent considérées comme utiles parce qu’elles remplacent ou réduisent le besoin d’attention et d’intervention humaine. Comme les humains, les applications de ML prennent des décisions en fonction de ce que le modèle « comprend », des données d’apprentissage et des concepts reflétés par ces données. Si la nature des données change (dérive des données), ou si les concepts sous-jacents ne s’appliquent plus (dérive conceptuelle), le modèle doit être réentraîné avec de nouvelles données ou un nouveau cadre conceptuel sous-jacent.

Le programme d’analyse des sentiments susmentionné pourrait nécessiter un réentraînement régulier en raison de la dérive conceptuelle. Les mots et les structures syntaxiques que les gens utilisent pour indiquer un sentiment positif ou négatif évoluent. L’application pourrait également être confrontée à une dérive des données en raison d’un changement soudain du volume de messages générés par des robots ou de messages rédigés par des services promotionnels payants.