La semaine dernière, Databricks a annoncé la disponibilité générale de Model Serving, une solution de déploiement serverless de modèles de machine learning à partir du framework MLflow intégré dans son lakehouse.

Selon l’éditeur, il s’agit d’éliminer pour les data engineers la gestion de l’infrastructure cloud sous-jacente. Ils n’ont qu’à pointer la terminaison API REST et choisir « la taille du t-shirt », à savoir la taille de l’instance qui exécutera le modèle pour lancer le flux.

Model Serving se connecte plus spécifiquement au registre MLFlow pour sélectionner le modèle, et s’intègre au feature store (reposant sur DynamoDB sur AWS, CosmosDB sur Azure) et au data catalog de la plateforme.

Plus précisément, les équipes data peuvent déployer des écrits en Python, enregistrés dans MLFlow, et développés à l’aide des framework scikit-learn, Pytorch et Huggingface.

Databricks propose des tableaux de bord pour suivre l’exécution des fonctions, mesurer leur performance, la latence ou encore les taux d’erreur. L’éditeur assure une intégration avec Prometheus et Datadog. Plus tard, l’éditeur introduira des mécanismes afin de mesurer la qualité des modèles et tenter de les débugger.

Model Serving est conçu pour un usage spécifique : l’inférence à la volée de modèles de machine learning.

« Beaucoup de nos clients font l'inférence de modèles de machine learning en temps réel, dans l'e-commerce, par exemple, ou même maintenant, de plus en plus d’applications web internes utilisent le temps réel », justifie Prem Prakash, responsable du marketing produit pour le machine learning, les outils développeurs et l’entraînement chez Databricks.

« Cela vous oblige à faire beaucoup de travail supplémentaire parce que lorsque vous essayez de faire du temps réel, vous devez planifier le pic de charge, vous devez comprendre Kubernetes, vous devez comprendre une grande partie du cycle DevOps, vous devez comprendre la performance et surveiller le modèle. Il s'agit donc d'un travail très spécifique et d'une grande complexité ».