Getty Images

DataRobot s'empare d'Algorithmia pour renforcer son MLOps

DataRobot poursuit sa stratégie de croissance par acquisition en rachetant Algorithmia, un spécialiste du MLOps, dans le but de devenir l'éditeur d'une plateforme complète de machine learning, quitte à risquer les chevauchements technologiques.

DataRobot a racheté l’éditeur MLOps Algorithmia, ce qui constitue la dernière opération en date d’une série d’acquisitions qui a permis au spécialiste en data science de croître rapidement sur un marché saturé. Il se positionne comme un fournisseur de services exhaustifs pour les entreprises qui cherchent à créer des modèles d’apprentissage automatique plus rapidement et à un volume plus important.

DataRobot, basé à Boston, a accessoirement levé 300 millions de dollars lors d’une série G, portant sa valorisation à 6,3 milliards de dollars, avant une introduction en bourse largement anticipée. Le tour de table a été mené par les investisseurs historiques Altimeter Capital et Tiger Global, avec de nouveaux venus : Counterpoint Global (Morgan Stanley), Franklin Templeton, ServiceNow Ventures et Sutter Hill Ventures. Au total, l’éditeur a levé un plus d’un milliard de dollars à travers douze collectes.

DataRobot n’a pas divulgué le coût de l’acquisition annoncée le 27 juillet. Pour sa part, Algorithmia a levé 31,1 millions de dollars depuis sa création en 2014, selon Crunchbase.

Industrialisation du machine learning

L’acquisition d’Algorithmia doit compléter les solutions de DataRobot en matière de DataOps et d’autres segments du cycle de vie du machine learning et renforce la capacité de l’éditeur à offrir une plateforme que les entreprises peuvent utiliser pour automatiser la construction de modèles ML et à les déployer rapidement en production, selon Chirag Dekate, analyste chez Gartner.

« Le secteur dans lequel DataRobot évolue – l’opérationnalisation de l’IA en entreprise – est hyperactif et cela s’explique en partie par le fait que les organisations industrialisent l’IA comme jamais auparavant », affirme Chirag Dekate. « Elles veulent prendre des modèles d’IA et les déployer en production.

« Pour rester en tête de la courbe, les compagnies spécialisées dans l’IA peuvent soit innover par elles-mêmes, soit acquérir, soit faire tout cela à la fois », poursuit-il. « Dans ce cas, DataRobot fait tout cela. »

La croissance de DataRobot ne s’est pas faite sans heurts, cependant. En mars 2020, au début de la pandémie COVID-19, elle a licencié un nombre indéterminé d’employés.

DataRobot, le Pac-Man de la data science

L’acquisition d’Algorithmia intervient après que DataRobot a acheté Zepl en mai, le créateur d’une plateforme de partage de notebooks par les fondateurs d’Apache Zeppelin. En juin 2020, DataRobot a repris la technologie d’IA du Boston Consulting Group, notamment du code source et un logiciel de développement et de déploiement modulaire.

En février 2019, Cursor, un éditeur d’outils de recherche unifiée et de collaboration sur les données, rejoignait ses rangs. En juin 2019, c’était au tour de ParallelM, une startup qui vendait une plateforme de gestion, de déploiement et de surveillance de modèles d’apprentissage automatique, puis Paxata, spécialiste de la préparation de données, lui a fait allégeance en décembre 2019.

De son côté, Algorithmia propose une « plateforme » sous la forme d’une UI qui permet de connecter différents frameworks de machine learning (sckit-learn, TensorFlow, PyTorch, etc.) ou plateformes de data science afin de créer des modèles (ce qui est également possible à travers un IDE Web compatible avec sept langages de programmation), de les enregistrer dans un catalogue, puis de les entraîner et de les inférer en appelant une API qui elle-même lance les traitements sur des infrastructures sur site (VMware) ou dans le cloud. L’interface inclut aussi un autre catalogue dédié aux données d’entraînement et des modèles eux-mêmes, qui dépend d’une API spécifique. Les utilisateurs peuvent consulter le nombre d’appels vers les API, les clients émetteurs des appels, les erreurs et la consommation des ressources.

« La combinaison des capacités de déploiement de modèles d’Algorithmia et de sécurité et de gouvernance de niveau entreprise inclus dans la suite d’outils de surveillance et de gestion de modèle de DataRobot offre aux entreprises une plateforme opérationnelle pour exécuter n’importe quel modèle de machine learning », selon DataRobot.

Les cas d’usage incluent le traitement du langage naturel et la reconnaissance d’images qui demandent généralement de déployer des pipelines d’inférence complexes consommateurs de ressources CPU et GPU, précise l’éditeur.

À y regarder de plus près, certaines fonctionnalités se chevauchent, mais DataRobot supporte moins de langage de programmation et de plateformes de data science concurrentes qu’Algorithmia. Surtout, la manière dont la startup appelle les ressources, les supervise et les monétise promet une réduction de coûts non négligeables. Si DataRobot fournit déjà beaucoup d’informations sur les performances des modèles en production, il affichait jusqu’alors moins de données sur la consommation des ressources IT par les algorithmes. De plus, l’architecture d’Algorithmia est davantage pensée pour les data scientists et les data engineers, alors que DataRobot rencontre un certain succès chez les entreprises s’appuyant sur leurs équipes de data analysts expérimentés pour faire ce travail, selon Gartner.

La plateforme MLOps d’Algorithmia est utilisée par de grandes entreprises telles que Merck, EY, Deloitte et les Nations unies, selon ses créateurs.

Un marché hautement fragmenté

DataRobot s’est hissé à une position de premier plan sur le marché de la data science, qui compte au moins 70 startups axées sur différentes phases de la production de modèles d’apprentissage automatique, selon Chirag Dekate.

En outre, les géants du cloud que sont Google, Microsoft et AWS veulent tous renforcer l’efficacité et les capacités de leurs plateformes de data science pour attirer encore et toujours plus d’entreprises dans leur giron.

Avec sa dernière acquisition, ainsi que les précédentes, DataRobot cherche à fournir aux entreprises un système de production de machine learning « de bout en bout » plutôt qu’une série de « solutions ponctuelles », affirme l’analyste de Gartner.

« La combinaison permet aux entreprises de prendre des données et de les mettre en production et de déployer des modèles aussi rapidement que possible », répète-t-il. DataRobot doit encore s’assurer d’intégrer correctement les différentes technologies pour éviter l’effet « usine à gaz » et ne pas oublier de les enrichir régulièrement pour compléter son portfolio.

Pour approfondir sur Intelligence Artificielle et Data Science

Close