Parti après les autres, le fournisseur doit mener des projets sur plusieurs fronts. Dans le domaine En 2022, OVHcloud a principalement déployé des bases de donnes managées, 12 SGBD au total, et a complété son portfolio consacré aux charges de travail d’IA.

Aux services AI Notebooks (Jupyter, VS Code, et bientôt Matlab) et AI Training, s’est ajouté AI Deploy, accessible actuellement en bêta. La disponibilité générale de cette solution consacrée à l’inférence de modèles depuis des conteneurs Docker est prévue pour le 3 avril 2023.

Plus tard dans l’année, OVHcloud compte commercialiser une marketplace qui accueillera des modèles préentraînés, dont ceux des startups Gladia et Voxist. AI Notebooks, Training et Deploy sont compatibles avec Conda, PyTorch, TensorFlow, Scikit-learn, Fast.AI et la plateforme Huggingface. Le fournisseur veut également rendre disponible des « tranches de GPU pour permettre d’affiner le coût de l’apprentissage », dixit Thierry Souche, CTO d’OVHcloud, lors de l’événement Very Tech Trip, qui se tenait ce 2 février à la Cité des sciences et de l’industrie, à Paris.

Concernant l’inférence, OVHcloud anticipe plusieurs modes d’utilisation, suivant les usages et le nombre d’appels API. Il s’agit par ailleurs de rendre possible « l’exécution de modèles sur de multiples GPU », et leur déploiement sur site.

Cela ne suffit pas à constituer une plateforme de traitement de données. C’est pour cette raison que le fournisseur a mis la main sur ForePaaS en avril 2022. Cette startup française spécialisée dans l’analytique a commencé par développer un moteur ELT/ETL pour finalement proposer une PaaS analytique à ses clients.

Sans mettre fin à la disponibilité de cette solution sur d’autres clouds (la plateforme de ForePaaS peut être déployée sur AWS, Microsoft Azure, GCP ou OVHcloud), le fournisseur entend découpler et enrichir ces fonctionnalités pour fournir sa propre collection de services PaaS. OVHcloud va adapter la brique ELT/ETL de ForePaaS, qui sera disponible en alpha au mois d’août 2023. Elle disposera d’une cinquantaine de connecteurs. Cette solution de collecte et d’ingestion de données complétera le service Apache Kafka à la demande et s’ajoutera aux bases de données managées, aux outils d’observabilité, aux services de processing Apache Spark, et aux solutions d’IA.

Un lakehouse open source en approche chez OVHcloud La collection de services PaaS d'OVHcloud. Mais il manque encore des briques clés pour compléter cette collection. L’une d’entre elle n’est autre qu’un lakehouse open source, « hautement personnalisable », dont une première version devrait être accessible « dans le courant de l’hiver 2023 ». Les premières illustrations suggèrent une interface similaire à celle de Snowflake. Il s’agira en premier lieu d’interroger des données relationnelles placées dans des instances de stockage objet compatible S3. L’équipe derrière ForePaaS est également en train de développer un outil de visualisation de données « à la Apache SuperSet ou à la Metabase » (deux outils de visualisation open source N.D.L.R), ainsi qu’une interface « no-code » afin de rendre le tout simple d’utilisation pour les data analysts. Au cours de l’année 2023, OVHcloud veut aussi pouvoir transférer ou exposer les données vers des outils tiers, qu’ils soient hébergés sur son cloud, ou non. Sur un slide diffusé lors de l’événement Very Tech Trip, le fournisseur évoque Tableau, Dataiku, ALEIA, ou encore Qlik. « Si vous n’aimez pas notre dataviz, nous serons nativement ouverts vers les solutions leaders du marché », promet Thierry Souche. Ce sera aussi vrai pour le lakehouse, si les éditeurs tels Snowflake, Databricks ou encore Dremio sont prêts à suivre le fournisseur français. Dans un même temps, OVHcloud fait évoluer son stockage objet. À la fin du mois d’octobre dernier, il annonçait la disponibilité en bêta de Cold Archive, un tier (très) « froid » pour son stockage objet compatible S3 (les données sont stockées sur des bandes physiques IBM). Il proposera d’ici à deux mois des réplications asynchrones et inter-régions des buckets, ainsi qu’un système de gestion des politiques de déploiement et d’accès. En outre, les bases de données SQL s’intègreront plus facilement avec ce service.