Rustic - stock.adobe.com

Plongée dans les abysses du partenariat entre SAS et SingleStore

À la fin du mois d’août, le spécialiste de l’analytique et l’éditeur d’une base de données multimodèle ont présenté un partenariat stratégique. Avec la solution commune qui en découle, SAS espère bien convaincre ses clients qu’il peut les aider à migrer vers le cloud tout en réalisant des économies.

Même si en mai dernier, SAS réalisait 60 % de ses nouvelles ventes dans le cloud, environ 66 % des clients de SAS n’ont pas migré vers le nuage. L’éditeur mise, depuis le lancement de sa plateforme SAS Viya 4, sur une architecture cloud native. Toutefois, il semble avoir du mal à convaincre des clients de passer le pas.

L’éditeur sait très bien que certains clients n’ont aucun intérêt à le faire, au vu de la sensibilité de leurs données. Les produits de SAS sont très populaires dans les milieux régulés de la finance, de l’industrie pharmaceutique, du renseignement civil et militaire ou encore dans les administrations.

Parmi ceux qui peuvent migrer, certains hésitent encore au vu de la politique de maintenance de l’éditeur. SAS n’a pas posé d’ultimatum à ses utilisateurs pour passer dans le cloud et ne semble pas vouloir le faire pour l’instant.

En l’occurrence la plupart des versions de SAS 9.4, la plateforme legacy de SAS, bénéficieront d’un support standard jusqu’en 2025, mais l’éditeur n’a pas annoncé de date de fin de vie. Toutes les mises à jour de maintenance de SAS 9.4 bénéficient de cinq ans de support standard. La disponibilité de SAS 9.4 M8 est prévue à la fin du mois de janvier 2023. En clair, cette mouture sera supportée a minima jusqu’en 2028.

Pour ceux qui souhaitent moderniser leur architecture de traitements de données, SAS s’est assuré de la portabilité de Viya, afin que la plateforme, réceptacle des outils de préparation, d’analyse et de visualisation de données de l’éditeur, puisse être déployée sur site ou chez des fournisseurs cloud qu’il ne supporterait pas nativement. Cette portabilité est passée par la conteneurisation et le passage à Kubernetes, ainsi que la prise en charge des solutions du marché, dont Red Hat OpenShift. Ainsi, ceux qui n’auraient pas encore franchi le pas du cloud pourraient se préparer en migrant de SAS 9 vers SAS Viya, puis réaliser un lift and shift plus tard.

D’autres clients de SAS, qu’ils déploient leur plateforme analytique sur site ou dans le cloud, sont à la recherche de gains de performance et de réductions des coûts. « En réalité, nous évoquons le sujet de la réduction du coût du cloud depuis un an et demi », assure Bryan Harris, EVP et CTO de SAS auprès du MagIT. « Il y a environ un an, les gens se disaient que cela ne serait pas un problème. Maintenant, tout le monde en parle, parce que les marchés financiers ont changé de telle sorte que les entreprises veulent optimiser leurs coûts. Et la consommation de services cloud génère de très grosses factures pour les organisations ».

 En ce sens, l’éditeur aurait réalisé « des investissements importants » pour réduire les coûts des analyses et des traitements de machine learning, avance Bryan Harris. « Nous avons fait beaucoup d’investissements technologiques en matière d’intégrations afin de minimiser les mouvements de données, qui représentent une part importante d’une facture cloud ».

SAS s’est ainsi rapproché de SingleStore, un partenariat « stratégique » rendu public à la fin du mois d’août 2022.

SAS + SingleStore = In-memory²

SingleStore (ex-MemSQL) est l’une des célébrités montantes dans le monde du SGBD. Il propose une base de données multimodèle (OLAP/OLTP) propulsée par une technologie in-memory et établie sur un socle relationnel. Elle combine trois tiers de stockage : un froid, dans les services de stockage objet, un tiède dans un cache persistant de stockage en bloc et un chaud, en mémoire.

Ses clients habituels ? Les plateformes de streaming, les services financiers, les acteurs du manufacturing et quelques grands noms du retail. Ce qui les attirent ? La promesse de performance et l’espoir de réduire le nombre de SGBD installé dans l’entreprise. « SingleStore est véritablement à la pointe sur le marché de la base de données », juge Bryan Harris. « Pour nous, ils se distinguent parce qu’ils offrent une technologie cloud native qui peut s’exécuter on premise au besoin, et les benchmarks de performances sont vraiment remarquables », vante-t-il.

Pour bien comprendre pourquoi SAS estime que l’apport de SingleStore est bénéfique pour ses clients, il est de bon ton d’évoquer l’architecture de SAS Viya. Celle-ci s’adosse à des bases de données relationnelles, des data warehouse ou des data lake. SAS Viya s’appuie pleinement sur Kubernetes.

Accessible depuis un serveur Jump (pour l’authentification) et une gateway, un seul namespace Kubernetes peut contenir quatre pools de nœuds. Les nœuds stateteless contiennent les applications et les services SAS reposant sur des architectures de microservices. Des nœuds stateful servent, au besoin, au stockage persistant des données des utilisateurs, typiquement à l’aide d’une base de données PostgreSQL.

Ensuite, il y a deux types de nœuds consacrés aux traitements des données : les nœuds « Compute Services » consacrés aux traitements dans les applications SAS et in-data base (comme les procédures stockées), ainsi que les nœuds CAS (Cloud Analytics Service). Le pool CAS représente le moteur in-memory de SAS. Il est composé d’un contrôleur et de plusieurs workers, permettant l’exécution des tâches de préparation et les traitements analytiques à l’aide d’une architecture distribuée hautement parallèle.

Avant de pouvoir traiter les données in-memory, elles sont d’abord chargées, puis copiées en mémoire dans des tables propriétaires. Dans le cadre de l’intégration avec SingleStore, la base de données réside dans le même namespace que les nœuds CAS. SingleStore s’appuie également sur deux types de nœuds : les nœuds « leaf », qui contiennent un sous-ensemble de données d’un cluster pour les opérations basiques, et les nœuds aggregator, « qui acheminent les requêtes vers les nœuds feuilles, agrègent les résultats intermédiaires et renvoient le résultat au client ».

SAS et SingleStore ont développé un connecteur permettant le transfert de données en parallèle entre la base de données et la plateforme. Plus précisément, il est possible de charger les données dans les nœuds CAS en provenance des nœuds agrégateurs. Cela améliorerait les performances pour les tables très volumineuses (plus de 100 000 lignes). Dans un même temps, SAS pousse automatiquement ses procédures stockées (SAS Embedded Procedure ou EP) au sein des nœuds leaf. Il est ainsi possible d’effectuer localement les opérations WHERE et les colonnes calculées.

« Cela nous aide à réduire la taille de notre calcul analytique en mémoire, en laissant les données dans la base de données et en les diffusant par le biais de notre protocole de diffusion construit entre SAS Viya et SingleStore », résume Bryan Harris. « Nous effectuons des analyses in-memory au point d’exécution ». Ainsi, il serait possible d’abaisser le nombre de nœuds CAS et donc de réduire les coûts de calcul.

Des économies d’envergure sur le stockage

Mais les gains les plus directs pour les clients ayant déjà opté pour la solution concernent les coûts de stockage. Historiquement, SAS utilise les formats propriétaires 7BDAT et HDAT. « Ces formats étaient optimisés pour la rapidité de lecture, ce qui est bien, mais quand vous avez beaucoup de données de chaînes variables en taille, cela gaspille de l’espace de stockage », explique le CTO.

Dans SingleStore, les données sont compressées par défaut. « Avec cette solution, vous bénéficiez d’un format orienté colonnes et de ses avantages de compression », assure-t-il. 

« Certains clients ont économisé 60 à 80 % d’espace de stockage en cloud rien qu’en mettant leurs données dans SingleStore », relate Bryan Harris. « Ce seul avantage se traduit en économie réelle : ils peuvent réduire leurs coûts de stockage d’un demi-million, de deux millions, de trois millions de dollars selon la quantité de données à leur disposition. C’est un avantage énorme avant même de faire quoi que ce soit d’autre avec les données ».

Outre la compression des données, le système de tiering, désormais commun à la plupart des SGBD in-memory, serait efficace. « Cela permet de laisser les données à faible accès dans des services de stockage en bloc ou de stockage objet, et donc de bénéficier des modèles de coûts inférieurs ».

Techniquement, la plateforme SAS Viya perçoit SingleStore comme n’importe quelle autre source de données qui inclurait la librairie caslib nécessaire à l’exécution des traitements au sein des pools CAS. Commercialement, ce partenariat donne lieu à une offre spécifique intitulée « SAS Viya with SingleStore », ce qui justifie les améliorations régulières en provenance des parties prenantes.

Des améliorations à venir

« Au cours de l’année prochaine, nous allons fournir des améliorations significatives pour prendre en charge les algorithmes multipasse, les méthodes de gradient boosting et les réseaux de neurones, etc. »
Bryan HarrisEVP et CTO de SAS

Les deux éditeurs ont d’abord optimisé les charges de travail liées à SAS Visual Analytics. Depuis, le mois d’août, les deux éditeurs ont ajouté la prise en charge des méthodes des k plus proches voisins et de l’analyse en composantes principales sur de gros volumes de données, en sus de fonctions pour superviser et alléger les traitements. La solution ne supporte pas encore certains traitements liés au développement de réseaux de neurones.

« Au cours de l’année prochaine, nous allons fournir des améliorations significatives pour prendre en charge les algorithmes multipasse, les méthodes de gradient boosting et les réseaux de neurones, etc. Tout un ensemble de techniques de Deep Learning qui seront optimisées pour cette intégration », promet Bryan Harris.

Aussi, les deux partenaires ont fait en sorte de ne pas verrouiller contractuellement l’accès à la base de données SingleStore. « Nous ne nous soucions pas du fait que nos clients utilisent des produits concurrents pour interroger les données. Nous voulons simplement que nos clients sachent que nous les aidons à obtenir une base de données cloud native, qui peut être exécutée sur site ou dans le cloud », vante le CTO. « Et que SAS dispose des outils analytiques optimisés pour ce SGBD ».

« Plusieurs clients » auraient déjà adopté l’offre SAS Viya with SingleStore, mais le CTO n’a pas cité de noms.

Pour approfondir sur Base de données

Close