L’essentiel sur SAP HANA

LeMagIT fait le point sur les principales bases de données du marché. Place à la base In-Memory et multimodèle de SAP, HANA.

SAP HANA est un SGBD relationnel In-Memory en colonnes. HANA est structuré de manière à permettre aux applications de prendre en charge les traitements transactionnel et analytique sur un seul système avec un même jeu de données. 

Le SGBD, qui s’exécute sur SUSE Linux (SLES) et Red Hat Enterprise Linux (RHEL), prend en charge l’analytique en temps réel sur des systèmes transactionnels, à grande échelle et sur des données très diverses : structurées, non structurées, spatiales, chronologiques et en flux.

Reposant sur des serveurs certifiés, propulsés par des chipsets Intel ou IBM Power, il offre des fonctionnalités qui facilitent le développement d’applications SAP et sur mesure.

SAP HANA combine des fonctions de base de données, d’analytique avancée (prédictive, spatiale, analyse de texte, analyse de sentiments, recherche), de gestion des informations de l’entreprise (chargement en masse, réplication en temps réel, transformation, nettoyage) et de serveur d’applications. Toutes ces fonctions s’exécutent dans la mémoire vive, sur un seul jeu de données et une seule plateforme.

SAP HANA prend en charge le modèle multitenant et la hiérarchisation des données (data tiering), ce qui permet des déploiements en pétaoctets pour stocker les données tièdes (qui font l’objet de peu d’accès) sur le disque et offre un grand choix de modèles de déploiement et de partenaires.

Le SGBD peut être déployé localement, dans le cloud ou dans une configuration hybride alliant les deux.

Fonctionnalités SAP HANA

Le SGBD In-Memory SAP HANA est doté de trois composants essentiels : des services applicatifs, des services de base de données et des services d’intégration (dont les API développeur).

SAP HANA Extended Application Services (XS) offre un serveur d’application de faible encombrement, un serveur Web prenant en charge JavaScript côté serveur et les bases d’une plateforme de développement d’applications. XS est intégré à SAP HANA ; il ne s’agit pas d’un logiciel séparé.

XS inclut des bibliothèques d’interface utilisateur Fiori (basées sur Open UI5) pour permettre aux clients de développer des applications Web grand public accessibles à partir de n’importe quel équipement.

Les services de base de données se composent des principaux services de moteur et de système de base de données du SGBD, ce qui permet la création d’applications de traitement transactionnel en ligne (OLTP), de traitement analytique en ligne et d’applications transactionnelles de nouvelle génération avec des fonctionnalités intégrées d’analytique prédictif.

Les services d’intégration incluent la fonction Smart Data Access, qui fournit la virtualisation et la fédération des données, l’intégration des données intelligentes ainsi que diverses fonctions telles que le chargement en masse, la réplication bidirectionnelle en temps réel, la transformation et le nettoyage des données, et le traitement de données en streaming.

La synchronisation à distance permet aux entreprises de synchroniser leurs informations avec leurs équipements et sites distants.

Elle permet en outre l’intégration entre Hadoop et HIVE, Spark et l’accès direct aux fichiers HDFS et aux tâches Map Reduce à l’aide de fonctions virtuelles définies par l’utilisateur (vUDF).

Pour créer des applications, les développeurs disposent d’outils de développement Web ou SAP HANA Studio basés sur Eclipse. SAP Database Control Center et le « cockpit » SAP HANA fournissent des outils Web basés sur Fiori permettant d’administrer et de surveiller HANA à partir de n’importe quel lieu et équipement.

En 2015, la version SPS 10 (Support Package Stacks) de SAP HANA 1.0 présentait plusieurs nouveautés afin d’améliorer la gestion des rôles, d’apporter davantage de mécanismes de sécurité taillés pour les besoins des entreprises (pour le chiffrement, l’authentification unique, des privilèges d’analytique SQL, de nouveaux privilèges système et de nouveaux privilèges au niveau des objets) ou encore de surveiller et d’optimiser les performances du SGBD.

Il y avait également une meilleure gestion de la synchronisation des données à distance et des connecteurs vers Apache Spark, et les dernières versions des distributions Hadoop de Cloudera, Hortonworks et MapR, en plus d’un transfert accéléré des données grâce à Spark SQL et d’une interface d’administration unique pour HANA et Hadoop utilisant Apache Ambari.

La version SPS12 de SAP HANA, qui a été publiée en 2016, offre plusieurs nouvelles fonctionnalités clés. La possibilité de capturer et de rejouer des charges de travail afin de comparer les temps d’exécution entre les environnements facilite la gestion des changements en termes de tests et de mise en œuvre. Cette version permet également aux administrateurs de bases de données d’activer ou de désactiver facilement les classes de charge de travail pour prendre en charge les changements commerciaux tels que le traitement de fin de mois.

La prise en charge multitenant est améliorée grâce au clonage et au déplacement des locataires en temps d’arrêt quasi nul, à la journalisation des audits pour les scénarios interlocataires et à des détails de surveillance plus granulaires. La réplication du système est également améliorée grâce à une plus grande flexibilité dans le choix des combinaisons de réplication synchrone et asynchrone entre les niveaux.

Le SAP HANA Cockpit a été considérablement optimisé avec de nouvelles options de configuration et de surveillance, la possibilité de planifier des tâches de sauvegarde et des capacités d’administration de la sécurité améliorées. Les améliorations en matière de sécurité comprennent la gestion des politiques de mot de passe et des listes noires, la configuration et la gestion de l’audit, et la gestion du cryptage des volumes de données.

Du point de vue du développement d’applications, cette version apporte des améliorations en matière d’exploration de texte et de traitement spatial, ainsi qu’une prise en charge du traitement des données orientées graphes.

Cette version SPS 12 n’est plus officiellement supportée par SAP depuis juin 2021.

Éditions de SAP HANA

SAP HANA se décline en quatre éditions :

  • SAP HANA Base Edition, qui fournit les principaux services de base de données et les outils de développement, ainsi que des bibliothèques de fonctions métier et prédictives et l’intégration avec le système R.
  • SAP HANA Platform Edition, l’édition de base, à laquelle s’ajoutent les moteurs de traitement spatial, de recherche, de texte, d’analytique, de représentation graphique, ainsi que d’autres bibliothèques et outils de développement intégrés.
  • SAP HANA Enterprise Edition, l’édition plateforme intégrant des packs de composants pour le data provisioning et HANA Rules Framework.
  • SAP HANA Runtime Edition, réservée à l’exécution des applications SAP. La licence dépend de la valeur de l’application et non des unités de mémoire.

Le SGBD SAP HANA In-Memory utilise un accès relationnel (SQL et MDX), mais déploie un SGBDR en colonnes et prend en charge les données géospatiales, orientées graphes (avec le langage de requêtes Cypher, développé par Neo4J), en streaming et de texte/non structurées.

Licences et tarifs SAP HANA

Plusieurs types de licences SAP HANA sont proposés : achat d’incréments de mémoire, contrat de licence d’entreprise ou base de données exécutable pour les applications SAP. La tarification repose généralement sur des incréments de mémoire de 64 Go.

Le SGBD SAP HANA In-Memory est commercialisé par SAP et par des intégrateurs de systèmes, des éditeurs de logiciels indépendants, des fournisseurs OEM et des partenaires cloud.

SAP propose 20 options d’essai gratuit pour différentes applications HANA, notamment un essai de 30 jours pour Business Warehouse Powered by HANA et la version Amazon Web Services pour SAP HANA One, à 99 cents de l’heure. Les périodes d’essai durent entre trois et 30 jours, selon le produit.

SAP propose plusieurs niveaux de support pour SAP HANA, du support d’incident standard à la collaboration personnalisée entre SAP et le client.

Des tests d’évaluation des performances SAP BW-EML sur SAP HANA permettent d’évaluer l’impact des fonctionnalités In-Memory de HANA par comparaison avec les performances des SGBD.

Différence entre SAP HANA et SAP HANA 2.0

En 2016, SAP a aussi présenté la disponibilité générale de SAP HANA 2.0. Selon les dires de Denys van Kempen, Solution Expert, SAP BTP, sur les forums de SAP, cette dénomination a été choisie à des fins marketing. HANA 2.0 s’inscrit dans la pure continuité de HANA et vient enrichir des capacités existantes.

La principale différence entre SAP HANA 2.0 et HANA tient dans le fait que l’éditeur a imposé par défaut une architecture multitenant. Le système peut supporter des tenants de bases de données. Chacun d’entre eux est isolé et alloué à une application. Selon SAP, cette approche apporte davantage de sécurité et permet de mieux séparer les charges de travail, notamment en matière d’administration de la bande passante. Plus tard, SAP a introduit un stockage multi-tier, à partir de la SPS04, en avril 2019.

HANA 2.0 est administré depuis SAP Cockpit 2.0, un module revu et corrigé pour administrer le SGBD. De même, le serveur applicatif « built-in » basé sur le moteur JavaScript SpiderMonkey a été remplacé par défaut par XS Advanced (XSA), c’est-à-dire une distribution de la PaaS Cloud Foundry. Cependant, comme SAP et ses clients n’aiment pas voir disparaître des fonctionnalités legacy, la plupart des capacités et des utilitaires du SGBD sont maintenus.

En 2020, SAP a commercialisé HANA 2.0 SPS 05, la version LTS de cette deuxième mouture, qui est prise en charge jusqu’en 2025. En décembre 2021, l’éditeur allemand a aussi dévoilé SAP HANA 2.0 SPS 06, une distribution bénéficiant de deux ans de maintenance.

Si certaines sources de données ont changé, il s’agit toujours de prendre en charge des traitements HTAP via un service multimodèle, d’apporter divers mécanismes de sécurité et de traiter divers formats de données. Avec SPS 05, SAP s’est principalement concentré sur le support d’algorithmes de machine learning, de langage de programmation comme Python, et de capacités graphes. La SPS 06 met l’accent sur la sécurité, la haute disponibilité, la gestion des workloads, des réplicas et des backups.

Vers SAP HANA Cloud

En réalité, quand SAP a dévoilé HANA 2.0, il avait déjà l’intention de fournir SAP HANA Cloud, une DBaaS disponible depuis 2020 sur AWS, Google Cloud, et Microsoft Azure. La promesse ? Réduire drastiquement le TCO de la base de données, un des inconvénients majeurs de SAP HANA on prem. Et puisque le cloud lui permet cela, SAP HANA Cloud dispose d’une déclinaison Data Lake.

À titre d’exemple, la mise à jour QRC1 2022, disponible depuis mars 2022 permet aux clients de contrôler les mises à jour et de réaliser les audits des données présentes dans le data lake. Cette version introduit également un mécanisme de haute disponibilité multizone entre deux AZ, avec synchronisation de la réplication, qui n’est pas pour l’instant compatible avec le dispositif de disaster recovery. Là encore, SAP a introduit plusieurs librairies Python consacrées au machine learning, ainsi que des fonctions d’AutoML. Cette version enrichit aussi les traitements SQL, notamment pour la constitution de vues fédérées et les requêtes sur les fichiers JSON.

Article publié le 17 septembre 2015, mis à jour le 13 mai 2022.

Pour approfondir sur Outils décisionnels et analytiques

Close