Cet article fait partie de notre guide: Le Who’s Who du Data Warehouse

L’essentiel sur HPE Vertica Analytics Platform

La solution Vertica Analytics Platform de Hewlett Packard Enterprise est conçue pour être utilisée dans les entrepôts de données et autres applications complexes, faisant un usage intensif des requêtes.

Au coeur de la solution HPE Vertica Analytics Platform de HPE se trouve un système de bases de données relationnelles orienté colonnes, spécifiquement élaboré pour gérer les charges de travail de l'analytique moderne. La plateforme utilise une approche en clusters du stockage de grands volumes de données, et de la mise à disposition de fonctions d'analytique et de requête hautes performances.

La solution fournit une fonctionnalité analytique SQL sophistiquée sous la forme d'un SGBDR qui repose sur des normes et qui s'accompagne d'une prise en charge intégrale du langage SQL et des technologies de connectivité JDBC (Java DataBase Connectivity) et ODBC (Open DataBase Connectivity). Les entreprises préservent ainsi les investissements ainsi que les années de formation dans ces technologies. En effet, tous les outils et langages de programmation SQL fonctionnent ici, ensemble, et de manière transparente.

La plateforme est un data store relationnel en colonnes. Il regroupe les données sur disques, en les organisant en colonnes plutôt qu'en lignes. En termes de regroupement et d'agrégation, les bases de données en colonnes, comme leur nom le laisse entendre, facilitent l'accès aux colonnes de données : ici, la donnée suivante lue sur disque correspond, non pas à une ligne, mais à l'attribut suivant (colonne suivante). Ainsi, une lecture réduite aux seules colonnes référencées par la requête permet d'améliorer le traitement de cette dernière et de diminuer les E/S disque.

La solution HPE Vertica Analytics Platform est disponible sur site, dans le Cloud ou en déploiement sur un cluster Hadoop.

HPE Vertica Analytics : caractéristiques et points forts

La solution HPE Vertica Analytics Platform 7.2 affiche une prise en charge Hadoop avancée. Les requêtes SQL s'exécutent directement sur des fichiers ORC, dopant ainsi considérablement les performances par rapport à un accès Hadoop classique.

Cette version fournit également une fonction de recherche textuelle sur les logs machine. Elle aide l'utilisateur à collecter et à indexer de grands volumes de données, tels que celles générées par des systèmes organisés en réseau. En outre, l'exploration des journaux, ou "log mining", aide les services informatiques à gérer des pratiques de sécurité des données, en identifiant et en anticipant les défaillances et les cyberattaques, et en enquêtant sur d'éventuels accès non autorisés.

Les fonctions d'analytique SQL avancées de HPE Vertica 7.2 contribuent à enrichir la bibliothèque de fonctions analytiques intégrées ; fonctions allant du traitement analytique relationnel en ligne, à l'analyse géospatiale ou de sentiments afin de tirer des informations de diverses formes de données.

La solution HPE Vertica 7.2 facilite l'administration grâce à une capacité de sauvegarde/restauration plus granulaire et à des alertes dynamiques et renforce la sécurité grâce à une synchronisation LDAP (Lightweight Directory Access Protocol) améliorée.

Elle permet aussi de contrôler les accès en fonction des rôles et d'automatiser la gestion des utilisateurs et des groupes d'utilisateurs. Parallèlement, une interopérabilité avancée avec les Cloud tiers est optimisée pour l'activité d'entrepôt de données à la demande, grâce à un assistant qui simplifie le chargement des données dans Vertica depuis Amazon S3.

La compression de données est également plus efficace. La solution HPE Vertica Analytics Platform dispose d'une bibliothèque d'algorithmes de compression qu'elle applique automatiquement en fonction du type de données. Cette compression des données peut alors diminuer l'espace disque occupé jusqu'à 90 %, ce qui induit une diminution des coûts de stockage et une accélération potentielle des requêtes.

La solution HPE Vertica Analytics Platform est une base de données distribuée de type Shared-Nothing (sans partage) conçue pour fonctionner sur des clusters de serveurs génériques. Ses performances évoluent par l'ajout de nouveaux serveurs au cluster.

Comparée aux bases de données traditionnelles, qui requièrent des serveurs de grande envergure avec de nombreuses UC et des réseaux de stockage (SAN), l'architecture grid de la plateforme diminue de manière substantielle les coûts liés au matériel et à la montée en charge.

En outre, l'organisation en clusters permet d'améliorer les performances, grâce à la gestion en parallèle des requêtes et des chargements à l'échelle des noeuds du cluster, pour obtenir un débit supérieur.

Différentes distributions Linux prennent en charge la solution HPE Vertica Analytics Platform, notamment :

  • Red Hat Enterprise Linux 6.x et 7.x
  • SUSE Linux Enterprise Server 11.0 à 11.0 SP3
  • Debian Linux 7.0 à 7.7
  • CentOS 6.x et 7.x
  • Ubuntu 12.04 LTS et 14.04 LTS

Des pilotes sont proposés pour les connectivités JDBC, ODBC et ADO.NET. L'utilisateur peut les télécharger individuellement ou sous la forme de packages. HPE fournit également un module spécifique Hadoop pour les machines clientes HPE Vertica.

HPE Vertica : licences, tarifs et assistance

Sur site. L'édition communautaire (Community Edition) permet d’utiliser gratuitement jusqu'à 1 téraoctet (To). Pour une version payante, dotée d'une assistance complète et d'au moins 1 To, l'utilisateur est facturé au téraoctet au moment de l'installation sur Vertica Platform.

En Cloud. L'utilisateur peut choisir de payer selon une tarification en fonction du stockage ou en fonction des requêtes. Par exemple, il peut acheter 1 To et 100 000 requêtes pour 999 dollars. S'il a besoin de plus de requêtes, il peut les acheter sous forme d'ensemble pour 999 dollars, et ainsi obtenir 500 000 requêtes supplémentaires et 250 Go de stockage. Une version d'essai gratuite de 14 jours de HPE Vertica OnDemand est disponible.

Pour les clients qui souhaitent utiliser Vertica pour SQL on Hadoop, la gestion des licences s'effectue par noeud. L'utilisateur paie alors par noeud sans autre limite en termes de requêtes, d'utilisateurs simultanés, de stockage utilisé, etc.

L'assistance et la maintenance sont à négocier dans le cadre de l'achat initial.

Pour approfondir sur Datawarehouse

Close