Cet article fait partie de notre guide: Le Who’s Who du Data Warehouse

L’essentiel sur Amazon Redshift

Amazon Redshift est un service de Data Warehouse hébergé. Conçu pour les charges de travail analytiques, cet entrepôt dans le Cloud permet aux entreprises d'utiliser leurs propres outils d'informatique décisionnelle pour leurs opérations d'analyse de données.

Amazon Redshift fournit des fonctions de base de données optimisées pour les requêtes analytiques. Cette offre complète d’autres systèmes Cloud de gestion de bases relationnelles (SimpleDB et Amazon RDS) ou non relationnelles (DynamoDB).

Caractéristiques de l'entrepôt de données Amazon Redshift dans le Cloud

Le Data Warehouse Redshift propose un traitement massivement parallèle qui repose sur un SGBD en colonnes. Cette infrastructure fournit des performances de requêtage rapides en exécutant des requêtes en parallèle sur plusieurs noeuds. Outre le stockage en colonnes, Amazon Redshift utilise la compression de données et le mappage de zones afin de réduire la quantité d'E/S nécessaires à l'exécution des requêtes.

Le matériel sous-jacent d'Amazon Redshift, conçu pour le traitement de données hautes performances, exploite le stockage local, de manière à optimiser le débit entre les CPU et les lecteurs, ainsi qu'un réseau maillé 10 GigE afin de maximiser le débit entre les noeuds.

L'architecture d'Amazon Redshift permet d'automatiser la plupart des tâches administratives courantes associées à la mise en service, à la configuration et à la surveillance d'un entrepôt de données dans le Cloud. Les données sont automatiquement sauvegardées sur Amazon Simple Storage Service (S3) de manière continue et incrémentielle. Les restaurations depuis S3 sont simples et permettent une reprise après désastre sur plusieurs régions.

Amazon Redshift offre des fonctions de sécurité intégrées, telles que le chiffrement des données au repos et en transit à l'aide des protocoles AES 256 et SSL à accélération matérielle, la gestion des clés avec AWS Key Management System, et l'isolement des clusters grâce à Amazon Virtual Private Cloud.

Il est possible d'ajuster la capacité de l'entrepôt à l'aide d'AWS Management Console ou d'un simple appel d'API. Ainsi, les utilisateurs peuvent modifier le type et le nombre de noeuds de l'entrepôt à mesure qu'évoluent les exigences de l'entreprise.

Les noeuds de stockage denses permettent par ailleurs de créer de très grands entrepôts de données basés sur des disques durs, à des prix très compétitifs. Il est également possible de configurer des noeuds de calcul denses afin de créer des entrepôts de données très hautes performances utilisant des CPU ultrarapides, une grande quantité de RAM et des disques SSD.

Étant donné que Redshift est fourni et géré dans le Cloud, les utilisateurs doivent disposer d'un compte Amazon Web Services.

Amazon Redshift gère les connexions issues d'autres applications au moyen des protocoles ODBC (Open Database Connectivity) et JDBC (Java Database Connectivity) standard.

Après avoir défini les pilotes et le compte AWS, il vous suffit de configurer vos règles de pare-feu pour être prêt à lancer un cluster Amazon Redshift.

Amazon répertorie les nouvelles versions d'Amazon Redshift par date sur son site Internet.

Licences, tarifs et support Amazon Redshift

Vous pouvez essayer Amazon Redshift gratuitement pendant deux mois, après quoi les prix commencent à 0,25 $ de l'heure, sans engagement. Les utilisateurs peuvent augmenter la capacité de leur entrepôt de données jusqu'à plusieurs pétaoctets, pour un coût de 1 000 $ par To et par an. Les données brutes sont compressées, généralement selon un facteur de 3, entraînant des coûts trois fois moins élevés que pour des données non compressées.

Les clients peuvent commencer avec un seul noeud DC1.Large de 160 Go, puis augmenter leur configuration jusqu'à atteindre un ou plusieurs pétaoctets, à l'aide de noeuds DS2.8XLarge de 16 To.

Au cours du redimensionnement, Amazon Redshift place votre cluster en lecture seule, en met un nouveau en service de la taille de votre choix, puis copie les données de l’ancien cluster vers le nouveau. Pendant cette opération, vous pouvez continuer à interroger l'ancien cluster.

Il existe quatre niveaux de support pour Amazon Redshift. Chacun comprend un nombre de cas illimité, avec une tarification au mois et sans contrat à long terme.

  • Basic : fournit un service client 24h/24 et 7j/7 et comprend un accès au centre de documentation, au tableau de bord de l'état des services, aux FAQ du produit, aux forums de discussion et aux vérifications d'état, sans frais supplémentaires.
  • Developer : s'ajoutent à la formule de base des conseils sur les bonnes pratiques et un temps de réponse garanti de moins de 12 heures.
  • Business : ajoute l'API de support et un temps de réponse garanti de moins d’une heure.
  • Enterprise : offre en plus un accès direct à un gestionnaire de compte technique, la gestion des événements liés à l'infrastructure et un temps de réponse garanti de moins de 15 minutes.

Pour approfondir sur Datawarehouse

Close