Sauvegarde : une évolution vers la gestion des copies de données

De plus en plus les éditeurs de solutions de sauvegarde s’intéressent à la gestion des copies de données (et vice versa). Ce tour d’horizon rapide de l’offre du marché vous permettra d’en savoir plus sur l’offre des différents fournisseurs et sur leurs implémentations.

Par Christophe Bardy et Chris Evans.
La gestion des copies de données, ou CDM pour Copy Data Management, décrit la discipline qui consiste à gérer et administrer les données autres que les données primaires. Il peut s’agir des copies destinées à la protection de données (snapshots, réplicas, sauvegardes), des copies générées à des fins de test ou de développement d’applications, etc...
On estime de façon générale que pour une donnée primaire, une entreprise stocke en moyenne entre 8 et 10 copies de données à des fins de protection, de test et de développement, ou d’analyse de données.

Lorsque l’on analyse les produits des principaux fournisseurs de gestion de copies de données, on distingue plusieurs catégories et modèles de mise en œuvre distincts. Certains fournissent leur technologie sous la forme d’appliances physiques, d’autres sous forme purement logicielle.

La plupart des solutions de CDM sont issues de start-ups spécialisées comme Actifio, Catalogic ou Delphix, ou par des éditeurs de solutions de sauvegarde et de protection de données cherchant à ajouter une corde supplémentaire à leur arc. Cependant, l’étendue des systèmes de gestion des données de copie s’élargit au fur et à mesure que les fournisseurs traditionnels ajoutent des fonctionnalités de gestion des données à leurs plates-formes. Ici, nous approfondissons les produits des six principaux fournisseurs de gestion des données de copie.

Actifio

Actifio est l’un des pionniers du « Copy Data Management » et a construit sa plate-forme autour d’un système de stockage objet distribué. La fonction Virtual Data Pipeline d’Actifio ingère des données à partir de plates-formes virtuelles et physiques de production. La plate-forme Actifio Sky prend en charge les applications traditionnelles telles que Oracle, Microsoft SQL Server, Microsoft Exchange et SAP, ainsi que les environnements virtuels, y compris VMware vSphere.

Sky ingère les données au niveau du bloc, tout en conservant la cohérence de l’application. Après une première copie complète des données, des données incrémentales sont utilisées pour permettre la création d’images synthétiques de l’application. Ces images sont rendues disponibles grâce aux caractéristiques du produit qui permettent le montage instantané de l’application, le clonage ou la restauration.

Actifio Sky est livré en deux versions : Actifio Sky Basic et Actifio Sky Advanced. La version de base offre des fonctions permettant d’effectuer des sauvegardes de VM, de les répliquer sur le cloud public, d’effectuer des restaurations instantanées et de les exécuter sous forme de VM ou d’appliance physique. Basic ne couvre que la protection des données pour les bases de données fonctionnant dans les environnements d’hyperviseur VMware vSphere et Microsoft Hyper-V, et n’offre qu’une protection de base des instances cloud.

La version Advanced étend les capacités de Basic en prenant en charge les bases de données et l’intégration des bases de données dans les nuages. Sky Advanced fournit également des capacités de sauvegarde physique, de sauvegarde NAS et de clonage de bases de données. Le produit inclut Sky DB, le produit de clonage et de récupération de base de données d’Actifio. Il prend en charge la capture cohérente des données des bases de données traditionnelles, et fournit des copies virtuelles utilisables par les développeurs grâce à des outils d’automatisation en libre-service, notamment Jenkins, Chef, Puppet, GitHub, Ansible et SaltStack.

Actifio annonce des temps de récupération quasi instantanés avec des bases de données de 100 To ou plus. Sky DB est disponible en tant qu’appliance virtuelle au format Amazon Machine Image dans Amazon Web Services (AWS), et fonctionne aussi dans les clouds d’Oracle et d’IBM. L’application peut aussi être déployée sous VMware et Hyper-V.

La plate-forme Actifio Sky prend en charge plusieurs environnements de cloud public, dont AWS, Microsoft Azure, Oracle Cloud, IBM Bluemix et Google Cloud. Dans AWS, Actifio propose deux produits : Actifio One pour la migration des instances VM vers AWS et Actifio Sky pour AWS.

Catalogic Software

Catalogic Software offre un système de gestion des copies de données purement logiciel. Son produit phare, ECX, s’intègre avec les grandes baies de stockage du marché et fournit des services de gestion des données in situ sur les baies Pure Storage, IBM, NetApp et Dell EMC (Unity). ECX tire parti des API de stockage et des API des applications pour s’assurer que les données sont capturées de façon cohérente afin de les mettre à disposition d’autres applications.

ECX offre trois caractéristiques principales :

  • Livraison automatisée des copies. La production et l’utilisation de copies sont hautement automatisées. Il est ainsi possible de générer simplement de nouvelles copies des données à des fins autres que la production, la protection de données ou les tests et le développement.
  • Libre-service utilisateur. ECX permet aux utilisateurs finaux d’accéder à un portail utilisateur pour gérer leurs propres copies de données dans le respect des contraintes établies par le département informatique.
  • Sensibilisation à l’application. ECX s’intègre avec les applications courantes pour fournir des copies cohérentes des données. Les applications supportées incluent Oracle Recovery Manager (avec le support d’Oracle RAC et d’Oracle ASM), Microsoft SQL Server et SAP HANA. Ce support est indépendant de la plate-forme de stockage matérielle utilisée.

 La version 2.7 d’ECX, la plus récente étend le support des applications à SAP HANA2.0 en plus des systèmes déjà supportés dont les principales bases de données du marché, mais aussi certaines applications métiers comme le logiciel de santé Epic electronic health records systems.

ECX peut être déployé sous forme d’appliance virtuelle ou dans un conteneur Docker.

Il est à noter que récemment, Catalogic a pris une participation dans l’éditeur européen Storware pour revendre ses produits de sauvegarde en conjonction avec ses propres logiciels. L’accord noué entre les deux firmes permet à Catalogic de revendre l’outil de protection des postes de travail Kodo ainsi que vProtect le logiciel de backup des environnements virtualisés de Storware (qui incluent Citrix XenServer, Xen, Red Hat Virtualization, Nutanix Acropolis et KVM).

Cohesity

Spécialiste du stockage secondaire, Cohesity a été fondé en juin 2013 par Mohit Aron, l’un des fondateurs de Nutanix. L’entreprise a reçu 410 millions de dollars de financement, dont 250 millions de dollars lors de sa dernière levée de fonds en juin 2018.

La technologie de Cohesity s’appuie un système de fichiers distribué qui supporte un grand nombre d’instantanés et la possibilité de récupérer des données à partir de n’importe quelle image sans impact sur les performances. Le logiciel de l’éditeur, baptisé DataPlatform, est disponible en trois versions - sous forme d’appliances matérielles dédiées et dans deux versions logicielles uniquement.

Cohesity propose un choix de cinq appliances matérielles offrant des capacités allant de 6 To bruts à près de 180 To. L’éditeur propose aussi DataPlatform Virtual Edition, qui permet aux entreprises d’exécuter sa technologie sur une infrastructure vSphere. Enfin, Cloud Edition est une version du logiciel Cohesity qui s’exécute dans les clouds publics d’Amazon AWS, Microsoft et Google. Les données peuvent être répliquées entre les versions sur site et le nuage pour une protection hors site et pour permettre la migration des données. L’ensemble de ces plates-formes peut être piloté de façon centralisée depuis une console unique en mode SaaS, baptisée Helios

DataPlatform 4.0, sorti en avril 2017, a introduit des capacités de stockage objet compatibles Amazon S3. Il a également ajouté le support de la sauvegarde des serveurs NAS. La couverture des serveurs physiques et du stockage a été étendue à l’aide du support des API de snapshot des baies Pure Storage FlashArray//M.

Les appliances physiques et virtuelles sont tarifées par nœud. Le logiciel DataProtect de l’entreprise fait l’objet d’une licence par capacité.

Commvault

Commvault Systems est historiquement connu comme un fournisseur de logiciels de sauvegarde, mais a constamment augmenté les caractéristiques de ce que l’éditeur appelle maintenant sa plate-forme de données. Comme de nombreux autres produits du marché, Data Platform peut désormais fournir des points de récupération aux applications en utilisant des sauvegardes complètes et incrémentales pour fournir des restaurations synthétiques.

Commvault Data Platform prend en charge les infrastructures virtualisées « on premises » et les grands fournisseurs publics de cloud computing, dont AWS et Microsoft Azure. Cela permet aux clients d’utiliser le cloud public pour la récupération d’applications et cela permet aussi de migrer des applications dans le cloud.

En ce qui concerne la protection des données, Commvault fournit une gestion des instantanés pour un large éventail de fournisseurs de stockage, permettant la gestion sur place des copies de données. Les fonctions d’automatisation permettent de transformer des tâches répétitives en flux de travail, avec de nombreuses tâches communes déjà préconfigurées.

En passant à la gestion de contenu, Commvault Data Platform offre des fonctions de conservation et de conformité des données, permettant la recherche et la découverte électronique et l’archivage des courriels. Commvault gère les bases de données traditionnelles, y compris Oracle, Microsoft SQL Server, IBM DB2, ainsi que plusieurs bases de données open source, comme MySQL, PostgreSQL et MongoDB.

L’éditeur propose plusieurs modes de licence selon les fonctionnalités désirées. Solution Set fournit des fonctions de sauvegarde et de restauration d’entrée de gamme. Platform Licensing délivre un ensemble plus large de fonctions de gestion des données. Enfin Capacity Licensing donne accès à toutes les fonctions et les factures en fonction de la quantité de données gérées.

Delphix

La plate-forme de Delphix diffère des solutions offertes par ses concurrents puisqu’elle se concentre sur le Copy Data Management appliqué aux bases de données.

Le moteur Delphix se déploie sous la forme d’une machine virtuelle pour vSphere ou KVM. Le moteur de virtualisation de l’éditeur supporte l’ingestion native de données provenant des bases de données Oracle, SQL Server, DB2, SAP, SAP ASE, PostgreSQL et MySQL.

Le moteur de virtualisation de Delphix stocke les données sur le système de fichiers Delphix (dérivé de ZFS). Les données sont à la fois dédupliquées et compressées, ce qui permet de réaliser une économie de 3:1. Une fois qu’une copie complète initiale a été stockée, les mises à jour de l’application sont stockées au fil de l’eau ou par incréments, ce qui permet de restaurer les copies complètes et synthétiques d’une base de données à n’importe quel moment antérieur.

Les données sont mises à disposition pour la restauration ou comme service de base pour le travail des développeurs d’applications par le biais d’une interface libre-service. Le moteur de virtualisation met en œuvre des contrôles d’accès basés sur les rôles qui régulent ce à quoi les utilisateurs finaux peuvent et ne peuvent pas accéder. Il embarque des fonctions sophistiquées de masquage (statique ou flexible) et de filtrage de données.

Delphix prend également en charge la réplication des données vers un deuxième moteur de virtualisation pour la sauvegarde et la reprise après sinistre. Cette approche peut être utilisée comme alternative aux outils de réplication des fournisseurs afin de fournir une interface cohérente pour les environnements de bases de données hétérogènes.

Rubrik

Fondé en 2014, Rubrik a levé près de 300 millions de dollars et s’est rapidement hissé sur le marché de la sauvegarde de données et du copy datamanagement (CDM) pour devenir l’un des fournisseurs en vue du marché.

La société a fait ses débuts en mettant l’accent sur les fonctions de sauvegarde et de protection de données de sa plate-forme, mais elle a progressivement pris un virage vers le CDM et la gestion de données avec la sortie de la version 4.0 de sa plate-forme (nom de code Alta) à l’été 2017. Depuis les capacités de la plate-forme ont été enrichies d’un large support du cloud.

La solution de Rubrik s’appuie sur un système de fichier distribué et se déploie sous la forme d’appliances physiques ou virtuelles. Cinq configurations d’appliances physiques sont disponibles avec des capacités allant de 36 à 120 To. Les appliances virtuelles se déclinent quant à elles dans les environnements ROBO (« Remote Office, Branch Office ») ou dans le cloud. La prise en charge du cloud permet par exemple aux utilisateurs de restaurer des VMs en tant qu’instances dans le cloud public, ou d’instancier des répliques de VM de production dans le cloud à des fins de test et de développement.

Avec la sortie récente de la version 4.2, le logiciel combine désormais des fonctions avancées de sauvegarde, de réplication et d’archivage avec des fonctions sophistiquées de « copy data management », d’indexation ainsi que d’analytique, et ce, aussi bien on premises que dans le cloud (avec un support avancé d’Amazon AWS).

Ces fonctions ont été complétées au printemps par le lancement de Rubrik « Polaris », une plate-forme de gestion de données en mode SaaS conçue comme un parapluie cloud pour piloter les multiples déploiements Rubrik d’une grande entreprise. Avec Polaris, Rubrik fournit un point de contrôle centralisé dans le cloud pour apporter une visibilité sur l’ensemble des données gérées par les environnements Rubrik d’une entreprise, qu’elles soient dans le datacenter ou dans le cloud. 

Pour approfondir sur Administration du stockage

Close