Dossier Déduplication : faites faire une cure d’amaigrissement à vos données 

Le 05 novembre 2010 (13:16) - par Christophe Bardy

Imprimer Envoyer par e-mail

Rubriques : Gestion des données - Archivage - Backup et protection de données Tags : sauvegarde - deduplication

La déduplication des données a fait couler beaucoup d’encre au cours des dernières années. Alors que les volumes de données primaires des entreprises continuent à progresser à un rythme rapide et que les exigences de continuité et la réglementation se traduisent par un accroissement des volumes de données sauvegardées, la déduplication apparaît comme la seule technologie à même de limiter la course à la capacité à laquelle se livrent fournisseurs et entreprises depuis plusieurs années. LeMagIT fait un point sur la technologie et ses usages ainsi que sur les principaux fournisseurs du marché.
Dossier Déduplication : faites faire une cure d’amaigrissement à vos données

Dossier Déduplication : faites faire une cure d’amaigrissement à vos données

Au sommaire de notre dossier :

1 - Déduplication : aujourd’hui pour la sauvegarde, demain pour les données primaires ?

2 - Déduplication : une appellation, plusieurs technologies

3 - La déduplication de données permet de réduire l’impact de la prolifération des machines virtuelles

4 - NetApp va revendre les appliances de déduplication et de VTL de Fujitsu

5 - Déduplication : les forces en présence

[Pour consulter l’ensemble de ce dossier téléchargez-le !]


Déduplication : Aujourd’hui pour la sauvegarde, demain pour les données primaires ?


Confrontées à la croissance exponentielle de leurs données, de plus en plus d'entreprises s'intéressent de près à la déduplication une technologie qui dans ses différentes incarnations permet de supprimer les doublons dans les données stockées et résulte dans d'important gains d'espace. Aujourd'hui la déduplication tend à se généraliser dans les applications de sauvegarde mais elle ambitionne aussi d'étendre son champ d'action aux données primaires.

Même si la technologie n'est pas nouvelle, elle n'est devenue populaire que récemment du fait de la conjonction de plusieurs facteurs et notamment la crise économique, qui a amené les entreprises à tenter de réduire le coût de leur stockage, la croissance continue et exponentielle des volumes de données à stocker et l'arrivée d'une nouvelle généraiton de processeurs offrant les capacités nécessaires pour rendre les performances de la déduplication acceptables par les utilisateurs. Subitement tous les grands du stockage se sont mis à s'intéresser à la technologie à commencer par EMC, avec le rachat d'Avamar en 2006 - avant celui de DataDomain en 2009 -, puis Netapp, avec l'introduction de la déduplication à des fins d'archivage dans ses baies en mars 2007, puis IBM avec son rachat de Diligent en 2008, HP avec le lancement de StoreOnce en juin 2010 et enfin Dell avec le rachat d'Ocarina en 2010. et c'est sans compter sur Hitachi qui après avoir revendu la technologie de Diligent a récemment signé avec Falconstor, ou avec Fujitsu qui revend en OEM la technologie de Quantum dans ses appliance de sauvegarde Eternus CS.

donnees


Principale cible de ces constructeurs : le marché de la sauvegarde et de l'archivage. Du fait de la nature de ces processus qui visent à créer de multiples copie des données primaires pour se prémunir d'éventuelles pannes ou pertes de données, la déduplication se révèle particulièrement efficace sur les flux de backup (et ce d'autant plus s'il s'agit de Full backup). Mais d'autres scénarios d'utilisation de la déduplication émergent, notamment appliqués aux environnements serveurs virtualisés et aux déploiements à grande échelle de poste de travail virtualisés. Ces scénarios, qui touchent des données primaires actives et non plus des données dormantes

Retrouvez la fin de cet article et l’intégralité de notre dossier au format PDF

livres blancs avec LesSourcesIT.fr

Sécuriser les terminaux mobiles des utilisateurs dans l’entreprise

Les appareils mobiles, tels que les smartphones et les tablettes tactiles, permettent à un nombre croissant d’employ…


L’efficacité opérationnelle et la réduction des coûts grâce à une approche intégrée de la veille sécuritaire

La mise en place d’un programme de veille sécuritaire efficace au sein d’une organisation n’est pas à prendre à…

vues 2914 lectures commentaire 1 commentaire(s) recommandation notez cet article
2

Réagissez à cet article

Votre Pseudo

Commentaire

Pertinence du commentaire : 4
Par LOL
 Le 05/11/2010 à 22:52
Dans le cadre du backup, le facteur principal d'amelioration de la performance est tres tres souvent autre que la deduplication. La deduplication ne vise qu'a corriger certaines derives dues a un manque de structures des donnée (vulgairement, chacun fou sa merde n'importe ou et on se fait chier pour sauvegarder ce gros tas).
Dans le cadre du backup, et je precise bien backup, les gains sont vraiment significatif lorsque l'on supprime les "full backup" pour aller vers de l'"incremental for ever". Et ceci est d'autant plus efficace quand cela est géré a la volée pendant la phase de backup et non pas a posteriori une fois le backup terminé.
Maintenant on va me retorquer que la deduplication de block est l'avenir etc ... etc ... Je reponds : Quels sont les acteurs ? Quel est la performance en terme de reduction, mais aussi de temps, de taille de la base des metadatas, de capacite a recouvrir cette base en cas d'incident, donc de backup de cette base etc ... etc ...
Juste a titre d'exemple, la totalite des données de l'univers peut etre dédupliqué a l'extreme a 2 bits : 0 et 1. C'est tres leger, ca tiens dans ma poche et meme dans ma cervelle. Mais quid de la taille de la base des metadatas permettant de reconstruire la totalite des données de l'univers ? Example loufoque, j'en conviens, mais qui illustre le fait que reduire d'un cote augmente potentiellement la complexite de l'autre coté. Coté,sur lequel le marketing ne communique pas vraiment (c'est géré par l'equipement qu'ils disent). Ce n'est pas un probleme de technologie, mais un probleme de mathematique tres complexe. Ou mettre le curseur pour optimiser tous les parametres de l'equation ?
Bref, il n'y a pas de "free lunch". Commencons par structurer les données, et on fera de grosses economies sur les pansements, patchs et autres rustines visant a corriger nos problemes d'organisation.
Autre morale de l'histoire, si on veut faire fortune, il faut vendre un produit performant, certe, mais qui se nourris de l'incompetence et de la feneantise de l'espece humaine :) :) La deduplication n'est pas le meilleur candidat, mais il n'est pas mauvais :) :) :)
Noter ce commentaire
publicité
publicité
Les dernières offres d'emploi

 TECHNICIEN HOTLINE (H/F)

A ce titre, vous effectuez le support utilisateurs niveau 1 dans un environnement Windows, bureautique (excel, word...), et sur les différentes applications. Le périmètre de la mission, concerne...

 TECHNICIEN HOTLINE (H/F)

A ce titre, vous effectuez le support utilisateurs niveau 1 dans un environnement Windows, bureautique (excel, word...), et sur les différentes applications. Cette mission, basée à Lorient, est à...

 ADMINISTRATEUR RESEAUX ET SECURITE (H/F)

A ce titre, vous travaillez en étroite collaboration avec l?ensemble de l?équipe Production informatique (administration, exploitation, support), les architectes des infrastructures et le Responsable...

Les économies de stockage à travers une architecture unifiée


Beaucoup d’organisations ont fait le choix du stockage « unifié » à travers les systèmes Multiprotocol storage systems (MPS). Avec la croissance exponentielle du nombre de d…

Virtualisation : bénéfices, défis et solutions


Alors qu’il existe différentes voies en matière de virtualisation ce document se concentre sur 3 approches : serveurs, postes de travail et appliances. L’un des motifs de cet…
livres blancs avec LesSourcesIT.fr
Recevez les newsletters du MagIT
L'essentiel IT : L'actu IT au quotidien
événements

TechDays 2012 : développeurs et projets en avant

1 2 3 4 5   
Click Here