Bonnes pratiques en matière d'archivage des données : stratégies, planification et produits

Le stockage primaire peut se révéler onéreux et offre une capacité limitée. Les bonnes pratiques suivantes vous aideront à sélectionner les données à transférer dans une archive.

Les responsables du stockage sont régulièrement confrontés au problème de l'intégration et du stockage de volumes de données en perpétuelle augmentation. Le stockage primaire étant relativement onéreux et offrant une capacité limitée, la plupart des entreprises transfèrent leurs données anciennes dans une archive. Cette pratique contribue à libérer de l'espace sur le stockage primaire, afin d'y intégrer de nouvelles données.

En théorie, le concept de l'archivage des données est simple. Dans la pratique, il se révèle souvent plutôt compliqué. Une préparation minutieuse s'impose avant tout déplacement de données. Le présent article passe en revue quelques bonnes pratiques en matière d'archivage.

Identifier les données à archiver

La première étape consiste à déterminer quelles données doivent être archivées. En général, il s'agit des données statiques qui n'ont pas été modifiées depuis un certain temps ; plusieurs mois par exemple. Certaines organisations commencent donc par examiner la date de dernier accès aux données.

Archives

Mais de nombreuses autres considérations entrent en ligne de compte, telles que le type des données. Ainsi, vous vous apercevrez sans doute que vous avez besoin d'une stratégie et d'une méthode d'archivage pour les données d'un serveur de fichiers, mais d'une stratégie et d'une méthode entièrement différentes pour des données SQL Server. Il n'existe malheureusement pas de méthode universelle qui gérerait tous les types de données de la même façon. Si déplacer des fichiers est facile, vous ne pouvez pas vous contenter d'archiver toute une table de base de données, car il est probable qu'une application en aura besoin. Dans ce cas, l'archivage de base de données consiste à extraire les données anciennes d'une table pour les stocker dans une table de base de données d'archive.

Stratégies de suppression et gestion du cycle de vie des données

Autre bonne pratique en matière d'archivage des données : évaluer votre gestion globale du cycle de vie des données. Supposons que vous décidiez d'archiver des données n'ayant connu aucune modification ni aucun accès depuis trois ans. Cette décision entraîne un certain nombre d'autres interrogations liées au cycle de vie des données. Par exemple, faut-il archiver toutes les données qui répondent au critère des trois ans, ou est-il possible d'en supprimer purement et simplement certaines ? De même, allez-vous conserver les données dans vos archives indéfiniment ou comptez-vous les éliminer au bout d'un certain temps ? Vous devez donc élaborer des plans spécifiques en fonction des circonstances exactes dans lesquelles des données doivent être archivées, ainsi qu'un plan prévoyant le sort final des données archivées. Pour de nombreuses entreprises, l'adoption d'une stratégie d'archivage implique nécessairement une stratégie de suppression ; elles finissent par regretter de ne pas avoir formulé clairement et en détail la procédure de suppression et les conditions d'archivage des données.

Le respect de la réglementation est également un élément à prendre en compte. Toutes les organisations ne sont pas soumises aux réglementations fédérales qui encadrent la conservation des données, mais celles qui le sont s'exposent à des sanctions sévères si elles manquent à leurs obligations en la matière. Les entreprises multinationales doivent également connaître les diverses politiques réglementaires.

Etant donné que les administrateurs sont passibles de poursuites civiles et pénales s'ils n'archivent pas correctement les données, certains en archivent bien plus et pour des durées bien plus longues que la loi les y oblige.

Cependant, une telle approche peut faire plus de mal que de bien. Les réglementations fédérales imposent de conserver certaines données afin de permettre leur analyse au cas où l'entreprise serait accusée d'actes répréhensibles. Or, nombre d'experts juridiques représentant des sociétés soumises à des demandes d'investigation informatique (e-discovery) indiquent que conserver des données au-delà de ce qui est imposé par la loi peut être source d'ennuis. En premier lieu, plus il y a de données à examiner, plus l'opération coûte cher. En outre, plus de données peut être synonyme de plus de vulnérabilité.

Créer une stratégie d'archivage pérenne

Dès lors que vous avez clairement déterminé quelles données vous souhaitez archiver, l'étape suivante consiste à élaborer une stratégie d'archivage complète. Il s'agit d'un ensemble formalisé de procédures édictant les règles du processus d'archivage. Cette stratégie doit notamment comporter les éléments suivants :

  • Les critères d'archivage des données. Il est probable que ces critères diffèrent selon le type des données.
  • Les mécanismes utilisés pour faciliter le processus d'archivage.
  • Le type de support utilisé pour stocker les données archivées.
  • La durée pendant laquelle les données seront conservées. Elle peut également varier en fonction du type de données.
  • Des règles définissant qui peut accéder aux archives et dans quelles circonstances.

Pour de nombreuses entreprises, l'adoption d'une stratégie d'archivage implique nécessairement une stratégie de suppression ; elles finissent par regretter de ne pas avoir formulé clairement et en détail la procédure de suppression et les conditions d'archivage des données.

Dans une étude de cas intéressante, une entreprise avait autorisé uniquement son directeur informatique et son directeur des ressources humaines à accéder à ses archives. En cherchant un logiciel d'archivage des messages, l'entreprise a découvert une application qui permettait aux utilisateurs d'accéder aux messages archivés. Le logiciel assurait la sécurité des messages en empêchant les utilisateurs de les modifier ou de les effacer. Pourtant, les utilisateurs pouvaient quand même consulter les messages archivés, ainsi que les imprimer ou les transmettre. Comme ce logiciel offrait aux utilisateurs un accès permanent aux anciens messages tout en assurant la sécurité de ces derniers, il a été décidé d'assouplir la politique d'archivage de façon à permettre aux utilisateurs d'accéder à leurs propres messages archivés.

Autre considération importante, la protection de l'intégrité de l'archive. Ce concept présente deux aspects : tout d'abord, les archives doivent être protégées contre toute falsification. Elles doivent être suffisamment sécurisées pour qu'un utilisateur ne puisse pas les modifier dans l'intention de dissimuler des agissements peu scrupuleux.

Le second aspect consiste à éviter toute perte de données archivées. Imaginons qu'une entreprise transfère toutes ses données de 2005 dans une archive sur bande et que la bande se démagnétise. Dans une telle situation, toutes les données d'archive de 2005 seraient perdues. Les entreprises doivent se prémunir contre ce type de perte.

Pour protéger vos archives de la perte de données, il convient de conserver plusieurs copies des données archivées. Certaines entreprises créent plusieurs copies des archives sur bande, afin de pouvoir en conserver un exemplaire sur site et de mettre un double en lieu sûr hors site. Les passerelles de stockage en Cloud peuvent assurer des fonctions similaires. Ainsi, une appliance de passerelle peut stocker une copie sur site des archives, tout en les répliquant également dans le Cloud. Par ailleurs, il existe des applications capables de vérifier l'intégrité des bandes et de réaliser des copies des exemplaires douteux.

En matière de sécurisation des données d'archivage, votre approche dépend du niveau d'accès dont les utilisateurs ont besoin. Au minimum, les données archivées doivent être cryptées au niveau du volume de stockage et définies en lecture seule (pour éviter toute falsification). De nombreuses entreprises stockent les données archivées sur des serveurs de stockage (ou dans un stockage en Cloud) isolés du reste du réseau de production. Cet isolement contribue à renforcer le niveau de sécurité.

Quel que soit le mode de stockage choisi pour vos archives, ces dernières doivent être protégées par un mécanisme d'audit. L'audit sert à vous alerter dès que quelqu'un accède (ou tente d'accéder) aux archives. En cas de mise en cause de vos archives, vos journaux d'audit vous permettront de prouver que les données archivées sont authentiques et qu'elles n'ont pas été falsifiées.

Critères d'archivage : recherche, automatisation, flexibilité

Il existe de nombreux produits d'archivage de données sur le marché, allant de simples applications de sauvegarde intégrant des fonctions d'archivage à de véritables applications spécialisées en gestion des archives. Quel que soit le produit retenu, certaines fonctions sont incontournables.

La première est la recherche. Le processus d'investigation informatique implique généralement de passer en revue d'énormes quantités de données archivées. Un moteur efficace vous aidera à réduire les temps de recherche. Le moteur de recherche du logiciel doit être suffisamment souple pour vous permettre d'effectuer des recherches détaillées sur les éléments suivants :

  • Type de données (documents Word, e-mail, etc.)
  • Sources de données (un bon moteur de recherche devrait être capable d'effectuer des recherches sur plusieurs plateformes de données. Par exemple, une recherche simple peut livrer des résultats provenant d'Exchange, de SharePoint et d'un serveur de fichiers.)
  • Auteur du document
  • Eléments de données essentiels (numéros de compte bancaire, de sécurité sociale et de carte de crédit)
  • Informations répondant à une structure de données spécifique, par opposition à un élément de données particulier (par exemple, données pouvant accueillir un numéro de sécurité sociale, au lieu d'un numéro particulier).

Le suivi des audits est une autre fonction importante. Pour des raisons liées aux mesures de suspension en cas de litige et à l'investigation informatique, une piste d'audit peut vous indiquer quel dépositaire de l'autorité a accédé aux archives, à quel moment et à quelles données en particulier.

Vous devez également choisir un produit d'archivage des données qui prenne en charge le plus grand nombre possible de plateformes. S'il n'existe pas de solution d'archivage universelle, certains produits du marché sont conçus pour fonctionner avec plusieurs applications et plateformes répandues. Certains offrent même la possibilité d'archiver les données des réseaux sociaux, telles que le contenu de la page Facebook d'une entreprise.

Un bon moteur de déduplication des données constitue une autre fonction indispensable. De par leur nature, les archives peuvent devenir très volumineuses. Heureusement, presque tous les produits d'archivage actuels prennent en charge la déduplication.

Votre produit d'archivage doit être flexible quant aux sources et cibles de données. En effet, ce n'est pas parce qu'une organisation effectue actuellement son archivage sur bande qu'il en sera toujours ainsi. Un bon produit d'archivage doit donc vous permettre d'enregistrer des archives sur disque, sur bande, dans le Cloud ou sur tout autre support.

De même, différents supports doivent être pris en charge pour la récupération d'archives. Lors de l'extraction à partir d'archives, vous souhaiterez peut-être écrire les données sur bande, sur DVD/Blu-ray ou sur un autre support.

Enfin, le logiciel d'archivage doit offrir des fonctions d'automatisation. En effet, il ne serait pas très pratique de transférer manuellement les données vers et depuis les archives. Tout bon produit d'archivage doit s'adapter facilement à votre stratégie. Le processus d'automatisation garantit que les données seront toujours archivées conformément à la stratégie et qu'aucune ne passera entre les mailles du filet. Le logiciel doit également générer un journal détaillé du processus d'archivage.

Si le concept d'archivage des données rarement utilisées est simple, sa mise en pratique peut représenter une tâche titanesque. Un plan clair et bien documenté contribue grandement à faciliter la procédure.

Dernière mise à jour de cet article : mars 2015

Approfondir

Participer à la conversation

1 commentaire

M'envoyer une notification dès qu'un autre membre commente.

Merci de créer un identifiant pour pouvoir poster votre commentaire.

L'archivage aujourd'hui est intéressant afin d'économiser l'espace du stockage primaire, sachant que les baies flash sont beaucoup plus onéreuses que les baies de disques traditionnelles à capacité égale. 
Imaginez que vous puissiez aisément déplacer des données à la volée vers des systèmes à coût de To contenu (NAS, bandes), voilà le Nirvana. 
De nouveaux outils sont apparus pour répondre à cette problématique nouvelle parmi lesquels on peut citer le glacier d'amazon. 
Si vous désirez conserver vos données (présentations, plan, vidéos, images, sons, photos,...) sur votre site, 
vous pouvez utiliser par exemple un outil nommé storiq One utilisé par exemple par l'auditorium du Louvre, le CNRS, ou Télémélody qui va déplacer et doubler via une interface web ou une API les data vers des disques NAS, ou des bandes LTO sans difficulté.
Annuler

- ANNONCES GOOGLE

Close