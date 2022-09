PoINT, un éditeur allemand de solutions d’archivage, lancera d’ici au mois d’octobre un nouveau système de stockage objet qui enregistre ses données sur un cluster de disques et... de bandes !

« Notre idée est de proposer sur site exactement la même chose que propose AWS en ligne, avec ses solutions S3 et S3 Glacier », explique Thomas Thalmann, le PDG et cofondateur de PoINT, à propos de Archival Gateway – Unified Object Storage, le nom de son logiciel.

Comme S3, des disques très capacitifs, peu chers, mais pas très rapides, stockent les données froides. Ce sont celles que l’entreprise n’a a priori plus besoin d’ouvrir, mais qu’elle ouvre tout de même de temps en temps. Comme S3 Glacier, les bandes sont encore plus lentes que les disques, mais elles sont aussi encore moins chères.

PoINT affirme pouvoir restaurer des fichiers en quelques millisecondes depuis les disques et en quelques minutes depuis les bandes. Pour déterminer quels fichiers doivent se trouver sur l’un ou l’autre type d’unité, l’éditeur analyse une cinquantaine de paramètres, définis par autant de règles.

Par exemple, l’utilisateur peut vouloir que les fichiers d’un certain type migrent des disques aux bandes au bout de 30 jours d’inactivité. Que ceux d’un autre type disparaissent des archives après une date de péremption. Que d’autres soient enregistrés en même temps sur les deux supports, mais maintenus dans les disques seulement pendant la période nécessaire à leur analyse.

Comparativement aux services d’archivage en cloud public, la solution de PoINT garantit que les données ne sortiront pas des murs de l’entreprise. Elle est aussi plus pérenne : l’entreprises possède ses disques et ses bandes, alors qu’elle devrait sans cesse payer un loyer au fournisseur de cloud pour qu’il maintienne les données en ligne. Thomas Thalmann évoque aussi un prix moins cher, une sécurité meilleure, mais manque de données chiffrées pour illustrer ces déclarations.

230 Go/s avec uniquement des lecteurs de bandes

Le tour de force de la solution de Archival Gateway – Unified Object Storage est surtout technique : c’est la première solution de ce genre à écrire des buckets objets directement sur des bandes.

La majorité des autres produits de stockage objet capables d’archiver leurs contenus sur des bandes le font en deux temps : ils font une sauvegarde de leurs contenus puis l’enregistrent au format fichier sur une bibliothèque de bande. Non seulement c’est plus lent, mais, surtout, les données restaurées à partir des bandes ne sont plus dans un format objet. Pour retrouver leurs métadonnées, leur accès S3, il faudrait les réinjecter dans le cluster S3. Cela fait beaucoup d’étapes quand une opération de restauration est généralement conditionnée par une urgence.

« Avec Archival Gateway, vous pouvez construire un cluster S3 de huit bibliothèques de bandes, chacune avec huit lecteurs fonctionnant en parallèle. Comme nous faisons de l’Erasure Coding au niveau des bandes [répartition des fragments de données sur plusieurs bandes, NDR], nous parallélisons les accès. En définitive, cette solution, sans même ses disques durs, peut atteindre un débit de 230 Go/s », argumente Thomas Thalmann.

En réalité, Archival Gateway – Unified Object Storage est la seconde version d’un produit lancé en Allemagne en 2018 : Archival Gateway (tout court). Lui n’avait pas de disques durs, mais déjà des bandes.

« Pour nos clients allemands, la nouveauté que nous annonçons est juste l’arrivée du tiering, avec moins de latence sur des disques et une cinquantaine de règles pour passer de l’un à l’autre. » Pour les entreprises de France et d’ailleurs, en revanche, Archival Gateway est une nouvelle solution de stockage S3 qui, grâce à l’infinité des cassettes que de l’on peut posséder, gère jusqu’à 50 milliards d’objets par bucket.

Archival Gateway se compose de nœuds passerelles qui présentent le stockage objet S3 sur le réseau. Chacun de ces nœuds accède à un maximum de huit lecteurs. Les passerelles sont secondées par de nœuds dits de base de données. Ils sont au maximum quatre par cluster. Ils servent à indexer les contenus, à piloter les lecteurs et à exécuter la console d’administration de la solution. Tous ces nœuds peuvent être virtualisés.