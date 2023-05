L’hyperscaler français OVHcloud commercialise enfin son offre Cold Archive de stockage très longue durée et très peu chère : le Go peut n’y coûter que 0,13 centime d’euro par mois. Censée concurrencer S3 Glacier Deep Archive chez AWS (0,16 centime d’euros par Go et par mois), l’offre avait été présentée en avant-première en décembre dernier. La recette, iso-fonctionnelle avec celle d’AWS, n’a pas changé entretemps : les données sont stockées sur des bandes via des bibliothèques IBM et accessibles au format objet. Le logiciel Miria du Français Atempo se charge des sauvegardes et des restaurations.

À l’instar de S3 Glacier Deep Archive, le but de ce nouveau service est de stocker des archives, comprendre des données sur lesquelles on ne travaille plus, mais qu’il faut garder sur le long terme. OVHcloud cite les exemples des rushs vidéo originaux dans les studios de production, des données de santé que la loi impose de conserver pendant des décennies, des documents comptables ou RH réglementaires…

Et puis, bien entendu, des copies de secours qui permettront de revenir en arrière même dans le pire des cas, ou encore des données de productions qu’il est bon d’emmagasiner en attendant de mettre la main sur une IA qui saura piocher dedans pour prédire l’avenir commercial.

Physiquement, le service Cold Archive est déployé dans quatre datacenters répartis sur le territoire, avec au moins 100 kilomètres de distance entre eux. OVHcloud précise qu’il s’agit de datacenters dédiés, physiquement éloignés des datacenters depuis lesquels il exécute les machines virtuelles de ses clients. Le traumatisme de l’incendie de son site à Strasbourg en 2021 et des dommages subis par ses clients est toujours bien présent.

Le fait que ces quatre datacenters soient situés en France permet à OVHcloud de présenter Cold Archive comme une solution souveraine. Et le fait que les données soient réparties entre ces datacenters avec un système d’Erasure coding (sorte de RAID à l’échelle de machines distantes) justifie que cette solution soit résiliente.

Un stockage sur bandes IBM 3592 Chaque site dispose d’une bibliothèque de bandes capable de référencer 18 000 cassettes pour une capacité locale de 3 Exaoctets. De manière assez étonnante, il ne s’agit pas ici des cassettes LTO standard, mais de cassettes 3592, un format propre à IBM, également revendu par SpectraLogic. A priori, il s’agit plus précisément de l’évolution 3592-60F, alias TS1160, qui stocke 20 To bruts par cassette et 60 To compressés. Cette évolution du format 3592, la sixième, a été lancée en 2018. Depuis, IBM a annoncé des versions TS1165 (30 To bruts par cassette), TS1170 (40 To) et TS1165 (80 To), mais ces évolutions n’ont pas encore vu le jour. Et, ce, malgré un calendrier initial qui prévoyait une nouvelle génération tous les trois ans. Comparativement, le format LTO-9, le dernier, apporte 18 To de capacité brute par cassette et 45 To de capacité compressée. Les données sont stockées (avec un chiffrement AES-256 systématique), interrogeables et récupérables via un protocole objet S3 classique. Pour autant, des contraintes tarifaires s’appliquent, exactement comme chez AWS, dès lors que l’on utilise ces accès. Ainsi, la relecture des bandes est réputée si lente – OVHcloud n’indique pas la durée – qu’il faudra stocker les données sur des disques durs si l’on souhaite les analyser avec des algorithmes d’IA. Dans ce cas, le coût du stockage passe à 0,7 centime d’euro par Go et par mois. L’opération de restauration des archives sur des machines de production sera facturée 0,5 centime d’euro par Go restauré. Enfin, l’export des données en dehors du cloud d’OVHcloud est facturé 1 centime par Go transféré. L’export correspond par exemple au besoin de restaurer les archives sur les machines d’un datacenter privé, ou encore à la fourniture des données à une application tierce qui est exécutée depuis un autre cloud.