
Stockage : CompressionX réinvente la réduction des données
La startup britannique entend dépoussiérer un domaine, la compression des données, qui n’a pas évolué depuis des années. Son algorithme est plus adapté aux données modernes et élimine les contraintes habituelles.
Il y aurait matière à moderniser les techniques de compression de données. La startup anglaise CompressionX, à l’origine d’un algorithme qui prend en compte le type des données sources avant de déterminer de quelle façon réduire leur taille, est persuadée que le marché a besoin d’une technologie plus efficace et plus transparente.
« Notre solution consiste à compresser/décompresser les données sans que vous vous en rendiez compte. Nous avons une version pour Mac, une autre pour Windows, bientôt une pour Linux, qui se fond dans le système hôte. Il n’y a pas à passer par un outil dédié », lance Nicholas Stavrinou, le PDG de la startup (en photo en haut de cet article), que LeMagIT a rencontré lors d’un évènement IT Press Tour consacré aux entreprises européennes qui innovent dans le stockage de données,
« Un fichier compressé par notre solution s’ouvre, s’enregistre, s’imprime, part dans le cloud et revient sur une autre de vos machines comme un fichier standard. Mais comme il est compressé, vous économisez de la bande passante et de la capacité de stockage », argumente-t-il.
Moderniser la compression
Les solutions de compression de données WinZip ou 7Zip existent depuis des années, mais sont de moins en moins utilisées. Parce qu’acheter des supports de plus grande taille est facile pour résoudre le problème de capacité. Alors que devoir lancer une application de compression en plus dans un flux de travail est contraignant. D’autant que ces algorithmes historiques perdent en efficacité au fur et à mesure que les données se complexifient.
« Pour autant, une bonne compression résout les problèmes d’investissements en stockage et en bande passante, d’allongement des temps de transfert et de dépenses en énergie. Il suffisait donc juste d’avoir une compression adaptée aux données modernes et non contraignante. C’est ce que nous faisons », assure Nicholas Stavrinou.
Et en plus de réduire efficacement la taille des données, l’algorithme de CompressionX chiffre aussi les contenus. Il suffit d’avoir défini le même mot de passe dans le client installé sur chacun des appareils que possède une équipe pour qu’un fichier s’ouvre directement en clair, alors qu’il a voyagé à travers le cloud ou sur des unités de stockage en étant parfaitement illisible.
Réorganiser les données en tableaux pour mieux les compresser
D’un point de vue fonctionnel, l’innovation de CompressionX est de ne pas seulement éliminer les segments répétitifs dans les documents – ce que tous les autres algorithmes de compression se contentent de faire – mais d’identifier une structure qui puisse être factorisée. Dans un PDF par exemple, CompressionX applique une compression optimisée pour le texte et une autre pour les images.
« Les éléments de n’importe quel document peuvent être rangés en différents tableaux. Nous identifions les tableaux possibles, mettons les données dedans et compressons chacun des tableaux selon la méthode la plus adaptée à son contenu », résume Nicholas Stavrinou. Selon lui, le taux de compression moyen sur les fichiers serait de 66%. Il atteindrait 90% dès lors que la donnée source est un tableau Excel ou une base de données.
WinZip et 7Zip n’atteindraient pas de tels taux, car ils ont été conçus à une époque où chaque fichier ne contenait d’un type de données.
« J’ajoute que notre algorithme est sans perte. Une image ou une musique compressée par notre technologie est aussi pure à la lecture qu’au moment de sa création », affirme-t-il, en faisant référence aux compressions JPeg ou MPeg qui éliminent les informations que l’œil ou l’oreille détectent peu.
L’algorithme fonctionne aussi pour compresser les données en temps réel, comme lors de la collecte d’informations (enregistrements audio, données radars) qui doivent ensuite être envoyées à un service cloud en consommant le moins de bande passante possible. Cependant, la technologie compresse dans ce cas des segments successifs de données de manière individuelle, par exemple chaque seconde, ce qui est bien moins efficace qu’une compression sur un lot fini d’informations.
Des débouchés dans les studios de production et les objets connectés
Reste que, contrairement à ses concurrents, la solution de CompressionX est un logiciel payant. La version gratuite ne sait compresser que 25 Go de données par mois. Pour aller au-delà, il faut compter 3,99£ (environ 4,60 €) par mois et par utilisateur. La décompression, quelle que soit la taille, est gratuite.
Les marchés ciblés sont ceux liés à la production d’images, de vidéos, ou de musiques, principalement les studios de création, mais aussi les kiosques de diffusion. CompressionX veut croire que sa technologie sera aussi bientôt utilisée par divers fournisseurs d’objets connectés, dont les constructeurs automobiles, qui collectent beaucoup de données et souhaitent les rapatrier dans leurs centres de calcul en minimisant les coûts et les temps de téléchargement.
Pour la suite, CompressionX planche sur une version qui tire parti des processeurs multicœurs, sur un kit de développement pour intégrer son algorithme à des applications sur mesure, sur un agent capable de compresser des lots de données d’un coup à intervalles réguliers et, bien entendu, sur des clients pour appareils mobiles.
Pour approfondir sur Administration du stockage
-
Ransomware : Frag s’attaque aussi bien à Windows qu’à Linux et ESXi
-
Cyberattaques : ces services utilisés pour exfiltrer et récupérer de l’outillage
-
OpenTelemetry, optimisation des coûts : les arguments d’Elastic face à ses rivaux
-
Google Cloud met la GenAI au service des bases de données (et vice-versa)