Incendie OVHcloud : Aucun élément tangible pour cautionner la thèse d’une négligence

Malgré un emballement médiatique sur de supposées négligences d’OVHcloud, aucun élément ne permet encore d’expliquer pourquoi SBG2 a brûlé. En revanche, les flammes hors normes incitent à revoir la conception des datacenters.

Depuis l’incendie du datacenter d’OVHcloud, la police mène son enquête. De manière confidentielle. En marge de cette investigation officielle, les hypothèses plus ou moins bien argumentées se sont multipliées. L’une d’entre elles a abouti à un emballement médiatique sur de supposées négligences d’OVHcloud. L’hébergeur serait coupable de mal construire ses datacenters.

À l’origine de ces attaques, un billet technique qu’Arnaud de Bermingham, le fondateur de Scaleway, avait rédigé en 2013 sur le forum discret de LaFibre.info. Arnaud de Bermingham est une sommité reconnue depuis des années dans le monde des datacenters pour sa capacité à inventer des designs innovants, tandis que LaFibre.info est un site de discussion ultraspécialisé, dont l’interface sans fard tient a priori les chalands à distance.

À l’époque, à l’occasion d’un sujet sur les protections anti-incendie qu’OVHcloud a déployées au Canada selon les réglementations locales, il se lâche : « Il y a lieu de s’interroger sérieusement sur la sécurité de telles infrastructures », lance-t-il, dans l’intimité de ses pairs et sur la foi de photos dont on ignore si elles sont complètes.

Huit ans plus tard, alors qu’OVHcloud se mure dans le silence que lui impose l’enquête judiciaire en cours, droit dans ses bottes, Arnaud de Bermingham assume ses propos dans les colonnes de nos confrères. Et il les illustre même d’interrogations légitimes pour un expert, ainsi que de faits censés prouver sa connaissance des enjeux : « Il y a neuf ans déjà, je m’étonnais du modèle de construction des datacenters d’OVH (…) Il n’y a pas que le problème de structure en métal et bois. Il y a aussi le mode d’agencement et de protection des salles qui hébergent les serveurs. Sont-elles isolées entre elles par des cloisons anti-feu ? Les portes sont-elles conçues pour bloquer les flammes ? Chez nous, elles sont remplies de béton. Elles coûtent 23 000 euros. Ces systèmes servent à circonscrire le feu à la salle où il s’est déclaré en attendant son extinction », dit-il, le 12 mars, au micro de l’Usine Nouvelle.

Opération déminage

« Non, nous n’avons aucune idée des mesures de sécurité qu’OVHcloud avait déployées sur son site de Strasbourg ! Comme tout le monde, nous ne saurons ce qui a causé l’incendie qu’au terme de l’enquête en cours, quand OVHcloud ou les autorités partageront leurs résultats. » Mardi 30 mars, 10h07, au téléphone avec LeMagIT, Yann Lechelle, PDG de l’hébergeur Scaleway, se démène pour sortir son entreprise de l’emballement médiatique qui l’associe aux accusations de négligence contre son concurrent.

« Nous n’avons aucune idée des mesures de sécurité qu’OVHcloud avait déployées sur son site de Strasbourg. Comme tout le monde, nous ne saurons ce qui a causé l’incendie qu’au terme de l’enquête en cours. »
Yann LechellePDG, Scaleway

Depuis trois semaines, en marge des débats sur la perte des données suite à l’incendie qui a détruit près de 15 000 serveurs sur le site SBG d’OVHcloud, les journalistes auraient appelé, à plus de deux cents reprises les équipes de Scaleway, pour savoir. OVHcloud est-il coupable d’avoir construit des datacenters au rabais ? Est-ce qu’il casse les prix grâce aux économies réalisées sur ses systèmes de sécurité ? Qu’est-ce que c’est que cette histoire de plancher en bois ?

Le mal est fait. Et les messages de soutien que Scaleway adressera publiquement à son concurrent passeront inaperçus dans l’engouement des médias. « Nous n’avons mené aucune campagne de dénigrement pour grappiller des parts de marché à OVHcloud ! », se défend Yann Lechelle, qui désolidarise vigoureusement Scaleway des spéculations parues dans la presse.

L’union sacrée

Il faut dire que cette polémique tombe mal : le jour même, la fondation Gaia-X, censée incarner le projet de cloud souverain voulu par les gouvernements européens, publie un communiqué qui liste les noms de ses nouveaux deux cents adhérents. Dans le lot, les géants américains du cloud public AWS, Azure et GCP n’ont pas manqué d’inscrire leurs filiales européennes.

« Il y a un véritable enjeu d’indépendance stratégique. 90 % des entreprises sont hébergées dans un cloud américain. Si le câble transatlantique est coupé, l’économie française s’arrête ! », prévient le PDG de Scaleway. « Dans ces circonstances, les acteurs du cloud européen doivent faire front commun. Or, si vous regardez la liste des vingt-deux membres fondateurs de Gaia-X, vous avez trois fournisseurs de cloud français : OVHcloud, Outscale et Scaleway. Cela signifie qu’ensemble nous devrions héberger 30 % des entreprises européennes. Nous sommes loin du compte. »

« Notre travail est de nous unir pour susciter un volontarisme économique européen. Nous nous parlons tous les jours à ce sujet avec OVHcloud et Outscale », promet Yann Lechelle, en martelant de toute son énergie que la fraternité est le mot d’ordre.

Rien ne permet d’affirmer qu’il y a eu négligence

De son côté, Octave Klaba, le président fondateur d’OVHcloud a démenti les accusations de négligence dès le 22 mars dans un communiqué vidéo : « Les systèmes de détection d’incendie, bien sûr on en a. Les systèmes d’extinction du feu, bien sûr on en a, dans l’ensemble de nos datacenters. Ces systèmes diffèrent selon les standards locaux, ils dépendent des sites géographiques, mais aussi du lieu à l’intérieur du datacenter. Certains sont automatisés, certains sont manuels. »

Impossible d’avoir plus de détails. Les porte-parole de l’hébergeur se refusent à tout commentaire avant les conclusions officielles des inspecteurs de police et des assurances, qui analysent toujours les débris à la loupe.

Quant aux planchers en bois encore une fois montrés par les photos publiées sur le forum de la LaFibre.info, à propos de datacenters OVHcloud situés ailleurs qu’à Strasbourg, LeMagIT n’a pas trouvé d’expert pour expliquer en quoi il s’agirait d’un défaut de conception. Au contraire, même.

« C’est un biais cognitif de penser que le bois, que l’on met dans une cheminée pour faire du feu, est un élément susceptible de favoriser les incendies. »
Frédéric BordageConsultant écodesign et infrastructures durables, GreenIT.fr

« C’est un biais cognitif de penser que le bois, que l’on met dans une cheminée pour faire du feu, est un élément susceptible de favoriser les incendies. En réalité, dans la majorité des datacenters, les faux planchers sont en bois. Et pour cause : le bois s’écroule moins vite que le ciment, brûle moins vite que le plastique et ne fond pas », commente Frédéric Bordage, consultant écodesign et infrastructures durables pour le cabinet GreenIT.fr. Il fait remarquer que, malgré la puissance phénoménale du feu, le bâtiment SBG2 ne s’est pas écroulé.

Reste donc la question : pourquoi ce bâtiment SBG2 s’est-il enflammé ? Dans son premier communiqué vidéo, Octave Klaba évoque un départ de feu anormal sur un onduleur dans un local technique, puis des flammes qui s’étendent excessivement rapidement au reste du bâtiment, là où se trouvent les salles serveurs. L’anomalie concernant cet onduleur – dont OVHcloud indique qu’il avait été manipulé le jour même par un agent de maintenance – est manifestement l’objet de l’enquête en cours. Quant à l’embrasement rapide qui s’en est suivi, les experts spéculent à présent que les systèmes anti-incendie ont bien fonctionné comme prévu, mais que personne ne pouvait prévoir qu’ils auraient à faire barrage contre des flammes hors-normes.

« Les incidents de ce type sont trop peu fréquents pour qu’on ait suffisamment de maturité à leur sujet. Et, d’une manière générale, ce que l’on surprotège dans un datacenter, ce sont les salles serveurs plus que les locaux techniques où se trouvent les onduleurs », dit Frédéric Bordage, en rappelant que, normalement, ce sont les batteries chargées d’éléments chimiques qui prennent feu, pas les onduleurs, lesquels sont majoritairement composés d’électronique.

Il a en revanche un avis plus tranché sur la vitesse de propagation des flammes. « Le problème est que les datacenters sont susceptibles de connaître de plus en plus des cascades d’incidents que l’on pensait improbables. Les systèmes de sécurité ont été pensés pour des datacenters à l’intérieur desquels il fallait maintenir une température de 18 °C. Dans ces conditions, si la climatisation tombe en panne, ou si une chaleur extraordinaire survient dans une salle, les tests montrent que les équipes sur place ont une heure pour réagir avant que la situation s’emballe et s’étende au reste du bâtiment. »

« Mais, pour servir des desseins écologiques, pour consommer moins d’énergie, les fournisseurs ont mis au point des serveurs qui supportent désormais de fonctionner à une température ambiante de 27 °C. Or, dans ces conditions-là, on se rend compte que le temps imparti pour réagir avant qu’une situation devienne dangereuse tombe à une minute. Si vous n’avez pas éteint vos serveurs dans ce laps de temps très court – trop court pour éteindre 15 000 serveurs – alors vous faites face à une cascade d’événements incontrôlable », ajoute-t-il.

L’enjeu de réinventer les datacenters

Les stratégies écologiques seraient-elles en définitive contre-productives pour la sécurité ? Octave Klaba assure que ses équipes vont se pencher sur le problème : « Nous allons proposer des évolutions de ces systèmes. Nous allons créer un laboratoire au sein duquel nous allons travailler sur les différents cas de départ de feu, sur des extinctions plus efficaces et sur les tests à mener concernant la durée de résistance des portes comme celle des différents éléments (…) Et nous allons partager ces travaux, nous mettrons nos innovations en Open source, pour que cet incident-là ne se reproduise pas chez nous ni chez personne d’autre », dit-il dans son communiqué vidéo du 22 mars.

« Abandonner le free-cooling au profit d’une technologie maison me semble encore prématuré. »
Michael CohenDG, ITT Advisory

Concernant le volet écologique, Octave Klaba précise qu’OVHcloud ne refroidit plus ses nouveaux bâtiments en free-cooling depuis 2016. Le free-cooling, qui était toujours à l’œuvre dans le bâtiment détruit par l’incendie, consiste à faire circuler l’air extérieur dans les salles serveur, via néanmoins des filtres et des clapets qui empêchent les particules fines de la ville de venir polluer les serveurs. Et qui sont censés retenir des flammes. Depuis ces dernières années, l’hébergeur emploierait une nouvelle technique de watercooling à l’échelle du bâtiment qui permettrait de confiner l’air dans chaque salle. Il serait également prêt à mettre cette technologie en Open source.

« Je salue la démarche d’OVHcloud de contribuer à l’alimentation des standards du marché. Notre secteur doit sa robustesse au partage de meilleures pratiques, largement adoptées et reconnues par l’ensemble de l’écosystème », commente Michael Cohen, DG du cabinet de conseil ITT Advisory, spécialisé dans les datacenters. « Néanmoins, comme l’industrie aéronautique, l’industrie du datacenter est très averse au risque. Elle apprécie les solutions éprouvées, qui ont un certain track record en termes de performance, de sécurité et de résilience. De ce point de vue, abandonner le free-cooling au profit d’une technologie maison me semble encore prématuré. »

Olivier Mis, PDG de la chaîne de datacenters en colocation CD2scale est également circonspect quant à la perspective de standardiser subitement des technologies qu’OVHcloud gardait jusque-là pour lui : « Je ne suis pas certain que les standards OVH correspondent aux standards du marché. Quoiqu’il en soit, nous sommes très curieux d’avoir un retour d’expérience, qui servirait plus au marché qu’un maladroit appel à changer les habitudes et qui, à mon sens, peut être mal perçu. »

La question du refroidissement

Michael Cohen pondère : « la culture d’OVHcloud est dans l’innovation, celle de son marché est davantage ancrée dans la sécurité, ce qui explique peut-être la communication d’Octave Klaba. Toujours est-il qu’à ce jour, il existe déjà un large panel de solutions qui permettent d’assurer de hauts niveaux de sécurité dans les datacenters, que ce soit en termes de design, d’alimentation énergétique, de climatisation. »

« 90 % des entreprises sont hébergées dans un cloud américain. Si le câble transatlantique est coupé, l’économie française s’arrête ! »
Yann LechellePDG, Scaleway

L’une de ces solutions éprouvées est le refroidissement adiabatique mis au point par Scaleway, justement, et largement documenté depuis 2019. Ici, l’air reste confiné dans la salle et se refroidit au contact de gouttelettes d’eau qui aspirent ses calories pour s’évaporer. À l’instar du free-cooling, ce système ne nécessite que des ventilateurs et pas de climatiseur ; il constitue donc un moyen efficace d’économiser l’énergie.

« Tout le monde se moquait de nous lorsque nous avons présenté cette technologie. Mais deux ans plus tard, force est de constater que notre datacenter DC5, qui bénéficie du refroidissement adiabatique le plus abouti, a un rendement énergétique fabuleux », se félicite Yann Lechelle.

Et de s’empresser de préciser : « DC5 est un datacenter prévu pour accueillir des serveurs apportés par nos clients, construits de manière classique par les fournisseurs. OVHcloud ne faisant pas de colocation, ils ont sans doute une approche qui correspond aux serveurs qu’ils fabriquent eux-mêmes. Donc, attention, nous ne comparons pas notre système à celui d’OVHcloud. »

Pour approfondir sur Architectures de Datacenters

Close