Panne Amazon : une mauvaise opération de mise à jour à l’origine du trouble 

Le 02 mai 2011 (17:07) - par Cyrille Chausson

Imprimer Envoyer par e-mail

Rubriques : Cloud et Grid Computing Tags : cloud-computing - sla - panne - amazon

Amazon décrypte pas à pas dans un long document les origines de la panne de son infrastructure de Cloud Computing, intervenue il y a deux semaines. Une procédure de mise à jour mal effectuée, qui reflète non seulement une erreur humaine mais, plus encore, la fébrilité des fournisseurs qui ajustent leurs offres au coup par coup.

Presque deux semaines la dramatique panne intervenue sur son infrastructure de Cloud Computing, qui a laissé de nombreuses entreprises sur le carreau dans la partie Est des Etats-Unis - avec, pour certaines, des pertes de données -, Amazon se décide à faire la lumière sur les raisons de cette interruption de ses services.

Dans un long document de synthèse, Amazon explique ainsi que la raison première de l’interruption est due à un changement de configuration intervenu sur les systèmes de sauvegarde et de stockage liés au service EBS (Elastic Block Stores), qui permet notamment la redondance. “Chaque volume de stockage est automatiquement répliqué au sein de la même zone de disponibilité. Ceci empêche la perte de données due à une défaillance d’un seul composant de matériel”, souligne Amazon sur son site Internet, expliquant l'une des utilités du service.

La routage de trafic [qui constitue une procédure standard dans le cadre d'une mise à jour, NDLR, ] a été effectué de manière incorrecte et, au lieu de router le trafic vers l’autre routeur du réseau primaire [EBS], le trafic a été dirigé vers un réseau EBS de capacité moindre”, explique le groupe.

Il s’agirait donc d’une erreur humaine, souligne alors Johannes Ullrich de la société SANS Internet Storm Center, spécialisée dans la sécurité informatique, interrogé par l’AFP, pour qui cette panne donne surtout un coup de projecteur sur les risques liés au Cloud Computing. Des risques selon lui étroitement liés à l’immaturité du marché et des fournisseurs qui fonctionnent au coup par coup. "Ce que cela montre, ce sont les limites de l'expérience opérationnelle d'Amazon ou d'autres pour faire fonctionner ces systèmes de cloud", explique-t-il à nos confrères.

Et, en effet, suite à cette épisode fâcheux qui a tout de même laissé balbutiants des sites comme Quora, Reddit, ou le très tendance Foursquare, Amazon promet d’auditer désormais ses procédures de mises à jour et de miser un peu plus sur leur automatisation. Une optimisation des services, en somme.

Au final, le groupe promet de dédommager ses clients, localisés dans la zone frappée par le panne et de leur accorder 10 jours de crédit.

Egalement sur LeMagIT :

Cloud Computing : le SLA sacrifié sur l'autel de la flexibilité

Cloud : Google renforce les garanties de service de ses Apps

livres blancs avec LesSourcesIT.fr

Sécuriser les terminaux mobiles des utilisateurs dans l’entreprise

Les appareils mobiles, tels que les smartphones et les tablettes tactiles, permettent à un nombre croissant d’employ…


L’efficacité opérationnelle et la réduction des coûts grâce à une approche intégrée de la veille sécuritaire

La mise en place d’un programme de veille sécuritaire efficace au sein d’une organisation n’est pas à prendre à…

vues 2510 lectures commentaire 0 commentaire(s) recommandation notez cet article
4

Réagissez à cet article

Votre Pseudo

Commentaire

publicité
publicité
Les dossiers du MagIT

Les économies de stockage à travers une architecture unifiée


Beaucoup d’organisations ont fait le choix du stockage « unifié » à travers les systèmes Multiprotocol storage systems (MPS). Avec la croissance exponentielle du nombre de d…

Virtualisation : bénéfices, défis et solutions


Alors qu’il existe différentes voies en matière de virtualisation ce document se concentre sur 3 approches : serveurs, postes de travail et appliances. L’un des motifs de cet…
livres blancs avec LesSourcesIT.fr
Recevez les newsletters du MagIT
L'essentiel IT : L'actu IT au quotidien
événements

TechDays 2012 : développeurs et projets en avant

1 2 3 4 5   
Click Here