Comment Profideo est sorti de l’enfer d’une stratégie DevOps mal cadrée

À force de déployer des ressources chez une multitude d’hébergeurs, l’éditeur ne maîtrisait plus le coût de ses applications ni leurs performances. Désormais, il rationalise tout sur Nutanix, chez OVHcloud.

Frédéric Boisseau, le DSI de l’éditeur de logiciels pour assureurs Profideo, est d’une rare franchise : « nous avons rencontré tous les écueils de la stratégie DevOps. Les équipes ont déployé à tour de bras, sans cadre, sans gérer l’obsolescence, sans maîtrise des coûts. D’autant plus sur le cloud, où il suffit d’entrer son numéro de carte bancaire et appuyer sur un bouton pour être facturé. »

Résultat ? La flotte informatique de Profideo est devenue un monstre tentaculaire, fait de machines virtuelles tantôt Microsoft, tantôt VMware, tantôt de containers. Surtout, l’ensemble est hébergé par-ci dans le datacenter du siège, par-là chez AWS. Il y en a aussi chez Scaleway, chez BSO

« Les coûts de cette infrastructure représentent chaque mois, chaque année, exactement le double de notre objectif budgétaire. Mais il y a pire : à cause de cette multitude de déploiements, les procédures de mises en production ne sont plus maîtrisées, les scripts sont difficilement mis à jour. Et pour couronner le tout, nous nous sommes parfois retrouvés à décommissionner des ressources dans l’urgence, afin de réduire l’hémorragie des coûts. Et nous nous rendions compte ensuite que nous n’avions pas fait le bon choix », raconte, dépité, le DSI.

Que l’on se rassure : cet article raconte comment Profideo vient de parvenir à se sortir de cette situation désespérée, en revoyant toute son infrastructure de fond en comble. Un tour de force qui doit lui permettre (à terme) de non seulement retrouver son équilibre financier, mais aussi d’offrir un service d’une qualité inédite.

Néanmoins, Frédéric Boisseau conserve un goût amer de cette expérience : « Bien entendu, nous sommes fautifs de nous être mis dans une situation pareille. Cependant, les fournisseurs de cloud portent aussi une part de la responsabilité. Chez AWS, par exemple, il faut payer pour obtenir la facture détaillée de leurs services. Et elle est incompréhensible. Et ils nous demandent de suivre des formations payantes pour maîtriser leur facturation », témoigne-t-il.

L’enjeu : reprendre la main sur son usine de logiciels

« En reprenant la maîtrise de l’usine, nous résolvons tous nos problèmes et, même, nous sommes en mesure de mettre en avant un argument commercial autour de la sécurité. »
Frédéric BoisseauDSI, Profideo

Profideo est l’une des principales AssurTech, ces startups qui ont transformé le monde de l’assurance avec des outils d’aide à la vente, des comparateurs et des solutions de conception assistée qui ont permis aux géants du secteur de basculer dans l’ère numérique. L’avantage que met en avant l’éditeur tient en une base de données particulièrement riche de pratiques, et d’expériences collectées sur le terrain, qui alimente toutes ses applications.

Profideo ne développe pas de solutions sur étagère, mais conçoit des plateformes à façon pour chacun de ses clients. Cette stratégie suppose donc de maintenir en parallèle une multitude d’infrastructures.

« Quand Profideo m’a appelé à la tête de la DSI pour résoudre ce problème de pilotage des coûts, de la performance et même de la sécurité des applications, je me suis livré à un audit de trois mois. Et cela m’a sauté aux yeux : notre métier est d’être une usine à logiciels. Dans ce contexte, l’erreur est de laisser les clés de l’usine à quelqu’un d’autre », raconte Frédéric Boisseau. « En reprenant la maîtrise de l’usine, nous résolvons tous nos problèmes et, même, nous sommes en mesure de mettre en avant un argument commercial autour de la sécurité. »

Nutanix, pour les avantages de VMware sans ses inconvénients

La première décision du DSI est donc de migrer toutes ses applications, en l’occurrence des machines virtuelles, des containers et des volumes de stockage, sur une infrastructure matérielle qu’il contrôle. Son choix se porte sur un cluster Nutanix.

« Nutanix a tous les avantages de VMware, sans ses inconvénients. C’est un cluster sur lequel nous pouvons exécuter des VMs (hyperviseur AHV), des containers (module Kubernetes Engine) et un système de fichiers avec des fonctions de haut niveau (Nutanix Files), dont la déduplication, la réplication. »

« Comme VMware, il s’interface naturellement avec AWS, que nous comptons utiliser en cas de débordement du pic d’activité. Ce n’est pas le cas, en revanche, d’autres systèmes d’infrastructure hyperconvergée que nous avons étudiés, Simplivity de HPE par exemple. »

« Et L’inconvénient que Nutanix n’a pas, c’est qu’il n’est pas sous le coup d’un rachat par Broadcom, lequel interroge quant à la pérennité de VMware. »

Profideo déploie en l’occurrence deux clusters Nutanix de trois nœuds chacun. Chaque nœud se compose de deux processeurs Intel Xeon de 20 cœurs, de 796 Go de RAM et de 12 SSDs de 600 Go. Chaque cluster totalise ainsi une capacité de stockage utile de 30 To.

« Nous avons privilégié la puissance de calcul au détriment de la capacité de stockage. Car, paradoxalement, même si notre valeur ajoutée repose sur une base de connaissances très riche, cette base n’est en réalité constituée que de documents texte qui occupent très peu de place. Notre machine virtuelle la plus importante n’a ainsi qu’un volume de 1 To », explique le DSI.

OVHcloud pour un seul hébergeur, mais plusieurs data centers

Autre particularité, ces deux clusters Nutanix, redondants, sont chacun hébergés dans un datacenter d’OVHcloud. 

« Pouvoir s’appuyer sur un hébergeur français qui garantit le stockage des données en France, en étant qui plus est certifié SecNumCloud, devient un véritable atout concurrentiel. »
Frédéric BoisseauDSI, Profideo

« Nous ne sommes pas assez nombreux à la DSI de Profideo pour nous occuper de la maintenance de deux datacenters. Donc nous faisons héberger nos serveurs physiques, ce qui nous permet de nous focaliser sur ce qui est le plus important pour nous, à savoir le développement, le déploiement de nouveaux services, ainsi que le pilotage de la qualité et des performances », dit Frédéric Boisseau.

« Nous avons choisi OVHcloud – que j’avais pratiqué au cours de ma carrière – parce qu’ils nous offrent de l’autonomie : nous gardons la main sur l’infrastructure. Chez d’autres, avec qui Profideo travaillait jusque-là, nous devons demander la permission à chaque opération. Et ils nous ont même envoyés balader lorsque nous voulions migrer des machines virtuelles ! Nous ne voulons plus travailler avec des gens comme ça ! »

« Le choix d’OVH Cloud n’est pas anodin non plus par rapport à l’amélioration de notre proposition commerciale. Nos clients nous confient des données sensibles et pouvoir s’appuyer sur un hébergeur français qui garantit le stockage des données en France, en étant qui plus est certifié SecNumCloud, devient un véritable atout concurrentiel. »

Contractuellement, les serveurs physiques de Profideo appartiennent à OVHcloud, qui les a lui-même installés au titre des offres de cloud privé qu’il propose. En revanche, les licences du système Nutanix sont possédées par Profideo.

« C’est un montage financier optimal. Dans le sens où nous choisissons nous-mêmes les caractéristiques techniques des serveurs et les emplacements des data centers. Chaque cluster étant hébergé sur un site différent pour parer à toute catastrophe naturelle. »

« Par ailleurs, posséder les licences Nutanix nous permet de ne pas être dépendant d’OVHcloud. Si nous le voulions, nous pourrions ainsi utiliser nos licences chez un autre hébergeur. Et même migrer nos contenus sans aucun effort, puisqu’il suffit d’avoir une machine Nutanix à la source et à la destination pour que le transfert des VMs et des volumes se fasse automatiquement. »

Une VM « witness » pour assurer la cohérence entre les deux datacenters

Un troisième acteur est impliqué dans ce déploiement : l’intégrateur Skill Partner. C’est lui qui s’est chargé d’installer les licences Nutanix sur les machines d’OVHcloud et c’est lui aussi qui héberge, dans un troisième data center, la machine virtuelle Nutanix « witness ».

Explication. Dans la configuration choisie par Profideo, toutes les applications pourraient ne fonctionner que sur un seul cluster Nutanix. Néanmoins, pour optimiser la bande passante, les applications sont réparties entre les deux clusters, selon des règles définies sur la VM witness.

En plus de ce fonctionnement, les contenus sont répliqués très fréquemment entre les deux clusters, via une double fibre optique avec un débit de 50 Gbit/s entre les deux datacenters d’OVHcloud. Là, encore, c’est la VM witness qui tient à jour la liste des contenus présents de part et d’autre et commande aux clusters de répliquer les données manquantes.

Ainsi, en cas d’indisponibilité sur l’un des deux sites, la VM witness serait en mesure de détecter l’incident et de reparamétrer les routeurs, pour diriger l’ensemble du trafic sur le site encore opérationnel. Dans un message, Arnaut Semont, le directeur avant-vente de Skill Partner, précise qu’il s’agit plus exactement de mettre en place un PCA (Plan de Continuité de l’Activité), que ses équipes gèrent depuis Prism, la console d’administration de Nutanix.

Une sécurité renforcée avec Cloudflare

« Avec ce nouveau déploiement, nous réalisons une économie énorme sur l’hébergement de nos infrastructures. Économie dont nous nous rendons d’autant mieux compte que Nutanix nous fournit, lui, des outils de reporting financiers. Donc le premier bénéfice est que nous maîtrisons de nouveau notre budget, que celui-ci devient prévisible. Et cela, c’est essentiel pour un éditeur qui héberge lui-même les logiciels qu’il vend à ses clients », se félicite Frédéric Boisseau.

Mais il y a mieux. Les économies réalisées sur l’hébergement sont telles qu’elles permettent à Profidéo d’investir dans le renforcement de la sécurité de ses offres. En l’occurrence, l’éditeur a souscrit au service de firewall applicatif de Cloudflare.

« Auparavant, la sécurité était gérée au cas par cas, avec parfois du filtrage IP au niveau des firewalls, d’autres fois au niveau des proxys. Cela n’était pas satisfaisant, aussi il était primordial d’adopter un pilotage et une gestion unifiée pour l’ensemble de l’infrastructure. Cloudflare est un service qui fonctionne en amont de nos infrastructures, qui filtre toutes les requêtes qui sont adressées à nos applications avant de les router vers elles. »

Le plus long à migrer : des paramètres dans les VPNs

« Ce qui nous prend du temps, c’est de reconstruire les environnements, d’en profiter pour revoir les droits d’accès à certains fichiers. »
Frédéric BoisseauDSI, Profideo

Cloudflare s’occupant du routage, c’est justement lui qui permet à Profideo de basculer ses clients des anciens hébergeurs à OVHcloud, au fur et à mesure que les machines virtuelles sont redéployées sur les clusters Nutanix.

« Nous avons commencé la migration un peu plus tôt cette année et nous avons aujourd’hui 50 % de nos applications qui fonctionnent sur la nouvelle infrastructure. Ce qui nous prend du temps, c’est de reconstruire les environnements, d’en profiter pour revoir les droits d’accès à certains fichiers », dit le DSI.

« Par ailleurs, changer d’hébergeur nécessite parfois des modifications de paramètres sur les firewalls de certains de nos clients. Nous avons aussi des accès VPN qui sont parfois directement gérés par des machines virtuelles, plutôt qu’au niveau du firewall. Ce sont des petites choses pas très compliquées, mais qui souffrent toujours d’une certaine inertie. »

« Nous pensons atteindre 90 % d’applications migrées d’ici à un mois, néanmoins », conclut Frédéric Boisseau.

Pour approfondir sur Gestion et administration du Datacenter

Close