motortion - stock.adobe.com

« AZ Cloud » : plongée dans l’IT de la R&D du vaccin d’AstraZeneca

AstraZeneca associe quatre clouds publics majeurs, des services d’interconnexion et un réseau de stockage pour soutenir le développement et aujourd’hui le déploiement de son vaccin Covid-19, dans un contexte de course contre la montre.

Le géant de l’industrie pharmaceutique AstraZeneca est en première ligne dans la recherche, le développement et le déploiement le plus rapide possible d’un vaccin pour freiner, voire stopper, la propagation du Covid-19 dans le monde.

En coulisse, côté IT, ce projet repose pour beaucoup sur le cloud computing. Scott Hunter – responsable de l’infrastructure mondiale, des plates-formes cloud et des solutions innovantes de l’entreprise – est revenu sur les outils mis en place pour mener à bien ce projet encore en cours.

AstraZeneca s’appuie sur quatre des grands clouds publics (Amazon Web Services, Microsoft Azure, Google Cloud Platform et Alibaba) ainsi que sur les capacités d’interconnexion du géant de la colocation Equinix pour relier ces services cloud à ses propres centres de données.

« Nous tirons [ainsi] parti de certaines capacités spécifiques comme le traitement du langage naturel (NLP) d’Azure pour la recherche [documentaire] (lire ci-après), et beaucoup des services d’infrastructures (IaaS) d’AWS pour notre recherche et développement », explique Scott Hunter.

Son équipe de 112 personnes a la responsabilité de l’architecture, de la conception, de la gouvernance et du contrôle d’un environnement hybride et multicloud maison, baptisé en interne « AZ Cloud ».

Des données mieux collectées et plus disponibles avec NetApp

Le manque de temps a été un des plus grands défis dans le développement et la production du vaccin.

Par le passé, les tests sur les anticorps ne pouvaient être effectués que sur un petit sous-ensemble de la population, puis ils augmentaient progressivement sur une période de 12 à 24 mois, au minimum. Dans le cas présent, avec cette course contre la montre, AstraZeneca doit ingérer les remontées sur deux milliards de doses administrées sur une période très courte, partout dans le monde.

« Il est extrêmement important que nous puissions recueillir ces données, en particulier sur les effets indésirables, et de nous assurer qu’elles sont bien transmises en temps réel aux organisations concernées. Une partie de ce processus nous permet de les croiser avec celles que nous avons sur nos propres patients afin d’être sûrs qu’il n’y a pas d’effets secondaires pour eux ni pour les thérapies qu’ils suivent », explique Scott Hunter.

Pour y arriver, son équipe a travaillé en étroite collaboration avec celles en charge de la connectivité chez AstraZeneca, afin que les données soient utilisées là et quand il y en a besoin – grâce à une couche d’abstraction du spécialiste du stockage NetApp.

Pour la gestion de ses données, le géant pharmaceutique n’a cependant pas toujours fonctionné de cette manière. Il y a cinq ans, il utilisait en effet des solutions d’Hitachi Data Systems (HDS) et de Hewlett Packard Enterprise (HPE). NetApp n’était là que pour le stockage fichiers. Mais AstraZeneca a décidé de réviser cette organisation en lançant une demande d’informations.

« Optimisation des workloads, consolidation sur un seul fournisseur, et bon accord commercial : tout cela faisait sens. »
Scott HunterAstraZeneca

« Nous avons alors constaté que NetApp proposait des capacités globales similaires à celles de HDS et de HPE, et que la manière dont on pouvait utiliser NetApp dans le cloud était particulièrement intéressante. Quant au prix par téraoctet, il était inférieur. Optimisation des workloads, consolidation sur un seul fournisseur, et bon accord commercial : tout cela faisait sens », résume Scott Hunter.

Depuis, NetApp est utilisé pour le réseau de stockage d’AstraZeneca (data fabric) qui lui permet de rassembler les données de ses quatre prestataires cloud, de les fédérer avec des partenaires et des instituts de recherche, et de documenter le développement pour d’autres traitements et thérapies Covid-19.

« Un élément important de ce réseau de stockage dans notre infrastructure multicloud et hybride, c’est de pouvoir migrer sereinement des traitements d’un cloud privé vers un cloud public – les scientifiques savent que les données sont tout le temps disponibles », se réjouit Scott Hunter.

« Avant cette approche, un des gros problèmes que nous avions était la conversion des données. Notre data fabric nous permet de faire fonctionner efficacement NetApp dans le cloud, de sorte que nous n’avons plus à faire de conversion – nous pouvons déplacer les données entre cloud privé et cloud public, et lancer un service en moins de dix minutes ».

Un déploiement mondial du vaccin dopé au cloud public

Aujourd’hui, le vaccin est distribué à des groupes de personnes prioritaires, partout sur la planète. Les avantages d’un environnement cloud mondial, hybride, qui s’appuie sur les technologies de plusieurs acteurs, commencent à se voir réellement. 

« Nous hébergeons beaucoup de traitements dans le cloud public. Comme vous pouvez l’imaginer, le déploiement d’un vaccin mondial se fait aussi dans des pays où nous ne disposons pas forcément d’un centre de données, ou qui ne sont pas proches de l’un de nos principaux data centers. Il était donc naturel que nous tirions parti des quatre clouds publics pour avoir la meilleure gamme de services possible, et conduire une approche uniformisée de la remontée d’informations pour savoir ce que nous devons faire [d’un point de vue opérationnel] » vante Scott Hunter.

Les leçons tirées sur la base des remontées portent sur l’élaboration de nouveaux conseils aux patients, sur la gouvernance, sur les effets indésirables et sur la traçabilité.

AstraZeneca utilise également des services d’IA pour, par exemple, mettre les informations sur le vaccin à disposition dans différentes langues sur ses sites web et pour optimiser le moteur de recherche avec du NLP. Normalement, ces informations doivent être communiquées en version papier aux patients – avec la notice du vaccin – mais comme le temps presse, elles sont à présent en ligne.

PRA : l’assurance cloud en cas de cyberattaque

« En ce moment, AstraZeneca est une cible de premier choix pour beaucoup d’acteurs malveillants – nous avons cinq à six millions d’événements [de sécurité] par jour, donc c’est critique pour nous. »
Scott HunterAstraZeneca

Enfin, le cloud offre une protection supplémentaire à AstraZeneca.

L’entreprise a adopté une approche « security by design ». Un impératif selon Scott Hunter, encore plus pour les données de la R&D qui aiguisent l’appétit de nombreux cybercriminels.

« Vous vous en doutez, en ce moment, AstraZeneca est une cible de premier choix pour beaucoup d’acteurs malveillants – nous avons cinq à six millions d’événements [de sécurité] par jour, donc c’est critique pour nous. »

« Si vous prenez la problématique sous l’angle d’un plan de reprise d’activité après sinistre (Disaster Recovery) et de la protection, notre réseau de stockage nous assure de ne pas perdre de données », conclut-il.

À lire aussi sur LeMagIT :

Jumeau numérique : Atos et Siemens veulent accélérer la production de vaccins
Dans le cadre de leur alliance et en pleine crise sanitaire, Atos et Siemens ont annoncé le développement commun d’une solution de jumeau numérique dédiée à l’industrie pharmaceutique.

L’intelligence artificielle malmenée par la Covid-19
L’IA n’a pas fait ses preuves durant la pandémie, parfois devancée par de simples statistiques mathématiques. Mais les données accumulées pourraient lui permettre de prendre sa revanche, notamment dans l’imagerie médicale.

Coronavirus : l’IA cumule les erreurs de diagnostic
Jusqu’à maintenant, l’intelligence artificielle n’a pas apporté d’aide convaincante concernant la pandémie du coronavirus. La cause : le manque de données fiables, d’autant que de nombreuses personnes infectées ne le savent pas elles-mêmes.

Covid-BOT : un chatbot open source français pour lutter contre la désinformation
Clevy, un éditeur français de chatbots open source s’engage lui aussi contre le coronavirus en lançant le Covid-BOT. L’objectif est d’éviter la saturation des numéros d’urgence comme le 15, de lutter contre la désinformation et proposer un auto-diagnostic indicatif.

Coronavirus : une agrégation des projets de data science est nécessaire
Pour lutter contre le coronavirus l’intelligence artificielle, et plus largement la data science, est perçue comme une aide précieuse. La multiplication cache un manque de cohésion.

Pour approfondir sur IaaS

Close