MR - stock.adobe.com

Projet Glasswing : la détection des vulnérabilités dépasse les capacités humaines de traitement

L’intégration des grands modèles de langage dans le cycle de sécurité transforme radicalement la dynamique de découverte de vulnérabilités. La difficulté n’est plus tant d’en trouver que de les traiter.

par

Valéry Rieß-Marchive, Rédacteur en chef

Publié le: 27 mai 2026

Anthropic rapporte avoir identifié « plus de dix mille vulnérabilités de sévérité élevée ou critique » dans des logiciels systèmes critiques, via le projet Glasswing, un volume qui dépasse largement la capacité humaine à traiter.

Les modèles avancés augmentent le taux de détection de bugs par un facteur significatif chez certains partenaires, indique l’éditeur. Cependant, ce flux massif est intrinsèquement bruité.

Cloudflare, dans son blog, souligne ainsi que les résultats des LLMs sont souvent accompagnés d’une incertitude ; les découvertes marquées « peut-être », « potentiellement » ou « pourrait en théorie » noyant les trouvailles solides. Des propos qui rappellent ceux de Linus Torvalds (le créateur du noyau Linux) : il a récemment déploré un « flux incessant de rapports » de bogues produits avec l’aide de l’IA ayant « rendu la liste de sécurité pratiquement ingérable ». La faute à « d’énormes redondances dues au fait que différentes personnes identifient les mêmes problèmes avec les mêmes outils »

Les équipes de sécurité doivent donc opérer une transition, passant d’un modèle réactif de chasse aux failles à un modèle proactif de gestion du flux et de validation automatisée.

De la simple alerte à la preuve d’exploitabilité : Le rôle critique de l’architecture encadrante

La valeur des LLMs réside dans leur capacité à structurer le raisonnement, dépassant la simple identification de défauts. Les modèles avancés peuvent désormais chaîner plusieurs primitives d’attaque mineures pour former un exploit fonctionnel, une étape cruciale qui distingue la spéculation de la menace réelle, relève Cloudflare. Et d’expliquer que Mythos démontre sa capacité à « prendre plusieurs […] primitives et raisonner sur la façon de les combiner en une preuve fonctionnelle ».

Néanmoins, les modèles présentent des limites intrinsèques. Cloudflare note que le processus est sujet à l’inconsistance : « la même tâche, formulée différemment ou présentée dans un contexte différent, peut produire des résultats complètement différents ».

Par conséquent, l’architecture méthodologique – le « harnais » – devient plus déterminante que la puissance brute du modèle. Cloudflare détaille ce harness (en anglais) en huit étapes séquentielles, transformant l’interaction d’une simple interface de chat à un pipeline contrôlé pour garantir la couverture et réduire le bruit.

Le fossé temporel : la vélocité IA contre la lenteur des processus de remédiation

L’accélération de la découverte par IA expose une faille structurelle dans les chaînes de valeur traditionnelles de la sécurité. Les délais entre l’identification d’une vulnérabilité et son traitement restent trop longs face à la vélocité algorithmique. Anthropic constate que, malgré des avancées rapides, « le goulot d’étranglement dans la correction de ces bugs est la capacité humaine à trier, signaler et concevoir les correctifs pour eux ».

« Si le test de régression prend une journée, vous ne pouvez pas atteindre un SLA de deux heures sans le sauter »

Cloudflare

L’instinct initial peut-être d’accélérer les accords de niveau de service (SLA) et demander des délais fortement raccourcis entre publication d’une vulnérabilité et distribution du correctif fini. Toutefois, Cloudflare met en garde contre cette simplification : « si le test de régression prend une journée, vous ne pouvez pas atteindre un SLA de deux heures sans le sauter ». Les anciens SLA basés sur des délais fixes sont donc obsolètes. La menace est amplifiée par ce décalage temporel entre la découverte rapide et l’application lente du correctif.

Au-delà du patch : renforcer l’architecture pour minimiser l’impact intrinsèque

Face à une vitesse de découverte insoutenable, la stratégie doit migrer vers la résilience architecturale. Il ne suffit plus de corriger le bug ; il faut rendre son exploitation difficile même en présence d’une faille connue. Cloudflare identifie que l’enjeu majeur est « ce à quoi devrait ressembler l’architecture autour de la vulnérabilité ».

La dépendance exclusive au correctif présente un risque résiduel, car Anthropic rappelle que le volume d’alertes ajoute une pression constante à un « écosystème de sécurité déjà surchargé ». Les décideurs doivent donc prioriser les défenses en amont : cloisonnement logique, durcissement des configurations par défaut et isolation. L’objectif est que, même si une vulnérabilité existe, son impact métier soit intrinsèquement limité par la conception du système, explique ainsi Cloudflare.

Projet Glasswing : la détection des vulnérabilités dépasse les capacités humaines de traitement

L’intégration des grands modèles de langage dans le cycle de sécurité transforme radicalement la dynamique de découverte de vulnérabilités. La difficulté n’est plus tant d’en trouver que de les traiter.

De la simple alerte à la preuve d’exploitabilité : Le rôle critique de l’architecture encadrante

Le fossé temporel : la vélocité IA contre la lenteur des processus de remédiation

Au-delà du patch : renforcer l’architecture pour minimiser l’impact intrinsèque

Pour approfondir sur Gestion des vulnérabilités et des correctifs (patchs)

Développement agentique : Cloudflare muscle sa panoplie d’outils

Entre mythe et réalité : l’impact de Claude Mythos sur la cybersécurité

Storm-1175 : un spécialiste de l'exploitation de vulnérabilités au service de Medusa

World Leaks décide que chiffrer, pour extorquer, ce n’est finalement pas si mal