Intelligence artificielle — Vulnérabilités

Ce que révèle le premier bilan public de Claude Mythos

Anthropic à publié ce 22 mai 2026 les résultats du premier mois de son initiative défensive. Plus de 10 000 vulnérabilités de gravité élevée ou critique identifiées, un goulot d’étranglement qui se déplace de la détection vers la correction, et une stratégie d’accès qui distingue le modèle frontière restreint du produit défensif commercialisé.

Un mois après le lancement de Project Glasswing, Anthropic publie un bilan d’étape consacré aux performances de Claude Mythos Preview, son modèle frontière non commercialisé, dans la détection autonome de vulnérabilités logicielles. Le document détaille la volumétrie observée chez une cinquantaine de partenaires, le triage indépendant des signalements open source, plusieurs cas d’usage opérationnels, les conséquences observées sur les cycles de correctifs et les recommandations défensives associées. L’ensemble des chiffres exposés ci-dessous provient directement du rapport officiel d’Anthropic⁽¹⁾, complété par les retours individuels publiés par les partenaires et par les reprises de la presse spécialisée francophone et anglophone.

ExecSum

Initiative. Project Glasswing, lancée en avril 2026 et structurée autour d’un consortium fermé d’environ 50 partenaires (AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia, Palo Alto Networks, et d’autres organisations issues de l’écosystème open source)^(1)(20).

Modèle. Claude Mythos Preview, modèle frontière non commercialisé, spécialisé dans la découverte autonome de vulnérabilités logicielles et la construction de chaînes d’exploitation^(1)(10).

Volumétrie consolidée. Plus de 10 000 vulnérabilités de gravité haute ou critique identifiées en un mois sur le périmètre partenaires + open source⁽¹⁾.

Open source. 23 019 signalements bruts sur plus de 1 000 projets scannés, dont 6 202 estimés haut/critique par le modèle^(1)(11)(23).

Triage indépendant. 1 752 signalements haut/critique évalués par six cabinets externes : 90,6 % confirmés vrais positifs (1 587), 62,4 % confirmés haut/critique (1 094)^(1)(21).

Projection. Environ 3 900 vulnérabilités haut/critique attendues en open source sur la base du taux de vrais positifs post-triage⁽¹⁾.

Remédiation open source. 530 vulnérabilités haut/critique divulguées aux mainteneurs, 75 patchées, 65 advisories publics ; 1 129 bugs supplémentaires divulgués sans triage approfondi, à la demande des mainteneurs⁽¹⁾.

Délai moyen. Environ deux semaines entre la découverte par Mythos Preview et le correctif pour un bug haut/critique⁽¹⁾.

Partenaires (chiffres publics). Cloudflare : 2 000 bugs dont 400 haut/critique⁽¹⁾⁽⁷⁾. Mozilla : 271 vulnérabilités corrigées dans Firefox 150, soit dix fois plus que sur la version précédente testée avec Claude Opus 4.6⁽¹⁾⁽⁸⁾. Palo Alto Networks : cinq fois plus de correctifs dans la dernière livraison^(1)(11). Microsoft : volume de patches Patch Tuesday annoncé en croissance soutenue^(1)(12). Oracle : détection et réponse plusieurs fois plus rapides^(1)(13).

Cas notable défensif. Virement frauduleux de 1,5 M$ détecté et bloqué chez une banque partenaire, dans un schéma combinant compromission de messagerie client et appels usurpés^(1)(22).

Vulnérabilité publique illustrative. CVE-2026-5194 sur la bibliothèque cryptographique open source wolfSSL, avec construction d’exploit permettant la forge de certificats^(1)(14)(15).

Évaluations externes. UK AISI : premier modèle à résoudre de bout en bout les deux cyber ranges⁽¹⁾⁽⁹⁾. XBOW : avancée significative sur l’identification de candidats et la chaîne complète vulnérabilité → exploit^(1)(10). ExploitBench et ExploitGym : Mythos Preview en tête⁽¹⁾⁽⁴⁾.

Engagement financier. Plus de 100 M$ de crédits d’usage et 4 M$ de dons annoncés en avril 2026, dont un partenariat de 12,5 M$ avec l’OpenSSF Alpha-Omega^(1)(16)(21).

Posture produit. Mythos Preview reste à diffusion restreinte ; Claude Security ouvert en bêta publique pour les clients Claude Enterprise — plus de 2 100 vulnérabilités corrigées en trois semaines avec Claude Opus 4.7⁽¹⁾⁽⁶⁾.

Qu’est-ce que Claude Mythos et comment fonctionne-t-il ?

Nature du modèle

Claude Mythos Preview est un modèle de langage frontière développé par Anthropic, spécialisé dans la découverte autonome de vulnérabilités logicielles et la construction de chaînes d’exploitation associées^(1)(10). À la différence des modèles de la gamme Claude commercialisée (Opus, Sonnet, Haiku), Mythos Preview n’est pas distribué publiquement : l’accès est réservé aux partenaires du programme Glasswing et à un petit nombre d’évaluateurs externes mandatés par Anthropic^(1)(20). Le suffixe « Preview » signale un statut de modèle en accès anticipé restreint, distinct d’une version commerciale stabilisée.

Périmètre d’analyse : un modèle qui opère sur le code source

Mythos Preview est conçu pour analyser du code source, et non des binaires compilés. XBOW le qualifie explicitement de modèle « particulièrement performant pour analyser du code source avec un raisonnement de sécurité »^(1)(10). Cette caractéristique a trois conséquences structurantes pour l’usage du modèle :

Côté open source. Les 1 000+ projets analysés par Anthropic sont accessibles publiquement par construction ; le code source est directement consultable et exploitable par le modèle, sans contrat de partage ni cadre de confidentialité spécifique^(1)(11).

Côté partenaires privés. Les éditeurs et opérateurs membres du consortium Glasswing partagent leur code source propriétaire avec Mythos Preview dans un cadre contractuel restreint. C’est l’une des raisons pour lesquelles le périmètre est limité à environ 50 partenaires triés sur le volet, plutôt qu’à un service ouvert : la mise à disposition de code propriétaire à un modèle d’IA suppose des engagements de confidentialité et un cadre de gouvernance des données^(1)(20)(21).

Hors périmètre. Le rapport ne décrit pas d’analyse de binaires compilés sans accès au code source. Les vulnérabilités présentes dans des composants propriétaires dont le code n’est pas partagé avec Anthropic — qu’il s’agisse de logiciels tiers fermés ou de firmwares — ne sont pas couvertes par le programme tel que décrit. Cette limite explique en partie pourquoi le périmètre publié se concentre sur des projets open source et sur le code des partenaires consentants.

Positionnement par rapport aux modèles publics

Le rapport situe explicitement Mythos Preview en tête sur deux benchmarks académiques récents dédiés au développement d’exploits — ExploitBench et ExploitGym⁽¹⁾⁽⁴⁾. Mozilla documente un facteur 10 sur le nombre de vulnérabilités identifiées dans Firefox 150 (sous Mythos Preview) par rapport à Firefox 148 (sous Claude Opus 4.6)⁽¹⁾⁽⁸⁾. XBOW décrit le modèle comme une avancée significative par rapport à l’état de l’art antérieur sur l’analyse de code source avec une logique de sécurité⁽¹⁰⁾. L’UK AISI indique que Mythos Preview est le premier modèle à résoudre de bout en bout les deux cyber ranges qu’il opère, simulant des chaînes d’attaque multi-étapes⁽¹⁾⁽⁹⁾.

Capacités revendiquées

Le rapport et les évaluations externes décrivent quatre familles de capacités principales, toutes appliquées à du code source mis à disposition du modèle^(1)(10) :

Analyse statique et sémantique de code source. Identification de motifs vulnérables (CWE), de mauvaises hypothèses de sécurité et de chaînes de propagation de données utilisateurs au sein d’une codebase fournie.

Construction d’exploits de bout en bout. Au-delà de la détection, le modèle est capable de produire une preuve de concept exploitant la vulnérabilité identifiée. Le cas wolfSSL (CVE-2026-5194), où Mythos Preview a construit un exploit permettant la forge de certificats à partir d’une analyse du code source de la bibliothèque, illustre cette capacité^(1)(14)(15).

Cartographie de codebase et raisonnement multi-fichiers. Le modèle est utilisé via un harnais qui lui permet de cartographier un dépôt complet, d’identifier les zones à fort impact de sécurité et d’orchestrer des sous-agents d’analyse spécialisés⁽¹⁾.

Analyse de signaux composites pour la détection de fraude. Le cas de la banque partenaire ayant bloqué un virement frauduleux de 1,5 M$ illustre un usage qui dépasse l’analyse de code et inclut la corrélation entre signaux de messagerie compromise et activité de paiement^(1)(22). Ce cas constitue une extension du périmètre habituel du modèle, qui repose néanmoins sur l’analyse de données structurées mises à sa disposition.

Architecture d’usage : modèle + harnais + skills

Le rapport et la page produit Claude Security précisent que Mythos Preview n’est pas utilisé seul, mais dans un environnement d’orchestration comportant plusieurs composants⁽¹⁾⁽⁶⁾ :

Un harnais (harness) qui pilote la séquence d’opérations : exploration du dépôt de code source, instanciation de sous-agents de scan, triage des résultats, rédaction des rapports.

Des skills, c’est-à-dire des instructions personnalisées préenregistrées pour des tâches répétées (par exemple : analyse d’un type de composant, génération d’un advisory, vérification d’une catégorie CWE spécifique).

Un threat model builder, qui mappe la codebase sur des objectifs d’attaque potentiels et oriente la priorisation du travail du modèle vers les zones les plus critiques.

Anthropic met ces composants à disposition des équipes de sécurité qualifiées sur demande, indépendamment de l’accès au modèle Mythos lui-même⁽¹⁾.

Processus de triage en aval du modèle

La détection brute par Mythos Preview ne constitue pas un résultat final. Le rapport décrit un processus de triage en plusieurs étapes⁽¹⁾ :

Reproduction du problème par Anthropic ou par l’un des six cabinets de recherche en sécurité indépendants partenaires.
Réévaluation de la sévérité, indépendamment de l’estimation initiale du modèle.
Recherche d’éventuels correctifs déjà en place.
Rédaction d’un rapport détaillé à destination du mainteneur ou de l’éditeur.
Suivi de la divulgation coordonnée selon la politique CVD d’Anthropic (90 jours, ou ~45 jours après publication d’un patch)⁽³⁾.

C’est ce triage qui fait passer les 6 202 signalements bruts haut/critique côté open source à 1 094 vulnérabilités confirmées haut/critique après réévaluation (taux de validation post-triage de 62,4 %)^(1)(21).

Pourquoi un modèle restreint ?

Anthropic justifie le maintien d’un accès restreint par un raisonnement asymétrique^(1)(21) : les capacités du modèle en matière de découverte et d’exploitation de vulnérabilités à partir d’un code source sont telles qu’une diffusion publique sans garde-fous renforcés bénéficierait davantage aux attaquants qu’aux défenseurs — en particulier durant la fenêtre transitoire pendant laquelle les correctifs ne sont pas encore largement déployés. Le code source des projets open source étant accessible à quiconque, un modèle de classe Mythos rendu public abaisserait drastiquement le coût d’identification et d’exploitation de vulnérabilités présentes dans ces projets. Le programme Glasswing est présenté comme un mécanisme défensif visant à donner aux opérateurs systémiques (éditeurs critiques, infrastructures, opérateurs gouvernementaux) un avantage temporel avant que des modèles de capacité équivalente n’arrivent sur le marché, potentiellement sans les mêmes restrictions d’usage⁽¹⁾.

Articulation avec Claude Security

Pour les usages défensifs ne nécessitant pas les capacités frontière de Mythos Preview, Anthropic a ouvert Claude Security en bêta publique pour les clients Claude Enterprise⁽⁶⁾. Ce produit s’appuie sur Claude Opus 4.7, modèle public, et permet à des équipes internes de scanner leur propre code source et de générer des propositions de correctifs. Le rapport indique que plus de 2 100 vulnérabilités ont été corrigées en trois semaines par ce biais⁽¹⁾. Claude Security incorpore une partie des apprentissages issus de Glasswing, sans les capacités les plus avancées de Mythos Preview, et conserve la même contrainte opérationnelle d’analyse sur du code source.

Synthèse

Mythos Preview se présente donc comme un modèle frontière spécialisé, opérant sur du code source mis à sa disposition, accessible uniquement via un programme partenaires et accompagné d’une infrastructure d’orchestration (harnais, skills, threat model builder). Il est positionné par Anthropic comme un outil de défense systémique transitoire, dans l’attente d’une diffusion plus large conditionnée au développement de garde-fous suffisants.

✦

Cadre et objectif de Project Glasswing

Project Glasswing a été annoncé par Anthropic en avril 2026 comme un effort collaboratif visant à sécuriser les logiciels les plus critiques à l’échelle mondiale, avant que des modèles d’IA de capacité équivalente ne soient employés à des fins offensives⁽¹⁾⁽²⁾. L’initiative repose sur un accès anticipé, accordé à une cinquantaine de partenaires triés sur le volet, à Claude Mythos Preview, un modèle frontière non commercialisé dont les capacités de découverte autonome de vulnérabilités sont, selon Anthropic, supérieures à celles des modèles publics^(1)(20).

Parmi les partenaires figurent AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, Nvidia et Palo Alto Networks, ainsi que d’autres organisations issues de l’écosystème open source^(20)(22). L’argumentaire avancé est défensif : permettre à des éditeurs et opérateurs systémiques de corriger leurs vulnérabilités avant qu’un modèle équivalent, distribué sans garde-fous, ne soit accessible à des acteurs malveillants. Anthropic justifie cette restriction par le constat que les capacités de Mythos Preview en matière de découverte et d’exploitation de vulnérabilités placent le modèle au-dessus de la quasi-totalité des opérateurs humains spécialisés^(1)(21).

Le bilan publié le 22 mai 2026 couvre les premières semaines d’utilisation et combine trois angles : résultats côté partenaires sur du code propriétaire, campagne d’analyses sur du code open source, et évaluations externes du modèle. La logique de publication retenue est celle de la divulgation coordonnée : les vulnérabilités ne sont pas détaillées tant que les correctifs ne sont pas largement déployés, conformément à la politique CVD interne d’Anthropic⁽¹⁾⁽³⁾. Le rapport fournit donc des statistiques agrégées et quelques cas illustratifs, plutôt qu’une énumération exhaustive.

✦

Volumétrie consolidée

Sur l’ensemble du périmètre couvert (partenaires + open source), Anthropic et ses partenaires revendiquent plus de 10 000 vulnérabilités de gravité élevée ou critique identifiées en un mois⁽¹⁾. La plupart des partenaires déclarent en avoir individuellement trouvé plusieurs centaines, avec un facteur de progression du taux de découverte supérieur à dix par rapport à leurs pratiques antérieures^(1)(20).

Sur le volet open source, Anthropic a utilisé Mythos Preview sur plus de 1 000 projets considérés comme structurants pour Internet et pour sa propre infrastructure, sur une période de plusieurs mois⁽¹⁾. Cette campagne a généré 23 019 signalements, dont 6 202 estimés par le modèle comme étant de gravité haute ou critique. La répartition entre projets, types de vulnérabilités et catégories CWE n’est pas publiée à ce stade ; Anthropic indique réserver cette analyse à un rapport ultérieur, une fois les correctifs largement déployés⁽¹⁾.

Le périmètre partenaires illustre par ailleurs la diversité des cibles. Cloudflare publie séparément avoir identifié 2 000 bugs sur ses systèmes critiques, dont 400 classés haut ou critique, avec un taux de faux positifs jugé meilleur que celui de testeurs humains expérimentés⁽¹⁾⁽⁷⁾. Mozilla rapporte avoir corrigé 271 vulnérabilités dans Firefox 150 en s’appuyant sur Mythos Preview, soit environ dix fois plus que sur la version Firefox 148 testée avec Claude Opus 4.6⁽¹⁾⁽⁸⁾. Microsoft indique que le nombre de correctifs publiés dans ses cycles Patch Tuesday continuera de croître pendant un certain temps, en lien avec les découvertes issues du programme^(1)(12). La dernière livraison de Palo Alto Networks contient cinq fois plus de correctifs que la moyenne historique^(1)(11). Oracle déclare détecter et corriger ses vulnérabilités plusieurs fois plus rapidement qu’auparavant^(1)(13).

✦

Triage indépendant des signalements open source

L’un des points méthodologiquement les plus structurés du rapport concerne la vérification externe des signalements open source. Sur les 6 202 vulnérabilités estimées haut/critique par Mythos Preview, 1 752 ont été réévaluées par six cabinets de recherche en sécurité indépendants ou, dans un nombre limité de cas, par les équipes internes d’Anthropic^(1)(21).

Le résultat publié est le suivant : 90,6 % (1 587) ont été confirmées comme vrais positifs, et 62,4 % (1 094) ont été confirmées en gravité haute ou critique après réévaluation^(1)(20)(22). Sur la base de ce taux de vrais positifs post-triage, Anthropic projette environ 3 900 vulnérabilités haut/critique en code open source à terme, en supposant la poursuite des analyses sur le périmètre déjà identifié, et en plus des vulnérabilités découvertes sur le code des partenaires⁽¹⁾.

Le processus de triage décrit comporte plusieurs étapes⁽¹⁾ : reproduction du problème par Anthropic ou un cabinet partenaire, réévaluation de la sévérité, recherche d’éventuels correctifs déjà en place, puis rédaction d’un rapport détaillé à destination des mainteneurs. Anthropic publie également un tableau de bord public retraçant les étapes du processus de divulgation pour les vulnérabilités open source, avec un point d’attention sur la décroissance marquée à chaque étape — symptôme du coût humain de la vérification et de la correction⁽⁵⁾.

Anthropic souligne que plusieurs mainteneurs open source, déjà confrontés à un afflux de rapports de bugs générés par des IA de moindre qualité, ont demandé à ralentir le rythme des divulgations pour pouvoir absorber le volume^(1)(21). À la demande de certains mainteneurs, des bugs sont divulgués sans triage approfondi : 1 129 signalements de ce type ont été transmis, parmi lesquels 175 sont estimés haut/critique par le modèle, sans réévaluation indépendante⁽¹⁾.

✦

Remédiation : du signalement au correctif

Au moment du rapport, Anthropic indique avoir divulgué 530 vulnérabilités haut/critique aux mainteneurs open source. Sur ce volume, 75 ont été patchées et 65 ont fait l’objet d’un advisory public⁽¹⁾. 827 vulnérabilités supplémentaires, confirmées et estimées haut/critique, sont en attente de divulgation⁽¹⁾. Le délai moyen entre la découverte par Mythos Preview et la mise à disposition d’un correctif pour un bug haut/critique est d’environ deux semaines⁽¹⁾.

Trois facteurs sont avancés pour expliquer l’écart entre le volume de signalements confirmés et le volume de correctifs déjà publiés⁽¹⁾ :

Fenêtre CVD encore ouverte. Le rapport intervient encore tôt dans la fenêtre de divulgation coordonnée de 90 jours retenue par la politique CVD d’Anthropic⁽³⁾.

Sous-comptage probable. Certains patchs sont déployés sans advisory : dans ces cas, le suivi repose sur une détection a posteriori, à l’aide de Claude.

Saturation humaine. Une saturation structurelle des capacités de triage et de correction, particulièrement marquée côté mainteneurs bénévoles d’open source.

En réponse, Anthropic a formalisé un partenariat de 12,5 M$ avec le projet Alpha-Omega de l’Open Source Security Foundation, qui vise à appuyer les mainteneurs dans le traitement et la priorisation des rapports de bugs⁽¹⁶⁾. Cette enveloppe s’inscrit dans l’engagement global annoncé en avril 2026 : plus de 100 millions de dollars de crédits d’usage et 4 millions de dollars de dons aux organisations de sécurité open source^(1)(21).

✦

Évaluations externes et benchmarks

Le rapport s’appuie sur plusieurs évaluations indépendantes pour qualifier la performance de Mythos Preview en dehors du périmètre partenaires.

L’AI Security Institute britannique (AISI) indique que Mythos Preview est le premier modèle à résoudre de bout en bout les deux cyber ranges qu’il opère, simulant des chaînes d’attaque multi-étapes⁽¹⁾⁽⁹⁾. La plateforme XBOW décrit Mythos Preview comme une avancée significative par rapport aux modèles existants pour l’identification de candidats vulnérables et l’analyse de code source dans une optique de sécurité, en particulier sur la transformation d’une vulnérabilité en chaîne d’attaque complète^(1)(10).

Deux benchmarks académiques récents, ExploitBench et ExploitGym, placent Mythos Preview en tête sur les capacités de développement d’exploits⁽¹⁾⁽⁴⁾. L’équipe Frontier Red Team d’Anthropic publie une analyse détaillée de ces benchmarks sur son blog dédié⁽⁴⁾.

Côté partenaires, les retours publics convergent : Cloudflare rapporte un taux de faux positifs jugé meilleur que celui de testeurs humains expérimentés sur son périmètre⁽⁷⁾ ; Mozilla observe un facteur 10 sur le volume de vulnérabilités trouvées entre Firefox 148 (Claude Opus 4.6) et Firefox 150 (Mythos Preview)⁽⁸⁾ ; Palo Alto Networks documente un facteur 5 sur le volume de patches publié dans sa dernière livraison⁽¹¹⁾. Microsoft, Oracle et plusieurs autres éditeurs ont publié des billets dédiés sur l’impact constaté en interne^(12)(13).

✦

Deux cas d’usage publics : wolfSSL et fraude bancaire

Le rapport publie deux exemples concrets, à des fins illustratives, sur des sujets dont la divulgation est jugée non préjudiciable.

wolfSSL — CVE-2026-5194

Mythos Preview a identifié une vulnérabilité dans la bibliothèque cryptographique open source wolfSSL, utilisée selon ses propres données par plusieurs milliards d’équipements dans le monde^(1)(14). Le modèle a construit un exploit permettant la forge de certificats, ce qui rendrait possible l’hébergement d’un site frauduleux indiscernable d’un site légitime (banque, messagerie) du point de vue de l’utilisateur final⁽¹⁾. La vulnérabilité est référencée dans la NVD sous CVE-2026-5194⁽¹⁵⁾. Anthropic annonce la publication d’une analyse technique complète après large déploiement du correctif⁽¹⁾.

Banque partenaire — fraude par compromission de messagerie

Une banque partenaire du programme Glasswing a utilisé Mythos Preview pour détecter et bloquer un virement frauduleux de 1,5 million de dollars^(1)(22). Le scénario combine la compromission de la messagerie d’un client et des appels téléphoniques usurpés. Le modèle a identifié le motif de fraude avant l’exécution du virement. Ce cas illustre que l’usage de Mythos Preview ne se limite pas à l’analyse de code et inclut des scénarios de détection de fraude impliquant l’analyse de signaux composites.

✦

Le déplacement du goulot d’étranglement : trouver vs corriger

Le rapport fait explicitement un constat structurel : la détection n’est plus le facteur limitant de la sécurité logicielle ; la vérification, la divulgation et la production de correctifs le sont devenues^(1)(20). Anthropic décrit ce déplacement comme un défi pour l’ensemble de l’écosystème, sur une période transitoire pendant laquelle les vulnérabilités sont découvertes rapidement et corrigées lentement.

Les recommandations défensives publiées ciblent deux populations⁽¹⁾ :

Éditeurs. Raccourcir les cycles de patch, faciliter le déploiement des mises à jour côté utilisateur, et solliciter plus activement les utilisateurs maintenant des versions vulnérables. L’usage de modèles publics pour automatiser la production de correctifs est explicitement encouragé.

Défenseurs réseau. Réduire les délais de test et de déploiement des correctifs, et renforcer l’application des contrôles fondamentaux référencés par le NIST Cybersecurity Framework et par le NCSC britannique : durcissement des configurations par défaut, authentification multifacteur, journalisation pour la détection et la réponse. Anthropic souligne que ces contrôles améliorent la posture défensive indépendamment de la rapidité d’application d’un correctif donné.

Le rapport présente cette période comme transitoire : à terme, des modèles de classe Mythos doivent permettre aux développeurs de capter les bugs avant déploiement, et donc de réduire le volume de vulnérabilités à corriger en aval. Mais l’écart actuel entre détection et correction constitue, dans l’intervalle, une fenêtre d’opportunité offensive accrue⁽¹⁾.

✦

Stratégie d’Anthropic : Mythos verrouillé, Claude Security ouvert

La communication d’Anthropic distingue deux trajectoires produit.

Mythos Preview

Mythos Preview demeure à diffusion restreinte ; sa mise à disposition publique est conditionnée au développement de garde-fous renforcés contre les usages offensifs⁽¹⁾. Anthropic indique qu’aucune entreprise, y compris elle-même, n’a à ce jour développé de garde-fous suffisamment robustes pour permettre une diffusion généralisée d’un modèle de cette catégorie. Le programme Glasswing est présenté comme un mécanisme transitoire visant à doter les défenseurs systémiques d’un avantage asymétrique avant que des modèles de capacité équivalente n’arrivent sur le marché, potentiellement sans les mêmes restrictions⁽¹⁾.

Claude Security

Claude Security a été ouvert en bêta publique pour les clients Claude Enterprise⁽⁶⁾. Cet outil permet à des équipes de sécurité de scanner leurs codebases et de générer des propositions de correctifs. Selon Anthropic, plus de 2 100 vulnérabilités ont été corrigées en trois semaines via cet outil, sur la base de Claude Opus 4.7⁽¹⁾. Anthropic explique l’écart de rythme par rapport à l’open source par le fait que les entreprises corrigent leur propre code, sans dépendre du processus de divulgation coordonnée vers des mainteneurs bénévoles.

Cyber Verification Program

Anthropic a lancé un programme permettant à des professionnels de la sécurité de mobiliser ses modèles publics pour des usages légitimes (recherche de vulnérabilités, pentest, red team) sans certaines restrictions appliquées par défaut⁽¹⁾.

Outils mis à disposition

Anthropic publie une partie des actifs utilisés en interne et avec ses partenaires Mythos Preview : skills (instructions personnalisées pour des tâches répétées), harnais permettant à Claude de cartographier une codebase et d’orchestrer des sous-agents de scan, et threat model builder pour prioriser les zones d’analyse⁽¹⁾.

Foundry Security Spec

Cisco, partenaire de Glasswing, a publié en open source sa spécification Foundry Security Spec, qui permet à d’autres défenseurs de construire un système d’évaluation comparable au sien⁽¹⁷⁾.

✦

Suites annoncées

Anthropic annonce trois axes pour la suite du programme⁽¹⁾ :

Extension du consortium. Extension de Project Glasswing à de nouveaux partenaires, incluant des administrations américaines et alliées.

Divulgation progressive. Poursuite du processus de divulgation coordonnée des vulnérabilités déjà identifiées, avec publication progressive d’advisories et de rapports techniques détaillés au fur et à mesure que les correctifs sont largement déployés. L’analyse complète de CVE-2026-5194 (wolfSSL) est annoncée pour les semaines suivantes⁽¹⁾.

Diffusion publique conditionnelle. Mise à disposition publique de modèles de classe Mythos une fois les garde-fous jugés suffisamment robustes. Aucun calendrier n’est communiqué.

Anthropic mentionne par ailleurs son soutien au développement des benchmarks ExploitBench et ExploitGym, qui permettent de mesurer l’évolution des capacités d’exploitation des modèles frontière dans la durée⁽⁴⁾. L’External Researcher Access Program est cité comme cadre de soutien pour le développement d’autres benchmarks quantitatifs de qualité⁽¹⁾.

✦

Sources

Anthropic — Project Glasswing: An initial update (22 mai 2026) : https://www.anthropic.com/research/glasswing-initial-update
Anthropic — Project Glasswing (page programme) : https://www.anthropic.com/glasswing
Anthropic — Coordinated Vulnerability Disclosure policy : https://www.anthropic.com/coordinated-vulnerability-disclosure
Anthropic Frontier Red Team — Exploit evaluations : https://red.anthropic.com/2026/exploit-evals/
Anthropic Frontier Red Team — Open-source CVD dashboard : https://red.anthropic.com/2026/cvd/
Anthropic — Claude Security (produit) : https://claude.com/product/claude-security
Cloudflare — Cyber frontier models : https://blog.cloudflare.com/cyber-frontier-models/
Mozilla — Behind the scenes: Hardening Firefox : https://hacks.mozilla.org/2026/05/behind-the-scenes-hardening-firefox/
UK AI Security Institute — How fast is autonomous AI cyber capability advancing : https://www.aisi.gov.uk/blog/how-fast-is-autonomous-ai-cyber-capability-advancing
XBOW — Mythos offensive security evaluation : https://xbow.com/blog/mythos-offensive-security-xbow-evaluation
Palo Alto Networks — Defenders’ guide: Frontier AI impact on cybersecurity, May 2026 update : https://www.paloaltonetworks.com/blog/2026/05/defenders-guide-frontier-ai-impact-cybersecurity-may-2026-update/
Microsoft MSRC — A note on Patch Tuesday : https://www.microsoft.com/en-us/msrc/blog/2026/05/a-note-on-patch-tuesday
Oracle Security — Accelerating vulnerability detection and response at Oracle : https://blogs.oracle.com/security/accelerating-vulnerability-detection-and-response-at-oracle
wolfSSL — How Claude Mythos Preview helped harden wolfSSL : https://www.wolfssl.com/how-claude-mythos-preview-helped-harden-wolfssl/
NIST NVD — CVE-2026-5194 : https://nvd.nist.gov/vuln/detail/CVE-2026-5194
OpenSSF — Linux Foundation announces $12.5M in grant funding : https://openssf.org/press-release/2026/03/17/linux-foundation-announces-12-5-million-in-grant-funding-from-leading-organizations-to-advance-open-source-security/
Cisco — Announcing Foundry Security Spec : https://blogs.cisco.com/ai/announcing-foundry-security-spec
Le Monde Informatique — Avec Claude Mythos, Anthropic détecte 10 000 failles : https://www.lemondeinformatique.fr/actualites/lire-avec-claude-mythos-anthropic-detecte-10-000-failles-100258.html
IT-Connect — Claude Mythos trouve 10 000 failles de sécurité en un mois : https://www.it-connect.fr/claude-mythos-trouve-10-000-failles-de-securite-en-un-mois-et-bouscule-lecosysteme-tech/
Help Net Security — Anthropic: Claude Mythos identified 10,000+ software flaws : https://www.helpnetsecurity.com/2026/05/26/anthropic-project-glasswing-update/
CSO Online — Project Glasswing has uncovered 10,000 vulnerabilities: Anthropic : https://www.csoonline.com/article/4176865/project-glasswing-has-uncovered-10000-vulnerabilities-anthropic.html
The Hacker News — Claude Mythos AI Finds 10,000 High-Severity Flaws in First Month of Project Glasswing : https://thehackernews.com/2026/05/claude-mythos-ai-finds-10000-high.html
Engadget — Anthropic says Mythos has already found more than 10,000 vulnerabilities : https://www.engadget.com/2180028/anthropic-claude-mythos-preview-project-glasswing-update/
Usine Digitale — Cybersécurité : Claude Mythos a trouvé plus de 10 000 failles critiques : https://www.usine-digitale.fr/intelligence-artificielle/anthropic/cybersecurite-claude-mythos-a-trouve-plus-de-10-000-failles-critiques-un-mois-apres-son-lancement-y-compris-dans-les-systemes-les-plus-importants-au-monde.H7GOEW6UVNG5VPKA762DKBT7HM.html
01net — 10 000 failles/mois : Anthropic dévoile le premier bilan Claude Mythos : https://www.01net.com/actualites/10-000-failles-mois-anthropic-devoile-premier-bilan-claude-mythos.html
The Next Web — Anthropic’s Claude Mythos found 10,000 critical vulnerabilities in one month : https://thenextweb.com/news/anthropic-glasswing-claude-mythos-10000-vulnerabilities

CTI & OSINT, Vulnérabilités et Alertes

Project Glasswing

by marcfred • 27 mai 2026