Anthropic affirme vouloir donner au public l’accès à son modèle Mythos, its vulnerability-hunting AI, mais uniquement une fois qu’elle aura mis en place des garde-fous qui n’existent pas encore.
Points clés :
- Anthropic prévoit de diffuser largement les modèles de classe Mythos après avoir d’abord étendu l’accès aux gouvernements des États‑Unis et de leurs alliés.
- L’entreprise reconnaît qu’aucune société, y compris elle‑même, n’a construit de garde-fous suffisamment solides pour empêcher les abus.
- Mythos a signalé plus de 23 000 problèmes dans 1 000 projets open source, dont 6 202 failles de gravité élevée ou critique.
Lancement d’Anthropic Mythos
Anthropic a confirmé ce projet dans une mise à jour de Project Glasswing, son programme de sécurité à accès limité, et un rapport séparé souligne que le calendrier reste incertain.
L’entreprise a indiqué qu’elle commencerait par travailler avec les gouvernements des États‑Unis et de leurs alliés pour élargir le programme. Une diffusion plus large des « modèles de classe Mythos » suivrait dans un avenir proche.
Anthropic s’est montrée franche sur les risques. Elle a déclaré qu’aucune entreprise, y compris elle‑même, n’a mis en place de garde-fous assez forts pour empêcher le détournement du modèle et la survenue de dommages graves.
Malgré cela, l’entreprise s’attend à une diffusion rapide d’outils similaires, et prévoit que des modèles de niveau Mythos seront largement disponibles d’ici six à douze mois.
Mythos a fait ses débuts en avril. Anthropic indique qu’il a généré des exploits fonctionnels dans 72,4 % des cas lors des tests, contre presque 0 % pour un précédent modèle Claude.
À lire aussi : Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks
Résultats de Mythos en matière de vulnérabilités
Depuis son lancement, le modèle a analysé plus de 1 000 projets open source et a dégagé 23 019 problèmes, dont 6 202 ont été classés de gravité élevée ou critique.
Une découverte s’est particulièrement démarquée. Mythos a mis au jour une faille dans la bibliothèque de cryptographie wolfSSL, utilisée par des milliards d’appareils, qui aurait pu permettre à des attaquants de forger des certificats et d’usurper l’identité de banques ou de fournisseurs de messagerie. La vulnérabilité a depuis été corrigée.
Le flot de rapports a mis sous pression les personnes chargées de les corriger. Les mainteneurs de projets open source ont demandé à Anthropic de ralentir les divulgations, affirmant que le volume dépasse leur capacité.
Des chercheurs voient un déséquilibre plus profond. Anthropic soutient qu’il est désormais bien plus facile de trouver des bugs que de les corriger, et l’entreprise s’est associée au projet Alpha‑Omega de l’Open Source Security Foundation pour aider les mainteneurs à hiérarchiser l’arriéré.
La carte système de Claude Mythos prédit que l’IA finira par avantager les défenseurs, même si Anthropic concède que les attaquants gardent probablement l’avantage pour l’instant.
Lorsque Mythos a été révélé pour la première fois, Anthropic a donné à plus de 50 organisations, dont Apple, Microsoft et Google, un accès assorti d’environ 100 millions de dollars de crédits d’utilisation, tout en refusant de rendre le modèle public en raison de sa capacité à transformer les failles logicielles en armes.
À lire ensuite : Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High





