Claude Mythos résout un piratage AISI en 32 étapes lors de 6 tentatives sur 10

Claude Mythos résout un piratage AISI en 32 étapes lors de 6 tentatives sur 10

Un nouveau checkpoint de Anthropic's Claude Mythos Preview est devenu le premier modèle d’IA à résoudre les deux simulations de cyberattaque du gouvernement britannique, soulevant de nouvelles questions sur le piratage autonome.

L’AISI annonce une percée de Mythos

L’AI Security Institute britannique a rapporté mercredi que le checkpoint Mythos le plus récent avait terminé son parcours d’attaque de réseau d’entreprise en 32 étapes, « The Last Ones », lors de 6 tentatives sur 10. La version précédente n’en avait réussi que 3 sur 10.

Le modèle mis à jour a également réussi « Cooling Tower », un parcours de système de contrôle industriel qu’aucun modèle précédent n’avait validé, lors de 3 tentatives sur 10.

Le GPT‑5.5 de l’OpenAI rival a été testé sur le même exercice. Il a résolu « The Last Ones » lors de 3 tentatives sur 10, mais n’a pas terminé « Cooling Tower ».

L’AISI a exécuté les parcours avec un budget de calcul de 100 millions de tokens par tentative, et l’agence a noté que les performances continuaient de progresser à ce plafond, laissant penser que des budgets plus élevés augmenteraient encore les taux de réussite.

À lire aussi : Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

Le temps de doublement ne cesse de diminuer

L’AISI suit les progrès en cybersécurité au moyen de repères d’horizon temporel, mesurant la durée d’une tâche autonome qu’un modèle peut accomplir avec 80 % de fiabilité. En novembre 2025, l’agence estimait un temps de doublement de 8 mois. En février 2026, ce chiffre s’était contracté à 4,7 mois, et Mythos comme GPT‑5.5 ont depuis dépassé cette tendance plus rapide.

L’agence a reconnu qu’il restait incertain de savoir si les derniers résultats indiquent une nouvelle accélération ou un saut ponctuel.

L’organisation de recherche à but non lucratif METR, qui suit l’IA sur des tâches logicielles plutôt que sur des parcours cyber, a obtenu un chiffre similaire d’environ 4,2 mois. L’AISI a indiqué que cette convergence renforce l’idée que la tendance reflète de réels gains de capacité plutôt qu’une particularité d’une seule suite d’évaluation.

L’institut a souligné que ses parcours n’incluent pas de défenseurs actifs : les résultats montrent donc ce que les modèles peuvent faire contre des réseaux faiblement protégés plutôt que contre des systèmes d’entreprise durcis.

Pourquoi les bonds de capacité comptent

Le nouveau checkpoint Mythos n’a pas été lancé avec une nouvelle version de modèle. L’AISI a utilisé la même version qu’Anthropic a déployée le mois dernier avec Project Glasswing, son programme de partenariat en matière de sécurité, après avoir reçu une build mise à jour du même modèle.

« Des bonds de capacité notables ne nécessitent pas toujours de nouvelles versions de modèle », a écrit l’institut. Cela va à l’encontre de l’hypothèse selon laquelle les défenseurs peuvent caler leur rythme sur les cycles de lancement.

Anthropic a présenté Mythos Preview le 7 avril, en décrivant le modèle comme un tournant pour l’industrie de la sécurité après qu’il a identifié des failles zero‑day sur les principaux systèmes d’exploitation et navigateurs lors de tests internes. L’entreprise a indiqué avoir retenu une diffusion plus large en raison de ces capacités, et l’évaluation d’avril de l’AISI avait signalé Mythos comme une avancée nette par rapport aux précédents systèmes de pointe.

À lire ensuite : Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO

Avertissement et avertissement sur les risques : Les informations fournies dans cet article sont à des fins éducatives et informatives uniquement et sont basées sur l'opinion de l'auteur. Elles ne constituent pas des conseils financiers, d'investissement, juridiques ou fiscaux. Les actifs de cryptomonnaie sont très volatils et sujets à des risques élevés, y compris le risque de perdre tout ou une partie substantielle de votre investissement. Le trading ou la détention d'actifs crypto peut ne pas convenir à tous les investisseurs. Les opinions exprimées dans cet article sont uniquement celles de l'auteur/des auteurs et ne représentent pas la politique officielle ou la position de Yellow, de ses fondateurs ou de ses dirigeants. Effectuez toujours vos propres recherches approfondies (D.Y.O.R.) et consultez un professionnel financier agréé avant de prendre toute décision d'investissement.
Dernières nouvelles
Voir toutes les nouvelles
Claude Mythos résout un piratage AISI en 32 étapes lors de 6 tentatives sur 10 | Yellow.com