Comment Claude Mythos et GPT-5.5 ont discrètement rebattu les cartes des mathématiques de la cyberdéfense

Comment Claude Mythos et GPT-5.5 ont discrètement rebattu les cartes des mathématiques de la cyberdéfense

Anthropic's Claude Mythos Preview et OpenAI's GPT-5.5, deux modèles d’IA de pointe, ont exécuté des tâches cyber autonomes à un rythme qui a dépassé les prévisions de capacités existantes, ont indiqué les chercheurs mercredi.

Les modèles de pointe dépassent la tendance

Claude Mythos Preview et GPT-5.5 outperformed la tendance de doublement que l’AI Security Institute du Royaume‑Uni suivait depuis la fin de 2024.

L’AISI avait estimé plus tôt cette année que l’horizon temporel pour atteindre 80 % de fiabilité en cybersécurité doublait approximativement tous les cinq mois, contre huit mois en novembre 2025. Une version plus récente de Mythos Preview a solved « The Last Ones », une attaque simulée de réseau d’entreprise en 32 étapes, lors de 6 tentatives sur 10, et a terminé « Cooling Tower » lors de 3 tentatives sur 10. GPT-5.5 a réussi « The Last Ones » lors de 3 tentatives sur 10.

C’était la première fois qu’un modèle parvenait à compléter les deux séries de tests de l’AISI.

À lire aussi : Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided

Alerte « vulnpocalypse » de Palo Alto

Palo Alto Networks a reported des conclusions similaires à travers ses propres tests.

L’entreprise a analysé plus de 130 produits au cours du dernier mois et a mis au jour 75 vulnérabilités avérées, soit plus de sept fois son nombre mensuel habituel, toutes désormais corrigées.

Lee Klarich, directeur technologique de l’entreprise, a déclaré que les organisations disposent d’une fenêtre étroite avant que les adversaires n’obtiennent des capacités similaires.

Il a estimé une « fenêtre étroite de trois à cinq mois pour que les organisations gardent une longueur d’avance sur l’adversaire ».

L’AISI a mis en garde en rappelant que son échantillon reste limité et que les tâches les plus difficiles disposent de peu de données comparatives humaines. Malgré cela, l’institut indique que retirer n’importe quel modèle de l’analyse modifie l’estimation de la période de doublement de moins d’un mois. METR, une organisation à but non lucratif qui tracks l’IA sur les tâches logicielles, est arrivée à un chiffre quasi identique, d’environ quatre mois.

La courbe de capacité s’accentue

Anthropic a limité le déploiement initial de Mythos le mois dernier à un groupe restreint comprenant Palo Alto Networks, CrowdStrike, Amazon, Apple et JPMorgan.

OpenAI a suivi avec son modèle GPT-5.5-Cyber et son initiative cyber Daybreak.

Le rythme du changement s’est fortement accéléré au cours des 18 derniers mois. L’AISI a réduit sa période de doublement projetée de huit mois à 4,7 mois en février 2026, puis l’a de nouveau réduite après cette dernière série de tests. La valeur recalculée se situe désormais plus près de quatre mois, reflétant l’estimation de METR sur les tâches d’ingénierie logicielle.

À lire ensuite : Coinbase Opens $100K USDC Loans Against Solana Token Holdings

Avertissement et avertissement sur les risques : Les informations fournies dans cet article sont à des fins éducatives et informatives uniquement et sont basées sur l'opinion de l'auteur. Elles ne constituent pas des conseils financiers, d'investissement, juridiques ou fiscaux. Les actifs de cryptomonnaie sont très volatils et sujets à des risques élevés, y compris le risque de perdre tout ou une partie substantielle de votre investissement. Le trading ou la détention d'actifs crypto peut ne pas convenir à tous les investisseurs. Les opinions exprimées dans cet article sont uniquement celles de l'auteur/des auteurs et ne représentent pas la politique officielle ou la position de Yellow, de ses fondateurs ou de ses dirigeants. Effectuez toujours vos propres recherches approfondies (D.Y.O.R.) et consultez un professionnel financier agréé avant de prendre toute décision d'investissement.
Comment Claude Mythos et GPT-5.5 ont discrètement rebattu les cartes des mathématiques de la cyberdéfense | Yellow.com