Anthropic's Claude Mythos Preview et OpenAI's GPT-5.5, deux modèles d’IA de pointe, ont exécuté des tâches cyber autonomes à un rythme qui a dépassé les prévisions de capacités existantes, ont indiqué les chercheurs mercredi.
Les modèles de pointe dépassent la tendance
Claude Mythos Preview et GPT-5.5 outperformed la tendance de doublement que l’AI Security Institute du Royaume‑Uni suivait depuis la fin de 2024.
L’AISI avait estimé plus tôt cette année que l’horizon temporel pour atteindre 80 % de fiabilité en cybersécurité doublait approximativement tous les cinq mois, contre huit mois en novembre 2025. Une version plus récente de Mythos Preview a solved « The Last Ones », une attaque simulée de réseau d’entreprise en 32 étapes, lors de 6 tentatives sur 10, et a terminé « Cooling Tower » lors de 3 tentatives sur 10. GPT-5.5 a réussi « The Last Ones » lors de 3 tentatives sur 10.
C’était la première fois qu’un modèle parvenait à compléter les deux séries de tests de l’AISI.
À lire aussi : Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided
Alerte « vulnpocalypse » de Palo Alto
Palo Alto Networks a reported des conclusions similaires à travers ses propres tests.
L’entreprise a analysé plus de 130 produits au cours du dernier mois et a mis au jour 75 vulnérabilités avérées, soit plus de sept fois son nombre mensuel habituel, toutes désormais corrigées.
Lee Klarich, directeur technologique de l’entreprise, a déclaré que les organisations disposent d’une fenêtre étroite avant que les adversaires n’obtiennent des capacités similaires.
Il a estimé une « fenêtre étroite de trois à cinq mois pour que les organisations gardent une longueur d’avance sur l’adversaire ».
L’AISI a mis en garde en rappelant que son échantillon reste limité et que les tâches les plus difficiles disposent de peu de données comparatives humaines. Malgré cela, l’institut indique que retirer n’importe quel modèle de l’analyse modifie l’estimation de la période de doublement de moins d’un mois. METR, une organisation à but non lucratif qui tracks l’IA sur les tâches logicielles, est arrivée à un chiffre quasi identique, d’environ quatre mois.
La courbe de capacité s’accentue
Anthropic a limité le déploiement initial de Mythos le mois dernier à un groupe restreint comprenant Palo Alto Networks, CrowdStrike, Amazon, Apple et JPMorgan.
OpenAI a suivi avec son modèle GPT-5.5-Cyber et son initiative cyber Daybreak.
Le rythme du changement s’est fortement accéléré au cours des 18 derniers mois. L’AISI a réduit sa période de doublement projetée de huit mois à 4,7 mois en février 2026, puis l’a de nouveau réduite après cette dernière série de tests. La valeur recalculée se situe désormais plus près de quatre mois, reflétant l’estimation de METR sur les tâches d’ingénierie logicielle.
À lire ensuite : Coinbase Opens $100K USDC Loans Against Solana Token Holdings





