Yellow.com

Anthropic's Claude Mythos Preview et OpenAI's GPT-5.5, deux modèles d’IA de pointe, ont exécuté des tâches cyber autonomes à un rythme qui a dépassé les prévisions de capacités existantes, ont indiqué les chercheurs mercredi.

Les modèles de pointe dépassent la tendance

Claude Mythos Preview et GPT-5.5 outperformed la tendance de doublement que l’AI Security Institute du Royaume‑Uni suivait depuis la fin de 2024.

L’AISI avait estimé plus tôt cette année que l’horizon temporel pour atteindre 80 % de fiabilité en cybersécurité doublait approximativement tous les cinq mois, contre huit mois en novembre 2025. Une version plus récente de Mythos Preview a solved « The Last Ones », une attaque simulée de réseau d’entreprise en 32 étapes, lors de 6 tentatives sur 10, et a terminé « Cooling Tower » lors de 3 tentatives sur 10. GPT-5.5 a réussi « The Last Ones » lors de 3 tentatives sur 10.

C’était la première fois qu’un modèle parvenait à compléter les deux séries de tests de l’AISI.

Alerte « vulnpocalypse » de Palo Alto

Palo Alto Networks a reported des conclusions similaires à travers ses propres tests.

L’entreprise a analysé plus de 130 produits au cours du dernier mois et a mis au jour 75 vulnérabilités avérées, soit plus de sept fois son nombre mensuel habituel, toutes désormais corrigées.

Lee Klarich, directeur technologique de l’entreprise, a déclaré que les organisations disposent d’une fenêtre étroite avant que les adversaires n’obtiennent des capacités similaires.

Il a estimé une « fenêtre étroite de trois à cinq mois pour que les organisations gardent une longueur d’avance sur l’adversaire ».

L’AISI a mis en garde en rappelant que son échantillon reste limité et que les tâches les plus difficiles disposent de peu de données comparatives humaines. Malgré cela, l’institut indique que retirer n’importe quel modèle de l’analyse modifie l’estimation de la période de doublement de moins d’un mois. METR, une organisation à but non lucratif qui tracks l’IA sur les tâches logicielles, est arrivée à un chiffre quasi identique, d’environ quatre mois.

La courbe de capacité s’accentue

Anthropic a limité le déploiement initial de Mythos le mois dernier à un groupe restreint comprenant Palo Alto Networks, CrowdStrike, Amazon, Apple et JPMorgan.

OpenAI a suivi avec son modèle GPT-5.5-Cyber et son initiative cyber Daybreak.

Le rythme du changement s’est fortement accéléré au cours des 18 derniers mois. L’AISI a réduit sa période de doublement projetée de huit mois à 4,7 mois en février 2026, puis l’a de nouveau réduite après cette dernière série de tests. La valeur recalculée se situe désormais plus près de quatre mois, reflétant l’estimation de METR sur les tâches d’ingénierie logicielle.

Alexey Bondarev

Alexey Bondarev est responsable du contenu chez Yellow.com et couvre l’actualité crypto depuis dix ans. Il est spécialisé dans les articles de Recherche et Learn approfondis, avec un accent particulier sur l’analyse, la mise en contexte sectorielle et les grandes forces qui façonnent l’écosystème crypto, de l’ère de l’IA et des technologies de sécurité aux innovations fintech. Il est convaincu que tout ce qui est numérique supplantera très prochainement tout ce qui est analogique et travaille dur pour contribuer à rendre cela possible.

Comment Claude Mythos et GPT-5.5 ont discrètement rebattu les cartes des mathématiques de la cyberdéfense

Les modèles de pointe dépassent la tendance

Alerte « vulnpocalypse » de Palo Alto

La courbe de capacité s’accentue

Alexey Bondarev