Как Claude Mythos и GPT-5.5 тихо переписали расчёты киберзащиты

Anthropic's Claude Mythos Preview и OpenAI's GPT-5.5, две передовые модели ИИ, выполнили автономные киберзадачи с такой скоростью, что существующие прогнозы возможностей не успевали за ними, сообщили исследователи в среду.

Передовые модели опережают тренд

Claude Mythos Preview и GPT-5.5 outperformed тренд удвоения, который AI Security Institute Великобритании отслеживал с конца 2024 года.

Ранее в этом году AISI оценивал, что горизонт достижения 80% надёжности в киберзадачах примерно каждые пять месяцев сокращается вдвое, по сравнению с восьмимесячным показателем в ноябре 2025 года. Более свежая версия Mythos Preview solved «The Last Ones» — 32‑шаговую смоделированную атаку на корпоративную сеть — в 6 из 10 попыток и завершила «Cooling Tower» в 3 из 10. GPT-5.5 прошёл «The Last Ones» в 3 из 10 попыток.

Впервые какая‑либо модель завершила оба диапазона задач AISI.

Также читайте: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided

Предупреждение Palo Alto о «vulnpocalypse»

Palo Alto Networks reported о похожих выводах по итогам собственных тестов.

Компания за последний месяц просканировала более 130 продуктов и обнаружила 75 реальных уязвимостей — более чем в семь раз больше обычного месячного показателя; все они уже исправлены.

Ли Кларич, технический директор компании, заявил, что у организаций есть узкое окно, прежде чем соперники получат аналогичные возможности.

По его оценке, это «узкое трёх‑ до пяти‑месячное окно, чтобы опередить противника».

В AISI предупредили, что выборка пока мала, а по самым сложным задачам мало данных для сравнения с людьми. Тем не менее институт отметил, что исключение любой одной модели из анализа меняет оценку периода удвоения менее чем на месяц. Некоммерческая организация METR, которая tracks ИИ в программных задачах, получила почти идентичную оценку — примерно четыре месяца.

Кривая возможностей становится круче

Anthropic ограничила ранний запуск Mythos в прошлом месяце узким кругом партнёров, включая Palo Alto Networks, CrowdStrike, Amazon, Apple и JPMorgan.

OpenAI вслед за этим представила модель GPT-5.5-Cyber и инициативу Daybreak в области кибербезопасности.

Темпы изменений резко ускорились за последние 18 месяцев. AISI сократил прогнозируемый период удвоения с восьми месяцев до 4,7 месяца в феврале 2026 года, а затем снова уменьшил его после последнего раунда тестов. Пересчитанный показатель сейчас ближе к четырём месяцам, что отражает оценку METR по задачам программной инженерии.