Anthropic's Claude Mythos Preview и OpenAI's GPT-5.5, две передовые модели ИИ, выполнили автономные киберзадачи с такой скоростью, что существующие прогнозы возможностей не успевали за ними, сообщили исследователи в среду.
Передовые модели опережают тренд
Claude Mythos Preview и GPT-5.5 outperformed тренд удвоения, который AI Security Institute Великобритании отслеживал с конца 2024 года.
Ранее в этом году AISI оценивал, что горизонт достижения 80% надёжности в киберзадачах примерно каждые пять месяцев сокращается вдвое, по сравнению с восьмимесячным показателем в ноябре 2025 года. Более свежая версия Mythos Preview solved «The Last Ones» — 32‑шаговую смоделированную атаку на корпоративную сеть — в 6 из 10 попыток и завершила «Cooling Tower» в 3 из 10. GPT-5.5 прошёл «The Last Ones» в 3 из 10 попыток.
Впервые какая‑либо модель завершила оба диапазона задач AISI.
Также читайте: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided
Предупреждение Palo Alto о «vulnpocalypse»
Palo Alto Networks reported о похожих выводах по итогам собственных тестов.
Компания за последний месяц просканировала более 130 продуктов и обнаружила 75 реальных уязвимостей — более чем в семь раз больше обычного месячного показателя; все они уже исправлены.
Ли Кларич, технический директор компании, заявил, что у организаций есть узкое окно, прежде чем соперники получат аналогичные возможности.
По его оценке, это «узкое трёх‑ до пяти‑месячное окно, чтобы опередить противника».
В AISI предупредили, что выборка пока мала, а по самым сложным задачам мало данных для сравнения с людьми. Тем не менее институт отметил, что исключение любой одной модели из анализа меняет оценку периода удвоения менее чем на месяц. Некоммерческая организация METR, которая tracks ИИ в программных задачах, получила почти идентичную оценку — примерно четыре месяца.
Кривая возможностей становится круче
Anthropic ограничила ранний запуск Mythos в прошлом месяце узким кругом партнёров, включая Palo Alto Networks, CrowdStrike, Amazon, Apple и JPMorgan.
OpenAI вслед за этим представила модель GPT-5.5-Cyber и инициативу Daybreak в области кибербезопасности.
Темпы изменений резко ускорились за последние 18 месяцев. AISI сократил прогнозируемый период удвоения с восьми месяцев до 4,7 месяца в феврале 2026 года, а затем снова уменьшил его после последнего раунда тестов. Пересчитанный показатель сейчас ближе к четырём месяцам, что отражает оценку METR по задачам программной инженерии.
Read Next: Coinbase Opens $100K USDC Loans Against Solana Token Holdings





