Новый чекпоинт Anthropic's Claude Mythos Preview стал первой моделью ИИ, сумевшей пройти обе правительственные кибератаки Великобритании, что усилило вопросы об автономном взломе.
AISI сообщает о прорыве Mythos
Британский Институт безопасности ИИ (AI Security Institute) сообщил в среду, что новый чекпоинт Mythos завершил 32‑шаговый корпоративный сетевой атакующий диапазон «The Last Ones» в 6 из 10 попыток. Более ранняя версия справилась лишь в 3 из 10.
Обновлённая модель также взломала «Cooling Tower» — диапазон промышленной системы управления, который ни одна предыдущая модель пройти не смогла, — в 3 из 10 попыток.
Конкурирующая модель OpenAI GPT-5.5 была протестирована на том же упражнении. Она решила «The Last Ones» в 3 из 10 попыток, но не завершила «Cooling Tower».
AISI запускал диапазоны с вычислительным бюджетом 100 миллионов токенов на попытку, и агентство отметило, что производительность продолжала масштабироваться на этом потолке, что предполагает: более высокие бюджеты могут ещё больше повысить долю успешных запусков.
Также читайте: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok
Время удвоения продолжает сокращаться
AISI отслеживает прогресс в киберсфере через временные бенчмарки, измеряя, за какой горизонт времени модель может автономно выполнять задачу с надёжностью 80%. В ноябре 2025 года агентство оценило время удвоения в 8 месяцев. К февралю 2026 года эта цифра сократилась до 4,7 месяца, и с тех пор и Mythos, и GPT-5.5 превзошли даже этот ускоренный тренд.
Агентство признало, что неясно, означают ли последние результаты новую фазу ускорения или разовый скачок.
Исследовательская некоммерческая организация METR, которая отслеживает ИИ по задачам в области разработки ПО, а не по кибер-диапазонам, получила схожую оценку около 4,2 месяца. AISI заявляет, что такое совпадение усиливает аргумент в пользу того, что тренд отражает реальные приросты возможностей, а не особенности отдельного набора тестов.
Институт подчеркнул, что в его диапазонах нет активных защитников, поэтому результаты показывают, на что модели способны против слабо защищённых сетей, а не против «закалённых» корпоративных систем.
Почему скачки возможностей имеют значение
Новый чекпоинт Mythos не сопровождался выпуском свежей модели. AISI использовал ту же версию, которую Anthropic развернула в прошлом месяце в рамках Project Glasswing, своей программы партнёрства по безопасности, после получения обновлённой сборки той же модели.
«Заметные скачки возможностей не всегда требуют выхода новых релизов моделей», — написали в институте. Это идёт вразрез с предположением, что защитники могут выстраивать темп работы под цикл выпусков.
Anthropic представила Mythos Preview 7 апреля, обозначив модель как переломный момент для индустрии безопасности после того, как во внутренних тестах она выявила уязвимости нулевого дня в ключевых операционных системах и браузерах. Компания заявила, что сдерживала более широкий релиз из‑за этих возможностей, а апрельская оценка AISI показала, что Mythos — заметный шаг вперёд по сравнению с предыдущими пограничными системами.
Читайте далее: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO





