Mythos Claude решает 32‑шаговую атаку AISI в 6 из 10 попыток

Mythos Claude решает 32‑шаговую атаку AISI в 6 из 10 попыток

Новый чекпоинт Anthropic's Claude Mythos Preview стал первой моделью ИИ, сумевшей пройти обе правительственные кибератаки Великобритании, что усилило вопросы об автономном взломе.

AISI сообщает о прорыве Mythos

Британский Институт безопасности ИИ (AI Security Institute) сообщил в среду, что новый чекпоинт Mythos завершил 32‑шаговый корпоративный сетевой атакующий диапазон «The Last Ones» в 6 из 10 попыток. Более ранняя версия справилась лишь в 3 из 10.

Обновлённая модель также взломала «Cooling Tower» — диапазон промышленной системы управления, который ни одна предыдущая модель пройти не смогла, — в 3 из 10 попыток.

Конкурирующая модель OpenAI GPT-5.5 была протестирована на том же упражнении. Она решила «The Last Ones» в 3 из 10 попыток, но не завершила «Cooling Tower».

AISI запускал диапазоны с вычислительным бюджетом 100 миллионов токенов на попытку, и агентство отметило, что производительность продолжала масштабироваться на этом потолке, что предполагает: более высокие бюджеты могут ещё больше повысить долю успешных запусков.

Также читайте: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

Время удвоения продолжает сокращаться

AISI отслеживает прогресс в киберсфере через временные бенчмарки, измеряя, за какой горизонт времени модель может автономно выполнять задачу с надёжностью 80%. В ноябре 2025 года агентство оценило время удвоения в 8 месяцев. К февралю 2026 года эта цифра сократилась до 4,7 месяца, и с тех пор и Mythos, и GPT-5.5 превзошли даже этот ускоренный тренд.

Агентство признало, что неясно, означают ли последние результаты новую фазу ускорения или разовый скачок.

Исследовательская некоммерческая организация METR, которая отслеживает ИИ по задачам в области разработки ПО, а не по кибер-диапазонам, получила схожую оценку около 4,2 месяца. AISI заявляет, что такое совпадение усиливает аргумент в пользу того, что тренд отражает реальные приросты возможностей, а не особенности отдельного набора тестов.

Институт подчеркнул, что в его диапазонах нет активных защитников, поэтому результаты показывают, на что модели способны против слабо защищённых сетей, а не против «закалённых» корпоративных систем.

Почему скачки возможностей имеют значение

Новый чекпоинт Mythos не сопровождался выпуском свежей модели. AISI использовал ту же версию, которую Anthropic развернула в прошлом месяце в рамках Project Glasswing, своей программы партнёрства по безопасности, после получения обновлённой сборки той же модели.

«Заметные скачки возможностей не всегда требуют выхода новых релизов моделей», — написали в институте. Это идёт вразрез с предположением, что защитники могут выстраивать темп работы под цикл выпусков.

Anthropic представила Mythos Preview 7 апреля, обозначив модель как переломный момент для индустрии безопасности после того, как во внутренних тестах она выявила уязвимости нулевого дня в ключевых операционных системах и браузерах. Компания заявила, что сдерживала более широкий релиз из‑за этих возможностей, а апрельская оценка AISI показала, что Mythos — заметный шаг вперёд по сравнению с предыдущими пограничными системами.

Читайте далее: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO

Отказ от ответственности и предупреждение о рисках: Информация, представленная в этой статье, предназначена только для образовательных и информационных целей и основана на мнении автора. Она не является финансовой, инвестиционной, юридической или налоговой консультацией. Криптоактивы крайне волатильны и подвержены высоким рискам, включая риск потери всех или значительной части ваших инвестиций. Торговля или владение криптоактивами может не подходить для всех инвесторов. Мнения, выраженные в этой статье, принадлежат исключительно автору(ам) и не представляют официальную политику или позицию Yellow, её основателей или руководителей. Всегда проводите собственное тщательное исследование (D.Y.O.R.) и консультируйтесь с лицензированным финансовым специалистом перед принятием любых инвестиционных решений.
Связанные Новости
Связанные исследовательские статьи
Связанные обучающие статьи
Mythos Claude решает 32‑шаговую атаку AISI в 6 из 10 попыток | Yellow.com