Claude Mythos стал первым ИИ, завершившим смоделированную атаку на корпоративную сеть

Anthropic Claude Mythos Preview стал первой моделью ИИ, завершившей полную смоделированную атаку на корпоративную сеть, решив 73% экспертных задач по кибербезопасности, с которыми ранее не справлялась ни одна система ИИ, по данным Института безопасности ИИ Великобритании (AISI).

Оценка кибербезопасности AISI

AISI, исследовательское подразделение в структуре британского Министерства науки, инноваций и технологий, провёл два набора тестов модели после того, как Anthropic анонсировала её 7 апреля.

Компания решила не выпускать Claude Mythos в широкий доступ, а вместо этого предоставила ограниченный доступ фирмам, занимающимся исследованиями в области безопасности.

В capture-the-flag‑оценках Claude Mythos добился 73% успешности на заданиях экспертного уровня.

До апреля 2025 года ни одна модель не решала ни одной из этих задач. AISI также создал 32‑шаговую симуляцию атаки на корпоративную сеть под названием «The Last Ones», рассчитанную примерно на 20 часов работы для человеческих специалистов. Claude Mythos полностью прошёл симуляцию в 3 из 10 попыток и в среднем выполнял 22 из 32 шагов, по сравнению с 16 шагами у Claude Opus 4.6, следующего по результатам.

«Успех Mythos Preview на одном киберполигоне указывает на то, что он по крайней мере способен автономно атаковать небольшие, слабо защищённые и уязвимые корпоративные системы, в которых уже получен доступ к сети», — заявили в AISI.

Также читайте: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns

Уязвимости нулевого дня

Собственная red‑team Anthropic обнаружила, что Claude Mythos может обнаруживать и эксплуатировать уязвимости нулевого дня во всех основных операционных системах и популярных веб‑браузерах, когда пользователь даёт ему явные инструкции. По словам компании, более 99% выявленных уязвимостей до сих пор не исправлены.

«Мы ограничены в том, что можем здесь сообщить. Было бы безответственно раскрывать их детали», — заявили в Anthropic.

Возможности модели уже дошли до политических кругов.

По данным Reuters, министр финансов США Скотт Бессент и председатель ФРС Джером Пауэлл провели срочную встречу с гендиректорами крупнейших банков, чтобы обсудить потенциальные киберриски, связанные с моделью.

Ответ Anthropic в сфере безопасности

Anthropic запустила Project Glasswing одновременно с анонсом модели, описав его как попытку использовать Claude Mythos для защиты критически важного программного обеспечения. Компания представила инициативу как подготовку к эпохе, когда командам по безопасности придётся опережать атакующих, использующих ИИ. AISI рекомендовала организациям в первую очередь сосредоточиться на базовых мерах кибербезопасности, включая регулярное обновление и установку патчей, жёсткий контроль доступа, усиление настроек конфигураций и всеобъемлющее логирование.

Анонс 7 апреля последовал за месяцами растущей обеспокоенности ролью ИИ в кибербезопасности. Предыдущие передовые модели демонстрировали ограниченные наступательные возможности, но ни одна до Claude Mythos не преодолевала экспертные CTF‑бенчмарки и не выполняла многошаговые симуляции атак.

Читайте далее: RaveDAO Just Exploded 1,194% In A Week — Here's The Real Story Behind The Crypto That Turns Raves Into Blockchain