Anthropic отказывается от Claude Fable 5 policy, которая тайно ухудшала результаты для исследователей, создающих конкурирующие ИИ‑системы, — ограничения, которое, по словам компании, затрагивало 0,03% трафика.
Ключевые моменты:
- Anthropic отменила политику Fable 5, тихо ослаблявшую ответы для передовых исследований ИИ.
- Необъявленное ограничение было спрятано в 319‑страничной системной карте и не сопровождалось уведомлением пользователей.
- Помеченные запросы теперь будут явно переадресовываться на Claude Opus 4.8 с отображением причины каждый раз.
Ограничения Claude Fable 5 отменены
Компания подтвердила изменение изданию Wired на этой неделе, которое первым сообщило об отступлении после нескольких дней растущего недовольства среди исследователей, разработчиков и аналитиков политики в сети. Решение последовало за вторничным запуском Fable 5 — первой публично доступной Mythos-class model Anthropic, систему, которую лаборатория долго не выпускала из‑за её более острой способности находить уязвимости в ПО. Через несколько часов после релиза пользователи заметили, что модель тихо перенаправляла или ослабляла ответы по узкому кругу задач в области продвинутых ИИ‑разработок.
Эти задачи охватывали обучение конкурирующих моделей, отладку ИИ‑кода и настройку нейросетей, все они помечались через абзац, спрятанный в 319‑страничной системной карте. Вместо прямой блокировки Fable 5 опирался на скрытые правки промптов и управляющие векторы, чтобы тихо притупить свои ответы — ограничение, которое Anthropic оценила всего в 0,03% трафика.
Исправление сохраняет защитный механизм, но убирает секретность, вызвавшую основную критику. Anthropic ранее защищала скрытый вариант тем, что видимые правила проще изучать и обходить. Теперь помеченные запросы будут открыто перенаправляться на Claude Opus 4.8, тот же маршрут, который применяется к запросам по кибербезопасности и биологии, а в ближайшее время API начнёт возвращать явное объяснение каждой отказной или пониженной реакции.
Также читайте: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows
Исследователи отвергают тайное «саботирование»
Критика была направлена на саму секретность, а не на стоящие за ней ограничения. Anthropic представляла это ограничение как продолжение условий, запрещающих использовать Claude для создания конкурирующих систем, утверждая, что тихое применение правил мешает самым злостным нарушителям продвигаться вперёд. Дин Болл (Dean Ball), старший научный сотрудник Foundation for American Innovation, назвал тактику «секретным саботажем» и заявил, что она укрепляет мнение, будто часть усилий по безопасности лишь прикрывает бизнес‑интересы.
Выражение быстро разошлось.
Другие указывали на асимметрию, заложенную в саму норму. Anthropic сохраняла полную мощность Fable 5 для собственных сотрудников, одновременно ограничивая внешние команды — такой подход разозлил как сторонников open‑source, так и давних союзников по вопросам безопасности. Джереми Ховард (Jeremy Howard) из Fast AI заявил, что лаборатория фактически пообещала подрывать конкурентов, которые попытались бы идти тем же путём, а Нейтан Ламберт (Nathan Lambert) из AI2 назвал скрытое ухудшение «ужасным» и «антинаучным».
Конфликт подвёл черту под тяжёлой первой неделей для Fable 5 — модели, которую Anthropic когда‑то считала слишком рискованной для общего доступа. На этой неделе компания допустила систему к публичному использованию примерно через неделю после подачи конфиденциальных документов на IPO, сделав ставку на то, что более жёсткие и прозрачные ограничения позволят удержать её способности по поиску уязвимостей в безопасных рамках.
Читайте далее: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO





