Anthropic отказывается от правила Claude Fable 5, которое ослабляло результаты для конкурирующих исследователей ИИ

Anthropic отказывается от правила Claude Fable 5, которое ослабляло результаты для конкурирующих исследователей ИИ

Anthropic отказывается от Claude Fable 5 policy, которая тайно ухудшала результаты для исследователей, создающих конкурирующие ИИ‑системы, — ограничения, которое, по словам компании, затрагивало 0,03% трафика.

Ключевые моменты:

  • Anthropic отменила политику Fable 5, которая незаметно ослабляла ответы по передовым ИИ‑исследованиям.
  • Необъявленный лимит был спрятан внутри 319‑страничной системной карты и не сопровождался уведомлениями пользователей.
  • Помеченные запросы теперь будут открыто переключаться на Claude Opus 4.8, при этом причина будет показываться каждый раз.

Ограничения Claude Fable 5 отменены

Компания подтвердила изменение изданию Wired на этой неделе; оно первым сообщило об отступлении после нескольких дней нарастающего возмущения среди исследователей, разработчиков и аналитиков политики в сети. Отказ последовал за запуском во вторник Fable 5 — первой публично доступной Mythos-class model Anthropic, системы, которую лаборатория долго не выпускала из‑за её более острой способности находить уязвимости в ПО. Уже через несколько часов после релиза пользователи заметили, что модель тихо перенаправляла или ослабляла ответы по узкому кругу задач, связанных с продвинутыми ИИ‑разработками.

Эти задачи охватывали обучение конкурирующих моделей, отладку ИИ‑кода и настройку нейронных сетей — всё это помечалось абзацем, спрятанным в 319‑страничной системной карте. Вместо того чтобы блокировать такие запросы напрямую, Fable 5 полагалась на скрытые правки промптов и управляющие векторы, чтобы незаметно притупить ответы — ограничение, которое Anthropic оценила всего в 0,03% трафика.

Исправление сохраняет предохранитель, но убирает секретность, вызвавшую основную критику. Anthropic защищала скрытую версию тем, что видимые правила проще изучать и обходить. Теперь помеченные промпты будут открыто переключаться на Claude Opus 4.8, по той же схеме, что и запросы по кибербезопасности и биологии, а API вскоре начнёт возвращать ясное объяснение каждой отказанной или перенаправленной просьбы.

Также читайте: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows

Исследователи отвергли «секретный саботаж»

Критика была направлена на саму секретность, а не на лежащие за ней ограничения. Anthropic представила меру как расширение условий, запрещающих использовать Claude для создания конкурирующих систем, утверждая, что тихое применение мешало худшим нарушителям получать выгоды. Дин Болл (Dean Ball), старший научный сотрудник Foundation for American Innovation, назвал тактику «секретным саботажем» и заявил, что она подкрепляет мнение о том, что часть повестки в области безопасности лишь защищает бизнес‑интересы.

Выражение быстро разошлось.

Другие сосредоточились на асимметрии, заложенной в самом правиле. Anthropic сохраняла Fable 5 на полной мощности для собственных сотрудников, одновременно ограничивая внешние команды — разделение, которое возмутило как сторонников открытого кода, так и давних союзников по вопросам безопасности. Джереми Ховард (Jeremy Howard) из Fast AI сказал, что лаборатория фактически пообещала подрывать конкурентов, которые попытаются догнать её, а Натан Ламберт (Nathan Lambert) из AI2 назвал скрытое понижение «ужасным и антинаучным».

Конфликт завершил тяжёлую первую неделю для Fable 5 — модели, которую Anthropic когда‑то считала слишком рискованной, чтобы выпускать вообще. На этой неделе компания дала системе зелёный свет для публичного использования примерно через неделю после подачи конфиденциальных документов на IPO, сделав ставку на то, что более строгие и прозрачно описанные ограничители помогут удержать её навыки поиска уязвимостей в безопасных рамках.

Читайте далее: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO

Отказ от ответственности и предупреждение о рисках: Информация, представленная в этой статье, предназначена только для образовательных и информационных целей и основана на мнении автора. Она не является финансовой, инвестиционной, юридической или налоговой консультацией. Криптоактивы крайне волатильны и подвержены высоким рискам, включая риск потери всех или значительной части ваших инвестиций. Торговля или владение криптоактивами может не подходить для всех инвесторов. Мнения, выраженные в этой статье, принадлежат исключительно автору(ам) и не представляют официальную политику или позицию Yellow, её основателей или руководителей. Всегда проводите собственное тщательное исследование (D.Y.O.R.) и консультируйтесь с лицензированным финансовым специалистом перед принятием любых инвестиционных решений.
Последние новости
Показать все новости
Связанные Новости
Связанные исследовательские статьи
Связанные обучающие статьи
Anthropic отказывается от правила Claude Fable 5, которое ослабляло результаты для конкурирующих исследователей ИИ | Yellow.com