Anthropic скасовує правило Claude Fable 5, яке послаблювало результати для дослідників конкуруючих ІІ

Anthropic скасовує правило Claude Fable 5, яке послаблювало результати для дослідників конкуруючих ІІ

Anthropic скасовує Claude Fable 5 policy, яка таємно погіршувала результати для дослідників, що будують конкуруючі ІІ‑системи, — обмеження, яке компанія оцінила лише в 0,03% трафіку.

Ключові пункти:

  • Anthropic відкотила політику Fable 5, яка непомітно послаблювала відповіді для прикордонних досліджень ІІ.
  • Неоприлюднене обмеження ховалося всередині 319‑сторінкової системної картки й не показувало жодних сповіщень користувачеві.
  • Позначені запити тепер відкрито будуть переводитися на Claude Opus 4.8, із поясненням причини щоразу.

Обмеження Claude Fable 5 скасовано

Компанія підтвердила цю зміну виданню Wired цього тижня; саме воно першим повідомило про відступ після кількох днів зростаючого обурення серед дослідників, розробників і політичних аналітиків онлайн. Відкат стався незабаром після вівторкового запуску Fable 5 — першої публічно доступної Mythos-class model Anthropic, системи, яку лабораторія довго не випускала через її загострену здатність знаходити вразливості в софті. Вже за кілька годин після релізу користувачі помітили, що вона тихо перенаправляла або послаблювала відповіді в вузькій смузі завдань з передового ІІ.

Ці задачі охоплювали тренування конкуруючих моделей, налагодження ІІ‑коду та тюнінг нейромереж — усе це позначалося через абзац, захований у 319‑сторінковій системній картці. Замість того щоб блокувати їх напряму, Fable 5 покладався на приховані правки промптів і керувальні вектори, щоби непомітно притупити відповіді; Anthropic оцінила цю «засічку» лише в 0,03% трафіку.

Оновлення зберігає запобіжний механізм, але прибирає таємність, яка викликала основну хвилю критики. Anthropic захищала приховану версію, стверджуючи, що видимі правила легше вивчати й обходити. Тепер позначені запити відкрито будуть переводитися на Claude Opus 4.8, той самий маршрут, що використовується для кібер‑ та біозапитів, а API невдовзі повертатиме чітке пояснення кожної відмови.

Також читайте: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows

Дослідники відкидають «таємний саботаж»

Критика була спрямована саме на таємність, а не на самі обмеження. Anthropic подала цей запобіжник як розширення умов, що забороняють використовувати Claude для побудови конкуруючих систем, стверджуючи, що тихе застосування завадило б найгіршим порушникам отримувати перевагу. Дін Болл (Dean Ball), старший науковий співробітник Foundation for American Innovation, назвав цю тактику «таємним саботажем» і сказав, що вона підживлює думку, нібито частина ініціатив із безпеки лише захищає бізнес‑інтереси.

Вираз швидко набув популярності.

Інші звернули увагу на асиметрію, закладену в самі правила. Anthropic зберігала повну потужність Fable 5 для власних співробітників, водночас обмежуючи зовнішні команди — розрив, який розлютив як прихильників відкритого коду, так і давніх союзників у сфері безпеки. Представник Fast AI Джеремі Говард (Jeremy Howard) заявив, що лабораторія фактично пообіцяла підрізати крила конкурентам, які спробують наздогнати, тоді як Натан Ламберт (Nathan Lambert) з AI2 назвав приховане зниження якості вкрай обурливим і антинауковим.

Суперечка завершила виснажливий перший тиждень для Fable 5 — моделі, яку Anthropic раніше вважала надто ризикованою, щоб узагалі випускати. Компанія схвалила систему для публічного використання цього тижня, приблизно через тиждень після подання конфіденційної заявки на IPO, зробивши ставку на те, що жорсткіші й краще задекларовані запобіжники дозволять утримати її здібності з пошуку вразливостей у безпечних рамках.

Читайте далі: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO

Відмова від відповідальності та попередження про ризики: Інформація, надана в цій статті, призначена лише для освітніх та інформаційних цілей і базується на думці автора. Вона не є фінансовою, інвестиційною, правовою чи податковою консультацією. Криптоактиви є надзвичайно волатильними та піддаються високому ризику, включаючи ризик втрати всіх або значної частини ваших інвестицій. Торгівля або утримання криптоактивів може не підходити для всіх інвесторів. Думки, висловлені в цій статті, належать виключно автору(ам) і не представляють офіційну політику чи позицію Yellow, її засновників або керівників. Завжди проводьте власне ретельне дослідження (D.Y.O.R.) та консультуйтесь з ліцензованим фінансовим фахівцем перед прийняттям будь-яких інвестиційних рішень.
Останні новини
Показати всі новини
Схожі новини
Схожі дослідницькі статті
Схожі навчальні матеріали
Anthropic скасовує правило Claude Fable 5, яке послаблювало результати для дослідників конкуруючих ІІ | Yellow.com