Anthropic скасовує правило Claude Fable 5, яке послаблювало результати для конкурентних дослідників ШІ

Anthropic скасовує правило Claude Fable 5, яке послаблювало результати для конкурентних дослідників ШІ

Anthropic скасовує Claude Fable 5 policy, яка таємно погіршувала результати для дослідників, що створюють конкуруючі системи ШІ, — обмеження, яке компанія оцінила лише в 0,03% трафіку.

Ключові моменти:

  • Anthropic відмовилася від політики Fable 5, що тихо послаблювала відповіді для передового дослідження ШІ.
  • Непрозоре обмеження було заховане всередині 319-сторінкової системної картки й не супроводжувалося жодним повідомленням користувачу.
  • Позначені запити тепер відкрито переводитимуться на Claude Opus 4.8 із поясненням причини кожного разу.

Обмеження Claude Fable 5 скасовані

Компанія підтвердила зміну виданню Wired цього тижня, яке першим повідомило про відступ після кількох днів зростаючого обурення серед дослідників, розробників і аналітиків політики в онлайні. Відступ послідовно збігся з вівторковим запуском Fable 5 — першої публічно доступної Mythos-class model від Anthropic, системи, яку лабораторія довго стримувала через її гостріші здібності до пошуку вразливостей у програмному забезпеченні. Протягом кількох годин після релізу користувачі помітили, що модель тихо перенаправляла або послаблювала свої відповіді для вузького сегмента завдань із просунутого ШІ.

Ці завдання охоплювали тренування конкуруючих моделей, налагодження коду ШІ та тонке налаштування нейронних мереж — усе це позначалося через абзац, захований у 319-сторінковій системній картці. Замість того щоб просто блокувати такі запити, Fable 5 використовувала приховані правки підказок і керувальні вектори, аби тихо притупити свої відповіді, — обмеження, яке Anthropic оцінила лише в 0,03% трафіку.

Виправлення зберігає запобіжник, але прибирає таємність, яка викликала найбільше обурення. Anthropic захищала приховану версію тим, що видимі правила легше досліджувати й обходити. Тепер позначені запити відкрито переводитимуться на Claude Opus 4.8 — той самий маршрут, що використовується для кібер- і біозапитів, — а API невдовзі повертатиме чітке пояснення причини кожної відмови.

Також читайте: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows

Дослідники відкидають таємну «диверсію»

Критика була спрямована на секретність як таку, а не на самі обмеження. Anthropic подала цей запобіжник як розширення умов, що забороняють використовувати Claude для створення конкуруючих систем, стверджуючи, що тихе застосування правил стримує найгірших порушників. Дін Болл (Dean Ball), старший науковий співробітник Фонду американських інновацій, назвав таку тактику «таємною диверсією» й сказав, що вона підживлює думку, ніби частина ініціатив із безпеки лише захищає бізнес-інтереси.

Вислів швидко набув розголосу.

Інші зосередилися на асиметрії, закладеній у саме правило. Anthropic зберігала повну потужність Fable 5 для власних співробітників, водночас обмежуючи зовнішні команди — розрив, який розлютив як прихильників відкритого коду, так і давніх союзників компанії в сфері безпеки. Представник Fast AI Джеремі Говард сказав, що лабораторія фактично пообіцяла послаблювати конкурентів, які спробують зрівнятися, а дослідник AI2 Натан Ламберт назвав приховане погіршення «обурливим» і антинауковим.

Конфлікт підсумував важкий перший тиждень для Fable 5 — моделі, яку Anthropic колись вважала надто ризикованою, щоб узагалі випускати. Цього тижня компанія дала системі «зелене світло» для масового використання приблизно через тиждень після подання конфіденційних документів для IPO, роблячи ставку на те, що жорсткіші й краще задекларовані обмеження дадуть змогу зберегти її здатність знаходити вразливості в безпечних межах.

Читайте далі: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO

Відмова від відповідальності та попередження про ризики: Інформація, надана в цій статті, призначена лише для освітніх та інформаційних цілей і базується на думці автора. Вона не є фінансовою, інвестиційною, правовою чи податковою консультацією. Криптоактиви є надзвичайно волатильними та піддаються високому ризику, включаючи ризик втрати всіх або значної частини ваших інвестицій. Торгівля або утримання криптоактивів може не підходити для всіх інвесторів. Думки, висловлені в цій статті, належать виключно автору(ам) і не представляють офіційну політику чи позицію Yellow, її засновників або керівників. Завжди проводьте власне ретельне дослідження (D.Y.O.R.) та консультуйтесь з ліцензованим фінансовим фахівцем перед прийняттям будь-яких інвестиційних рішень.
Останні новини
Показати всі новини
Схожі новини
Схожі дослідницькі статті
Схожі навчальні матеріали
Anthropic скасовує правило Claude Fable 5, яке послаблювало результати для конкурентних дослідників ШІ | Yellow.com