Fable 5 обійшла GPT 5.5, перш ніж наказ уряду США вивів її з мережі

Anthropic’s Fable 5 ненадовго випередила OpenAI’s GPT 5.5 у ключових ІІ‑бенчмарках, перш ніж 12 червня наказ про експортний контроль США вивів її з мережі.

Основні моменти:

Fable 5 випереджала GPT 5.5 в Arena, SWE-Bench Pro та основних тестах з програмування.

Модель була доступна лише три дні, перш ніж уряд США наказав Anthropic вимкнути її.

GPT 5.5 тепер є найсильнішою доступною моделлю за замовчуванням, але не тому, що перевершила Fable 5.

Закриття Fable 5

Fable 5 стала найздатнішою публічно доступною ІІ‑моделлю після запуску 9 червня, випередивши GPT 5.5 у ключових бенчмарках, перш ніж через три дні втрутився уряд США.

Модель посіла перше місце в Arena, тоді як GPT 5.5 був четвертим. У SWE-Bench Pro Fable 5 набрала 80,3% проти 58,6% у GPT 5.5 — розрив майже 22 пункти в реальних завданнях з розробки ПЗ.

Перевага також була очевидною в тестах з програмування. Fable 5 набрала 1 665 балів у Code Arena, на 98 Elo‑пунктів більше, ніж GPT 5.5, і досягла 29,3% у FrontierCode Diamond, де GPT 5.5 показала 5,7%.

GPT 5.5 мала одну, більш вузьку, перевагу в практичному використанні. Вона коштує $5 за мільйон вхідних токенів і $30 за мільйон вихідних, тоді як Fable 5 — $10 і $50, що робило модель OpenAI дешевшою для великомасштабного застосування.

Fable 5 також пропонувала контекстне вікно на один мільйон токенів і до 128 000 вихідних токенів. Anthropic зробила її доступною для передплатників Pro, Max, Team і Enterprise без додаткової плати до 22 червня, але наказ достроково припинив це вікно.

Також читайте: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 — новий лідер

Закриття відбулося після наказу про експортний контроль від 12 червня, в якому посилалися на вразливість до джейлбрейку в Fable 5 і ширшій лінійці моделей Mythos 5. Anthropic заперечила ці висновки, заявивши, що проблема є незначною, вже відомою і так само досяжною в GPT 5.5 без спеціальних методів обходу.

Це незвичний результат для ринку ШІ.

Розробники втратили доступ до моделі, яка очолювала таблиці бенчмарків, а GPT 5.5 став найкращим доступним варіантом лише тому, що його найближчого конкурента прибрали.

Ця різниця найбільше важить для робочих процесів розробки коду. Розрив у 22 пункти в SWE-Bench Pro означає різницю між моделлю, що може розв’язати близько чотирьох із п’яти реальних проблем у кодовій базі, і тією, що впорається приблизно з трьома з п’яти.

Короткий період роботи Fable 5 також показав, як швидко може рухатися фронтир. GPT 5.5 вийшла наприкінці квітня під внутрішнім кодовим ім’ям «Spud», але її лідерство тривало лише до того моменту, поки Anthropic не відкрила публічний доступ до потужнішої системи класу Mythos у червні.

Читайте далі: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says