Anthropic’s Fable 5 na krótko wyprzedził OpenAI’s GPT 5.5 w głównych benchmarkach AI, zanim 12 czerwca amerykańskie rozporządzenie eksportowe odłączyło go od sieci.
Kluczowe punkty:
- Fable 5 wyprzedził GPT 5.5 w Chatbot Arena, SWE-Bench Pro i głównych testach kodowania.
- Model był dostępny tylko przez trzy dni, zanim rząd USA nakazał Anthropic jego wyłączenie.
- GPT 5.5 jest teraz najsilniejszym dostępnym modelem domyślnie, nie dlatego, że dogonił Fable 5.
Wyłączenie Fable 5
Fable 5 stał się najbardziej zaawansowanym publicznym modelem AI po premierze 9 czerwca, wyprzedzając GPT 5.5 w głównych benchmarkach, zanim rząd USA interweniował trzy dni później.
Model był pierwszy w Chatbot Arena, podczas gdy GPT 5.5 zajmował czwarte miejsce. W SWE-Bench Pro Fable 5 osiągnął 80,3%, wobec 58,6% dla GPT 5.5, co daje prawie 22 punkty przewagi w rzeczywistych zadaniach inżynierii oprogramowania.
Przewaga była wyraźna także w testach programistycznych. Fable 5 zdobył 1 665 punktów w Code Arena, o 98 punktów Elo więcej niż GPT 5.5, oraz osiągnął 29,3% w FrontierCode Diamond, gdzie GPT 5.5 uzyskał 5,7%.
GPT 5.5 miał jedną, węższą przewagę praktyczną. Kosztuje 5 USD za milion tokenów wejściowych i 30 USD za milion tokenów wyjściowych, podczas gdy Fable 5 kosztował odpowiednio 10 i 50 USD, co czyni model OpenAI tańszym przy dużej skali użycia.
Fable 5 oferował także kontekst o wielkości miliona tokenów i 128 000 tokenów wyjściowych. Anthropic udostępnił go subskrybentom Pro, Max, Team i Enterprise bez dodatkowych opłat do 22 czerwca, zanim nakaz skrócił ten okres.
Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 zostaje królem
Wyłączenie nastąpiło po rozporządzeniu eksportowym z 12 czerwca, które wskazywało na podatność typu jailbreak w Fable 5 oraz w szerszej rodzinie modeli Mythos 5. Anthropic zakwestionował te ustalenia, twierdząc, że problem jest drobny, już znany i możliwy także w GPT 5.5 bez specjalnych metod omijania zabezpieczeń.
To niecodzienna sytuacja na rynku AI.
Deweloperzy stracili dostęp do modelu, który prowadził w tabelach benchmarków, a GPT 5.5 stał się najlepszą dostępną opcją tylko dlatego, że jego najbliższy rywal został usunięty.
To rozróżnienie jest szczególnie istotne dla przepływów pracy związanych z kodowaniem. Różnica 22 punktów w SWE-Bench Pro oznacza przeskok od modelu, który rozwiązuje około cztery na pięć rzeczywistych problemów w kodzie, do takiego, który radzi sobie raczej z trzema na pięć.
Krótki okres dostępności Fable 5 pokazał też, jak szybko może przesuwać się technologiczna granica. GPT 5.5 zadebiutował pod koniec kwietnia pod wewnętrzną nazwą „Spud”, ale jego przewaga trwała tylko do momentu, gdy Anthropic udostępnił publicznie silniejszy system klasy Mythos w czerwcu.
Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





