Fable 5 pokonał GPT 5.5, zanim nakaz USA odłączył go od sieci

Anthropic’s Fable 5 przez krótki czas przewyższał OpenAI’s GPT 5.5 w głównych benchmarkach AI, zanim 12 czerwca nakaz kontroli eksportu USA odłączył go od sieci.

Kluczowe punkty:

Fable 5 wyprzedzał GPT 5.5 w Arena, SWE-Bench Pro i głównych testach kodowania.

Model był dostępny tylko przez trzy dni, zanim rząd USA nakazał Anthropic go wyłączyć.

GPT 5.5 jest teraz najsilniejszym dostępnym modelem z braku Fable 5, a nie dlatego, że go prześcignął.

Wyłączenie Fable 5

Fable 5 stał się najbardziej zaawansowanym publicznym modelem AI po premierze 9 czerwca, wyprzedzając GPT 5.5 w kluczowych benchmarkach, zanim rząd USA zainterweniował trzy dni później.

Model zajął pierwsze miejsce w Arena, podczas gdy GPT 5.5 był czwarty. W SWE-Bench Pro Fable 5 uzyskał wynik 80,3%, w porównaniu do 58,6% dla GPT 5.5, co daje prawie 22 punkty przewagi w rzeczywistych zadaniach inżynierii oprogramowania.

Przewaga była widoczna także w testach kodowania. Fable 5 zdobył 1 665 punktów w Code Arena, o 98 punktów Elo więcej niż GPT 5.5, oraz osiągnął 29,3% w FrontierCode Diamond, gdzie GPT 5.5 uzyskał 5,7%.

GPT 5.5 miał jedną węższą przewagę w praktycznym pozycjonowaniu. Kosztował 5 USD za milion tokenów wejściowych i 30 USD za milion tokenów wyjściowych, podczas gdy Fable 5 kosztował odpowiednio 10 i 50 USD, co czyniło model OpenAI tańszym przy dużej skali użycia.

Fable 5 oferował także okno kontekstu na milion tokenów i 128 000 tokenów wyjściowych. Anthropic udostępnił go subskrybentom Pro, Max, Team i Enterprise bez dodatkowych opłat do 22 czerwca, ale nakaz zakończył ten okres wcześniej.

Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 na szczycie

Wyłączenie nastąpiło po wydaniu 12 czerwca nakazu kontroli eksportu, który wskazywał na podatność na jailbreak w Fable 5 i szerszej rodzinie modeli Mythos 5. Anthropic zakwestionował to ustalenie, twierdząc, że problem był niewielki, już znany i możliwy także w GPT 5.5 bez specjalnych metod omijania zabezpieczeń.

To niecodzienna sytuacja na rynku AI.

Deweloperzy stracili dostęp do modelu, który prowadził w tabelach benchmarków, a GPT 5.5 stał się najlepszą dostępną opcją tylko dlatego, że jego najbliższy rywal został usunięty.

To rozróżnienie ma największe znaczenie dla workflowów programistycznych. Różnica 22 punktów w SWE-Bench Pro to dystans między modelem, który rozwiązuje około cztery na pięć realnych problemów w kodzie, a takim, który radzi sobie bliżej trzech na pięć.

Krótka obecność Fable 5 na rynku pokazała też, jak szybko może przesuwać się technologiczna granica. GPT 5.5 zadebiutował pod koniec kwietnia pod wewnętrznym kryptonimem „Spud”, ale jego przewaga trwała tylko do momentu, gdy Anthropic udostępnił publicznie silniejszy system klasy Mythos w czerwcu.