Anthropic’s Fable 5 presteerde kortstondig beter dan OpenAI’s GPT 5.5 op belangrijke AI-benchmarks, voordat een Amerikaanse exportcontrolemaatregel op 12 juni het model offline haalde.
Belangrijkste punten:
- Fable 5 lag voor op GPT 5.5 op Chatbot Arena, SWE-Bench Pro en grote coderingstests.
- Het model was slechts drie dagen beschikbaar voordat de Amerikaanse overheid Anthropic opdracht gaf het uit te schakelen.
- GPT 5.5 is nu standaard het sterkste beschikbare model, niet omdat het Fable 5 heeft ingehaald.
Fable 5 uitgeschakeld
Fable 5 werd na de lancering op 9 juni het krachtigste publieke AI-model en overtrof GPT 5.5 op belangrijke benchmarks, voordat de Amerikaanse overheid drie dagen later ingreep.
Het model stond op nummer één op Chatbot Arena, terwijl GPT 5.5 vierde stond. Op SWE-Bench Pro haalde Fable 5 een score van 80,3%, tegenover 58,6% voor GPT 5.5, een verschil van bijna 22 punten bij echte software-engineeringtaken.
De voorsprong was ook duidelijk in coderingstests. Fable 5 scoorde 1.665 op Code Arena, 98 Elo-punten boven GPT 5.5, en haalde 29,3% op FrontierCode Diamond, waar GPT 5.5 5,7% behaalde.
GPT 5.5 had één kleiner voordeel in praktische inzet. Het kost $5 per miljoen inputtokens en $30 per miljoen outputtokens, terwijl Fable 5 $10 en $50 kostte, waardoor het model van OpenAI goedkoper was voor gebruik op grote schaal.
Fable 5 bood ook een contextvenster van één miljoen tokens en 128.000 outputtokens. Anthropic had het zonder extra kosten beschikbaar gemaakt voor Pro-, Max-, Team- en Enterprise-abonnees tot 22 juni, voordat de ordemaatregel dat venster voortijdig sloot.
Ook lezen: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 is de koning
De uitschakeling volgde op een exportcontrolemaatregel van 12 juni, waarin werd verwezen naar een jailbreak-kwetsbaarheid in Fable 5 en de bredere Mythos 5-modelfamilie. Anthropic bestreed die conclusie en stelde dat het om een klein, al bekend probleem ging dat ook bij GPT 5.5 bereikt kon worden zonder speciale omzeiltechnieken.
Het resultaat is ongebruikelijk voor de AI-markt.
Ontwikkelaars verloren de toegang tot het model dat bovenaan de benchmarklijsten stond, terwijl GPT 5.5 de beste beschikbare optie werd omdat zijn naaste rivaal was verwijderd.
Dat onderscheid telt vooral voor codeworkflows. Een SWE-Bench Pro-verschil van 22 punten betekent het verschil tussen een model dat ongeveer vier op de vijf echte codebaseproblemen oplost en een model dat er dichter bij drie op de vijf afhandelt.
De korte levensduur van Fable 5 liet ook zien hoe snel de frontier kan verschuiven. GPT 5.5 werd eind april gelanceerd onder de interne codenaam “Spud”, maar zijn voorsprong hield slechts stand tot Anthropic in juni publieke toegang gaf tot een krachtiger Mythos-systeem.
Lees hierna: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





