Anthropic’s Fable 5 presteerde kortstondig beter dan OpenAI’s GPT 5.5 op grote AI‑benchmarks, voordat een Amerikaans exportbevel het model op 12 juni offline haalde.
Belangrijkste punten:
- Fable 5 lag voor op GPT 5.5 op Arena, SWE‑Bench Pro en grote coderingstests.
- Het model was slechts drie dagen beschikbaar voordat de Amerikaanse overheid Anthropic opdroeg het uit te schakelen.
- GPT 5.5 is nu standaard het sterkste beschikbare model, niet omdat het Fable 5 heeft ingehaald.
Fable 5 uitgeschakeld
Fable 5 werd het krachtigste publieke AI‑model na de lancering op 9 juni, waarbij het GPT 5.5 op belangrijke benchmarks overtrof voordat de Amerikaanse overheid drie dagen later ingreep.
Het model stond op de eerste plaats op Arena, terwijl GPT 5.5 vierde eindigde. Op SWE‑Bench Pro haalde Fable 5 een score van 80,3%, vergeleken met 58,6% voor GPT 5.5, een verschil van bijna 22 punten op echte software‑engineeringtaken.
De voorsprong was ook duidelijk in coderingstests. Fable 5 scoorde 1.665 op Code Arena, 98 Elo‑punten boven GPT 5.5, en behaalde 29,3% op FrontierCode Diamond, waar GPT 5.5 5,7% haalde.
GPT 5.5 had één kleiner praktisch voordeel in de positionering. Het kost $5 per miljoen inputtokens en $30 per miljoen outputtokens, terwijl Fable 5 $10 en $50 kostte, waardoor het model van OpenAI goedkoper was voor gebruik op grote schaal.
Fable 5 bood ook een contextvenster van één miljoen tokens en 128.000 outputtokens. Anthropic had het zonder extra kosten beschikbaar gemaakt voor Pro‑, Max‑, Team‑ en Enterprise‑abonnees tot 22 juni, voordat het bevel dat venster voortijdig sloot.
Ook lezen: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 is de koning
De uitschakeling volgde op een exportbevel van 12 juni waarin werd gewezen op een jailbreak‑kwetsbaarheid in Fable 5 en de bredere Mythos 5‑modelfamilie. Anthropic bestreed die bevinding en stelde dat het probleem klein was, al bekend, en ook op GPT 5.5 kon worden gereproduceerd zonder speciale omzeilmethoden.
Het resultaat is ongebruikelijk voor de AI‑markt.
Ontwikkelaars verloren de toegang tot het model dat de benchmarkranglijsten aanvoerde, terwijl GPT 5.5 de beste beschikbare optie werd omdat zijn dichtste rivaal werd verwijderd.
Dat onderscheid is vooral belangrijk voor code‑workflows. Een verschil van 22 punten op SWE‑Bench Pro betekent het verschil tussen een model dat ongeveer vier van de vijf echte codebase‑problemen kan oplossen en een model dat er eerder drie van de vijf aankan.
De korte levensduur van Fable 5 liet ook zien hoe snel de frontier kan verschuiven. GPT 5.5 werd eind april gelanceerd onder de interne codenaam “Spud”, maar de voorsprong duurde slechts tot Anthropic in juni publieke toegang opende tot een sterker systeem uit de Mythos‑klasse.
Lees hierna: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





