Anthropic’s Fable 5 ha brevemente superato OpenAI’s GPT 5.5 nei principali benchmark di AI prima che una direttiva USA sul controllo delle esportazioni del 12 giugno lo mettesse offline.
Key Points:
- Fable 5 ha superato GPT 5.5 su Chatbot Arena, SWE-Bench Pro e nei principali test di programmazione.
- Il modello è stato disponibile solo per tre giorni prima che il governo statunitense ordinasse ad Anthropic di disattivarlo.
- GPT 5.5 è ora il modello più forte disponibile per impostazione predefinita, non perché abbia superato Fable 5.
Chiusura di Fable 5
Fable 5 è diventato il modello di AI pubblico più capace dopo il lancio del 9 giugno, superando GPT 5.5 nei principali benchmark prima che il governo USA intervenisse tre giorni dopo.
Il modello si è classificato primo su Chatbot Arena, mentre GPT 5.5 era quarto. Su SWE-Bench Pro, Fable 5 ha ottenuto l’80,3%, rispetto al 58,6% di GPT 5.5, un divario di quasi 22 punti in compiti reali di ingegneria del software.
Il vantaggio era evidente anche nei test di programmazione. Fable 5 ha ottenuto 1.665 punti su Code Arena, 98 punti Elo in più rispetto a GPT 5.5, e ha raggiunto il 29,3% su FrontierCode Diamond, dove GPT 5.5 si è fermato al 5,7%.
GPT 5.5 manteneva un vantaggio più ridotto sul piano pratico del posizionamento. Costa 5 dollari per milione di token in input e 30 dollari per milione di token in output, mentre Fable 5 costava 10 e 50 dollari, rendendo il modello di OpenAI più economico per gli utilizzi ad alto volume.
Fable 5 offriva anche una finestra di contesto da un milione di token e 128.000 token in output. Anthropic lo aveva reso disponibile agli abbonati Pro, Max, Team ed Enterprise senza costi aggiuntivi fino al 22 giugno, prima che l’ordine ponesse fine anticipatamente a questo periodo.
Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 è il re
La chiusura è seguita a una direttiva di controllo delle esportazioni del 12 giugno che citava una vulnerabilità di jailbreak in Fable 5 e nell’intera famiglia di modelli Mythos 5. Anthropic ha contestato la valutazione, sostenendo che il problema fosse minore, già noto e ottenibile anche su GPT 5.5 senza metodi di aggiramento speciali.
Il risultato è insolito per il mercato dell’AI.
Gli sviluppatori hanno perso l’accesso al modello che guidava le classifiche dei benchmark, mentre GPT 5.5 è diventato la migliore opzione disponibile perché il suo rivale più vicino è stato rimosso.
Questa distinzione conta soprattutto per i flussi di lavoro di programmazione. Un divario di 22 punti su SWE-Bench Pro significa la differenza tra un modello che può risolvere circa quattro problemi di codebase reale su cinque e uno che ne gestisce più vicino a tre su cinque.
La breve corsa di Fable 5 ha anche mostrato quanto velocemente possa muoversi la frontiera. GPT 5.5 è stato lanciato a fine aprile con il nome in codice interno “Spud”, ma il suo vantaggio è durato solo fino a quando Anthropic non ha aperto l’accesso pubblico a un sistema Mythos di classe superiore a giugno.
Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





