Fable 5 ha battuto GPT 5.5 prima che un ordine USA lo mettesse offline

Anthropic’s Fable 5 ha brevemente superato OpenAI’s GPT 5.5 nei principali benchmark di IA prima che una direttiva statunitense sul controllo delle esportazioni del 12 giugno lo mettesse offline.

Key Points:

Fable 5 ha superato GPT 5.5 su Arena, SWE-Bench Pro e nei principali test di programmazione.

Il modello è stato disponibile solo per tre giorni prima che il governo USA ordinasse ad Anthropic di disabilitarlo.

GPT 5.5 è ora il modello disponibile più potente per impostazione predefinita, non perché abbia superato Fable 5.

Chiusura di Fable 5

Fable 5 è diventato il modello di IA pubblico più capace dopo il lancio del 9 giugno, superando GPT 5.5 nei principali benchmark prima che il governo USA intervenisse tre giorni dopo.

Il modello si è classificato primo su Arena, mentre GPT 5.5 era quarto. Su SWE-Bench Pro, Fable 5 ha ottenuto l’80,3%, contro il 58,6% di GPT 5.5, un divario di quasi 22 punti in compiti reali di ingegneria del software.

Il vantaggio era evidente anche nei test di programmazione. Fable 5 ha segnato 1.665 su Code Arena, 98 punti Elo in più di GPT 5.5, e ha raggiunto il 29,3% su FrontierCode Diamond, dove GPT 5.5 si è fermato al 5,7%.

GPT 5.5 manteneva un vantaggio più ristretto sul piano pratico del posizionamento. Costa 5 dollari per milione di token in input e 30 dollari per milione di token in output, mentre Fable 5 costava 10 e 50 dollari, rendendo il modello di OpenAI più economico per gli utilizzi ad alto volume.

Fable 5 offriva anche una finestra di contesto da un milione di token e 128.000 token di output. Anthropic lo aveva reso disponibile agli abbonati Pro, Max, Team ed Enterprise senza costi aggiuntivi fino al 22 giugno, prima che l’ordine facesse terminare anticipatamente quel periodo.

Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 è il re

La chiusura è seguita a una direttiva di controllo delle esportazioni del 12 giugno che citava una vulnerabilità di jailbreak in Fable 5 e nell’intera famiglia di modelli Mythos 5. Anthropic ha contestato la conclusione, affermando che il problema era minore, già noto e ottenibile anche su GPT 5.5 senza metodi di aggiramento speciali.

Il risultato è insolito per il mercato dell’IA.

Gli sviluppatori hanno perso l’accesso al modello che guidava le classifiche dei benchmark, mentre GPT 5.5 è diventato la migliore opzione disponibile perché il suo rivale più vicino è stato rimosso.

Questa distinzione conta soprattutto per i flussi di lavoro di programmazione. Un divario di 22 punti su SWE-Bench Pro significa la differenza tra un modello che può risolvere circa quattro problemi di codebase reali su cinque e uno che ne gestisce più vicino a tre su cinque.

La breve corsa di Fable 5 ha anche mostrato quanto rapidamente possa muoversi il confine tecnologico. GPT 5.5 è stato lanciato a fine aprile con il nome in codice interno “Spud”, ma il suo vantaggio è durato solo fino a quando Anthropic non ha aperto l’accesso pubblico a un sistema più potente di classe Mythos a giugno.