Fable 5 superó a GPT 5.5 antes de que una orden de EE. UU. lo desconectara

Anthropic’s Fable 5 superó brevemente a OpenAI’s GPT 5.5 en los principales benchmarks de IA antes de que una directiva de control de exportaciones de EE. UU. del 12 de junio lo desconectara.

Puntos clave:

Fable 5 superó a GPT 5.5 en Arena, SWE-Bench Pro y en las principales pruebas de programación.

El modelo estuvo disponible solo tres días antes de que el gobierno de EE. UU. ordenara a Anthropic deshabilitarlo.

GPT 5.5 es ahora el modelo disponible más potente por defecto, no porque haya superado a Fable 5.

Fable 5 se apaga

Fable 5 se convirtió en el modelo de IA público más capaz tras su lanzamiento el 9 de junio, superando a GPT 5.5 en los principales benchmarks antes de que el gobierno de EE. UU. interviniera tres días después.

El modelo ocupó el primer lugar en Arena, mientras que GPT 5.5 se situó en cuarto lugar. En SWE-Bench Pro, Fable 5 obtuvo un 80,3 %, frente al 58,6 % de GPT 5.5, una diferencia de casi 22 puntos en tareas reales de ingeniería de software.

La ventaja también era clara en las pruebas de código. Fable 5 logró 1.665 puntos en Code Arena, 98 puntos Elo por encima de GPT 5.5, y alcanzó un 29,3 % en FrontierCode Diamond, donde GPT 5.5 llegó al 5,7 %.

GPT 5.5 mantenía una ventaja más estrecha en posicionamiento práctico. Cuesta 5 dólares por millón de tokens de entrada y 30 dólares por millón de tokens de salida, mientras que Fable 5 costaba 10 y 50 dólares, lo que hacía que el modelo de OpenAI fuera más barato para usos de alto volumen.

Fable 5 también ofrecía una ventana de contexto de un millón de tokens y 128.000 tokens de salida. Anthropic lo había puesto a disposición de los suscriptores Pro, Max, Team y Enterprise sin coste adicional hasta el 22 de junio, antes de que la orden pusiera fin a ese periodo de forma anticipada.

También lea: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 es el rey

El cierre siguió a una directiva de control de exportaciones del 12 de junio que citaba una vulnerabilidad de jailbreak en Fable 5 y en toda la familia de modelos Mythos 5. Anthropic impugnó esta conclusión, afirmando que el problema era menor, ya conocido y también reproducible en GPT 5.5 sin métodos especiales de evasión.

El resultado es inusual para el mercado de la IA.

Los desarrolladores perdieron acceso al modelo que encabezaba las tablas de benchmarks, mientras que GPT 5.5 se convirtió en la mejor opción disponible porque se retiró a su rival más cercano.

Esta diferencia importa sobre todo para los flujos de trabajo de programación. Una brecha de 22 puntos en SWE-Bench Pro significa la diferencia entre un modelo que puede resolver alrededor de cuatro de cada cinco incidencias reales en bases de código y otro que se queda más cerca de tres de cada cinco.

La breve trayectoria de Fable 5 también mostró lo rápido que puede avanzar la frontera. GPT 5.5 se lanzó a finales de abril bajo el nombre interno en clave “Spud”, pero su liderazgo duró solo hasta que Anthropic abrió el acceso público a un sistema de clase Mythos más potente en junio.

Lea a continuación: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says