Anthropic’s Fable 5 superó brevemente a OpenAI’s GPT 5.5 en los principales benchmarks de IA antes de que una directiva de control de exportaciones de EE. UU. del 12 de junio lo desconectara.
Puntos clave:
- Fable 5 superó a GPT 5.5 en Chatbot Arena, SWE-Bench Pro y en las principales pruebas de codificación.
- El modelo solo estuvo disponible durante tres días antes de que el gobierno de EE. UU. ordenara a Anthropic desactivarlo.
- GPT 5.5 es ahora el modelo disponible más potente por defecto, no porque haya superado a Fable 5.
Cierre de Fable 5
Fable 5 se convirtió en el modelo de IA público más capaz tras su lanzamiento el 9 de junio, superando a GPT 5.5 en los principales benchmarks antes de que el gobierno de EE. UU. interviniera tres días después.
El modelo ocupó el primer lugar en Chatbot Arena, mientras que GPT 5.5 quedó en cuarto puesto. En SWE-Bench Pro, Fable 5 obtuvo un 80,3%, frente al 58,6% de GPT 5.5, una diferencia de casi 22 puntos en tareas reales de ingeniería de software.
La ventaja también fue clara en las pruebas de codificación. Fable 5 obtuvo 1.665 puntos en Code Arena, 98 puntos Elo por encima de GPT 5.5, y alcanzó el 29,3% en FrontierCode Diamond, donde GPT 5.5 logró un 5,7%.
GPT 5.5 tenía una ventaja más limitada en términos prácticos de posicionamiento. Cuesta 5 dólares por millón de tokens de entrada y 30 dólares por millón de tokens de salida, mientras que Fable 5 costaba 10 y 50 dólares, lo que hacía que el modelo de OpenAI fuera más barato para usos de gran volumen.
Fable 5 también ofrecía una ventana de contexto de un millón de tokens y 128.000 tokens de salida. Anthropic lo había puesto a disposición de los suscriptores Pro, Max, Team y Enterprise sin costo adicional hasta el 22 de junio, antes de que la orden pusiera fin anticipado a ese período.
También lea: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 es el rey
El cierre siguió a una directiva de control de exportaciones del 12 de junio que citaba una vulnerabilidad de jailbreak en Fable 5 y en la familia de modelos Mythos 5 en general. Anthropic cuestionó esta conclusión, afirmando que el problema era menor, ya conocido y también posible en GPT 5.5 sin métodos especiales de evasión.
El resultado es inusual para el mercado de la IA.
Los desarrolladores perdieron acceso al modelo que lideraba las tablas de benchmarks, mientras que GPT 5.5 se convirtió en la mejor opción disponible porque se eliminó a su rival más cercano.
Esta diferencia importa sobre todo para los flujos de trabajo de codificación. Una brecha de 22 puntos en SWE-Bench Pro significa la diferencia entre un modelo que puede resolver alrededor de cuatro de cada cinco problemas reales de bases de código y otro que maneja más bien tres de cada cinco.
La breve etapa de Fable 5 también mostró la rapidez con la que puede avanzar la frontera. GPT 5.5 se lanzó a finales de abril bajo el nombre interno en clave “Spud”, pero su liderazgo solo duró hasta que Anthropic abrió el acceso público a un sistema más potente de la clase Mythos en junio.
Lea a continuación: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





