Claude Mythos resuelve hackeo AISI de 32 pasos en 6 de 10 intentos

Un nuevo punto de control del Claude Mythos Preview de Anthropic se ha convertido en el primer modelo de IA que resuelve ambos simulacros de ciberataque del gobierno del Reino Unido, planteando nuevas dudas sobre el hackeo autónomo.

AISI informa un avance con Mythos

El AI Security Institute del Reino Unido informó el miércoles que el nuevo punto de control de Mythos completó su rango de ataque a una red corporativa de 32 pasos, "The Last Ones", en 6 de 10 intentos. La versión anterior solo había logrado 3 de 10.

El modelo actualizado también superó "Cooling Tower", un rango de sistema de control industrial que ningún modelo previo había aprobado, en 3 de 10 intentos.

El rival GPT-5.5 de OpenAI fue probado en el mismo ejercicio. Resolvió "The Last Ones" en 3 de 10 intentos, pero no logró completar "Cooling Tower".

La AISI ejecutó los rangos con un presupuesto de cómputo de 100 millones de tokens por intento, y la agencia señaló que el rendimiento seguía aumentando en ese techo, lo que sugiere que presupuestos más altos impulsarían aún más las tasas de éxito.

También lee: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

El tiempo de duplicación sigue acortándose

La AISI rastrea el progreso en ciberseguridad mediante referencias de horizonte temporal, midiendo cuán larga puede ser una tarea autónoma que un modelo puede completar con un 80 % de fiabilidad. En noviembre de 2025, la agencia estimó un tiempo de duplicación de 8 meses. Para febrero de 2026, esa cifra se había comprimido a 4,7 meses, y tanto Mythos como GPT-5.5 han superado desde entonces la tendencia más rápida.

La agencia reconoció incertidumbre sobre si los resultados más recientes señalan una nueva aceleración o un salto puntual.

La organización de investigación sin fines de lucro METR, que evalúa la IA en tareas de software en lugar de rangos cibernéticos, ha producido una cifra similar de aproximadamente 4,2 meses. La AISI afirmó que esta convergencia refuerza la idea de que la tendencia refleja mejoras reales de capacidad y no una peculiaridad de un único conjunto de evaluación.

El instituto subrayó que sus rangos carecen de defensores activos, por lo que los resultados muestran lo que los modelos pueden hacer contra redes débilmente protegidas en lugar de sistemas empresariales reforzados.

Por qué importan los saltos de capacidad

El nuevo punto de control de Mythos no llegó con un lanzamiento de modelo completamente nuevo. La AISI utilizó la misma versión que Anthropic desplegó el mes pasado con Project Glasswing, su programa de asociación en seguridad, tras recibir una compilación actualizada del mismo modelo.

"Los saltos notables de capacidad no siempre requieren nuevos lanzamientos de modelos", escribió el instituto. Eso cuestiona la suposición de que los defensores pueden marcar el paso de acuerdo con los ciclos de lanzamiento.

Anthropic presentó Mythos Preview el 7 de abril, enmarcando el modelo como un punto de inflexión para la industria de la seguridad después de que identificó vulnerabilidades de día cero en los principales sistemas operativos y navegadores en pruebas internas. La compañía dijo que había retrasado un lanzamiento más amplio debido a esas capacidades, y la evaluación de la AISI de abril anterior señaló a Mythos como un claro avance frente a sistemas frontera previos.

Lee a continuación: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO