Claude Mythos se convierte en la primera IA en completar un ataque simulado a una red corporativa

Anthropic Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack, resolviendo el 73% de las tareas de ciberseguridad de nivel experto que ningún sistema de IA anterior había logrado resolver, según el UK AI Security Institute (AISI).

Evaluación cibernética de AISI

AISI, un organismo de investigación dentro del Departamento de Ciencia, Innovación y Tecnología del gobierno del Reino Unido, ran dos conjuntos de pruebas sobre el modelo después de que Anthropic lo anunciara el 7 de abril.

La empresa decidió no lanzar Claude Mythos de forma general, sino que granting acceso limitado a firmas de investigación en seguridad.

En evaluaciones de capture the flag, Claude Mythos alcanzó una tasa de éxito del 73% en tareas de nivel experto.

Ningún modelo había resuelto ninguna de estas antes de abril de 2025. AISI también construyó una simulación de ataque a red corporativa de 32 pasos llamada "The Last Ones", diseñada para tomar a profesionales humanos aproximadamente 20 horas. Claude Mythos completó la simulación completa en 3 de 10 intentos y promedió 22 de 32 pasos, en comparación con 16 de Claude Opus 4.6, el siguiente mejor modelo.

"El éxito de Mythos Preview en un cyber range indica que al menos es capaz de atacar de forma autónoma sistemas empresariales pequeños, débilmente defendidos y vulnerables donde ya se ha obtenido acceso a la red", dijo AISI.

También lee: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns

Exploits de día cero

El propio equipo red de Anthropic descubrió que Claude Mythos puede detectar y explotar vulnerabilidades de día cero en todos los principales sistemas operativos y navegadores web líderes cuando un usuario se lo indica explícitamente. La empresa afirmó que más del 99% de las vulnerabilidades que descubrió siguen sin parchearse.

"Tenemos un margen muy limitado sobre lo que podemos comunicar aquí. Sería irresponsable divulgar detalles sobre ellas", dijo Anthropic.

Las capacidades del modelo ya han reached los círculos de formulación de políticas.

Según Reuters, el Secretario del Tesoro de EE. UU. Scott Bessent y el presidente de la Reserva Federal, Jerome Powell, held una reunión urgente con los directores ejecutivos de los principales bancos para discutir los posibles riesgos cibernéticos asociados con el modelo.

Respuesta de seguridad de Anthropic

Anthropic lanzó Project Glasswing junto con el anuncio del modelo, describiéndolo como un esfuerzo para usar Claude Mythos para ayudar a asegurar software crítico. La empresa presentó la iniciativa como una preparación para una era en la que los equipos de seguridad deben adelantarse a atacantes potenciados por IA. AISI recomendó que las organizaciones prioricen medidas fundamentales de ciberseguridad, como el parcheo regular, controles de acceso estrictos, endurecimiento de configuraciones y registros exhaustivos.

El anuncio del 7 de abril siguió a meses de creciente preocupación sobre el papel de la IA en la ciberseguridad. Modelos frontera anteriores habían mostrado una capacidad ofensiva limitada, pero ninguno había superado benchmarks CTF de nivel experto ni completado simulaciones de ataques de múltiples pasos antes de Claude Mythos.

Lee a continuación: RaveDAO Just Exploded 1,194% In A Week — Here's The Real Story Behind The Crypto That Turns Raves Into Blockchain