Claude Mythos, 32단계 AISI 해킹을 10번 중 6번 성공

Claude Mythos, 32단계 AISI 해킹을 10번 중 6번 성공

AnthropicClaude Mythos Preview의 새로운 체크포인트가 영국 정부의 사이버 공격 시뮬레이션 두 개를 모두 해결한 첫 AI 모델이 되면서, 자율 해킹에 대한 새로운 우려를 낳고 있다.

AISI, Mythos 성과 보고

영국 AI Security Institute는 수요일 보고에서, 최신 Mythos 체크포인트가 32단계 기업 네트워크 공격 레인지인 "The Last Ones"를 10회 시도 중 6회 완수했다고 밝혔다. 이전 버전은 10회 중 3회에 그쳤다.

업데이트된 모델은 또 다른 산업 제어 시스템 레인지인 "Cooling Tower"도 10회 중 3회 성공적으로 돌파했다. 이 레인지는 이전까지 어떤 모델도 통과하지 못했던 과제다.

경쟁사 OpenAI의 GPT-5.5도 같은 연습에 투입됐다. 이 모델은 "The Last Ones"를 10회 중 3회 해결했지만, "Cooling Tower"는 완수하지 못했다.

AISI는 시도당 1억 토큰의 연산 예산으로 레인지를 실행했으며, 그 상한선에서도 성능이 계속 상승했다고 지적했다. 이는 예산을 더 높이면 성공률이 더 올라갈 수 있음을 시사한다.

또 읽어보기: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

성능 두 배로 뛰는 시간은 계속 단축

AISI는 자율 과제를 80% 신뢰도 수준으로 완료하는 데 걸리는 시간을 기준으로, 이른바 시간 지평선 벤치마크를 통해 사이버 역량의 진전을 추적하고 있다. 2025년 11월, 기관은 두 배 성능에 도달하는 시간을 8개월로 추산했다. 2026년 2월에는 이 수치가 4.7개월로 압축됐고, 이후 Mythos와 GPT-5.5 모두 이보다 더 빠른 추세를 넘어섰다.

기관은 이번 최신 결과가 새로운 가속화를 의미하는지, 아니면 단발성 도약인지에 대해서는 불확실하다고 인정했다.

사이버 레인지 대신 소프트웨어 과제에서 AI를 추적하는 비영리 연구단체 METR도 비슷한 약 4.2개월이라는 수치를 내놓은 바 있다. AISI는 이러한 수렴이, 이번 추세가 특정 평가 도구의 특이점이 아니라 실제 역량 향상을 반영한다는 주장을 강화한다고 말했다.

연구소는 또한 자사의 레인지에는 능동적인 방어자가 없다는 점을 강조했다. 따라서 이번 결과는 강화된 엔터프라이즈 시스템이 아니라, 상대적으로 방어가 약한 네트워크를 상대로 모델이 무엇을 할 수 있는지를 보여준다고 설명했다.

왜 역량 도약이 중요한가

최신 Mythos 체크포인트는 새로운 모델 릴리스와 함께 등장한 것이 아니다. AISI는 Anthropic이 지난달 보안 파트너십 프로그램인 Project Glasswing에 배포한 것과 같은 버전을 사용했으며, 동일한 모델의 업데이트된 빌드를 받은 뒤 평가를 진행했다.

연구소는 보고서에서 "주목할 만한 역량 도약이 항상 새로운 모델 릴리스를 필요로 하는 것은 아니다"라고 적었다. 이는 수호자들이 모델 출시 주기에 맞춰 대비하면 된다는 기존 가정과 배치된다.

Anthropic은 4월 7일 Mythos Preview를 공개하며, 이 모델이 내부 테스트에서 주요 운영체제와 브라우저 전반에 걸친 제로데이 취약점을 찾아낸 뒤, 보안 업계의 전환점으로 포지셔닝했다. 회사는 이러한 역량 때문에 더 넓은 공개를 보류해왔다고 밝혔고, AISI의 4월 초기 평가 역시 Mythos를 이전 프런티어 시스템보다 한 단계 도약한 모델로 분류했다.

다음 읽기: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO

면책 조항 및 위험 경고: 이 기사에서 제공되는 정보는 교육 및 정보 제공 목적으로만 제공되며 저자의 의견을 바탕으로 합니다. 이는 재정, 투자, 법적 또는 세무 조언을 구성하지 않습니다. 암호화폐 자산은 매우 변동성이 크고 높은 위험에 노출되어 있으며, 여기에는 투자금 전부 또는 상당 부분을 잃을 위험이 포함됩니다. 암호화폐 자산의 거래나 보유는 모든 투자자에게 적합하지 않을 수 있습니다. 이 기사에 표현된 견해는 저자(들)의 견해일 뿐이며 Yellow, 창립자 또는 임원의 공식적인 정책이나 입장을 나타내지 않습니다. 투자 결정을 내리기 전에 항상 자신만의 철저한 조사(D.Y.O.R.)를 수행하고 면허를 가진 금융 전문가와 상담하십시오.
Claude Mythos, 32단계 AISI 해킹을 10번 중 6번 성공 | Yellow.com