Claude Mythos와 GPT-5.5가 사이버 방어 수학을 조용히 다시 쓴 방식

Anthropic's Claude Mythos Preview와 OpenAI's GPT-5.5는 두 개의 최전선 AI 모델로, 자율 사이버 작업을 수행하는 속도가 기존 능력 예측을 크게 앞질렀다고 연구진이 수요일 밝혔다.

최전선 모델, 추세를 앞지르다

Claude Mythos Preview와 GPT-5.5는 영국 AI Security Institute가 2024년 말부터 추적해 온 두 배 성장 추세를 상회했다.

AISI는 올해 초, 80% 신뢰도에 도달하는 사이버 타임라인이 2025년 11월 당시 8개월에서 약 5개월마다 두 배로 줄어들고 있다고 추정했다. Mythos Preview의 최신 체크포인트는 32단계로 구성된 시뮬레이션 기업 네트워크 공격인 "The Last Ones"를 10번 시도 중 6번 해결했고, "Cooling Tower"는 10번 중 3번 완료했다는 결과를 냈다. GPT-5.5는 "The Last Ones"를 10번 시도 중 3번 돌파했다.

어떤 모델도 AISI가 설계한 두 범위를 모두 완료한 것은 이번이 처음이었다.

또 읽어보기: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided

팔로알토의 취약점 대폭발 경고

팔로알토 네트웍스는 자체 테스트를 통해 비슷한 결론을 내렸다.

이 회사는 지난 한 달 동안 130개가 넘는 제품을 스캔해 75개의 실제 취약점을 찾아냈는데, 이는 평소 월간 발견 건수의 7배가 넘는 수준이며 현재는 모두 패치된 상태다.

회사의 CTO인 **리 클라리치(Lee Klarich)**는 조직들이 적대 세력이 유사한 능력을 확보하기 전에 대응할 수 있는 시간 여유가 크지 않다고 말했다.

그는 조직들이 "적을 앞지를 수 있는 기간이 3~5개월로 매우 좁다"고 추정했다.

AISI는 여전히 표본 규모가 작고, 가장 어려운 과제들에 대해서는 인간 성능 비교 데이터가 제한적이라고 주의를 당부했다. 그럼에도 불구하고, 어떤 단일 모델을 분석에서 제외해도 두 배 추정치가 한 달 미만으로만 달라진다고 밝혔다. 소프트웨어 작업에서 AI를 추적하는 비영리 단체 METR 역시 약 4개월로 거의 동일한 수치를 제시했다.

능력 곡선이 더 가팔라지다

Anthropic은 지난달 Mythos의 초기 롤아웃을 팔로알토 네트웍스, CrowdStrike, Amazon, Apple, JPMorgan 등 소수의 그룹으로 제한했다.

OpenAI는 뒤이어 GPT-5.5-Cyber 모델과 Daybreak 사이버 이니셔티브를 내놓았다.

지난 18개월 동안 변화 속도는 급격히 가팔라졌다. AISI는 2026년 2월, 예상되는 두 배 기간을 8개월에서 4.7개월로 줄여 잡았고, 이번 최신 결과 이후 다시 한 번 압축했다. 재계산된 수치는 이제 약 4개월에 더 가까워졌으며, 이는 소프트웨어 엔지니어링 작업에서 METR가 관측한 수치와도 유사하다.

다음 읽기: Coinbase Opens $100K USDC Loans Against Solana Token Holdings