GPT-5.5, 32단계 사이버 공격에서 Claude Mythos와 대등…영국 AISI 보고

GPT-5.5, 32단계 사이버 공격에서 Claude Mythos와 대등…영국 AISI 보고

OpenAI의 최신 모델 GPT-5.5는 32단계 corporate network breach를 자율적으로 연쇄 수행하고, 12시간 분량의 리버스 엔지니어링 퍼즐을 약 10분 만에 풀 수 있다.

AISI 사이버 평가 결과

영국 과학·혁신·기술부 산하 연구 기관인 영국 AI 보안 연구소(AI Security Institute, AISI)는 목요일에 해당 평가 결과를 published했다.

연구진은 GPT-5.5가 SpecterOps와 함께 구축한 다단계 시뮬레이션인 "The Last Ones"를 완전히 해결한 두 번째 모델이라고 밝혔다. 10번의 시도 중 2번에서 이 공격 체인을 completed했다.

이 테스트를 처음 통과한 모델은 Anthropic's Claude Mythos Preview로, 10번 중 3번을 성공했다. AISI는 인간 전문가가 네 개의 서브넷과 약 20대의 호스트에 걸친 동일한 킬체인을 완수하려면 약 20시간이 걸릴 것으로 추산한다.

전문가급(Expert-tier) 과제에서 GPT-5.5는 71.4%의 합격률을 scored했으며, Mythos Preview의 68.6%를 근소하게 앞섰고 GPT-5.4의 52.4%보다는 크게 상회했다.

또한 읽어보기: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning

탈옥(jailbreak) 위험과 정책 대응

AISI는 모든 악성 사이버 질의에서 모델의 안전 장치를 우회하는 보편적 탈옥 기법이 발견되었다고 경고했다. 이 익스플로잇은 전문가 레드팀이 6시간에 걸쳐 개발했으며, 설정 문제로 인해 OpenAI의 패치 검증은 이뤄지지 못했다.

AISI는 공격적 사이버 역량이 이제는 추론 및 자율성 전반의 향상에 따른 부산물로 나타나는 것으로 보인다고 경고했다.

4월, AISI가 Mythos Preview marked the first time any frontier model finished the corporate attack을 완료했다고 평가한 것은, 어떤 최첨단 모델도 처음으로 기업 공격 시나리오를 처음부터 끝까지 완주했다는 의미였다. 이번 GPT-5.5 결과는 단발성 도약이 아니라, 이러한 추세가 이어지고 있음을 확인해 주는 사례로 제시된다.

다음 읽기: Crypto VC Funding Crashes To $659M In April, A 2-Year Low

면책 조항 및 위험 경고: 이 기사에서 제공되는 정보는 교육 및 정보 제공 목적으로만 제공되며 저자의 의견을 바탕으로 합니다. 이는 재정, 투자, 법적 또는 세무 조언을 구성하지 않습니다. 암호화폐 자산은 매우 변동성이 크고 높은 위험에 노출되어 있으며, 여기에는 투자금 전부 또는 상당 부분을 잃을 위험이 포함됩니다. 암호화폐 자산의 거래나 보유는 모든 투자자에게 적합하지 않을 수 있습니다. 이 기사에 표현된 견해는 저자(들)의 견해일 뿐이며 Yellow, 창립자 또는 임원의 공식적인 정책이나 입장을 나타내지 않습니다. 투자 결정을 내리기 전에 항상 자신만의 철저한 조사(D.Y.O.R.)를 수행하고 면허를 가진 금융 전문가와 상담하십시오.
GPT-5.5, 32단계 사이버 공격에서 Claude Mythos와 대등…영국 AISI 보고 | Yellow.com