OpenAI의 최신 모델 GPT-5.5는 32단계 corporate network breach를 자율적으로 연쇄 수행하고, 12시간 분량의 리버스 엔지니어링 퍼즐을 약 10분 만에 풀 수 있다.
AISI 사이버 평가 결과
영국 과학·혁신·기술부 산하 연구 기관인 영국 AI 보안 연구소(AI Security Institute, AISI)는 목요일에 해당 평가 결과를 published했다.
연구진은 GPT-5.5가 SpecterOps와 함께 구축한 다단계 시뮬레이션인 "The Last Ones"를 완전히 해결한 두 번째 모델이라고 밝혔다. 10번의 시도 중 2번에서 이 공격 체인을 completed했다.
이 테스트를 처음 통과한 모델은 Anthropic's Claude Mythos Preview로, 10번 중 3번을 성공했다. AISI는 인간 전문가가 네 개의 서브넷과 약 20대의 호스트에 걸친 동일한 킬체인을 완수하려면 약 20시간이 걸릴 것으로 추산한다.
전문가급(Expert-tier) 과제에서 GPT-5.5는 71.4%의 합격률을 scored했으며, Mythos Preview의 68.6%를 근소하게 앞섰고 GPT-5.4의 52.4%보다는 크게 상회했다.
또한 읽어보기: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
탈옥(jailbreak) 위험과 정책 대응
AISI는 모든 악성 사이버 질의에서 모델의 안전 장치를 우회하는 보편적 탈옥 기법이 발견되었다고 경고했다. 이 익스플로잇은 전문가 레드팀이 6시간에 걸쳐 개발했으며, 설정 문제로 인해 OpenAI의 패치 검증은 이뤄지지 못했다.
AISI는 공격적 사이버 역량이 이제는 추론 및 자율성 전반의 향상에 따른 부산물로 나타나는 것으로 보인다고 경고했다.
4월, AISI가 Mythos Preview marked the first time any frontier model finished the corporate attack을 완료했다고 평가한 것은, 어떤 최첨단 모델도 처음으로 기업 공격 시나리오를 처음부터 끝까지 완주했다는 의미였다. 이번 GPT-5.5 결과는 단발성 도약이 아니라, 이러한 추세가 이어지고 있음을 확인해 주는 사례로 제시된다.
다음 읽기: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





