OpenAI의 최신 모델 GPT-5.5는 32단계 corporate network breach를 자율적으로 연쇄 수행하고, 12시간 분량의 리버스 엔지니어링 퍼즐을 약 10분 만에 풀어낼 수 있다.
AISI 사이버 평가 결과
영국 과학·혁신·기술부 산하 연구 기관인 U.K. AI Security Institute는 목요일 해당 평가 결과를 published했다.
연구진은 GPT-5.5가 SpecterOps와 함께 구축한 다단계 시뮬레이션인 "The Last Ones"를 완전히 해결한 두 번째 모델이라고 밝혔다. 이 모델은 10번의 시도 중 두 번에서 전체 공격 체인을 completed했다.
시험을 처음 통과한 모델은 Anthropic's Claude Mythos Preview로, 10번 중 세 번 성공했다. AISI는 인간 전문가가 네 개 서브넷과 약 20대의 호스트로 구성된 동일한 킬체인을 완료하려면 약 20시간이 필요할 것으로 추정한다.
전문가 수준 과제에서 GPT-5.5는 71.4%의 통과율을 scored했으며, Mythos Preview의 68.6%를 소폭 상회했고, GPT-5.4의 52.4%를 크게 앞질렀다.
또한 읽어보기: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
탈옥(jailbreak) 위험과 정책 대응
AISI는 모든 악의적 사이버 질의에서 모델의 안전장치를 우회하는 범용 탈옥 기법이 발견됐다고 경고했다. 이 익스플로잇을 개발하는 데에는 전문가 레드팀의 6시간이 소요됐고, 설정 문제로 인해 OpenAI 패치의 검증은 이뤄지지 못했다.
기관은 공격적 사이버 역량이 이제 더 폭넓은 추론 능력과 자율성 향상의 부산물로 나타나고 있다고 경고했다.
4월 AISI는 Mythos Preview marked the first time any frontier model finished the corporate attack 범위를 처음부터 끝까지 완료했다고 평가했으며, GPT-5.5는 단발성 도약이 아닌 추세의 연속임을 확인해 주는 사례로 제시됐다.
다음 글: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





