Claude Opus 4.7 출시 임박, 그러나 Anthropic의 가장 강력한 AI는 여전히 비공개

Anthropic은(는) Claude Opus 4.7과 웹사이트 및 프레젠테이션을 제작할 수 있는 AI 기반 디자인 도구 출시를 준비하고 있으며, 이 소식은 월요일 Adobe, Wix, Figma의 주가를 흔들었다.

Opus 4.7 출시 세부 정보

The Information은(는) 4월 14일, 계획에 정통한 인사를 인용해 두 제품이 이르면 이번 주에 출시될 수 있다고 보도했다. 이 디자인 도구는 자연어 프롬프트를 입력받으며, 개발자와 비개발자 모두를 대상으로 한다.

이는 Anthropic을(를) Gamma 같은 스타트업과 Google의 Stitch 등과 직접 경쟁하는 위치에 놓는다.

Opus 4.7은 Anthropic의 가장 발전한 모델조차 아니다.

그 타이틀은 회사가 Project Glasswing을 통해 일부 보안 기업에만 배포하고 일반 대중에게서는 숨기고 있는, 사이버보안 특화 시스템 Claude Mythos에 돌아간다.

함께 읽기: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked

AI 벤치마크 위기와 Mythos

OpenAI는 최근 프런티어 모델들이 학습 과정에서 해답을 암기한 사실이 드러난 뒤, 대표적인 코딩 벤치마크인 SWE-bench Verified를 “오염되었다”고 선언했다. 그럼에도 연구소들은 여전히 모델 비교에 같은 테스트를 인용하고 있다.

별도의 ARC-AGI-3 평가에서는 AI 시스템과 인간 추론 사이의 격차가 드러났다. Gemini는 0.37%, GPT-5.4는 0.26%를 기록한 반면, 인간은 100%를 달성했다. Anthropic이 Opus 4.7에 대한 상세한 모델 카드를 공개하지 않는 이상, 성능 향상에 대한 주장을 독립적으로 검증하기는 어렵다.

영국 AI Security Institute는 최근 Mythos Preview를 평가한 결과, 어떤 다른 모델도 따라가지 못한 속도로 고도화된 사이버공격을 자율적으로 수행할 수 있다고 발표했다. 이 모델은 32단계로 구성된 기업 네트워크 공격 시뮬레이션 “The Last Ones”를 완료한 첫 번째 AI가 되었으며, 이는 일반적으로 인간 레드팀이 20시간에 걸쳐 수행하는 작업이다.

다음 읽기: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers