Anthropic은 Claude Opus 4.7 출시와 함께 웹사이트와 프레젠테이션을 제작하는 AI 기반 디자인 도구를 선보일 준비를 하고 있으며, 이 소식은 월요일 Adobe, Wix, Figma의 주가를 흔들었다.
Opus 4.7 출시 세부 사항
The Information은 4월 14일, 양 제품이 이르면 이번 주에 출시될 수 있다고 보도했으며, 계획에 정통한 한 인물을 인용했다. 이 디자인 도구는 일상적인 영어 프롬프트를 입력받아 개발자와 비전문가 모두를 대상으로 한다.
이는 Anthropic을 Gamma와 Google의 Stitch 같은 스타트업과 직접 경쟁하는 위치에 놓는다.
Opus 4.7은 Anthropic의 가장 앞선 모델조차 아니다.
그 타이틀은 회사를 통해 Project Glasswing 프로그램으로 소수의 보안 업체에만 배포되고 일반 대중에게는 공개되지 않고 있는 사이버 보안 특화 시스템 Claude Mythos에 돌아간다.
관련 기사: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
AI 벤치마크 논란과 Mythos
OpenAI는 최근 프런티어 모델들이 학습 과정에서 정답을 암기한 사실이 드러나자, 대표적인 코딩 벤치마크인 SWE-bench Verified가 “오염되었다”고 선언했다. 그럼에도 연구소들은 여전히 모델 비교에 같은 테스트를 인용하고 있다.
별도의 ARC-AGI-3 평가에서는 AI 시스템과 인간 추론 능력 사이의 격차가 강조되었다. Gemini는 0.37%, GPT-5.4는 0.26%를 기록한 반면, 인간은 100%를 달성했다. Anthropic이 상세한 모델 카드를 공개하지 않는 이상, Opus 4.7의 개선에 대한 주장을 독립적으로 검증하기는 어렵다.
영국의 AI Security Institute는 최근 Mythos Preview를 평가한 결과, 이 모델이 어떤 다른 모델도 따라오지 못한 수준으로 고도화된 사이버 공격을 자율적으로 수행할 수 있다고 밝혔다. Mythos는 32단계로 이루어진 기업 네트워크 공격 시뮬레이션 “The Last Ones”를 완수한 최초의 AI가 되었으며, 이 과제는 일반적으로 인간 레드팀에게 20시간이 걸린다.
다음 읽기: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers






