뉴스 학습 리서치 순위 생태계

플랫폼 라이브

yellow bottom left star road

지금 시작하기

Claude Mythos vs. GPT-5.5: 제한된 접근 Anthropic 모델, 9개 테스트 중 6개 승리

Alexey BondarevApr, 24 2026 5:36

#인공지능 #OpenAI #챗GPT #앤트로픽 #클로드 미토스

Claude Mythos vs. GPT-5.5: 제한된 접근 Anthropic 모델, 9개 테스트 중 6개 승리

OpenAI released GPT-5.5 on Wednesday, but fresh benchmark data shows Anthropic's gated Claude Mythos Preview still leads on six of nine directly comparable tests.

GPT-5.5 벤치마크 점수

GPT-5.5 arrived in ChatGPT and Codex on Apr. 23, priced at $5 per million input tokens and $30 for output, double the rate of its predecessor.

이 모델은 scored Terminal-Bench 2.0에서 82.7%를 기록하며, 이 벤치마크에서 유일하게 분명한 우위를 보인 GPT-5.5가 Mythos를 0.7포인트 차이로 앞섰다.

Mythos, which Anthropic withheld from public release over cybersecurity concerns, leads on SWE-bench Pro at 77.8% versus 58.6%.

또한 이 모델은 Humanity's Last Exam 무도구 설정에서 56.8% 대 41.4%로 GPT-5.5를 tops했다. 제한된 접근 모델은 CyberGym, OSWorld-Verified, 장문 문맥 GraphWalks 과제에서도 앞선다.

Also Read: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

애널리스트들의 주의점도 중요하다

두 연구소 모두 모델을 서로 직접 맞대어 벤치마킹하지 않았기 때문에, 이번 비교는 여전히 정밀성이 떨어진다. OpenAI는 공개 비교 대상으로 Claude Opus 4.7을 chose했고, Anthropic의 245페이지짜리 시스템 카드는 Mythos를 GPT-5.4와 비교했다.

테스트 하니스도 다르다. OpenAI는 Terminal-Bench에서 Codex CLI 환경을 사용한 반면, Anthropic의 Terminus-2 스캐폴드는 Terminal-Bench 2.1 타이밍 규칙에서 Mythos를 92.1%까지 끌어올렸다.

Anthropic이 4월 7일 발표한 Mythos 제한 공개 결정은 유럽연합 집행위원회와의 회의를 촉발했고, 영란은행 총재는 이 모델이 사이버 리스크를 본격적으로 드러낼 수 있다는 경고를 내놓았다.

Read Next: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

면책 조항 및 위험 경고: 이 기사에서 제공되는 정보는 교육 및 정보 제공 목적으로만 제공되며 저자의 의견을 바탕으로 합니다. 이는 재정, 투자, 법적 또는 세무 조언을 구성하지 않습니다. 암호화폐 자산은 매우 변동성이 크고 높은 위험에 노출되어 있으며, 여기에는 투자금 전부 또는 상당 부분을 잃을 위험이 포함됩니다. 암호화폐 자산의 거래나 보유는 모든 투자자에게 적합하지 않을 수 있습니다. 이 기사에 표현된 견해는 저자(들)의 견해일 뿐이며 Yellow, 창립자 또는 임원의 공식적인 정책이나 입장을 나타내지 않습니다. 투자 결정을 내리기 전에 항상 자신만의 철저한 조사(D.Y.O.R.)를 수행하고 면허를 가진 금융 전문가와 상담하십시오.

관련 뉴스

OpenAI, GPT-5.5 출시…에이전트 작업과 14개 벤치마크에서 Opus 4.7 능가

OpenAI가 GPT-5.5를 출시해 에이전트 작업과 14개 벤치마크에서 Claude Opus 4.7을 앞섰으며, 자율 다단계 작업에 최적화된 모델로 내세웠다.

Claude Mythos AI, 코드 감사에서는 경쟁사 앞서지만 5배 가격으로 경쟁력 제한

XBOW 테스트에서 Mythos는 취약점 탐지력은 뛰어나지만 비용과 혼합 성능 면에서 한계가 드러나, 단일 모델 의존보다 모델 조합 활용이 권고된다.

Fable 5, 미국 명령으로 오프라인되기 전 GPT 5.5 능가

Fable 5는 벤치마크에서 GPT 5.5를 잠시 앞섰지만 미국 수출 통제로 중단됐고, 그 결과 GPT 5.5가 최고 사용 가능 모델이 됐습니다.

Claude Fable 5, Opus의 두 배 가격…6월 22일까지는 무료 유지

Claude Fable 5는 100만 토큰당 10달러로 Opus 4.8의 두 배 가격이며, 6월 22일까지 Pro·Max·Team 요금제에서 무료로 제공된 뒤 사용 크레딧이 필요하다.

GPT-5.5, 32단계 사이버 공격에서 Claude Mythos와 대등…영국 AISI 보고

GPT-5.5가 32단계 기업 해킹 시뮬레이션을 자율 수행한 두 번째 모델로, 영국 AISI는 이를 Claude Mythos와 동급 수준으로 평가했다.

관련 연구 기사

클로드 미토스와 크립토: 새로운 AI 위협이 트레이딩에 의미하는 것

클로드 미토스는 제로데이를 대량 발견하며 공개 불가 판정을 받았고, 크립토 업계의 24/7·되돌릴 수 없는 구조는 AI 공격에 특히 취약하다.

밈코인 이후, AI 토큰이 다음 대형 크립토 트렌드가 될까?

AI 토큰이 인프라 수요와 기관 자금 유입을 바탕으로 밈코인과 경쟁 구도로 부상했지만, 에이전트 토큰 붕괴로 투기 거품 논란도 커지고 있다.

Claude Mythos가 금융 및 크립토 산업을 어떻게 재편할 수 있는가

Anthropic의 고위험 사이버 AI Claude Mythos가 제한적 파트너십을 통해 은행·정부·크립토 인프라에 미칠 영향과 구조적 위험 재편 가능성을 다룬다.

42개 주가 이미 오픈AI를 조사하는 가운데 월가는 IPO를 주시한다

8,520억 달러 IPO 신청 직후 42개 주가 오픈AI에 AI 안전·데이터 기록을 요구하며 대규모 조사를 개시, 상장 일정과 가치에 불확실성 증대.

AI 코인 부활: 비텐서의 117% 랠리가 섹터 반등을 이끌 수 있을까

비텐서가 117% 급등하며 AI 코인 섹터를 다시 주목받게 했지만, 2025년 75% 폭락 여파와 경쟁·규제 리스크로 섹터 회복은 여전히 불확실하다.

관련 학습 기사

분산형 AI는 정말 프롬프트를 프라이버시로 지킬 수 있을까?

프라이버시 특화 분산형 AI 네트워크가 노드·암호 기술·온체인 결제를 활용해 프롬프트 노출 없이 추론을 제공하는 방식을 설명한다.

어떤 기업도 지배하지 않는 26억 달러 규모의 AI 마켓플레이스를 운영하는 Bittensor

Bittensor는 탈중앙화 AI 마켓으로, 모델이 생성한 가치에 따라 TAO 토큰을 분배합니다. 서브넷과 스테이킹 구조를 통해 개방형 AI 인프라를 지향합니다.

AI 에이전트가 자체 블록체인 레이어 없이 확장할 수 없는 이유

AI 에이전트는 사람용으로 설계된 기존 지갑·가스·서명 모델과 근본적으로 맞지 않는다. 전용 계정·가스 위임·인텐트 기반 라우팅 같은 인프라가 핵심이다.

AI 데이터 마켓플레이스가 본격 가동된다, 알아두어야 할 핵심 내용

탈중앙화 AI 데이터 마켓은 암호화폐, 검증, 프라이버시 기술, 토큰 이코노미를 통해 개인이 자신의 데이터를 직접 판매·수익화하게 하는 구조를 다룬다.

암호화폐에서 AI 에이전트의 부상: 금융 혁명이 펼쳐진다

AI 에이전트와 암호화폐의 융합이 금융을 혁신하고 있으며, 블록체인의 분산된 인프라와 함께 자율적인 의사결정을 병합하고 있습니다.

Claude Mythos vs. GPT-5.5: 제한된 접근 Anthropic 모델, 9개 테스트 중 6개 승리 | Yellow