앤트로픽, 새로운 클로드 오푸스 4.8이 자체 오류를 4배 더 잘 잡아낸다고 밝혀

앤트로픽, 새로운 클로드 오푸스 4.8이 자체 오류를 4배 더 잘 잡아낸다고 밝혀

Anthropic released Claude Opus 4.8 on Thursday, pitching the upgraded model as more honest and less prone to inventing facts than the version it replaces.

핵심 내용:

  • 앤트로픽은 목요일에 Claude Opus 4.8을 출시하며, ‘정직성’을 가장 큰 개선점으로 내세웠다.
  • 회사에 따르면 이 모델은 코드 결함을 눈치채지 못하고 넘길 가능성이 이전보다 대략 4배 낮다.
  • 빠른 모드는 이제 속도가 2.5배 빨라지고 비용은 이전의 3분의 1 수준으로 줄었다.

앤트로픽, 오푸스 4.8의 ‘정직성’을 강조

회사는 목요일에 이 모델을 unveiled 하며, 완전한 재발명이 아니라 Opus 4.7을 차근차근 개선한 버전이라고 설명했다. 대부분의 벤치마크 점수는 소폭 상승에 그쳤다. SWE-Bench Pro 코딩 테스트에서는 이전 버전의 64.3%에서 69.2%로 scored 를 기록하며, 58.6%에 그친 OpenAI의 GPT-5.5를 앞섰다.

특히 ‘정직성’이 주목을 받았다. 앤트로픽은 AI 모델이 종종 근거가 부족한 상태에서 성급히 결론을 내리고 진전을 주장한다고 지적하며, 초기 테스트에서 4.8은 길고 사람이 지켜보지 않는 작업에서 의심이 들릴 때 더 빨리 이를 인정하는 경향을 보였다고 밝혔다. 회사의 indicated 에 따르면, 이 모델은 코딩 결함을 눈치채지 못하고 지나칠 가능성이 4.7보다 약 4배 낮다.

이번 업그레이드는 사용자가 작업에 모델이 얼마나 강하게 매달릴지 조정할 수 있는 설정 등 새로운 제어 기능과 함께 shipped 되었으며, 이제 모든 요금제에서 이용 가능하다. 앤트로픽은 또한 모델이 일반 속도의 2.5배로 실행되는 빠른 모드의 가격을 이전 모델의 3분의 1 수준으로 인하했다.

Also Read: Kalshi Wins CFTC Approval For First U.S. Bitcoin Perpetual Futures

프리차드, 오푸스 4.8의 판단력에 힘 실어

Shopify의 스태프 엔지니어인 Tom Pritchard는 코딩 특화 버전이 훨씬 더 뛰어난 판단력을 보여준다고 Anthropic에 told 했다. 그는 이 모델이 “올바른 질문을 던지고, 스스로의 실수를 잡아내며”, 계획이 허술해 보일 때는 반박까지 한다고 말했다. 실시간 운영 데이터베이스를 통째로 날려버린 AI 에이전트 때문에 피해를 본 팀들에게는, 이런 약속이 상당한 의미를 가질 수 있다.

그러나 모두가 납득한 것은 아니다.

Reddit에서는 많은 사용자가 벤치마크 차트에 대해 doubted 를 표시하며 “아무도 믿지 않는다”는 분위기를 요약했고, 다른 이들은 여전히 일상 업무에 선호하는 기존 Opus 4.6이 사라질 것을 우려했다.

오푸스 4.8, 앤트로픽의 급성장을 마무리짓다

이번 출시는 연구소에 매우 뜨거운 시점에 이뤄졌다. 앤트로픽의 기업 가치는 최근 투자 라운드 이후 OpenAI의 약 9,650억 달러 수준을 넘어서는 수준으로 climbed 했으며, 이는 테크 업계 최대급 라운드 중 하나로 꼽힌다. 투자자들은 회사가 올해 말 기업공개(IPO)를 추진할 가능성이 크다고 보고 있다.

이 릴리스는 또한 빠른 업그레이드 행진의 정점을 장식했다. Opus 4.7은 불과 한 달 전, 자체적인 벤치마크 논란 속에서 사용자에게 reaching 된 상태였다. 앤트로픽은 이후 사이버 보안 우려로 일반 공개를 미루고 있는 훨씬 더 강력한 모델 Mythos를 예고했다.

Read Next: Dogecoin Reserves Edge Up To 28B As Whale Support Stays Weak

면책 조항 및 위험 경고: 이 기사에서 제공되는 정보는 교육 및 정보 제공 목적으로만 제공되며 저자의 의견을 바탕으로 합니다. 이는 재정, 투자, 법적 또는 세무 조언을 구성하지 않습니다. 암호화폐 자산은 매우 변동성이 크고 높은 위험에 노출되어 있으며, 여기에는 투자금 전부 또는 상당 부분을 잃을 위험이 포함됩니다. 암호화폐 자산의 거래나 보유는 모든 투자자에게 적합하지 않을 수 있습니다. 이 기사에 표현된 견해는 저자(들)의 견해일 뿐이며 Yellow, 창립자 또는 임원의 공식적인 정책이나 입장을 나타내지 않습니다. 투자 결정을 내리기 전에 항상 자신만의 철저한 조사(D.Y.O.R.)를 수행하고 면허를 가진 금융 전문가와 상담하십시오.
앤트로픽, 새로운 클로드 오푸스 4.8이 자체 오류를 4배 더 잘 잡아낸다고 밝혀 | Yellow.com