Anthropic, 새로운 Claude Opus 4.8로 자체 오류의 4배 더 많이 포착한다고 밝혀

Anthropic released Claude Opus 4.8 on Thursday, pitching the upgraded model as more honest and less prone to inventing facts than the version it replaces.

핵심 내용:

Anthropic은 목요일 Claude Opus 4.8을 출시하며, 정직성을 가장 큰 개선점으로 강조했다.

이 모델은 코드 결함을 눈치채지 못하고 넘길 가능성이 대략 4배 정도 더 낮아졌다고 회사는 밝혔다.

이제 빠른 모드는 이전보다 2.5배 빨리 동작하고, 비용은 3분의 1 수준으로 줄었다.

Anthropic, Opus 4.8의 ‘정직성’을 전면에 내세워

회사는 목요일 이 모델을 공개하며, 대대적인 재설계라기보다는 Opus 4.7의 안정적인 개선판으로 규정했다. 대부분의 벤치마크 점수는 소폭 상승하는 데 그쳤다. SWE-Bench Pro 코딩 테스트에서 Opus 4.8은 69.2%를 기록해, 이전 버전의 64.3%에서 올라갔고, 58.6%에 그친 OpenAI의 GPT-5.5를 앞질렀다.

‘정직성’이 특히 주목을 받았다. Anthropic은 AI 모델이 종종 근거가 빈약한데도 성과를 과장하거나, 성급하게 결론을 내리는 경향이 있다고 말한다. 초기 테스트 이용자들은 4.8이 긴 무인 작업 동안 의심이 들릴 때 더 빨리 인정한다고 보고했다. 내부 테스트에서는 이 모델이 4.7에 비해 코드 결함을 눈치채지 못하고 지나칠 확률이 약 4배 낮아진 것으로 나타났다고 밝혔다.

이번 업그레이드는 작업에 투입할 노력의 강도를 조정할 수 있는 설정 등 새 제어 기능도 함께 도입했다. 이 기능은 이제 모든 요금제에서 사용할 수 있다. 또한 Anthropic은 모델이 일반 속도의 2.5배로 동작하는 빠른 모드의 가격을 이전 모델의 3분의 1 수준으로 크게 낮췄다.

또 읽어보기: Kalshi Wins CFTC Approval For First U.S. Bitcoin Perpetual Futures

Pritchard, Opus 4.8의 판단력에 신뢰 표명

Shopify의 스태프 엔지니어인 Tom Pritchard는 코딩 특화 버전이 훨씬 더 뛰어난 판단력을 보여준다고 Anthropic에 전했다. 그는 이 모델이 “올바른 질문을 하고, 스스로의 실수를 찾아내며”, 계획이 빈약해 보일 때는 반박한다고 말했다. 실서비스 데이터베이스를 날려버리는 AI 에이전트로 곤혹을 치른 팀들에게는 이런 약속이 상당한 무게를 가질 수 있다.

하지만 모두가 이에 동의한 것은 아니다.

Reddit에서는 많은 이용자들이 벤치마크 차트에 회의적 태도를 보이며, “아무도 이를 신뢰하지 않는다”는 분위기를 요약하기도 했다. 또 다른 이들은, 여전히 일상 작업에 선호하는 이전 버전 Opus 4.6을 잃게 될까봐 걱정했다.

Opus 4.8, Anthropic의 질주를 마무리하는 정점

이번 런칭은 연구소에 매우 뜨거운 시기에 맞춰 이뤄졌다. Anthropic의 기업 가치는 최근 라운드를 통해, 기술 업계에서도 손꼽히는 규모의 투자를 유치하며 상승했고, 그 결과 OpenAI가 기록한 약 9,650억 달러 수준을 넘어섰다. 투자자들은 회사가 올해 말쯤 기업공개를 추진할 것으로 널리 예상하고 있다.

또한 이번 공개는 빠른 업그레이드 행진의 정점을 장식한 셈이다. Opus 4.7은 자체적인 벤치마크 논란 속에 출시된 지 한 달도 채 안 돼서 이미 이용자들에게 도달한 상태였다. Anthropic은 그 이후로 훨씬 더 강력한 모델인 Mythos를 예고했지만, 사이버보안 우려로 대중 공개를 미루고 있다.

다음 읽기: Dogecoin Reserves Edge Up To 28B As Whale Support Stays Weak