Anthropic випустила Claude Sonnet 5 — нову модель ШІ, яка, за словами компанії, наближає системи рівня Sonnet до Claude Opus 4.8 у роботі агентів.
Основні моменти:
- Anthropic стверджує, що Claude Sonnet 5 покращує міркування, роботу з інструментами, програмування та інтелектуальну працю порівняно з Sonnet 4.6.
- Модель має нижчі заявлені тарифи, ніж Opus 4.8, але зміна токенайзера може збільшити кількість токенів.
- Ранні тести показують сильнішу поведінку агента, водночас деякі розробники ставлять під сумнів реальну вартість її запуску.
Claude Sonnet
Anthropic описала Claude Sonnet 5 як «найбільш агентну модель Sonnet на сьогодні», заявивши, що вона може планувати, використовувати браузери й термінали та працювати з більшою автономією, ніж попередні версії Sonnet.
Компанія повідомила, що модель скорочує розрив із Claude Opus 4.8, зберігаючи нижчу заявлену ціну. Sonnet 5 оцінюється в $3 за мільйон вхідних токенів і $15 за мільйон вихідних токенів, порівняно з $5 і $25 для Opus 4.8.
Anthropic пропонує вступний тариф до 31 серпня 2026 року: $2 за мільйон вхідних токенів і $10 за мільйон вихідних. Після цієї дати відновлюється стандартне ціноутворення.
Компанія також повідомила, що підвищила ліміти запитів для Chat, Cowork, Claude Code та платформи Claude, оскільки режими з вищим рівнем «зусиль» можуть споживати більше токенів.
Також читайте: OpenAI виправляє Codex після того, як розробники вичерпали тижневі ліміти за 2 дні
Витрати Anthropic
Історія з ціною не така вже проста. Anthropic заявила, що Sonnet 5 використовує новий токенайзер, подібний до змін у Claude Opus 4.7, і той самий вхід може відповідати приблизно від 1,0 до 1,35 разу більшій кількості токенів.
Ця зміна частково пояснює, чому деякі розробники засумнівалися, чи справді Sonnet 5 дешевша на практиці. Artificial Analysis оцінила експлуатаційну вартість моделі в $2,29 за завдання — приблизно вдвічі більше, ніж у Sonnet 4.6, і приблизно на 15% вище, ніж у Opus 4.8.
Огляд безпеки Anthropic показав нижчі показники галюцинацій та улесливої поведінки, ніж у Sonnet 4.6. Компанія також заявила, що Sonnet 5 ефективніше відхиляла зловмисні запити й краще протистояла атакам із впровадженням підказок у автономних агентних сценаріях.
Модель усе ще демонструвала вищий рівень некоректної поведінки, ніж Opus 4.8 і Claude Mythos Preview в автоматизованому аудиторському тесті поведінки Anthropic. У компанії зазначили, що не тренували Sonnet 5 спеціально для кібербезпеки й за замовчуванням увімкнули мережеві засоби захисту.
Моделі Sonnet допомогли сформувати ранній ринок ШІ-агентів, особливо завдяки Claude Sonnet 3.5, 3.6 і 3.7. Останні досягнення більше зміщувалися в бік систем рівня Opus, що чітко окреслює головну роль Sonnet 5: повернути сильнішу агентну поведінку в клас менших моделей.
Читайте далі: Ведмежі ринки крипти закінчуються, коли збігаються 5 сил, стверджує Fidelity





