Claude Sonnet 5 rzuca wyzwanie Opus 4.8, ale koszty tokenów komplikują kalkulacje

Anthropic udostępnił Claude Sonnet 5, nowy model AI, który według firmy zbliża systemy z rodziny Sonnet do Claude Opus 4.8 w pracy agentowej.

Kluczowe punkty:

Anthropic twierdzi, że Claude Sonnet 5 poprawia wnioskowanie, korzystanie z narzędzi, programowanie i pracę z wiedzą względem Sonnet 4.6.

Model ma niższe oficjalne stawki niż Opus 4.8, ale zmiana tokenizerów może zwiększyć liczbę tokenów.

Wczesne testy pokazują silniejsze zachowanie agentowe, podczas gdy część deweloperów podważała realny koszt jego uruchamiania.

Claude Sonnet

Anthropic opisał Claude Sonnet 5 jako swój „najbardziej agentowy model Sonnet do tej pory”, podkreślając, że potrafi planować, korzystać z przeglądarek i terminali oraz działać z większą autonomią niż wcześniejsze wydania Sonnet.

Firma podała, że model zmniejsza dystans do Claude Opus 4.8, utrzymując niższą oficjalną cenę. Sonnet 5 kosztuje 3 USD za milion tokenów wejściowych i 15 USD za milion tokenów wyjściowych, w porównaniu z odpowiednio 5 i 25 USD dla Opus 4.8.

Anthropic oferuje stawkę promocyjną do 31 sierpnia 2026 r., z ceną 2 USD za milion tokenów wejściowych i 10 USD za milion tokenów wyjściowych. Po tym terminie wraca standardowy cennik.

Firma poinformowała również, że zwiększyła limity stawek dla Chat, Cowork, Claude Code i platformy Claude, ponieważ tryby o wyższym „poziomie wysiłku” mogą zużywać więcej tokenów.

Zobacz też: OpenAI naprawia Codex po tym, jak deweloperzy wyczerpali tygodniowe limity w 2 dni

Koszty Anthropic

Historia cen nie jest prosta. Anthropic podał, że Sonnet 5 korzysta z nowego tokenizera, podobnego do zmiany wprowadzonej w Claude Opus 4.7, i to samo wejście może odpowiadać ok. 1,0–1,35 raza większej liczbie tokenów.

Ta zmiana pomaga wyjaśnić, dlaczego część deweloperów kwestionowała, czy Sonnet 5 jest w praktyce tańszy. Artificial Analysis oszacował koszt operacyjny modelu na 2,29 USD za zadanie, czyli około dwa razy więcej niż Sonnet 4.6 i ok. 15% powyżej Opus 4.8.

Przegląd bezpieczeństwa Anthropic wykazał niższe wskaźniki halucynacji i służalczości niż w Sonnet 4.6. Firma podała też, że Sonnet 5 skuteczniej odrzucał złośliwe żądania i lepiej opierał się atakom typu prompt injection w ustawieniach autonomicznych agentów.

Model nadal wykazywał wyższy poziom nieodpowiednich zachowań niż Opus 4.8 i Claude Mythos Preview w zautomatyzowanym audycie zachowań Anthropic. Firma podkreśliła, że nie trenowała Sonnet 5 specjalnie pod kątem cyberbezpieczeństwa i domyślnie włączyła zabezpieczenia sieciowe.

Modele Sonnet pomogły zdefiniować wczesny rynek agentów AI, szczególnie dzięki Claude Sonnet 3.5, 3.6 i 3.7. Nowsze postępy przesunęły się w stronę systemów klasy Opus, co jasno określa główną rolę Sonnet 5: przywrócić silniejsze zachowanie agentowe do mniejszej klasy modeli.

Przeczytaj następnie: Bessy na rynku kryptowalut kończą się, gdy zbiega się 5 sił, twierdzi Fidelity