Anthropic wypuścił Claude Sonnet 5, nowy model AI, który – jak twierdzi firma – zbliża systemy Sonnet do Claude Opus 4.8 w pracy agentskiej.
Kluczowe punkty:
- Anthropic twierdzi, że Claude Sonnet 5 poprawia wnioskowanie, użycie narzędzi, programowanie i pracę z wiedzą względem Sonnet 4.6.
- Model ma niższe oficjalne stawki niż Opus 4.8, ale zmiana tokenizera może zwiększyć liczbę tokenów.
- Wczesne testy pokazują silniejsze zachowanie agentskie, podczas gdy część deweloperów poddaje w wątpliwość realny koszt jego uruchamiania.
Claude Sonnet
Anthropic opisał Claude Sonnet 5 jako swój „najbardziej agentski model Sonnet do tej pory”, wskazując, że potrafi planować, używać przeglądarek i terminali oraz działać z większą autonomią niż wcześniejsze wydania Sonnet.
Firma podała, że model zmniejsza dystans do Claude Opus 4.8, zachowując niższą cenę katalogową. Sonnet 5 kosztuje 3 USD za milion tokenów wejściowych i 15 USD za milion tokenów wyjściowych, w porównaniu do 5 i 25 USD dla Opus 4.8.
Anthropic oferuje stawkę promocyjną do 31 sierpnia 2026 r.: 2 USD za milion tokenów wejściowych i 10 USD za milion tokenów wyjściowych. Po tej dacie wracają standardowe ceny.
Firma poinformowała też, że zwiększyła limity stawek dla Chat, Cowork, Claude Code i platformy Claude, ponieważ tryby o wyższym „poziomie wysiłku” mogą zużywać więcej tokenów.
Zobacz też: OpenAI naprawia Codex po tym, jak deweloperzy spalili tygodniowe limity w 2 dni
Koszty Anthropic
Historia z ceną nie jest prosta. Anthropic podał, że Sonnet 5 używa nowego tokenizera, podobnego do zmiany wprowadzonej w Claude Opus 4.7, a to samo wejście może przekładać się na około 1,0 do 1,35 raza więcej tokenów.
Ta zmiana pomaga wyjaśnić, dlaczego część deweloperów kwestionowała, czy Sonnet 5 jest w praktyce tańszy. Artificial Analysis oszacowało koszt operacyjny modelu na 2,29 USD za zadanie, czyli około dwukrotnie więcej niż Sonnet 4.6 i około 15% powyżej Opus 4.8.
Przegląd bezpieczeństwa Anthropic wykazał niższy poziom halucynacji i służalczych zachowań niż w Sonnet 4.6. Firma podała też, że Sonnet 5 skuteczniej odrzucał złośliwe żądania i lepiej opierał się atakom typu prompt injection w autonomicznych ustawieniach agentskich.
Model nadal wykazywał wyższy poziom nieodpowiednich zachowań niż Opus 4.8 oraz Claude Mythos Preview w zautomatyzowanym audycie zachowań Anthropic. Firma zaznaczyła, że nie trenowała Sonnet 5 specjalnie do pracy w cyberbezpieczeństwie i domyślnie włączyła zabezpieczenia sieciowe.
Modele Sonnet pomogły zdefiniować wczesny rynek agentów AI, zwłaszcza dzięki Claude Sonnet 3.5, 3.6 i 3.7. Nowsze postępy przesunęły się jednak w stronę systemów klasy Opus, co jasno określa główną rolę Sonnet 5: przywrócenie silniejszych zachowań agentskich do mniejszej klasy modelu.
Czytaj dalej: Bessy na rynku krypto kończą się, gdy zbiegnie się 5 sił, twierdzi Fidelity





