Anthropic uruchomiło Claude Mythos 5 we wtorek, nazywając go najbardziej zaawansowanym na świecie modelem cyberbezpieczeństwa i ustalając cenę na 10 USD za milion tokenów wejściowych.
Kluczowe informacje:
- Claude Mythos 5 ulepsza ograniczony Mythos Preview i nadal jest dostępny wyłącznie dla partnerów Project Glasswing oraz amerykańskich obrońców cyberbezpieczeństwa z sektora rządowego.
- Anthropic wyceniło Mythos 5 oraz publiczny model Fable 5 na 10 USD za milion tokenów wejściowych, czyli mniej niż połowę kosztu Mythos Preview.
- Fable 5 przekierowuje zapytania z zakresu cyberbezpieczeństwa i biologii do Claude Opus 4.8, przy czym zabezpieczenia uruchamiają się w mniej niż 5% sesji.
Mythos 5 odblokowuje Glasswing
Anthropic zaprezentowało system razem z Claude Fable 5, ściśle strzeżoną wersją stworzoną do użytku publicznego, zarezerwowaną jednak w pełni odblokowaną wersję Mythos 5 dla zweryfikowanych partnerów. Model działa na tym samym silniku co Fable 5, ale usuwa zabezpieczenia ograniczające pracę nad cyberbezpieczeństwem i biologią.
Na razie Mythos 5 trafia wyłącznie do członków Project Glasswing oraz amerykańskich rządowych obrońców cyberprzestrzeni, czyli tej samej grupy, która testowała jego poprzednika. Firma po raz pierwszy zaprezentowała Mythos Preview w kwietniu, kiedy jego zdolność do wykrywania błędów w oprogramowaniu przyciągnęła uwagę Wall Street i władz federalnych. Anthropic zapowiedziało wtedy, że model nie trafi na otwarty rynek, powołując się na ryzyko nadużyć.
Zobacz także: OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead

Wyprzedzanie Opusa i rywali
Anthropic ocenia, że Mythos 5 jest najsilniejszym modelem na świecie w odkrywaniu i wykorzystywaniu luk w oprogramowaniu, wyprzedzając każdy konkurencyjny system, który testowano. Fable 5 z kolei kieruje wrażliwe zapytania z zakresu cyberbezpieczeństwa i biologii do starszego Claude Opus 4.8, który osiągnął mniej więcej połowę jego wyniku w zadaniach związanych z exploitami.
To mechaniczne przełączanie pojawia się w mniej niż 5% sesji, więc większość użytkowników nie zauważa różnicy między tymi dwoma modelami. W niektórych benchmarkach Fable 5 uzyskał wynik o ponad 10% wyższy niż Opus 4.8, jego publiczny model zapasowy. Jeden z wczesnych testerów zgłosił, że w 36 godzin osiągnął to, do czego OpenAI GPT-5.5 potrzebował czterech dni w badaniach z fizyki.
Ostrożność kształtowała cały proces wdrażania.
Anthropic przeprowadziło ponad 1000 godzin testów typu bug bounty i nie znalazło uniwersalnego jailbreaku omijającego nowe zabezpieczenia. Firma będzie także przechowywać dane klientów biznesowych przez 30 dni, aby badać nowe typy ataków, zaznaczając jednak, że zapisy nie posłużą do trenowania przyszłych modeli.
Mythos Preview pojawił się w kwietniu jako – według Anthropic – przełom w cyberbezpieczeństwie, z monitorowanym dostępem ograniczonym do kilkudziesięciu dostawców krytycznego oprogramowania. Od tego czasu firma rozszerzyła Glasswing do około 150 organizacji w ponad piętnastu krajach, które budują infrastrukturę krytyczną. Wtorkowa podwójna premiera przesuwa ten wysiłek w kierunku szerszego programu zaufanego dostępu dla firm zewnętrznych.
Przeczytaj następie: Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC





