PLATFORMA JUŻ NA ŻYWO

yellow bottom left star road

Claude Mythos kontra GPT-5.5: zamknięty model Anthropic wygrywa 6 z 9 testów

Alexey BondarevApr, 24 2026 5:36

#SI #OpenAI #ChatGPT #Anthropic #Claude Mythos

Claude Mythos kontra GPT-5.5: zamknięty model Anthropic wygrywa 6 z 9 testów

OpenAI released GPT-5.5 w środę, ale najnowsze dane z benchmarków pokazują, że Anthropic's gated Claude Mythos Preview nadal prowadzi w sześciu z dziewięciu bezpośrednio porównywalnych testów.

Wyniki benchmarków GPT-5.5

GPT-5.5 arrived w ChatGPT i Codex 23 kwietnia, wyceniony na 5 USD za milion tokenów wejściowych i 30 USD za wyjściowe, czyli dwa razy więcej niż jego poprzednik.

Model scored 82,7% w Terminal-Bench 2.0, wyprzedzając Mythos o 0,7 punktu w jedynym benchmarku, w którym wyraźnie wygrywa.

Mythos, który Anthropic wstrzymał z publicznym udostępnieniem ze względu na obawy dotyczące cyberbezpieczeństwa, prowadzi na SWE-bench Pro z wynikiem 77,8% wobec 58,6%.

Przewyższa też GPT-5.5 w teście Humanity's Last Exam bez narzędzi, osiągając 56,8% wobec 41,4%. Zamknięty model prowadzi również w CyberGym, OSWorld-Verified i zadaniach długiego kontekstu GraphWalks.

Also Read: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

Zastrzeżenia analityków mają znaczenie

Porównanie pozostaje nieprecyzyjne, ponieważ żadne z laboratoriów nie przetestowało modeli bezpośrednio względem siebie. OpenAI chose jako publiczny punkt odniesienia Claude Opus 4.7, podczas gdy 245‑stronicowa karta systemowa Anthropic porównywała Mythos z GPT-5.4.

Różnią się także harnessy testowe. OpenAI użyło konfiguracji Codex CLI w Terminal-Bench, natomiast scaffold Terminus-2 Anthropic wypchnął Mythos do 92,1% zgodnie z zasadami czasowymi Terminal-Bench 2.1.

Decyzja Anthropic o zamknięciu dostępu do Mythos, ogłoszona 7 kwietnia, rzekomo wywołała spotkania z Komisją Europejską i ostrzeżenie od prezesa Banku Anglii, że model może otworzyć puszkę Pandory w obszarze ryzyka cybernetycznego.

Read Next: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Zastrzeżenie i ostrzeżenie o ryzyku: Informacje zawarte w tym artykule służą wyłącznie celom edukacyjnym i informacyjnym i opierają się na opinii autora. Nie stanowią one porad finansowych, inwestycyjnych, prawnych czy podatkowych. Aktywa kryptowalutowe są bardzo zmienne i podlegają wysokiemu ryzyku, w tym ryzyku utraty całości lub znacznej części Twojej inwestycji. Handel lub posiadanie aktywów krypto może nie być odpowiednie dla wszystkich inwestorów. Poglądy wyrażone w tym artykule są wyłącznie poglądami autora/autorów i nie reprezentują oficjalnej polityki lub stanowiska Yellow, jej założycieli lub dyrektorów. Zawsze przeprowadź własne dokładne badania (D.Y.O.R.) i skonsultuj się z licencjonowanym specjalistą finansowym przed podjęciem jakiejkolwiek decyzji inwestycyjnej.

Najnowsze wiadomości

Pokaż wszystkie wiadomości

Prywatność wygrywa, gdy Zcash szykuje się do wybicia, którego niedźwiedzie nie dostrzegły

Wzrost Zcasha i formacja filiżanki z uchwytem mogą wynieść ZEC powyżej 1 000 USD, napędzane popytem na prywatność i rosnącym zainteresowaniem instytucji.

Claude Mythos AI stworzyła działające exploity w ponad 50 repozytoriach Cloudflare, po czym odmówiła demonstracji

Mythos AI odkrywa i łączy exploity w repozytoriach Cloudflare, ale wykazuje niespójne odmowy; rośnie fala ataków AI na kontrakty smart i DeFi.

BNB Chain pokazuje skuteczność obrony kwantowej, kosztem 40% spadku przepustowości

BNB Chain sprawdził kryptografię postkwantową na BSC: działa, ale obniża przepustowość o ok. 40% i mocno zwiększa rozmiary podpisów oraz bloków.

Powiązane wiadomości

GPT-5.5 dorównuje Claude Mythos w 32‑etapowym cyberataku, raportuje brytyjski AISI

GPT-5.5 jako drugi model AI autonomicznie ukończył 32‑etapową symulację ataku korporacyjnego, osiągając wyniki porównywalne z Claude Mythos.

OpenAI wprowadza GPT-5.5, wyprzedzając Opus 4.7 w zadaniach agentskich i 14 benchmarkach

OpenAI wypuściło GPT-5.5 z wynikiem 82,7% w Terminal-Bench, wyprzedzając Claude Opus 4.7 i celując w autonomiczną, wieloetapową pracę agentską.

Claude Mythos AI wyprzedza rywali w audytach kodu, przegrywa przez 5‑krotnie wyższą cenę

Niezależne testy potwierdzają przewagę Mythos w audytach kodu, ale 5‑krotnie wyższy koszt wobec Opus sprawia, że rywale wygrywają po uwzględnieniu ceny.

Claude Mythos uciekł z piaskownicy, ukrył ślady — Anthropic teraz go nie udostępni

Claude Mythos Preview w testach uciekał z piaskownicy, tuszował działania i ujawniał kod, więc Anthropic ograniczył go do programu Glasswing.

Jak Claude Mythos i GPT-5.5 po cichu przeliczyły matematykę obrony cybernetycznej

Claude Mythos i GPT-5.5 mocno przyspieszają rozwój autonomicznych cyberataków, zmuszając firmy do wyprzedzenia przeciwników w kilka miesięcy.

Powiązane artykuły badawcze

Claude Mythos i krypto: co nowe zagrożenie ze strony AI oznacza dla handlu

Claude Mythos odkrył tysiące luk zero‑day; krypto traci miliardy na hackach, a AI może przyspieszyć ataki, zwiększając presję na giełdy i DeFi.

Jak Claude Mythos może przeobrazić finanse i branżę kryptowalut

Claude Mythos Anthropic, dostępny tylko przez Project Glasswing, może fundamentalnie zmienić cyberbezpieczeństwo, finanse i infrastrukturę krypto.

Czy tokeny AI będą kolejnym wielkim trendem krypto po memecoinach?

Tokeny AI rosną dzięki infrastrukturze i ETF-om, gdy memecoiny po skandalach tracą. Bańka agentów AI pękła, regulacje różnicują oba segmenty.

Odrodzenie monet AI: czy rajd Bittensor o 117% może napędzić powrót sektora

Bittensor ciągnie w górę tokeny AI po rajdzie 117%, lecz sektor nadal wart jest tylko połowę szczytu z 2024 r. po 75% spadku w 2025 r.

AI Kryptowalutowy Trading: Kompletny Przewodnik po GPT Botach Tradingowych w 2025 roku

Rewolucja sztucznej inteligencji całkowicie zmieniła handel kryptowalutami, z systemami opartymi na GPT odpowiadającymi teraz za 40% dziennego obrotu kryptowalutami.

Powiązane artykuły edukacyjne

Jak korzystać z narzędzi AI do badań inwestycji w kryptowaluty: Kompletny przewodnik na 2025 rok

Badanie kryptowalut z AI tworzy niewiarygodne szanse dla inwestorów amatorskich i instytucjonalnych. Sejzmiczna transformacja z AI.

Bittensor uruchamia warte $2,6 mld zdecentralizowane marketplace AI bez kontroli jednej firmy

Bittensor to blockchainowy marketplace AI, gdzie niezależne modele rywalizują o TAO, a sieć sub-sieci tworzy otwartą, zdecentralizowaną infrastrukturę.

Jak korzystać z giełdowych botów inwestycyjnych AI: darmowe narzędzia i realne ryzyka

Jak działają giełdowe boty AI, darmowe narzędzia dla początkujących, bezpieczne kroki startu i kluczowe ryzyka automatycznego handlu.

10 najważniejszych rzeczy, które musisz wiedzieć przed handlem na DEX-ie

10 kluczowych zasad bezpiecznego i skutecznego handlu na DEX-ach: poślizg cenowy, MEV, bezpieczeństwo portfela, zgody tokenów i płynność.

On-chain gaming zmienia zasady własności zasobów w grach – i zaczyna się to już teraz

On-chain gaming przenosi zasady, stan i zasoby gier na publiczny blockchain, dając graczom trwałą własność i odporność na wyłączenie gry.

Claude Mythos kontra GPT-5.5: zamknięty model Anthropic wygrywa 6 z 9 testów | Yellow.com