PLATFORM NU LIVE

yellow bottom left star road

Claude Mythos vs. GPT-5.5: Gated Anthropic-model wint 6 van de 9 tests

Alexey BondarevApr, 24 2026 5:36

#AI #OpenAI #ChatGPT #Anthropic #Claude Mythos

Claude Mythos vs. GPT-5.5: Gated Anthropic-model wint 6 van de 9 tests

OpenAI released GPT-5.5 op woensdag, maar nieuwe benchmarkgegevens tonen dat Anthropic's gated Claude Mythos Preview nog steeds leidt op zes van negen direct vergelijkbare tests.

GPT-5.5 Benchmark-scores

GPT-5.5 arrived in ChatGPT en Codex op 23 april, geprijsd op $5 per miljoen inputtokens en $30 voor output, het dubbele tarief van zijn voorganger.

Het model scored 82,7% op Terminal-Bench 2.0 en bleef Mythos met 0,7 punten voor op de enige benchmark waarop het duidelijk wint.

Mythos, which Anthropic withheld from public release over cybersecurity concerns, leidt op SWE-bench Pro met 77,8% tegenover 58,6%.

Het tops ook GPT-5.5 op Humanity's Last Exam zonder tools, met een score van 56,8% tegenover 41,4%. Het gated model ligt eveneens voor op CyberGym, OSWorld-Verified en long-context GraphWalks-taken.

Also Read: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

Kanttekeningen van analisten zijn belangrijk

De vergelijking blijft onnauwkeurig omdat geen van beide labs de modellen direct tegen elkaar heeft gebenchmarkt. OpenAI chose Claude Opus 4.7 als publieke vergelijkingsbasis, terwijl Anthropics systeemkaart van 245 pagina's Mythos testte tegenover GPT-5.4.

Testomgevingen verschillen ook. OpenAI gebruikte een Codex CLI-opzet op Terminal-Bench, terwijl Anthropics Terminus-2-construct Mythos opdreef tot 92,1% onder de timingregels van Terminal-Bench 2.1.

Anthropics beslissing om Mythos te "gaten", aangekondigd op 7 april, leidde naar verluidt tot vergaderingen met de Europese Commissie en een waarschuwing van de gouverneur van de Bank of England dat het model cyberrisico's zou kunnen openbreken.

Read Next: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Disclaimer en risicowaarschuwing: De informatie in dit artikel is uitsluitend voor educatieve en informatieve doeleinden en is gebaseerd op de mening van de auteur. Het vormt geen financieel, investerings-, juridisch of belastingadvies. Cryptocurrency-assets zijn zeer volatiel en onderhevig aan hoog risico, inclusief het risico om uw gehele of een substantieel deel van uw investering te verliezen. Het handelen in of aanhouden van crypto-assets is mogelijk niet geschikt voor alle beleggers. De meningen die in dit artikel worden geuit zijn uitsluitend die van de auteur(s) en vertegenwoordigen niet het officiële beleid of standpunt van Yellow, haar oprichters of haar leidinggevenden. Voer altijd uw eigen grondig onderzoek uit (D.Y.O.R.) en raadpleeg een gelicentieerde financiële professional voordat u een investeringsbeslissing neemt.

Laatste nieuws

Toon al het nieuws

Bitcoin zakt onder $62K, dit zou de bloedstroom kunnen stoppen

27 minuten geleden

Bitcoin daalde tot rond $61.255 door sterke verkoopdruk, met oplopende liquidaties en belangrijke steunniveaus die nu bedreigd worden.

MoneyGram gaf 60 miljoen mensen de stablecoin die crypto niet kon bieden

MoneyGram lanceert MGUSD als stabiel dollartegoed in zijn app, gericht op onderbedeelde consumenten en niet op cryptohandel, binnen eigen netwerk.

Strategy lijdt grootste verlies ooit boven $10 mrd, Saylor houdt vol dat Bitcoin in orde is

Grootste zakelijke Bitcoin-houder lijdt papieren verlies van meer dan $10 mrd; Saylor ziet kapitaalrotatie naar AI, geen structurele Bitcoin‑zwakte.

Gerelateerd nieuws

Claude Opus 4.8 overtreft Gemini en GPT op meerdere coderingstests

Anthropic lanceert Claude Opus 4.8, dat beter scoort dan GPT-5.5 en Gemini 3.1 Pro op diverse coderingsbenchmarks en verbeterde kostenbeheersing biedt.

Claude Mythos AI overtreft rivalen bij code-audits, verliest door 5x hogere prijs

Onafhankelijke tests tonen dat Mythos beter scoort op code-audits maar duur is, waardoor goedkopere modellen met extra rekentijd kunnen bijbenen.

OpenAI lanceert GPT-5.5, verslaat Opus 4.7 op agent-taken en 14 benchmarks

OpenAI lanceert GPT-5.5 met sterke agent-prestaties en hogere scores dan Claude Opus 4.7 op meerdere benchmarks, inclusief Terminal-Bench 2.0.

GPT-5.5 evenaart Claude Mythos bij 32-stappen-cyberaanval, meldt Britse AISI

GPT-5.5 voltooit als tweede AI-model autonoom een 32-stappen bedrijfshack-simulatie, met prestaties vergelijkbaar met Claude Mythos volgens AISI.

Claude Opus 4.7 nadert lancering, maar Anthropics sterkste AI blijft buiten bereik

Anthropic nadert de lancering van Claude Opus 4.7 en een AI-ontwerptool, maar houdt zijn krachtigste cybersecuritymodel Claude Mythos beperkt beschikbaar.

Gerelateerde onderzoeksartikelen

Hoe Claude Mythos De Financiële En Crypto-industrie Kan Hervormen

Analyse van Claude Mythos, een krachtig cyber-AI-model dat via Project Glasswing alleen grote banken en techbedrijven bedient en grote risico’s én kansen creëert.

Claude Mythos en crypto: wat de nieuwe AI‑dreiging betekent voor de handel

Anthropic's Claude Mythos ontdekt duizenden zero‑days en blijft gesloten, terwijl crypto met miljardenverliezen en AI‑gedreven, multi‑step aanvallen kampt.

Zijn AI-tokens de volgende grote cryptotrend na memecoins?

AI-tokens winnen terrein op memecoins, gesteund door infrastructuur en institutionele interesse, ondanks zware crashes en blijvende volatiliteit.

Crypto-exchanges als schaduwbanken: 10 structurele risico’s die het BIS‑rapport in 2026 blootlegt

Analyse van het BIS-rapport uit 2026 over crypto-exchanges als schaduwbanken en de belangrijkste structurele risico’s voor particuliere beleggers.

AI Cryptovaluta Handel: Complete Gids voor GPT Handels Bots in 2025

Uitgebreide gids voor AI-crypto handelsbots in 2025.

Gerelateerde leerartikelen

Kan gedecentraliseerde AI je prompts echt privé houden?

Uitleg hoe gedecentraliseerde privacy-AI-netwerken zoals Venice prompts en antwoorden afschermen, welke technieken ze gebruiken en de rol van tokens.

Waarom AI-agents niet kunnen opschalen zonder een eigen blockchainlaag

Uitleg waarom AI-agents niet met gewone wallets en gasmodellen overweg kunnen en hoe nieuwe infrastructuur op protocolniveau dit oplost.

Bittensor runt een AI-marktplaats van $2,6 miljard waar geen enkel bedrijf de controle over heeft

Bittensor is een gedecentraliseerde AI‑marktplaats waar modellen strijden om TAO‑beloningen, via subnets met miners, validators, staking en governance.

Hoe AI-aandelenhandelsbots te gebruiken: gratis tools en echte risico’s

Uitleg over no-code AI-handelsbots, wat ze wel en niet zijn, gratis tools voor beginners, risico’s, en hoe veilig te starten met klein kapitaal.

Hoe AI-tools te gebruiken voor crypto-investering Onderzoek: Complete gids voor 2025

Beheers AI-crypto-onderzoek en verhoog strategieën en risicobeheer in 2025. Leer geavanceerde technieken en casestudies.