Claude Mythos AI overtreft rivalen bij code-audits, verliest door 5x hogere prijs

Claude Mythos AI overtreft rivalen bij code-audits, verliest door 5x hogere prijs

Anthropic's Mythos AI model loopt voor op concurrerende systemen bij het opsporen van softwarekwetsbaarheden, maar nieuwe, onafhankelijke benchmarks laten een zwakkere oordeelsvorming en hoge gebruikskosten zien.

Mythos Preview is top bij broncode-audits

Offensive-securitybedrijf XBOW bevestigde de opvallende claim. Het bedrijf stelde een team van tien experts samen om het model te evalueren op benchmarks, werkstromen en integraties.

XBOW stelde dat Mythos Preview „een aanzienlijke stap vooruit is ten opzichte van alle bestaande modellen, ongeacht de aanbieder”. Testers lieten het model draaien op bevroren open‑source‑applicaties met bekende kwetsbaarheden.

Mythos verlaagde het aantal false negatives met 42% ten opzichte van Opus 4.6, oplopend tot 55% zodra het model toegang kreeg tot de broncode, zo meldde The Decoder. Het model blonk uit in tests waarbij zowel live‑omgevingen als broncode werden gebruikt, maar presteerde minder betrouwbaar wanneer het alleen broncode kreeg.

Also Read: XRP ETFs Hit Record $1.39B But Token Loses 4th Spot To BNB

Kosten drukken het voordeel van Anthropic

Anthropic heeft aangegeven dat Mythos Preview ongeveer vijf keer zo duur zal zijn als een Opus‑model, dat nu al tot de duurste opties op de markt behoort. Die premie bracht XBOW ertoe te testen of een goedkopere rivaal Mythos zou kunnen evenaren met meer rekentijd.

Het antwoord was ja. Bij een vast tokenbudget voor het opsporen van webkwetsbaarheden versloeg Mythos Opus 4.6, maar verloor van OpenAI's GPT-5.5, dat volgens XBOW een gemist‑percentage van 10% haalde. XBOW merkte op dat het model „niet bijzonder inefficiënt” is als nauwkeurigheid het doel is, maar dat het niet langer de beste keuze is zodra met kosten wordt genormaliseerd.

Het bedrijf raadt nu aan om een mix van modellen te gebruiken in plaats van op één model te vertrouwen.

Mythos AI-prestaties in context

Mythos liet een gemengde oordeelsvorming zien: het wees false positives beter af dan voorgangers, maar verwierp soms ook echte kwetsbaarheden wanneer het bewijs niet aan de formele criteria voldeed. Reverse‑engineering en analyse van native code behoorden tot zijn sterkste vaardigheden, en het model kon bevindingen van concurrerende systemen prioriteren.

Anthropic presenteerde Mythos voor het eerst begin april, met toegang beperkt tot ongeveer 50 partners en met de release gepositioneerd als een sprong voorwaarts in AI‑cybercapaciteiten. Het Britse AI Security Institute verklaarde later dat zowel Mythos als GPT-5.5 zijn „versnelde prognose ruim hebben overtroffen”. Het agentschap schat nu dat cybercapaciteiten elke 4,7 maand verdubbelen, ten opzichte van de eerdere schatting van acht maanden uit november 2025.

Read Next: Hyperliquid Rejects Wall Street's Manipulation Claims As HYPE Drops 14%

Disclaimer en risicowaarschuwing: De informatie in dit artikel is uitsluitend voor educatieve en informatieve doeleinden en is gebaseerd op de mening van de auteur. Het vormt geen financieel, investerings-, juridisch of belastingadvies. Cryptocurrency-assets zijn zeer volatiel en onderhevig aan hoog risico, inclusief het risico om uw gehele of een substantieel deel van uw investering te verliezen. Het handelen in of aanhouden van crypto-assets is mogelijk niet geschikt voor alle beleggers. De meningen die in dit artikel worden geuit zijn uitsluitend die van de auteur(s) en vertegenwoordigen niet het officiële beleid of standpunt van Yellow, haar oprichters of haar leidinggevenden. Voer altijd uw eigen grondig onderzoek uit (D.Y.O.R.) en raadpleeg een gelicentieerde financiële professional voordat u een investeringsbeslissing neemt.
Claude Mythos AI overtreft rivalen bij code-audits, verliest door 5x hogere prijs | Yellow.com