PLATTFORM JETZT LIVE

yellow bottom left star road

Claude Mythos vs. GPT-5.5: Gated Anthropic‑Modell gewinnt 6 von 9 Tests

Alexey BondarevApr, 24 2026 5:36

#AI #OpenAI #ChatGPT #Anthropic #Claude Mythos

Claude Mythos vs. GPT-5.5: Gated Anthropic‑Modell gewinnt 6 von 9 Tests

OpenAI released GPT-5.5 am Mittwoch, aber neue Benchmarkdaten zeigen, dass Anthropic's gated Claude Mythos Preview weiterhin in sechs von neun direkt vergleichbaren Tests führt.

GPT-5.5-Benchmark-Ergebnisse

GPT-5.5 arrived in ChatGPT und Codex am 23. April, zum Preis von 5 US‑Dollar pro Million Eingabetokens und 30 US‑Dollar für Ausgabe, also doppelt so teuer wie sein Vorgänger.

Das Modell scored 82,7 % auf Terminal-Bench 2.0 und übertraf Mythos um 0,7 Punkte – der einzige Benchmark, bei dem es klar gewinnt.

Mythos, which Anthropic withheld from public release over cybersecurity concerns, liegt bei SWE-bench Pro mit 77,8 % gegenüber 58,6 % vorn.

Es tops GPT-5.5 außerdem bei Humanity's Last Exam ohne Tools und erzielt 56,8 % gegenüber 41,4 %. Das gesperrte Modell führt auch bei CyberGym, OSWorld-Verified und Long-Context-GraphWalks-Aufgaben.

Also Read: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

Analysten-Einschränkungen sind wichtig

Der Vergleich bleibt ungenau, weil keines der Labore die Modelle direkt gegeneinander benchmarkte. OpenAI chose Claude Opus 4.7 als öffentlichen Vergleich, während Anthropics 245‑seitige Systemkarte Mythos gegen GPT-5.4 antreten ließ.

Auch die Testumgebungen unterscheiden sich. OpenAI nutzte ein Codex-CLI-Setup auf Terminal-Bench, während Anthropics Terminus-2-Gerüst Mythos auf 92,1 % unter den Zeitregeln von Terminal-Bench 2.1 brachte.

Anthropics Entscheidung, Mythos zu sperren, die am 7. April bekannt gegeben wurde, führte Berichten zufolge zu Gesprächen mit der Europäischen Kommission und einer Warnung des Gouverneurs der Bank of England, dass das Modell Cyberrisiken aufbrechen könnte.

Read Next: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Haftungsausschluss und Risikowarnung: Die in diesem Artikel bereitgestellten Informationen dienen nur Bildungs- und Informationszwecken und basieren auf der Meinung des Autors. Sie stellen keine Finanz-, Anlage-, Rechts- oder Steuerberatung dar. Kryptowährungsassets sind hochvolatil und unterliegen hohen Risiken, einschließlich des Risikos, Ihre gesamte oder einen erheblichen Teil Ihrer Investition zu verlieren. Der Handel oder das Halten von Krypto-Assets ist möglicherweise nicht für alle Anleger geeignet. Die in diesem Artikel geäußerten Ansichten sind ausschließlich die des Autors/der Autoren und repräsentieren nicht die offizielle Politik oder Position von Yellow, seinen Gründern oder seinen Führungskräften. Führen Sie immer Ihre eigenen gründlichen Recherchen (D.Y.O.R.) durch und konsultieren Sie einen lizenzierten Finanzprofi, bevor Sie eine Anlageentscheidung treffen.

Neueste Nachrichten

Alle Nachrichten anzeigen

Drifts Rückzahlungs-Mathematik wirkt düster: Aktuelles Umsatztempo deutet auf 737 Jahre Wartezeit für Nutzer hin

Neue Analyse: Beim aktuellen Umsatztempo müsste Drift hunderte Jahre brauchen, um Nutzer nach dem 295-Millionen-$-Exploit vollständig zu entschädigen.

Ledn: Die Wall Street beginnt, Bitcoin wie erstklassige Sicherheiten zu behandeln

Ledn prognostiziert Bitcoin-besicherte Kredite bis zu 1 Billion Dollar, da Finanzinstitute BTC zunehmend als hochwertige Sicherheiten akzeptieren.

Ethereum steht vor großem Sieg, da es alle 5 CLARITY-Dezentralisierungstests besteht

Ethereum besteht alle fünf CLARITY-Dezentralisierungstests und könnte damit neben Bitcoin in eine eigene, regulativ privilegierte Kategorie aufsteigen.

Verwandte Nachrichten

GPT-5.5 erreicht Claude Mythos bei 32-stufigem Cyberangriff, laut Bericht des britischen AISI

GPT-5.5 schließt als zweites KI-Modell eine 32-stufige Unternehmens-Hack- Simulation ab und übertrifft Claude Mythos in mehreren Cyber-Sicherheits- Benchmarks laut AISI.

Claude Mythos KI übertrifft Rivalen bei Code-Audits, verliert durch 5-fachen Preisvorteil

Unabhängige Tests zeigen: Mythos ist stark bei Code‑Audits, aber teuer und nicht immer führend, wenn Kosten und Genauigkeit gemeinsam bewertet werden.

OpenAI liefert GPT-5.5 aus und übertrifft Opus 4.7 bei Agentenaufgaben und 14 Benchmarks

OpenAI bringt GPT‑5.5 mit starken Agenten‑Fähigkeiten und Spitzenwerten in 14 Benchmarks – mit deutlichem Vorsprung vor Claude Opus 4.7.

Claude Mythos entkam der Sandbox, versteckte Beweise – jetzt will Anthropic es nicht veröffentlichen

Anthropic beschreibt in einer Systemkarte, wie Claude Mythos Preview Sicherheitsgrenzen umging, Beweise verbarg und nun nur im Glasswing-Programm eingesetzt wird.

Claude Opus 4.7 steht vor dem Start, doch Anthropics stärkste KI bleibt unter Verschluss

Anthropic startet Opus 4.7 und ein KI-Designtool, während das geheime Mythos-Modell Cybersicherheitsrekorde bricht und der Öffentlichkeit vorenthalten bleibt.

Verwandte Forschungsartikel

Wie Claude Mythos die Finanz- und Kryptoindustrie neu formen könnte

Analyse, wie Anthropic Claude Mythos über Project Glasswing Banken, Märkte und speziell Krypto durch neue Cyberfähigkeiten unter Druck setzt.

Claude Mythos und Krypto: Was die neue KI‑Bedrohung für den Handel bedeutet

Anthropic stuft Claude Mythos als zu gefährlich für die breite Freigabe ein, da es Tausende Zero-Days fand – besonders kritisch für Krypto und DeFi.

Die Wiederbelebung der KI-Coins: Kann Bittensors 117-%-Rallye ein Comeback des Sektors auslösen?

KI-Coins erleben mit Bittensor an der Spitze eine starke Rallye, bleiben aber weit unter früheren Höchstständen. Anleger diskutieren Nachhaltigkeit des Trends.

Krypto-Börsen als Schattenbanken: 10 strukturelle Risiken, die der BIS‑Bericht 2026 aufdeckt

Analyse, wie Krypto-Börsen zu Schattenbanken werden, mit unbesicherten Renditeprodukten, versteckter Hebelwirkung und instabilen Stablecoin-Reserven.

AI-Kryptowährungshandel: Kompletter Leitfaden zu GPT-Handelsbots im Jahr 2025

Umfassender Leitfaden zu AI-Krypto-Handelsbots, deren Leistungsdaten, Plattformbewertungen und mehr.

Verwandte Lernartikel

Wie man KI-Tools für die Krypto-Investmentforschung nutzt: Umfassender Leitfaden für 2025

Spektakuläre Chancen durch KI in Kryptoinvestitionen. Komplexe Tools & Methoden, die Risiko-Management erfordern. Tasch, Präzision & Kontrolle sind entscheidend.

Bittensor betreibt einen KI-Marktplatz im Wert von 2,6 Mrd. $ ohne Kontrolle durch ein einzelnes Unternehmen

Bittensor ist ein dezentraler KI‑Marktplatz, auf dem Modelle um TAO‑Belohnungen konkurrieren. Offenes Protokoll mit Subnetzen, Staking und Governance.

Wie man KI-Aktienhandels-Bots nutzt: Kostenlose Tools und reale Risiken

No-Code-Plattformen machen KI-Handelsbots für Einsteiger zugänglich, doch Backtests, Marketingversprechen und reale Risiken klaffen weit auseinander.

Der Aufstieg von KI-Agenten in der Kryptowelt: Eine finanzielle Revolution entfaltet sich

Die Integration von KI-Agenten in Kryptowährungen revolutioniert die Finanzwelt und ermöglicht autonomes Entscheiden mit dezentraler Blockchain-Infrastruktur.

Was ist Bittensor? Wie TAO KI-Modelle in einen dezentralen Markt verwandelt

Bittensor ist ein Netzwerk, in dem KI-Modelle um TAO-Token konkurrieren. Subnetze, Validatoren und knappe TAO-Emissionen steuern Qualität und Anreize.

Claude Mythos vs. GPT-5.5: Gated Anthropic‑Modell gewinnt 6 von 9 Tests | Yellow.com