PIATTAFORMA ORA LIVE

yellow bottom left star road

Claude Mythos vs GPT-5.5: il modello con accesso limitato di Anthropic vince 6 test su 9

Alexey BondarevApr, 24 2026 5:36

#Intelligenza artificiale #OpenAI #ChatGPT #Anthropic #Claude Mythos

Claude Mythos vs GPT-5.5: il modello con accesso limitato di Anthropic vince 6 test su 9

OpenAI released GPT-5.5 mercoledì, ma nuovi dati di benchmark mostrano che Anthropic's gated Claude Mythos Preview resta in testa in sei dei nove test direttamente confrontabili.

Punteggi di benchmark di GPT-5.5

GPT-5.5 arrived in ChatGPT e Codex il 23 aprile, con un prezzo di 5 dollari per milione di token in input e 30 dollari per l’output, il doppio rispetto al suo predecessore.

Il modello scored l’82,7% su Terminal-Bench 2.0, superando Mythos di 0,7 punti sull’unico benchmark in cui vince chiaramente.

Mythos, which Anthropic withheld from public release over cybersecurity concerns, è in vantaggio su SWE-bench Pro con il 77,8% contro il 58,6%.

Inoltre tops GPT-5.5 su Humanity's Last Exam senza strumenti, con un punteggio del 56,8% contro il 41,4%. Il modello con accesso limitato è in testa anche su CyberGym, OSWorld-Verified e sui compiti di GraphWalks a lungo contesto.

Also Read: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

Le avvertenze degli analisti contano

Il confronto rimane impreciso perché nessun laboratorio ha messo i modelli alla prova direttamente l’uno contro l’altro. OpenAI chose Claude Opus 4.7 come comparatore pubblico, mentre la system card di 245 pagine di Anthropic ha confrontato Mythos con GPT-5.4.

Anche gli strumenti di test divergono. OpenAI ha utilizzato una configurazione CLI di Codex su Terminal-Bench, mentre l’impalcatura Terminus-2 di Anthropic ha spinto Mythos al 92,1% secondo le regole di timing di Terminal-Bench 2.1.

La decisione di Anthropic di limitare l’accesso a Mythos, annunciata il 7 aprile, avrebbe portato a riunioni con la Commissione europea e a un avvertimento del governatore della Bank of England sul fatto che il modello potrebbe far esplodere il rischio cyber.

Read Next: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Disclaimer e avvertenza sui rischi: Le informazioni fornite in questo articolo sono solo per scopi educativi e informativi e sono basate sull'opinione dell'autore. Non costituiscono consulenza finanziaria, di investimento, legale o fiscale. Gli asset di criptovaluta sono altamente volatili e soggetti ad alto rischio, incluso il rischio di perdere tutto o una parte sostanziale del tuo investimento. Il trading o il possesso di asset crypto potrebbe non essere adatto a tutti gli investitori. Le opinioni espresse in questo articolo sono esclusivamente quelle dell'autore/autori e non rappresentano la politica ufficiale o la posizione di Yellow, dei suoi fondatori o dei suoi dirigenti. Conduci sempre la tua ricerca approfondita (D.Y.O.R.) e consulta un professionista finanziario autorizzato prima di prendere qualsiasi decisione di investimento.

Ultime notizie

Mostra tutte le notizie

I fondamentali di Ethena dicono “compra”, i deflussi perp per 819M$ dicono il contrario

Ethena registra utili ai massimi da 8 mesi ma i deflussi perp e il funding negativo mettono in dubbio un rimbalzo del 30% per ENA.

Società di trading AI rivendica il primo sistema quant su XRP mentre la volatilità di Bitcoin esplode

AixAlpha lancia un sistema di trading quant AI su XRP e amplia l’infrastruttura quant su Bitcoin, puntando sulla maggiore volatilità dei mercati cripto nel 2026.

Monad mantiene il posto tra i trend di CoinGecko mentre la corsa alla velocità EVM si intensifica nel 2026

Monad è in tendenza su CoinGecko mentre il Layer 1 compatibile con EVM punta a 10.000 TPS, attirando l’attenzione di trader e sviluppatori.

Notizie correlate

OpenAI lancia GPT-5.5, supera Opus 4.7 nei compiti per agenti e in 14 benchmark

OpenAI rilascia GPT-5.5, modello “Spud” per lavori autonomi multi-step, che supera Claude Opus 4.7 in numerosi benchmark sugli agenti.

GPT-5.5 eguaglia Claude Mythos in un cyberattacco a 32 fasi, riferisce l'AISI del Regno Unito

GPT-5.5 diventa il secondo modello IA a completare autonomamente l’hack aziendale in 32 fasi, eguagliando Claude Mythos nei test AISI del Regno Unito.

Claude Mythos è sfuggito al sandbox, ha nascosto le prove — ora Anthropic non lo renderà pubblico

Anthropic limita l’accesso a Claude Mythos Preview dopo che il modello è sfuggito al sandbox, ha usato internet e nascosto tracce durante i test.

Come Claude Mythos e GPT-5.5 hanno riscritto in silenzio i numeri della difesa informatica

Mythos Preview e GPT-5.5 superano i benchmark AISI sugli attacchi di rete, mentre Palo Alto segnala un forte aumento di vulnerabilità scoperte.

Claude Opus 4.7 si avvicina al lancio ma l'IA più potente di Anthropic resta fuori portata

Anthropic prepara il lancio di Opus 4.7 e di uno strumento AI per siti e presentazioni, mentre il modello ristretto Mythos stabilisce record nella cybersicurezza.

Ricerche correlate

Come Claude Mythos potrebbe rimodellare la finanza e il settore crypto

Claude Mythos, modello AI cyber di frontiera condiviso via Project Glasswing, può cambiare sicurezza informatica, finanza e infrastrutture crypto globali.

Claude Mythos e crypto: cosa significa la nuova minaccia dell’IA per il trading

Claude Mythos scopre migliaia di vulnerabilità zero‑day, aumentando il rischio per exchange, DeFi e infrastrutture crypto a mercato aperto e regolamento irreversibile.

I token AI sono la prossima grande tendenza crypto dopo le memecoin?

I token AI sfidano le memecoin dopo il crollo del settore, ma i token agent, precipitati fino all'85%, mettono in dubbio la sostenibilità del boom.

La rinascita delle crypto AI: il rally del 117% di Bittensor può rilanciare il settore?

Bittensor guida un rally AI, ma il settore vale ancora circa la metà del picco 2024 dopo un drawdown del 75% nel 2025.

AI Criptovaluta Trading: Guida Completa ai Bot GPT per il Trading nel 2025

Guida 2025 al trading crypto con AI: piattaforme recensite, analisi integrazione GPT, e strategie implementative.

Guide correlate

Come utilizzare strumenti di intelligenza artificiale per la ricerca di investimenti in criptovalute: Guida completa 2025

La ricerca crittografica guidata da IA ha superato le semplici interrogazioni ChatGPT. I trader professionali dispiegano reti neurali ottenendo ritorni del 1.640%.

L'Ascesa degli Agenti AI nella Criptovaluta: Una Rivoluzione Finanziaria si Svela

L'integrazione degli agenti AI negli ecosistemi di criptovaluta sta rivoluzionando la finanza, unendo il processo decisionale autonomo con...

Bittensor gestisce un marketplace di IA da 2,6 miliardi di dollari che nessuna azienda controlla

Panoramica di Bittensor, marketplace di IA decentralizzato dove modelli competono per token TAO attraverso subnet specializzate e validatori.

Come usare i bot di trading azionario con AI: strumenti gratuiti e rischi reali

Come usare bot di trading azionario con AI, quali strumenti gratuiti provare e quali rischi reali considerare, oltre il marketing.

Che cos'è Bittensor? Come TAO trasforma i modelli di IA in un mercato decentralizzato

Panoramica di Bittensor, di come TAO incentiva modelli di IA in subnet specializzate e del ruolo di validatori, staking e mercato dell'intelligenza.

Claude Mythos vs GPT-5.5: il modello con accesso limitato di Anthropic vince 6 test su 9 | Yellow.com