Claude Opus 4.7 si avvicina al lancio ma l'IA più potente di Anthropic resta fuori portata

Claude Opus 4.7 si avvicina al lancio ma l'IA più potente di Anthropic resta fuori portata

Anthropic si sta preparando a lanciare Claude Opus 4.7 e uno strumento di progettazione basato su IA per creare siti web e presentazioni, una mossa che lunedì ha scosso le azioni di Adobe, Wix e Figma.

Dettagli sul lancio di Opus 4.7

The Information reported il 14 aprile che entrambi i prodotti potrebbero essere rilasciati già questa settimana, citando una persona a conoscenza dei piani. Lo strumento di progettazione accetta prompt in semplice inglese e si rivolge sia agli sviluppatori sia agli utenti non tecnici.

Questo puts Anthropic in concorrenza diretta con startup come Gamma e Stitch di Google.

Opus 4.7 non è nemmeno il modello più avanzato di Anthropic.

Questa distinzione spetta a Claude Mythos, un sistema incentrato sulla cybersicurezza che l'azienda distribuisce solo ad alcune società di sicurezza tramite Project Glasswing, tenendolo lontano dal grande pubblico.

Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked

Crisi dei benchmark di IA e Mythos

OpenAI ha recentemente dichiarato SWE-bench Verified, il principale benchmark di programmazione, «contaminato» dopo aver scoperto che i modelli di frontiera ne avevano memorizzato le soluzioni durante l’addestramento. Eppure i laboratori continuano a citare quegli stessi test nei confronti tra modelli.

Una valutazione separata, ARC-AGI-3, ha messo in evidenza il divario tra i sistemi di IA e il ragionamento umano. Gemini ha totalizzato lo 0,37% e GPT-5.4 lo 0,26%, mentre gli esseri umani hanno raggiunto il 100%. In assenza di una model card dettagliata da parte di Anthropic, le affermazioni sui miglioramenti di Opus 4.7 restano difficili da verificare in modo indipendente.

L’AI Security Institute del Regno Unito ha recentemente evaluated Mythos Preview e ha rilevato che può eseguire in modo autonomo sofisticati attacchi informatici a un livello che nessun altro modello ha eguagliato. È diventata la prima IA a completare «The Last Ones», una simulazione di attacco a una rete aziendale in 32 fasi che di solito richiede 20 ore ai red team umani.

Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers

Disclaimer e avvertenza sui rischi: Le informazioni fornite in questo articolo sono solo per scopi educativi e informativi e sono basate sull'opinione dell'autore. Non costituiscono consulenza finanziaria, di investimento, legale o fiscale. Gli asset di criptovaluta sono altamente volatili e soggetti ad alto rischio, incluso il rischio di perdere tutto o una parte sostanziale del tuo investimento. Il trading o il possesso di asset crypto potrebbe non essere adatto a tutti gli investitori. Le opinioni espresse in questo articolo sono esclusivamente quelle dell'autore/autori e non rappresentano la politica ufficiale o la posizione di Yellow, dei suoi fondatori o dei suoi dirigenti. Conduci sempre la tua ricerca approfondita (D.Y.O.R.) e consulta un professionista finanziario autorizzato prima di prendere qualsiasi decisione di investimento.