Anthropic si sta preparando a lanciare Claude Opus 4.7 e uno strumento di progettazione basato su AI per creare siti web e presentazioni, una mossa che ha scosso le azioni di Adobe, Wix e Figma lunedì.
Dettagli sul lancio di Opus 4.7
The Information reported il 14 aprile che entrambi i prodotti potrebbero essere rilasciati già questa settimana, citando una persona a conoscenza dei piani. Lo strumento di design accetta prompt in inglese semplice e si rivolge sia agli sviluppatori sia agli utenti non tecnici.
Questo puts Anthropic in concorrenza diretta con startup come Gamma e Stitch di Google.
Opus 4.7 non è nemmeno il modello più avanzato di Anthropic.
Questa distinzione spetta a Claude Mythos, un sistema incentrato sulla cybersecurity che l'azienda distribuisce solo a selezionate società di sicurezza tramite Project Glasswing, tenendolo lontano dal grande pubblico.
Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
Crisi dei benchmark AI e Mythos
OpenAI ha recentemente dichiarato SWE-bench Verified, il principale benchmark di coding, «contaminato» dopo aver scoperto che i modelli di frontiera ne avevano memorizzato le soluzioni durante l'addestramento. Eppure i laboratori continuano a citare quegli stessi test nei confronti tra modelli.
Una valutazione separata, ARC-AGI-3, ha messo in evidenza il divario tra i sistemi di AI e il ragionamento umano. Gemini ha ottenuto lo 0,37% e GPT-5.4 è arrivato allo 0,26%, mentre gli esseri umani hanno raggiunto il 100%. Senza una model card dettagliata da parte di Anthropic, le affermazioni sui miglioramenti di Opus 4.7 restano difficili da verificare in modo indipendente.
L'AI Security Institute del Regno Unito ha recentemente evaluated Mythos Preview e ha scoperto che può eseguire autonomamente sofisticati attacchi informatici a tassi che nessun altro modello ha eguagliato. È diventato la prima AI a completare «The Last Ones», una simulazione di attacco a una rete aziendale in 32 fasi che in genere richiede ai red team umani 20 ore.
Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers






