Ethan Mollick ha dichiarato di aver testato una versione preliminare del modello più avanzato di Anthropic, Claude Fable e di averlo trovato allo stesso tempo straordinario e inquietante da usare.
Test di Claude Fable
Mollick, professore alla Wharton School dell’Università della Pennsylvania, ha scritto in un saggio pubblicato martedì di aver testato in anticipo Claude 5 Fable. Il sistema è il primo modello di classe Mythos che Anthropic abbia reso pubblico. Ha affermato che ha superato con ampio margine ogni modello pubblico che avesse provato.
A partire da un unico prompt e un solo feedback, il modello ha prodotto quello che Mollick ha definito il più sofisticato articolo accademico di scienze sociali che avesse visto generato da un’IA. Ha anche scritto una poesia in rima di 10 pagine su un taglio di capelli, con ogni parola che iniziava con la lettera s.
Per creare una mappa dei tempi di viaggio, il modello ha lanciato agenti Claude Sonnet più economici e raccolto dati su oltre 2.200 voli. Un’altra richiesta ha prodotto software di ricerca dopo nove ore e mezza. Non può generare immagini, quindi ha costruito ogni grafico e oggetto usando la matematica, mentre i suoi guardrail bloccano i compiti legati alla sicurezza.
Also Read: OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead
Mollick sul controllo
Mollick ha affermato che il lavoro è stato allo stesso tempo piacevole e inquietante, perché chiedeva qualcosa e semplicemente accadeva. Il modello ha seguito le sue istruzioni in modo accurato, ha scritto, ma ha rivelato poco riguardo alle centinaia di piccole scelte che prendeva.
Ha osservato che Fable costa circa il doppio del modello Opus di Anthropic. Ha aggiunto che i suoi guardrail ricorrono troppo spesso a un sistema più debole. Ha paragonato il proprio ruolo a quello di un cliente che approva il lavoro finito di uno studio.
Un anno fa, Mollick aveva paragonato l’uso di questi strumenti al lanciare un incantesimo come un mago. L’incantesimo è diventato talmente potente, ha scritto, che non si sente più come colui che lo lancia.
Read Next: Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC





