Ethan Mollick a déclaré avoir testé une version précoce du modèle d’IA le plus avancé de Anthropic, Claude Fable, et l’avoir trouvé à la fois remarquable et troublant à utiliser.
Claude Fable testé
Mollick, professeur à la Wharton School de l’Université de Pennsylvanie, a écrit dans un essai publié mardi qu’il avait testé Claude 5 Fable en avant‑première. Le système est le premier modèle de classe Mythos qu’Anthropic a rendu public. Il a indiqué qu’il surpassait de loin tous les modèles publics qu’il avait essayés.
À partir d’un seul prompt et d’un seul retour, il a produit ce que Mollick a qualifié de mémoire académique en sciences sociales le plus sophistiqué qu’il ait vu provenant d’une IA. Il a également écrit un poème rimé de 10 pages sur une coupe de cheveux, avec chaque mot commençant par la lettre s.
Pour construire une carte des temps de trajet, le modèle a lancé des agents Claude Sonnet moins coûteux et collecté des données sur plus de 2 200 vols. Une autre requête a produit un logiciel de recherche après neuf heures et demie. Il ne peut pas créer d’images, il a donc construit chaque graphique et chaque objet à l’aide de mathématiques, tandis que ses garde‑fous bloquent les tâches de sécurité.
À lire aussi : OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead
Mollick sur le contrôle
Mollick a déclaré que ce travail était à la fois réjouissant et inquiétant, parce qu’il demandait quelque chose et que cela se produisait. Le modèle suivait de près ses instructions, écrit‑il, mais révélait peu des centaines de petites décisions qu’il prenait.
Il a noté que Fable coûte environ deux fois plus cher que le modèle Opus d’Anthropic. Ses garde‑fous basculent également trop souvent vers un système plus faible, a‑t‑il écrit. Il a comparé son rôle à celui d’un client qui valide le travail terminé d’un studio.
Il y a un an, Mollick comparait l’utilisation de ces outils au fait de lancer un sort en tant que sorcier. Le sort est devenu suffisamment puissant, écrit‑il, pour qu’il n’ait plus l’impression d’être celui qui le lance.
À lire ensuite : Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC





