Un professeur de Wharton essaie Mythos AI d'Anthropic et y voit un vrai bond en avant

Un professeur de Wharton essaie Mythos AI d'Anthropic et y voit un vrai bond en avant

Ethan Mollick a indiqué avoir testé une version précoce du modèle d’IA le plus avancé d’Anthropic, Claude Fable, et l’avoir trouvé à la fois remarquable et déstabilisant à utiliser.

Claude Fable mis à l’épreuve

Mollick, professeur à la Wharton School de l’Université de Pennsylvanie, a écrit dans un article publié mardi qu’il avait testé Claude 5 Fable en avant-première. Le système est le premier modèle de classe Mythos qu’Anthropic a rendu public. Il affirme qu’il a surpassé de loin tous les modèles publics qu’il avait essayés.

À partir d’un seul prompt et d’un seul retour, le modèle a produit ce que Mollick a décrit comme l’article académique de sciences sociales le plus sophistiqué qu’il ait vu provenant d’une IA. Il a également rédigé un poème rimé de 10 pages sur une coupe de cheveux, avec chaque mot commençant par la lettre s.

Pour construire une carte des temps de trajet, le modèle a lancé des agents Claude Sonnet moins coûteux et recueilli des données sur plus de 2 200 vols. Une autre requête a produit un logiciel de recherche après neuf heures et demie. Il ne peut pas créer d’images, il a donc construit chaque graphique et chaque objet à l’aide de mathématiques, tandis que ses garde-fous bloquent les tâches de sécurité.

À lire aussi : OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead

Mollick sur la question du contrôle

Mollick a expliqué que ce travail lui paraissait à la fois réjouissant et inquiétant, parce qu’il demandait quelque chose et que cela se produisait. Le modèle suivait ses instructions de près, écrit-il, mais révélait peu des centaines de petits choix qu’il faisait.

Il a souligné que Fable coûte environ deux fois plus cher que le modèle Opus d’Anthropic. Ses garde-fous basculent également trop souvent vers un système plus faible, ajoute-t-il. Il a comparé son rôle à celui d’un client qui valide le travail fini d’un studio.

Il y a un an, Mollick comparait le travail avec ces outils au fait de lancer un sort en tant que sorcier. Le sort est devenu suffisamment puissant, écrit-il, pour qu’il n’ait plus vraiment l’impression d’être celui qui le lance.

À lire ensuite : Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC

Avertissement et avertissement sur les risques : Les informations fournies dans cet article sont à des fins éducatives et informatives uniquement et sont basées sur l'opinion de l'auteur. Elles ne constituent pas des conseils financiers, d'investissement, juridiques ou fiscaux. Les actifs de cryptomonnaie sont très volatils et sujets à des risques élevés, y compris le risque de perdre tout ou une partie substantielle de votre investissement. Le trading ou la détention d'actifs crypto peut ne pas convenir à tous les investisseurs. Les opinions exprimées dans cet article sont uniquement celles de l'auteur/des auteurs et ne représentent pas la politique officielle ou la position de Yellow, de ses fondateurs ou de ses dirigeants. Effectuez toujours vos propres recherches approfondies (D.Y.O.R.) et consultez un professionnel financier agréé avant de prendre toute décision d'investissement.