Claude Opus 4.7 approche du lancement mais l’IA la plus puissante d’Anthropic reste hors de portée

Claude Opus 4.7 approche du lancement mais l’IA la plus puissante d’Anthropic reste hors de portée

Anthropic se prépare à lancer Claude Opus 4.7 ainsi qu’un outil de conception alimenté par l’IA pour créer des sites web et des présentations, une initiative qui a ébranlé lundi les actions d’Adobe, Wix et Figma.

Détails du lancement d’Opus 4.7

The Information reported le 14 avril que les deux produits pourraient être commercialisés dès cette semaine, citant une personne au fait des projets. L’outil de conception accepte des requêtes en anglais simple et vise aussi bien les développeurs que les utilisateurs non techniques.

That puts Anthropic en concurrence directe avec des startups comme Gamma et Stitch de Google.

Opus 4.7 n’est même pas le modèle le plus avancé d’Anthropic.

Cette distinction revient à Claude Mythos, a cybersecurity-focused system que l’entreprise ne distribue qu’à certaines sociétés de sécurité via Project Glasswing, tout en le gardant hors de portée du grand public.

Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked

Crise des benchmarks d’IA et Mythos

OpenAI a récemment déclaré que SWE-bench Verified, le principal benchmark pour le code, était « contaminé » après avoir découvert que les modèles de pointe en avaient mémorisé les solutions pendant l’entraînement. Pourtant, les laboratoires continuent de citer ces mêmes tests dans leurs comparaisons de modèles.

Une autre évaluation, ARC-AGI-3, a mis en évidence l’écart entre les systèmes d’IA et le raisonnement humain. Gemini a obtenu un score de 0,37 % et GPT-5.4 a atteint 0,26 %, tandis que les humains atteignent 100 %. En l’absence d’une fiche de modèle détaillée fournie par Anthropic, les affirmations sur les améliorations d’Opus 4.7 restent difficiles à vérifier de manière indépendante.

L’AI Security Institute du Royaume-Uni a récemment evaluated Mythos Preview et constaté qu’il peut exécuter de manière autonome des cyberattaques sophistiquées à un niveau qu’aucun autre modèle n’a encore atteint. Il est devenu la première IA à terminer « The Last Ones », une simulation d’attaque sur un réseau d’entreprise en 32 étapes qui prend habituellement 20 heures aux équipes rouges humaines.

Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers

Avertissement et avertissement sur les risques : Les informations fournies dans cet article sont à des fins éducatives et informatives uniquement et sont basées sur l'opinion de l'auteur. Elles ne constituent pas des conseils financiers, d'investissement, juridiques ou fiscaux. Les actifs de cryptomonnaie sont très volatils et sujets à des risques élevés, y compris le risque de perdre tout ou une partie substantielle de votre investissement. Le trading ou la détention d'actifs crypto peut ne pas convenir à tous les investisseurs. Les opinions exprimées dans cet article sont uniquement celles de l'auteur/des auteurs et ne représentent pas la politique officielle ou la position de Yellow, de ses fondateurs ou de ses dirigeants. Effectuez toujours vos propres recherches approfondies (D.Y.O.R.) et consultez un professionnel financier agréé avant de prendre toute décision d'investissement.