Anthropic se prépare à lancer Claude Opus 4.7 ainsi qu’un outil de conception alimenté par l’IA pour créer des sites web et des présentations, une initiative qui a ébranlé lundi les actions d’Adobe, Wix et Figma.
Détails du lancement d’Opus 4.7
The Information reported le 14 avril que les deux produits pourraient être commercialisés dès cette semaine, citant une personne au fait des projets. L’outil de conception accepte des requêtes en anglais simple et vise aussi bien les développeurs que les utilisateurs non techniques.
That puts Anthropic en concurrence directe avec des startups comme Gamma et Stitch de Google.
Opus 4.7 n’est même pas le modèle le plus avancé d’Anthropic.
Cette distinction revient à Claude Mythos, a cybersecurity-focused system que l’entreprise ne distribue qu’à certaines sociétés de sécurité via Project Glasswing, tout en le gardant hors de portée du grand public.
Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
Crise des benchmarks d’IA et Mythos
OpenAI a récemment déclaré que SWE-bench Verified, le principal benchmark pour le code, était « contaminé » après avoir découvert que les modèles de pointe en avaient mémorisé les solutions pendant l’entraînement. Pourtant, les laboratoires continuent de citer ces mêmes tests dans leurs comparaisons de modèles.
Une autre évaluation, ARC-AGI-3, a mis en évidence l’écart entre les systèmes d’IA et le raisonnement humain. Gemini a obtenu un score de 0,37 % et GPT-5.4 a atteint 0,26 %, tandis que les humains atteignent 100 %. En l’absence d’une fiche de modèle détaillée fournie par Anthropic, les affirmations sur les améliorations d’Opus 4.7 restent difficiles à vérifier de manière indépendante.
L’AI Security Institute du Royaume-Uni a récemment evaluated Mythos Preview et constaté qu’il peut exécuter de manière autonome des cyberattaques sophistiquées à un niveau qu’aucun autre modèle n’a encore atteint. Il est devenu la première IA à terminer « The Last Ones », une simulation d’attaque sur un réseau d’entreprise en 32 étapes qui prend habituellement 20 heures aux équipes rouges humaines.
Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers






