Anthropic se prépare à lancer Claude Opus 4.7 ainsi qu’un outil de conception alimenté par l’IA pour créer des sites web et des présentations, une annonce qui a secoué les actions d’Adobe, Wix et Figma lundi.
Détails sur le lancement d’Opus 4.7
The Information reported le 14 avril que les deux produits pourraient être lancés dès cette semaine, citant une personne au fait des projets. L’outil de conception accepte des instructions en anglais simple et vise aussi bien les développeurs que les utilisateurs non techniques.
Cela puts Anthropic en concurrence directe avec des startups comme Gamma et Stitch de Google.
Opus 4.7 n’est même pas le modèle le plus avancé d’Anthropic.
Cette distinction revient à Claude Mythos, a cybersecurity-focused system que l’entreprise ne distribue qu’à certaines sociétés de sécurité via Project Glasswing, en le maintenant hors de portée du grand public.
Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
Crise des benchmarks d’IA et Mythos
OpenAI a récemment déclaré que SWE-bench Verified, le principal benchmark de codage, était « contaminé » après avoir découvert que des modèles de pointe avaient mémorisé ses solutions pendant l’entraînement. Pourtant, les laboratoires continuent de citer ces mêmes tests dans les comparaisons de modèles.
Une évaluation distincte, ARC-AGI-3, a mis en évidence l’écart entre les systèmes d’IA et le raisonnement humain. Gemini a obtenu un score de 0,37 % et GPT-5.4 0,26 %, tandis que les humains atteignent 100 %. Sans fiche de modèle détaillée de la part d’Anthropic, les affirmations concernant les améliorations d’Opus 4.7 restent difficiles à vérifier de manière indépendante.
L’AI Security Institute du Royaume-Uni a récemment evaluated Mythos Preview et constaté qu’il peut exécuter de manière autonome des cyberattaques sophistiquées à un niveau qu’aucun autre modèle n’a atteint. Il est devenu la première IA à réussir « The Last Ones », une simulation d’attaque de réseau d’entreprise en 32 étapes qui prend généralement 20 heures aux équipes rouges humaines.
Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers





