Anthropic a rétabli Fable 5 dans le monde entier le 1er juillet avec ses capacités intactes, en ajoutant un filtre qui bloque un prompt de hacking signalé dans plus de 99 % des tentatives.
Points clés :
- Le département du Commerce des États-Unis a levé ses contrôles à l’exportation, et Fable 5 est revenu au niveau mondial dans les principaux produits d’Anthropic.
- Le modèle conserve toutes ses capacités, bien qu’un nouveau filtre redirige un prompt de hacking signalé vers un modèle plus faible.
- Les tests ont montré que des modèles moins chers pouvaient trouver les mêmes failles, ce qui a affaibli l’argument consistant à traiter Fable 5 comme particulièrement dangereux.
Fable 5 revient au niveau mondial
Le département du Commerce des États-Unis a levé l’ordre d’exportation d’urgence le 30 juin, et le modèle a de nouveau atteint les utilisateurs le lendemain sur la Claude Platform, Claude.ai, Claude Code et Claude Cowork. L’accès via les grandes plateformes cloud suivra.
Les abonnés payants peuvent l’utiliser dans la limite de leurs quotas hebdomadaires jusqu’au 7 juillet, après quoi l’accès continu basculera vers un système de crédits d’utilisation mesurés.
Le modèle avait été éteint le 12 juin. Les régulateurs ont interdit à tout ressortissant étranger d’y accéder et n’ont accordé qu’environ 90 minutes à l’entreprise pour se conformer, de sorte qu’Anthropic a retiré le modèle pour tous les utilisateurs plutôt que d’essayer de les filtrer un par un en temps réel.
La directive faisait suite à un rapport dans lequel des chercheurs d’Amazon ont découvert un prompt qui orientait le modèle vers le signalement d’un ensemble de vulnérabilités logicielles touchant des systèmes courants. Dans un cas, il est allé plus loin et a produit un code fonctionnel montrant comment une seule faille pouvait être exploitée. C’est cette unique démonstration, plus encore que la liste de vulnérabilités, qui a déclenché l’alarme.
À lire aussi : CrowdStrike avertit que Claude Mythos pourrait accélérer les décisions sur les zero‑day
Les tests ont blanchi Fable 5
L’examen interne d’Anthropic, mené parallèlement au gouvernement et à l’entreprise qui avait déposé le rapport, a confirmé que des modèles bien plus faibles pouvaient faire remonter les mêmes failles, parmi lesquels Opus 4.8, GPT‑5.5 et Kimi K2.7. Tous les autres modèles testés par l’équipe pouvaient encore reproduire l’unique démonstration d’exploit, ce qui a vidé de sa substance l’idée que Fable 5 détenait à lui seul une arme cyber unique. L’entreprise avait qualifié l’interdiction d’excès.
La correction a été ciblée. À son retour, le modèle est accompagné d’un classifieur qui intercepte le prompt signalé et le redirige vers le modèle plus faible Opus 4.8, laissant intactes les capacités de Fable 5 mais générant des faux positifs sur du code ordinaire, et avertissant l’utilisateur à chaque intervention.
Mythos 5 reste limité
Mythos 5, le même modèle sous‑jacent avec moins de garde‑fous, reste réservé à environ 100 organisations américaines triées sur le volet dans le cadre d’un programme appelé Project Glasswing.
L’entreprise a également ouvert un canal public pour les signalements de jailbreak. Elle a aussi promis aux régulateurs un accès plus précoce pour tester les futurs modèles de pointe avant leur lancement.
Fable 5 a été lancé pour la première fois le 9 juin comme le premier modèle de classe Mythos largement disponible d’Anthropic, salué sur un large éventail de benchmarks industriels avant de disparaître quelques jours après sa sortie. La panne a duré à peine trois semaines. Son retour lui permet maintenant de reprendre le terrain des benchmarks qu’un laboratoire chinois en forte ascension avait discrètement conquis pendant que le modèle restait à l’arrêt.
À lire ensuite : XRP teste à nouveau 1,07 $ alors que les rejets de juin pèsent sur les haussiers





