Fable 5 revient avec tous les pouvoirs sauf celui que les hackers voulaient le plus

Anthropic a rétabli Fable 5 dans le monde entier le 1er juillet avec ses capacités intactes, en ajoutant un filtre qui bloque une invite de piratage signalée dans plus de 99 % des tentatives.

Points clés :

Le département américain du Commerce a levé ses contrôles à l’exportation, et Fable 5 est revenu au niveau mondial dans les principaux produits d’Anthropic.

Le modèle conserve toutes ses capacités, mais un nouveau filtre redirige une invite de piratage signalée vers un modèle plus faible.

Les tests ont montré que des modèles moins chers pouvaient trouver les mêmes failles, ce qui a affaibli l’argument selon lequel Fable 5 était particulièrement dangereux.

Fable 5 revient au niveau mondial

Le département américain du Commerce a levé l’ordre d’exportation d’urgence le 30 juin, et le modèle a de nouveau atteint les utilisateurs le lendemain sur la Claude Platform, Claude.ai, Claude Code et Claude Cowork. L’accès via les principales plateformes cloud suivra.

Les abonnés payants peuvent l’utiliser dans la limite de leurs quotas hebdomadaires jusqu’au 7 juillet, après quoi l’accès continu basculera vers un système de crédits d’utilisation mesurés.

Le modèle avait été mis hors ligne le 12 juin. Les régulateurs avaient interdit à tout ressortissant étranger d’y accéder et n’avaient laissé à l’entreprise qu’environ 90 minutes pour se conformer, si bien qu’Anthropic a retiré le modèle pour tous les utilisateurs plutôt que de tenter de les filtrer un par un en temps réel.

La directive faisait suite à un rapport dans lequel des chercheurs d’Amazon ont découvert une invite qui amenait le modèle à signaler un ensemble de vulnérabilités logicielles sur des systèmes courants. Dans un cas, il est allé plus loin et a produit un code fonctionnel montrant comment une seule faille pouvait être exploitée. Cette démonstration unique, davantage que la liste de vulnérabilités, est ce qui a déclenché l’alerte.

Les tests ont blanchi Fable 5

L’examen interne d’Anthropic, mené avec le gouvernement et l’entreprise à l’origine du rapport, a confirmé que des modèles bien plus faibles pouvaient faire ressortir les mêmes failles, parmi lesquels Opus 4.8, GPT-5.5 et Kimi K2.7. Tous les autres modèles testés pouvaient encore reproduire l’unique démonstration d’exploitation, ce qui a miné l’idée que Fable 5 détenait à lui seul une arme cybernétique singulière. L’entreprise avait qualifié l’interdiction d’excès.

La correction a été ciblée. À son retour, le modèle embarque un classifieur qui intercepte l’invite signalée et la redirige vers le modèle plus faible Opus 4.8, laissant les capacités de Fable 5 intactes mais générant de fausses alertes sur du code ordinaire, et avertissant l’utilisateur à chaque intervention.

Mythos 5 reste limité

Mythos 5, le même modèle sous‑jacent avec moins de garde‑fous, reste réservé à environ 100 organisations américaines triées sur le volet dans le cadre d’un programme appelé Project Glasswing.

L’entreprise a aussi ouvert un canal public pour les signalements de jailbreak. Elle a également promis aux régulateurs un accès plus précoce pour tester les futurs modèles de pointe avant leur lancement.

Fable 5 a été lancé pour la première fois le 9 juin comme premier modèle de classe Mythos largement disponible chez Anthropic, salué sur un large éventail de benchmarks sectoriels avant de disparaître en quelques jours. La panne n’a duré qu’un peu moins de trois semaines. Son retour lui permet maintenant de reconquérir le terrain des benchmarks, qu’un laboratoire chinois en forte progression avait discrètement occupé pendant que le modèle restait inactif.