Anthropic kippt Claude-Fable-5-Regel, die Ergebnisse für konkurrierende KI‑Forschende abschwächte

Anthropic kippt Claude-Fable-5-Regel, die Ergebnisse für konkurrierende KI‑Forschende abschwächte

Anthropic macht eine Claude Fable 5‑Richtlinie rückgängig, die Ergebnisse für Forschende, die konkurrierende KI‑Systeme aufbauen, heimlich verschlechterte – eine Einschränkung, von der das Unternehmen sagte, sie habe 0,03 % des Traffics betroffen.

Zentrale Punkte:

  • Anthropic hat eine Fable‑5‑Richtlinie zurückgenommen, die Antworten für Forschung an Front‑AI heimlich abgeschwächt hatte.
  • Die nicht offengelegte Begrenzung versteckte sich in einer 319‑seitigen Systemkarte und umging jede Benachrichtigung der Nutzenden.
  • Gekennzeichnete Anfragen werden nun offen auf Claude Opus 4.8 zurückgestuft, wobei der Grund jedes Mal angezeigt wird.

Begrenzungen von Claude Fable 5 aufgehoben

Das Unternehmen hat die Änderung diese Woche gegenüber Wired bestätigt, das den Rückzieher zuerst nach Tagen wachsender Verärgerung unter Forschenden, Entwicklern und Politik‑Analysten online gemeldet hatte. Der Schritt folgt auf den Start von Fable 5 am Dienstag, Anthropic erstes öffentlich verfügbares Mythos‑Klassenmodell – ein System, das das Labor lange zurückgehalten hatte, weil es besonders gut Software‑Schwachstellen findet. Stunden nach der Veröffentlichung bemerkten Nutzende, dass das Modell seine Antworten für ein schmales Spektrum fortgeschrittener KI‑Arbeit leise umleitete oder abschwächte.

Diese Aufgaben umfassten das Trainieren konkurrierender Modelle, das Debuggen von KI‑Code und das Tuning neuronaler Netze – alles markiert durch einen Absatz, der in einer 319‑seitigen Systemkarte vergraben war. Anstatt sie vollständig zu blockieren, stützte sich Fable 5 auf versteckte Prompt‑Anpassungen und Steuerungsvektoren, um seine Antworten leise zu entschärfen – eine Begrenzung, die Anthropic auf lediglich 0,03 % des Traffics bezifferte.

Die Korrektur behält die Schutzmaßnahme bei, streicht aber die Geheimhaltung, die den größten Ärger ausgelöst hatte. Anthropic hatte die verdeckte Version damit verteidigt, dass sichtbare Regeln leichter zu untersuchen und zu umgehen seien. Nun werden markierte Prompts offen auf Claude Opus 4.8 zurückgestuft, denselben Pfad wie bei Cyber‑ und Biologie‑Anfragen, und die API wird demnächst einen klaren Grund für jede Ablehnung zurückgeben.

Also Read: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows

Forschende weisen geheime Sabotage zurück

Die Kritik richtete sich auf die Geheimhaltung selbst, nicht auf die dahinterstehenden Grenzen. Anthropic hatte die Begrenzung als Erweiterung von Nutzungsbedingungen dargestellt, die verbieten, Claude zum Bau konkurrierender Systeme zu verwenden, und erklärt, eine stille Durchsetzung hindere die schlimmsten Verstöße daran, Boden gutzumachen. Dean Ball, Senior Fellow bei der Foundation for American Innovation, bezeichnete die Taktik als „geheime Sabotage“ und sagte, sie stärke die Sichtweise, dass Teile der Sicherheits‑Agenda in Wirklichkeit Geschäftsinteressen abschirmen.

Der Ausdruck verbreitete sich rasch.

Andere konzentrierten sich auf die Asymmetrie, die in die Regel eingebaut war. Anthropic ließ Fable 5 für das eigene Personal mit voller Stärke laufen, während externe Teams gedrosselt wurden – eine Spaltung, die Open‑Source‑Verfechter und langjährige Sicherheits‑Verbündete gleichermaßen verärgerte. Fast AIs Jeremy Howard sagte, das Labor habe sich vorgenommen, Rivalen, die es versuchten, auszustechen, während Nathan Lambert vom AI2 die verdeckte Herabstufung als erschütternd und wissenschaftsfeindlich bezeichnete.

Der Streit krönte eine strapaziöse erste Woche für Fable 5, ein Modell, das Anthropic einst als zu riskant eingestuft hatte, um es überhaupt zu veröffentlichen. Das Unternehmen gab das System in dieser Woche für die öffentliche Nutzung frei, etwa eine Woche nachdem es vertrauliche IPO‑Unterlagen eingereicht hatte, in der Wette, dass striktere und besser offengelegte Leitplanken die Fähigkeiten des Modells zur Aufdeckung von Schwachstellen in sicheren Bahnen halten könnten.

Read Next: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO

Haftungsausschluss und Risikowarnung: Die in diesem Artikel bereitgestellten Informationen dienen nur Bildungs- und Informationszwecken und basieren auf der Meinung des Autors. Sie stellen keine Finanz-, Anlage-, Rechts- oder Steuerberatung dar. Kryptowährungsassets sind hochvolatil und unterliegen hohen Risiken, einschließlich des Risikos, Ihre gesamte oder einen erheblichen Teil Ihrer Investition zu verlieren. Der Handel oder das Halten von Krypto-Assets ist möglicherweise nicht für alle Anleger geeignet. Die in diesem Artikel geäußerten Ansichten sind ausschließlich die des Autors/der Autoren und repräsentieren nicht die offizielle Politik oder Position von Yellow, seinen Gründern oder seinen Führungskräften. Führen Sie immer Ihre eigenen gründlichen Recherchen (D.Y.O.R.) durch und konsultieren Sie einen lizenzierten Finanzprofi, bevor Sie eine Anlageentscheidung treffen.
Anthropic kippt Claude-Fable-5-Regel, die Ergebnisse für konkurrierende KI‑Forschende abschwächte | Yellow.com