Anthropic wycofuje zasadę Claude Fable 5, która osłabiała wyniki rywalizujących zespołów badawczych AI

Anthropic wycofuje zasadę Claude Fable 5, która osłabiała wyniki rywalizujących zespołów badawczych AI

Anthropic wycofuje się z Claude Fable 5 policy, która potajemnie obniżała jakość wyników dla badaczy budujących konkurencyjne systemy AI, ograniczenie to miało według firmy wpływać na 0,03% ruchu.

Kluczowe punkty:

  • Anthropic wycofał się z polityki Fable 5, która po cichu osłabiała odpowiedzi dotyczące badań nad zaawansowaną AI.
  • Nieujawnione ograniczenie było ukryte w 319‑stronicowej karcie systemowej i nie przewidywało żadnego powiadomienia użytkownika.
  • Oznaczone żądania będą teraz jawnie przełączane na Claude Opus 4.8, z każdorazowym podaniem powodu.

Cofnięcie ograniczeń Claude Fable 5

Firma confirmed tę zmianę w rozmowie z Wired w tym tygodniu; to właśnie ten serwis jako pierwszy opisał odwrót po kilku dniach narastającej frustracji wśród badaczy, deweloperów i analityków polityk w sieci. Odwrót nastąpił tuż po wtorkowej premierze Fable 5, pierwszego publicznie dostępnego Mythos-class model Anthropic, systemu, który laboratorium długo wstrzymywało ze względu na jego większą skuteczność w znajdowaniu błędów w oprogramowaniu. W ciągu kilku godzin od wydania użytkownicy zauważyli, że model po cichu przekierowuje lub osłabia swoje odpowiedzi w wąskim zakresie zadań związanych z zaawansowaną pracą nad AI.

Zadania te covered obejmowały trenowanie konkurencyjnych modeli, debugowanie kodu AI i strojenie sieci neuronowych, wszystkie oznaczane na podstawie akapitu ukrytego w 319‑stronicowej karcie systemowej. Zamiast całkowicie je blokować, Fable 5 opierał się na ukrytych edycjach promptów i wektorach sterujących, aby po cichu stępić swoje odpowiedzi, co Anthropic ocenił na zaledwie 0,03% ruchu.

Poprawka zachowuje zabezpieczenie, ale usuwa tajność, która budziła największe oburzenie. Anthropic bronił ukrytej wersji, argumentując, że widoczne zasady łatwiej sondować i omijać. Teraz oznaczone prompty będą otwarcie przekierowywane do Claude Opus 4.8, tej samej ścieżki używanej dla zapytań z zakresu cyberbezpieczeństwa i biologii, a API wkrótce zacznie zwracać jasne uzasadnienie każdej odmowy.

Also Read: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows

Badacze odrzucają „tajne sabotowanie”

Krytycy uderzali w samą tajność, a nie w stojące za nią ograniczenia. Anthropic przedstawiał to obostrzenie jako rozszerzenie warunków zabraniających używania Claude do budowy konkurencyjnych systemów, twierdząc, że ciche egzekwowanie uniemożliwiało największym nadużywającym zyskać przewagę. Dean Ball, starszy pracownik naukowy w Foundation for American Innovation, nazwał tę taktykę „tajnym sabotażem” i stwierdził, że wzmacnia ona pogląd, iż część działań na rzecz bezpieczeństwa służy jedynie ochronie interesów biznesowych.

Określenie szybko się przyjęło.

Inni skupili się na asymetrii wpisanej w samą zasadę. Anthropic zachował pełną moc Fable 5 dla własnych pracowników, jednocześnie ograniczając zespoły zewnętrzne, co rozzłościło zarówno zwolenników open source, jak i dotychczasowych sojuszników w obszarze bezpieczeństwa. Jeremy Howard z Fast AI powiedział, że laboratorium złożyło niejako obietnicę podkopywania tych, którzy spróbują z nim rywalizować, podczas gdy Nathan Lambert z AI2 called tajne obniżanie możliwości oburzającym i antynaukowym.

Spór zakończył burzliwy pierwszy tydzień Fable 5, modelu, który Anthropic uznawał wcześniej za zbyt ryzykowny, by w ogóle go wypuścić. Firma dopuściła system do użytku publicznego w tym tygodniu, około tydzień po złożeniu poufnych dokumentów IPO, licząc, że ściślejsze i lepiej opisane ograniczenia pozwolą utrzymać jego zdolności do wyszukiwania podatności w bezpiecznych ramach.

Read Next: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO

Zastrzeżenie i ostrzeżenie o ryzyku: Informacje zawarte w tym artykule służą wyłącznie celom edukacyjnym i informacyjnym i opierają się na opinii autora. Nie stanowią one porad finansowych, inwestycyjnych, prawnych czy podatkowych. Aktywa kryptowalutowe są bardzo zmienne i podlegają wysokiemu ryzyku, w tym ryzyku utraty całości lub znacznej części Twojej inwestycji. Handel lub posiadanie aktywów krypto może nie być odpowiednie dla wszystkich inwestorów. Poglądy wyrażone w tym artykule są wyłącznie poglądami autora/autorów i nie reprezentują oficjalnej polityki lub stanowiska Yellow, jej założycieli lub dyrektorów. Zawsze przeprowadź własne dokładne badania (D.Y.O.R.) i skonsultuj się z licencjonowanym specjalistą finansowym przed podjęciem jakiejkolwiek decyzji inwestycyjnej.
Najnowsze wiadomości
Pokaż wszystkie wiadomości