Anthropic udostępni Claude Mythos opinii publicznej, gdy zabezpieczenia nadrobią zaległości, być może za 12 miesięcy

Anthropic udostępni Claude Mythos opinii publicznej, gdy zabezpieczenia nadrobią zaległości, być może za 12 miesięcy

Anthropic deklaruje, że zamierza udostępnić opinii publicznej model Mythos, its vulnerability-hunting AI, ale dopiero wtedy, gdy zbuduje mechanizmy zabezpieczeń, które jeszcze nie istnieją.

Najważniejsze punkty:

  • Anthropic planuje szeroko udostępnić modele klasy Mythos po wcześniejszym rozszerzeniu dostępu dla rządów USA i sojuszników.
  • Firma przyznaje, że żadna organizacja, włącznie z nią samą, nie stworzyła zabezpieczeń wystarczająco silnych, by powstrzymać nadużycia.
  • Mythos wykrył ponad 23 000 problemów w 1 000 projektów open source, w tym 6 202 o wysokiej lub krytycznej wadze.

Udostępnienie Anthropic Mythos

Anthropic potwierdziło ten plan w aktualizacji Project Glasswing, swojego programu bezpieczeństwa z ograniczonym dostępem, a osobny raport zaznaczył, że harmonogram pozostaje niepewny.

Firma zapowiedziała, że najpierw będzie współpracować z rządami USA i państw sojuszniczych, aby rozszerzyć program. Szersze udostępnienie „modeli klasy Mythos” miałoby nastąpić w niedalekiej przyszłości.

Anthropic mówił o ryzyku wprost. Firma stwierdziła, że żadna firma, włącznie z nią samą, nie stworzyła zabezpieczeń na tyle silnych, by zapobiec nadużyciom modelu i poważnym szkodom.

Mimo to spółka spodziewa się szybkiego rozprzestrzenienia podobnych narzędzi, przewidując, że modele na poziomie Mythos staną się szeroko dostępne w ciągu sześciu do dwunastu miesięcy.

Mythos zadebiutował w kwietniu. Anthropic podało, że w testach generował działające exploity w 72,4 procent przypadków, w porównaniu z niemal zerem w przypadku wcześniejszego modelu Claude.

Zobacz też: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks

Odkrycia podatności przez Mythos

Od debiutu model zeskanował ponad 1 000 projektów open source i ujawnił 23 019 problemów, z czego 6 202 oceniono jako o wysokiej lub krytycznej wadze.

Jedno odkrycie szczególnie się wyróżniło. Mythos znalazł lukę w bibliotece kryptograficznej wolfSSL, używanej przez miliardy urządzeń, która mogła pozwolić atakującym fałszować certyfikaty i podszywać się pod banki lub dostawców poczty e‑mail. Luka została już załatana.

Lawina zgłoszeń przeciążyła osoby odpowiedzialne za ich naprawę. Opiekunowie projektów open source poprosili Anthropic o spowolnienie ujawnień, argumentując, że skala raportów przekracza ich możliwości przerobowe.

Badacze dostrzegają głębszą nierównowagę. Anthropic twierdzi, że znajdowanie błędów stało się teraz znacznie łatwiejsze niż ich naprawianie, a firma nawiązała współpracę z projektem Alpha-Omega Open Source Security Foundation, aby pomóc opiekunom w porządkowaniu zaległości.

Karta systemowa Claude Mythos przewiduje, że z czasem SI zacznie faworyzować obrońców, choć Anthropic przyznaje, że obecnie przewagę mogą mieć atakujący.

Kiedy Mythos został po raz pierwszy ujawniony, Anthropic dało dostęp do niego ponad 50 organizacjom, w tym Apple, Microsoftowi i Google, wraz z około 100 milionami dolarów w kredytach na wykorzystanie, wstrzymując jednak model przed opinią publiczną ze względu na jego zdolność do „uzbrajania” luk w oprogramowaniu.

Przeczytaj także: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High

Zastrzeżenie i ostrzeżenie o ryzyku: Informacje zawarte w tym artykule służą wyłącznie celom edukacyjnym i informacyjnym i opierają się na opinii autora. Nie stanowią one porad finansowych, inwestycyjnych, prawnych czy podatkowych. Aktywa kryptowalutowe są bardzo zmienne i podlegają wysokiemu ryzyku, w tym ryzyku utraty całości lub znacznej części Twojej inwestycji. Handel lub posiadanie aktywów krypto może nie być odpowiednie dla wszystkich inwestorów. Poglądy wyrażone w tym artykule są wyłącznie poglądami autora/autorów i nie reprezentują oficjalnej polityki lub stanowiska Yellow, jej założycieli lub dyrektorów. Zawsze przeprowadź własne dokładne badania (D.Y.O.R.) i skonsultuj się z licencjonowanym specjalistą finansowym przed podjęciem jakiejkolwiek decyzji inwestycyjnej.
Anthropic udostępni Claude Mythos opinii publicznej, gdy zabezpieczenia nadrobią zaległości, być może za 12 miesięcy | Yellow.com