Jak Claude Mythos i GPT-5.5 po cichu przeliczyły matematykę obrony cybernetycznej

Anthropic's Claude Mythos Preview i OpenAI's GPT-5.5, dwa czołowe modele AI, realizowały autonomiczne zadania cybernetyczne w tempie, które pozostawiło dotychczasowe prognozy możliwości w tyle, poinformowali w środę badacze.

Modele graniczne wyprzedzają trend

Claude Mythos Preview i GPT-5.5 outperformed trend podwajania, który brytyjski AI Security Institute śledził od końca 2024 roku.

AISI szacował wcześniej w tym roku, że horyzont czasowy osiągnięcia 80% niezawodności w cyberzadaniach podwajał się mniej więcej co pięć miesięcy, w dół z ośmiu miesięcy w listopadzie 2025 r. Nowsza wersja Mythos Preview solved „The Last Ones”, 32‑etapowy symulowany atak na sieć korporacyjną, w 6 z 10 prób i ukończyła „Cooling Tower” w 3 z 10. GPT-5.5 zaliczył „The Last Ones” w 3 z 10 prób.

Był to pierwszy raz, gdy jakikolwiek model ukończył oba zakresy testowe AISI.

Also Read: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided

Ostrzeżenie Palo Alto przed „vulnpocalypse”

Palo Alto Networks reported podobne wnioski na podstawie własnych testów.

Firma przeskanowała w ostatnim miesiącu ponad 130 produktów i odkryła 75 rzeczywistych podatności – ponad siedem razy więcej niż jej typowy miesięczny wynik – wszystkie już załatane.

Lee Klarich, dyrektor technologiczny firmy, powiedział, że organizacje mają wąskie okno czasowe, zanim przeciwnicy zyskają podobne możliwości.

Oszacował „wąskie, trzy‑ do pięciomiesięczne okno, w którym organizacje mogą wyprzedzić przeciwnika”.

AISI zaznaczył, że jego próbka nadal jest niewielka, a dla najtrudniejszych zadań istnieje ograniczona ilość danych porównawczych od ludzi. Mimo to instytut wskazał, że usunięcie z analizy dowolnego pojedynczego modelu zmienia szacunek podwajania się horyzontu o mniej niż miesiąc. METR, organizacja non profit, która tracks AI w zadaniach programistycznych, doszła do niemal identycznej wartości – około czterech miesięcy.

Krzywa możliwości się zaostrza

Anthropic ograniczył w zeszłym miesiącu wczesne wdrożenie Mythos do wybranej grupy, w tym Palo Alto Networks, CrowdStrike, Amazon, Apple i JPMorgan.

OpenAI poszedł w ślad za tym, wprowadzając model GPT-5.5-Cyber i inicjatywę cyber Daybreak.

Tempo zmian gwałtownie przyspieszyło w ciągu ostatnich 18 miesięcy. AISI skrócił prognozowany okres podwojenia z ośmiu miesięcy do 4,7 miesiąca w lutym 2026 r., a następnie ponownie go skorygował po tej ostatniej rundzie testów. Przeliczona wartość wynosi teraz bliżej czterech miesięcy, odzwierciedlając odczyt METR dla zadań z zakresu inżynierii oprogramowania.