Anthropic's Claude Mythos Preview i OpenAI's GPT-5.5, dwa czołowe modele AI, realizowały autonomiczne zadania cybernetyczne w tempie, które pozostawiło dotychczasowe prognozy możliwości w tyle, poinformowali w środę badacze.
Modele graniczne wyprzedzają trend
Claude Mythos Preview i GPT-5.5 outperformed trend podwajania, który brytyjski AI Security Institute śledził od końca 2024 roku.
AISI szacował wcześniej w tym roku, że horyzont czasowy osiągnięcia 80% niezawodności w cyberzadaniach podwajał się mniej więcej co pięć miesięcy, w dół z ośmiu miesięcy w listopadzie 2025 r. Nowsza wersja Mythos Preview solved „The Last Ones”, 32‑etapowy symulowany atak na sieć korporacyjną, w 6 z 10 prób i ukończyła „Cooling Tower” w 3 z 10. GPT-5.5 zaliczył „The Last Ones” w 3 z 10 prób.
Był to pierwszy raz, gdy jakikolwiek model ukończył oba zakresy testowe AISI.
Also Read: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided
Ostrzeżenie Palo Alto przed „vulnpocalypse”
Palo Alto Networks reported podobne wnioski na podstawie własnych testów.
Firma przeskanowała w ostatnim miesiącu ponad 130 produktów i odkryła 75 rzeczywistych podatności – ponad siedem razy więcej niż jej typowy miesięczny wynik – wszystkie już załatane.
Lee Klarich, dyrektor technologiczny firmy, powiedział, że organizacje mają wąskie okno czasowe, zanim przeciwnicy zyskają podobne możliwości.
Oszacował „wąskie, trzy‑ do pięciomiesięczne okno, w którym organizacje mogą wyprzedzić przeciwnika”.
AISI zaznaczył, że jego próbka nadal jest niewielka, a dla najtrudniejszych zadań istnieje ograniczona ilość danych porównawczych od ludzi. Mimo to instytut wskazał, że usunięcie z analizy dowolnego pojedynczego modelu zmienia szacunek podwajania się horyzontu o mniej niż miesiąc. METR, organizacja non profit, która tracks AI w zadaniach programistycznych, doszła do niemal identycznej wartości – około czterech miesięcy.
Krzywa możliwości się zaostrza
Anthropic ograniczył w zeszłym miesiącu wczesne wdrożenie Mythos do wybranej grupy, w tym Palo Alto Networks, CrowdStrike, Amazon, Apple i JPMorgan.
OpenAI poszedł w ślad za tym, wprowadzając model GPT-5.5-Cyber i inicjatywę cyber Daybreak.
Tempo zmian gwałtownie przyspieszyło w ciągu ostatnich 18 miesięcy. AISI skrócił prognozowany okres podwojenia z ośmiu miesięcy do 4,7 miesiąca w lutym 2026 r., a następnie ponownie go skorygował po tej ostatniej rundzie testów. Przeliczona wartość wynosi teraz bliżej czterech miesięcy, odzwierciedlając odczyt METR dla zadań z zakresu inżynierii oprogramowania.
Read Next: Coinbase Opens $100K USDC Loans Against Solana Token Holdings





