Najmocniejsze modele GPT-5.6 OpenAI trafiają za zamknięte drzwi

OpenAI zaprezentowało w piątek w podglądzie swoją trzy‑modelową rodzinę GPT-5.6, łącząc wyraźne postępy w kodowaniu, biologii i cyberbezpieczeństwie z dostępem ograniczonym na razie do wąskiego kręgu partnerów.

Kluczowe punkty:

GPT-5.6 pojawia się jako trójpoziomowa rodzina, z Sol jako flagowcem, Terra jako zrównoważoną opcją i Luna stworzoną z myślą o szybkości.

Nowe tryby max i ultra pozwalają Sol dłużej rozumować i dzielić trudne zadania na równolegle działające subagentów.

OpenAI ocenia wszystkie trzy poziomy jako wysokiego ryzyka w obszarze cyber i biologii, wstrzymując szeroki dostęp.

Rodzina GPT-5.6 celuje w kodowanie i cyberbezpieczeństwo

Firma ujawniła Sol jako swój najsilniejszy dotąd model, Terrę jako zrównoważony, codzienny poziom wyceniony na około połowę ceny poprzednika oraz Lunę jako najszybszą opcję w cenie 1 dolara za milion tokenów wejściowych. Nowy schemat nazewnictwa wykorzystuje numer do oznaczenia generacji modelu, podczas gdy nazwy oznaczają trwałe poziomy możliwości. Każdy poziom może rozwijać się we własnym tempie, dając deweloperom jaśniejszy wybór między szybkością, głębią a ceną.

GPT-5.6 wprowadza też dwa sposoby na mocniejsze dociśnięcie Sol przy długich, wieloetapowych zadaniach. Ustawienie max kupuje modelowi więcej czasu na myślenie, podczas gdy tryb ultra dzieli złożoną pracę między subagentów działających równolegle, zanim ich wyniki zostaną scalone.

OpenAI planuje także uruchomić Sol na układach Cerebras z prędkością do 750 tokenów na sekundę w lipcu.

Sol ustanowił nowy rekord na Terminal-Bench 2.1, teście pracy w wierszu poleceń, który wymaga planowania i koordynacji narzędzi. W analizie genomiki model nieznacznie wyprzedził GPT-5.5 przy mniejszym zużyciu tokenów.

W jednym z benchmarków exploitów Sol dorównał Mythos Preview firmy Anthropic, używając około jednej trzeciej tokenów wyjściowych.

Przeczytaj także: Rekord portfeli Chainlink zamienia odbicie LINK do 9 USD w główny test

Poziom ryzyka ChatGPT zmienia zasady dostępu do AI

OpenAI zaklasyfikowało wszystkie trzy modele jako wysokiego ryzyka zarówno pod kątem cyber-, jak i biologicznego nadużycia, po raz pierwszy także dla mniejszych, tańszych poziomów. Żaden z nich, jak podkreśliła firma, nie osiągnął jednak krytycznego poziomu, który uruchomiłby najsurowsze ograniczenia, a Sol okazał się lepszy w znajdowaniu i naprawianiu luk niż w prowadzeniu pełnych ataków.

Ta ocena pomaga wyjaśnić, dlaczego dostęp pozostaje na razie wąski. Około 20 organizacji zatwierdzonych przez rząd może uruchamiać modele w trakcie podglądu, a szersze wdrożenie do ChatGPT, Codex i API ma nastąpić w ciągu kilku tygodni. Badacz bezpieczeństwa Alex Stamos ostrzegł, że odgradzanie narzędzi z czołówki może dać zagranicznym rywalom przewagę w wyścigu AI.

Premiera zamyka rok zaostrzania kontroli cyberbezpieczeństwa w firmie – od pierwszych zabezpieczeń w GPT-5.2 w grudniu, po surowsze klasyfikatory w GPT-5.5. W przypadku GPT-5.6 OpenAI twierdzi, że poświęciło ponad 700 000 godzin GPU w ekwiwalencie A100 wyłącznie na zautomatyzowane red teaming.

Następnie przeczytaj: XRP spada w okolice 1 USD, gdy nabywcy ETF testują słaby rynek kasowy