OpenAI zaprezentowało w piątek swoją trzy-modelową rodzinę GPT-5.6, łącząc wyraźne postępy w kodowaniu, biologii i cyberbezpieczeństwie z dostępem ograniczonym na razie do wąskiego grona partnerów.
Kluczowe punkty:
- GPT-5.6 wchodzi jako trójstopniowa rodzina, z Sol jako flagowcem, Terra jako zrównoważoną opcją i Luna zbudowaną pod kątem szybkości.
- Nowe tryby max i ultra pozwalają Solowi dłużej rozumować i dzielić trudne zadania na równolegle działające subagentów.
- OpenAI ocenia wszystkie trzy poziomy jako wysokiego ryzyka dla cyber i biologii, wstrzymując szeroki dostęp.
Rodzina GPT-5.6 celuje w kodowanie i pracę cyber
Firma ujawniła Sol jako swój najsilniejszy dotąd model, Terrę jako zrównoważony codzienny poziom wyceniony na około połowę ceny poprzednika oraz Lunę jako najszybszą opcję za 1 dolara za milion tokenów wejściowych. Nowy schemat nazewnictwa używa teraz numeru do oznaczenia generacji modelu, podczas gdy nazwy oznaczają stabilne poziomy możliwości. Każdy poziom może rozwijać się we własnym tempie, dając deweloperom jaśniejszy wybór pomiędzy szybkością, głębokością i ceną.
GPT-5.6 wprowadza również dwa sposoby mocniejszego dociśnięcia Sol przy długich, wieloetapowych zadaniach. Ustawienie max kupuje modelowi więcej czasu na myślenie, natomiast tryb ultra dzieli złożoną pracę na subagentów, którzy działają równolegle, zanim połączą swoje wyniki.
OpenAI planuje też uruchomić Sol na układach Cerebras z prędkością do 750 tokenów na sekundę w lipcu.
Sol ustanowił nowy rekord w Terminal-Bench 2.1, teście pracy w wierszu poleceń wymagającym planowania i koordynacji narzędzi. W analizie genomiki nieznacznie wyprzedził GPT-5.5, zużywając przy tym mniej tokenów.
Na jednym z benchmarków exploitów Sol dorównał Mythos Preview firmy Anthropic, używając około jednej trzeciej liczby tokenów wyjściowych.
Zobacz też: Rekord portfela Chainlink zamienia odbicie LINK do 9 USD w główny test
Poziom ryzyka ChatGPT przekształca dostęp do AI
OpenAI sklasyfikowało wszystkie trzy modele jako wysokiego ryzyka zarówno pod kątem cyber, jak i biologicznego nadużycia – po raz pierwszy także dla mniejszych, tańszych poziomów. Żaden z nich, jak podała firma, nie osiągnął krytycznego poziomu, który uruchomiłby najsurowsze ograniczenia, a Sol lepiej radził sobie z wykrywaniem i naprawianiem luk niż z prowadzeniem pełnych ataków.
Ta ocena pomaga wyjaśnić, dlaczego dostęp pozostaje na razie wąski. Około 20 organizacji zatwierdzonych przez rząd może uruchamiać modele podczas podglądu, a szersze udostępnienie dla ChatGPT, Codex i API zapowiedziano w ciągu kilku tygodni. Badacz bezpieczeństwa Alex Stamos ostrzegł, że odgradzanie narzędzi z czołówki może dać zagranicznym rywalom przewagę w wyścigu AI.
Premiera zamyka rok zaostrzania kontroli cyber w firmie – od pierwszych zabezpieczeń w GPT-5.2 w grudniu ubiegłego roku po surowsze klasyfikatory w GPT-5.5. W przypadku GPT-5.6 OpenAI twierdzi, że poświęciło ponad 700 000 godzin GPU w ekwiwalencie A100 wyłącznie na zautomatyzowane red-teaming.
Czytaj dalej: XRP spada w okolice 1 USD, gdy nabywcy ETF testują słaby rynek spot





