OpenAI представила в превью своё семейство из трёх моделей GPT-5.6 в пятницу, сочетая заметный прогресс в программировании, биологии и кибербезопасности с доступом, который пока ограничен узким кругом партнёров.
Ключевые моменты:
- GPT-5.6 выходит как семейство из трёх уровней: Sol как флагман, Terra как сбалансированный вариант и Luna, ориентированная на скорость.
- Новые режимы max и ultra позволяют Sol дольше рассуждать и разбивать сложные задачи между параллельными субагентами.
- OpenAI относит все три уровня к высокому риску по кибербезопасности и биологии, откладывая широкий доступ.
Семейство GPT-5.6 нацелено на код и киберзадачи
Компания представила Sol как свою самую мощную на сегодня модель, Terra как сбалансированный повседневный уровень с ценой примерно вдвое ниже предшественника и Luna как самый быстрый вариант по $1 за миллион входных токенов. Обновлённая схема наименований теперь использует номер для указания поколения модели, а имена обозначают устойчивые уровни возможностей. Каждый уровень может обновляться по собственному графику, давая разработчикам более понятный выбор между скоростью, глубиной и ценой.
GPT-5.6 также впервые предлагает два способа нагрузить Sol сильнее на длинных многошаговых задачах. Режим max даёт модели больше времени на размышления, а режим ultra разбивает сложную работу между субагентами, которые выполняются параллельно и затем объединяют результаты.
OpenAI также планирует запуск Sol на чипах Cerebras со скоростью до 750 токенов в секунду в июле.
Sol установила новый рекорд на Terminal-Bench 2.1 — тесте командной строки, требующем планирования и согласованного использования инструментов. В геномном анализе она немного обошла GPT-5.5, затратив меньше токенов.
На одном из бенчмарков по эксплуатации уязвимостей Sol сравнялась с Mythos Preview компании Anthropic, используя примерно треть объёма выходных токенов.
Также читайте: Рекорд кошельков Chainlink превращает отскок LINK к $9 в главный тест
Уровни риска ChatGPT меняют доступ к ИИ
OpenAI классифицировала все три модели как высокорисковые с точки зрения кибер- и биологического злоупотребления — впервые для своих более компактных и дешёвых уровней. Ни одна из них, по словам компании, не достигла критического уровня, который запустил бы самые жёсткие ограничения, а Sol показала себя лучше в поиске и исправлении уязвимостей, чем в проведении полноценных атак.
Эта оценка помогает объяснить, почему доступ пока остаётся узким. Около 20 организаций, одобренных правительством, могут запускать модели в период превью; более широкий запуск в ChatGPT, Codex и через API обещан в течение нескольких недель. Исследователь в области безопасности Алекс Стамос предупредил, что изоляция передовых инструментов может дать конкурентам за рубежом преимущество в гонке ИИ.
Запуск завершает год ужесточения киберконтроля в компании — от первых защитных мер в GPT-5.2 в декабре прошлого года до более строгих классификаторов в GPT-5.5. Для GPT-5.6, по словам OpenAI, она потратила более 700 000 эквивалентных A100-часов GPU только на автоматизированный red-teaming.
Читайте далее: XRP падает к $1, пока покупатели ETF испытывают слабый спотовый рынок





