Смена стратегии OpenAI: разделение GPT-5.6 Pro на три ветки

OpenAI окончательно прощается с концепцией «один инструмент для всего». Свежий отчет компании о бенчмарках GPT-5.6 Pro подтверждает: эра единого всемогущего флагмана закончена. Вместо него на рынок выходит триада специализированных версий — Luna Pro, Terra Pro и Sol Pro. Это первый фундаментальный сдвиг в стратегии ChatGPT Pro с момента запуска. Если раньше платная подписка означала просто доступ к «самому мощному» ИИ, то теперь Сэм Альтман заставляет пользователей выбирать между скоростью, пропускной способностью и предельной мощностью рассуждений (reasoning).

Экономика рассуждений и реальность бенчмарков

Цифры показывают, что OpenAI сделала ставку на точечные улучшения вместо абстрактного роста общего интеллекта. Согласно внутренним данным, Sol Pro стал лидером среди 60 протестированных моделей, показав результат 31.5% в специализированном геномном бенчмарке. Для сравнения: стандартный Sol выдает 28.7%, а хваленый Claude Opus 4.8 от Anthropic застрял на отметке 16.0%. Однако этот прирост производительности крайне неравномерен. Если Luna Pro прибавила сразу семь процентных пунктов относительно базовой версии, то Sol Pro едва наскреб дополнительные три.

Sol Pro показал результат 31.5%, став мощнейшей моделью из 60 протестированных в глубоком анализе данных.

Такой разрыв намекает на неприятный для разработчиков факт: дополнительные вычислительные мощности (compute) гораздо эффективнее «подтягивают» слабые модели, чем толкают вперед фронтирные решения. Например, Terra Pro, заточенная под тяжелые бизнес-задачи, достигла 28.5% — это фактически уровень стандартного флагмана Sol. Для бизнеса это означает архитектурный арбитраж: теперь можно получить производительность топовой модели на мощностях, пригодных для массового производства, если правильно выбрать «ветку».

Скрытые косты и Unit-экономика инференса

Пока OpenAI хвастается процентами в тестах, экономическая сторона вопроса остается в тумане. В отчете компании среднее количество токенов используется как индикатор затрат на вычисления: стандартный Sol съедает около 33 200 токенов на максимальных настройках. Но вот данные по Pro-версиям в документе магическим образом отсутствуют. OpenAI объясняет это «отсутствием сопоставимых систем учета» для данных прогонов, но на деле это выглядит как попытка скрыть чудовищную стоимость Test-Time Scaling. Длинные циклы рассуждений, необходимые для рекордных баллов, превращают инференс в «финансовую дыру».

Это создает серьезный вызов для CTO и руководителей ИИ-трансформации: вам предлагают выбрать архитектуру, не раскрывая точной стоимости владения (TCO). OpenAI пока не подтвердила, появятся ли эти три головы в интерфейсе ChatGPT одновременно. Скорее всего, компания прощупывает почву, пытаясь понять, готовы ли вы пересесть с кнопки «сделай мне красиво» на пульт управления сложной системой. Отсутствие данных по токенам для Pro-моделей прямо указывает на то, что нынешние успехи в тестах субсидируются мощностями, которые OpenAI пока не в состоянии продавать по рыночной цене без убытка для себя.

Источник: The Decoder →

Оцените материал

★ ★ ★ ★ ★

Большие языковые моделиИИ в бизнесеПроизводительностьЦифровая трансформацияOpenAI

Конец эпохи универсальности: зачем OpenAI дробит GPT-5.6 Pro на три части

Экономика рассуждений и реальность бенчмарков

Скрытые косты и Unit-экономика инференса