DeepSeek планомерно демонтирует культ гигантизма в сфере искусственного интеллекта. С анонсом модели R2 и технологии Self-Principled Critique and Thought (SPCT) компания переносит фокус с бесконечного предварительного обучения на масштабирование вычислений непосредственно в момент инференса. Как следует из отчета разработчиков, такой подход превращает модель из продвинутого «Т9» в автономного аналитика, который сначала «думает», а только потом выдает результат.
В основе SPCT лежит метод самокритики на базе заданных принципов (Self-Principled Critique). Он заставляет систему генерировать цепочки рассуждений и проводить внутреннюю ревизию ответов до того, как их увидит пользователь. По оценке исследователей из Университета Цинхуа, участвовавших в разработке, это создает мультипликативный эффект между обучением с подкреплением и базовыми знаниями модели. Вместо того чтобы просто угадывать следующее слово, R2 моделирует варианты развития событий через внутреннюю модель мира (Internal World Model), отсекая тупиковые пути и исправляя ошибки на лету.
Для B2B-сектора это означает долгожданный переход от количества к качеству. В задачах с высокой ценой ошибки — будь то юридический аудит или проектирование архитектуры ПО — критически важна глубина логических рассуждений (Reasoning), а не объем оперативной памяти. Как отмечает Ву И из Цинхуа, технология решает проблему разреженности вознаграждения через онлайн-обучение с подкреплением на основе жестких правил. Проще говоря, модель больше не «галлюцинирует» на пустом месте, поскольку каждый шаг проходит через фильтр самокритики.
Стратегический сдвиг DeepSeek доказывает, что эффективность логики превосходит объемы обучающей выборки. Пока рынок гоняется за бескрайними контекстными окнами, пытаясь скормить нейросетям целые библиотеки, китайские разработчики создают «мыслителей» вместо «цифровых складов». С точки зрения бизнеса это прямой путь к снижению совокупной стоимости владения (TCO): зачем платить за содержание модели-монстра, если компактная система с глубоким планированием выдает экспертный результат? Главный вопрос теперь в том, готов ли корпоративный сектор довериться «черному ящику» внутреннего монолога машины ради экономии и точности.