Современные большие языковые модели оказались в ловушке парадокса новизны: всё, что в их выдаче звучит убедительно и точно — глубоко вторично, а всё, что претендует на оригинальность — оказывается галлюцинацией. Ричард Саттон, один из отцов-основателей обучения с подкреплением и лауреат премии Тьюринга, прямо заявляет: у массового генеративного ИИ отсутствует «двигатель», необходимый для реальных научных открытий. По мнению Саттона, системы, занятые предсказанием следующего токена, — это лишь зеркала обучающей выборки. Они мастерски имитируют паттерны, но органически не способны верифицировать результат или развивать собственные идеи. Это устанавливает жесткий потолок для технологии: она может резюмировать прошлое, но не способна систематически конструировать будущее науки.
Провал имитации
Саттон указывает на фундаментальную ограниченность текущего ИИ. LLM, генераторы изображений и видео обучаются на колоссальных массивах данных, чтобы выдавать контент, максимально похожий на первоисточник. Как иронично отмечает Саттон, когда эти результаты хороши, это заслуга данных, на которых модель училась. Когда же результаты действительно новы, они теряют связь с реальностью, так как у модели нет внутреннего механизма проверки собственных гипотез. Саттон вспоминает старую академическую шутку: «Ваша работа одновременно нова и хороша. Но та часть, что хороша — не нова, а та, что нова — не хороша».
«Новизна вспыхивает на мгновение, но если её ценность не распознана системой, она гаснет и исчезает навсегда».
Отсутствие «внутреннего цензора» — это то, что отделяет предиктивный движок от учёного. Саттон определяет подлинное открытие как процесс из трех этапов: вариация, оценка и селекция. И если генеративный ИИ блестяще справляется с вариациями, генерируя бесконечные версии текстов или кода, то на втором этапе он терпит крах. Без способности тестировать гипотезы относительно четкой цели модель не может провести отбор, необходимый для прогресса. Она производит «кандидатов», но по-прежнему нуждается в человеке, который решит, что из этого прорыв, а что — бред.
Архитектура истинного творчества
Саттон не ставит крест на ИИ, но проводит жирную черту между имитационными моделями и системами, способными к творчеству. Он приводит в пример AlphaGo, AlphaZero и AlphaFold — проекты, которые перешагнули через простое подражание. Их объединяет наличие петли обратной связи (evaluation loop), работающей за пределами генерации контента. В случае с AlphaGo ход либо приближает к победе, либо нет; в программировании код либо проходит тесты, либо падает. Эта обратная связь позволяет системе искать и находить решения, которые человек никогда бы не рассмотрел, вроде знаменитого «хода 37» в матче против Ли Седоля.
По мнению Саттона, индустрия добьется большего, если сместит фокус с бездумного масштабирования датасетов на архитектуры, включающие формальные верификаторы, поиск и обучение с подкреплением (RL). Для бизнеса и техлидов это сигнал: путь к «автономному ученому» лежит не через рост параметров, а через создание агентов, которые взаимодействуют со средой и оценивают себя сами. Ставка на чистые LLM в R&D-интенсивных отраслях рискует обернуться деградацией экспертизы: вы получите горы низкокачественных гипотез без возможности их проверить.
Экономическая ценность нынешнего генеративного ИИ останется на уровне «высокоскоростного ассистента», пока в него не внедрят механизмы самопроверки, характерные для игровых или математических моделей. Инвестиции в чистую генерацию как в основной инструмент исследований — это рецепт стагнации, так как такие модели не отличают озарение от галлюцинации. Реальное конкурентное преимущество получат те, кто интегрирует языковые модели в замкнутые системы с формальными верификаторами. Чтобы выйти за рамки имитации, нужно строить системы, способные доказать свою правоту или признать ошибку без подсказки человека.