Языковые модели отлично цитируют учебники Ландау и Лифшица, но позорно пасуют перед банальной задачей оценить массу или трение в динамике. Эта пропасть между теоретическим «красноречием» и физической реальностью превращает LLM в опасную игрушку для автономных систем, где любая ошибка в оценке инерции ведет к столкновению или поломке манипулятора. Как следует из отчета исследователей проекта LLMPhy, включая Анупа Чериана, полагаться на внутреннюю интуицию нейросети в инженерных задачах — значит добровольно подписываться на галлюцинации, несовместимые с промышленной эксплуатацией.

Проблема в том, что LLM понимают законы физики только в теории, не умея переводить их в точные цифровые двойники. Чтобы исправить этот архитектурный дефект, фреймворк LLMPhy внедряет подход на базе оптимизации «черного ящика». Здесь модель выступает не как всезнающий калькулятор, а как оптимизатор, работающий в связке с физическим движком. Система декомпозирует задачу на две части: оценку непрерывных физических параметров и определение дискретной структуры сцены. По сути, LLM итеративно генерирует программный код с оценками, запускает его в симуляторе и использует ошибку реконструкции как обратную связь для калибровки прогнозов.

Такой метод позволяет системе «выучить» законы движения конкретных объектов через проверяемые данные симуляции, избавляя разработчиков от необходимости переобучать всю нейросеть целиком. Данные бенчмарков LLMPhy показывают, что подобная интеграция демонстрирует лучшие результаты в задачах на физическое мышление без предварительного обучения (zero-shot). Система точнее восстанавливает параметры и сходится быстрее, чем любые предыдущие методы «черного ящика», переводя нейросети из разряда креативных ассистентов в категорию верифицируемых инструментов для исследований и разработок.

Исследователи подтвердили эффективность подхода на трех новых наборах данных, доказав: только жесткая связка лингвистической модели мира и детерминированного физического движка минимизирует риски механических сбоев. Если ваш процесс разработки до сих пор использует LLM для предсказания поведения материалов или допусков без цикла проверки в симуляторе, вы строите систему на песке. Настало время признать, что без цифрового «контролера» в виде физического движка любые рассуждения ИИ о материальном мире остаются не более чем уверенным бредом.

Большие языковые моделиРоботизацияИИ-инструментыLLMPhy