Современные LLM в беспилотниках напоминают «мозг в колбе»: по словам исследователей из Пекинского университета и BIGAI, модели блестяще рассуждают о ПДД, но абсолютно не чувствуют веса машины и инерции. Этот семантический разрыв порождает «физические галлюцинации» — когда алгоритм выдает логически верную, но кинематически невыполнимую команду. Для бизнеса это тупик: какой смысл в умении модели «решить» объехать препятствие, если маневр технически невозможен в рамках законов физики?
Чтобы вытащить автопилоты из мира грез, предложена архитектура Reason–Imagine–Act (RIA). Это замкнутый цикл, где LLM-рассуждатель работает в связке с моделью мира (World Model). Вместо того чтобы слепо крутить руль, система сначала «воображает» последствия своих действий в достоверной физической среде.
В Пекинском университете объяснили, что RIA формирует краткосрочный прогноз будущего, а специальный алгоритм оценки безопасности (safety scorer) проверяет эти сценарии на риск столкновений или нарушение динамики еще до того, как колеса начнут движение.
Цифры подтверждают: на тестах в симуляторе CARLA (протокол point-goal) архитектура RIA показала 80,05% завершенных маршрутов при критически низком уровне аварийности в 0,20%. Это заметно выше показателей систем вроде MADA, работающих без предварительного «прогона» в воображении. На наш взгляд, это четкий сигнал рынку: чистая логика без привязки к «железу» — это не только репутационный риск, но и неэффективное сжигание R&D-бюджетов.
Главное:
Интеграция моделей мира — единственный способ превратить автономные системы из «текстовых мечтателей» в адекватных навигаторов.
Если вы строите беспилотное будущее, забудьте о полировке промптов.
Инвестировать нужно в системы замкнутого цикла с физической верификацией, иначе ваши машины так и останутся запертыми в симуляциях, неспособные выехать в реальный город без риска фатальной ошибки.