Современные ИИ-агенты на базе больших языковых моделей (LLM) пребывают в затяжном кризисе композиционности: они блестяще справляются с типовыми паттернами, но моментально «сыплются» на новых комбинациях знакомых задач. Как отмечают Махнур Шахид и Ханнес Роте из Университета Дуйсбург-Эссен, проблема кроется в самом фундаменте — модели опираются на статистическую вероятность, а не на понимание причинно-следственных связей. Представленный ими фреймворк AGEL-Comp (Action-Grounded Experiential Learning) — это попытка пересадить ИИ с «галлюциногенных» рельсов на жесткую логику через заземление действий в реальной среде.
Вместо того чтобы раздувать количество параметров в надежде на чудо, AGEL-Comp использует причинно-следственный программный граф (Causal Program Graph, CPG) — динамический гиперграф, который служит моделью мира. В этой архитектуре действия не просто выбираются из списка вероятностей, а вписываются в процедурную структуру. Это позволяет системе строить явные, интерпретируемые связи, исключая ситуации, когда агент пытается «открыть дверь, не имея ключа» только потому, что такой сценарий часто встречается в обучающей выборке. Логика здесь первична, а нейросеть лишь предлагает варианты.
За обучение без переобучения весов отвечает индуктивное логическое программирование (ILP). Система синтезирует новые хорновские дизъюнкты, превращая полученный опыт в набор формальных правил. По сути, агент пишет собственный кодекс поведения на лету, адаптируясь к среде без дорогостоящего дообучения. При этом предложения LLM как планировщика не принимаются на веру — их проверяет нейронный доказыватель теорем (Neural Theorem Prover, NTP). Он работает как жесткий фильтр, верифицируя гипотезы на логическую непротиворечивость еще до того, как агент совершит физическое действие.
Эксперименты в среде Retro Quest подтвердили: там, где классические нейросетевые модели теряются в новых комбинациях задач, AGEL-Comp сохраняет работоспособность. Однако до внедрения в корпоративные решения еще далеко. Текущая методология Шахид и Роте ограничена симуляциями, и масштабирование дедуктивно-абдуктивного цикла обучения в хаосе реального бизнеса — задача нетривиальная. Тем не менее работа четко фиксирует тренд: для создания по-настоящему надежных агентов индустрии придется вернуться к символьным правилам и проверять каждый шаг через суровую логику, а не через статистическое правдоподобие.