Стандартная технология RAG (Retrieval-Augmented Generation) достигла своего потолка. Основная проблема в том, что на архитектурном уровне она воспринимает память как плоскую таблицу поиска, а не как динамический движок симуляции. Исследователи из Microsoft Research и Университета Вашингтона указывают на критический изъян: текущие системы настроены исключительно на ретроспективное извлечение данных. Они ищут в прошлом только то, что семантически похоже на текущий запрос пользователя.
В задачах долгосрочной персонализации такой подход ведет в тупик. Важные факты из истории диалогов часто не имеют прямого сходства с новой репликой, а значит, бесследно исчезают в недрах векторных хранилищ. Как подчеркивает Харшита Чопра и ее команда, жесткая привязка стратегии поиска к структуре хранения данных делает модель «близорукой». Если воспоминание не является очевидным совпадением, оно остается погребенным в базе.
Для решения этой проблемы был предложен метод Prospection-Guided Retrieval (PGR). Его суть заключается в имитации человеческой способности к проспекции — симуляции возможных сценариев будущего для активации памяти, которая станет актуальной «через шаг». Механика PGR превращает статический поиск в активное предвосхищение: когда пользователь ставит задачу, система запускает цикл Tree-of-Thought (ToT) или цепочку логических шагов, выступающих в роли поисковых зондов.
Эти гипотетические сценарии извлекают на поверхность скрытые данные, которые логически связаны с траекторией пользователя, но бесконечно далеки от исходного запроса в векторном пространстве. По оценке авторов, это позволяет ИИ-агенту уточнять свои планы на лету, опираясь на реальные факты, а не на галлюцинации. Для проверки гипотезы был создан бенчмарк MemoryQuest из 1625 запросов, где целевые факты намеренно лишены прямого сходства с вопросом. Результаты PGR-ToT впечатляют: метод показал почти трехкратный рост полноты извлечения (recall) по сравнению с лидерами рынка.
Безусловно, за точность приходится платить вычислительной мощностью и риском галлюцинаций при предугадывании намерений. Однако отделение процесса извлечения от семантического сходства — это, пожалуй, единственный способ превратить чат-ботов в по-настоящему умных ассистентов. Мы наблюдаем важный сдвиг: от реактивных систем к проактивным агентам, которые понимают контекст глубже, чем простое сравнение векторов.