Стандартный RAG (Retrieval-Augmented Generation) уперся в потолок возможностей внутри корпоративного контура. Пока бизнес надеялся, что простая связка базы данных с LLM вылечит галлюцинации, реальность оказалась суровее: одношаговый поиск функционально слеп к тому, как на самом деле живут данные в крупных компаниях. Информация — это не аккуратный PDF-файл, а разрозненные архипелаги из CRM-заметок, логов ERP и технических спецификаций. В итоге на любой многослойный запрос стандартная система выдает либо невнятную выжимку, либо честное, но бесполезное «информация не найдена», просто потому что не умеет самостоятельно связывать источники.

Смерть линейного поиска: проблема multi-hop

По словам Сайруса Раштиана из Google Research и инжиниринг-менеджера Да-Чэна Цзюаня, нынешние RAG-системы физически не приспособлены для сложных многоходовых запросов (multi-hop). Если вы спросите о спецификациях сервера для конкретного проекта, ИИ найдет документ проекта, где указан лишь ID оборудования. Обычному поисковику не хватает «мозгов», чтобы взять этот ID и инициировать второй поиск в базе «железа». В Google решили превратить монолитный поисковик в полноценный исследовательский отдел, запустив фреймворк Agentic RAG в связке с Google Cloud.

По сравнению со стандартным RAG, наш фреймворк повышает точность работы с фактами на 34%.

Этот скачок — результат разделения труда. Запрос больше не падает в общую кучу. «Оркестратор» оценивает сложность задачи, а «Агент-планировщик» чертит маршрутную карту: в какие базы (финансы, логистика или техдок) нужно зайти и в какой последовательности. Вместо одного кривого запроса в дело вступает Query Rewriter, который переводит туманное «что там с Проектом X?» в серию конкретных поисковых задач по статусам и блокировкам.

Порог достаточности контекста

В традиционной схеме, если первый поиск не дал результата, LLM начинает фантазировать или капитулирует. Многоагентная структура Google работает как контролер ОТК на конвейере. Она проверяет данные, добытые «Агентом-поисковиком» (Search Fanout Agent), и выносит вердикт: достаточно ли контекста для ответа. Если данных не хватает, система уходит на второй и третий круги до тех пор, пока пазл не сложится.

Такой итеративный подход превращает ИИ из цифрового библиотекаря в активного аналитика, способного сшивать разрозненные хранилища данных (data silos) без ручных подсказок со стороны пользователя. Интеграция в платформу Gemini Enterprise позволяет верифицировать каждую точку данных до того, как финальная модель начнет генерировать текст. Это не просто обновление, а техническая необходимость для компаний, чьи данные сложнее списка покупок. Если ваши запросы к ИИ на этой неделе требовали информации более чем из двух источников и потерпели крах — проблема не в «глупости» модели, а в архитектурной немощи вашего RAG.

RAG и векторный поискИИ-агентыИИ в бизнесеЦифровая трансформацияGoogle