Масштабирование AI-агентов: формула успеха от Google Research

Эпоха строительства AI-систем «по наитию» официально завершена. Пока индустрия годами жила на сомнительной эвристике «больше агентов — выше интеллект», Юбин Ким и Синь Лю из Google Research превратили это шаманство в строгую инженерную дисциплину. Опубликованные данные 180 конфигураций доказывают: бездумное наслоение агентов не просто бесполезно, оно методично убивает производительность там, где требуется линейная логика.

Провал эвристики «More-is-Better»

Исследователи Google провели препарирование пяти канонических архитектур: от одиночного агента (SAS) до сложных гибридных и децентрализованных сетей. Используя бенчмарки Finance-Agent и BrowseComp-Plus, команда выяснила, что популярный лозунг «More Agents Is All You Need» — это опасное упрощение. Эффективность системы упирается в потолок или деградирует, если архитектура не соответствует геометрии задачи. Для бизнеса это означает конец бесконечных трат на облачные вычисления ради «галлюцинирующего консенсуса» нескольких моделей.

Подход «больше агентов» быстро достигает плато, а затем начинает тянуть метрики вниз, если координация избыточна для конкретной цели.

В Google выделили три маркера истинно «агентской» задачи: длительное взаимодействие со средой, итеративный сбор данных в условиях неопределенности и адаптивная смена стратегии. Если этих условий нет, мультиагентная надстройка превращается в дорогостоящий балласт.

Механика координации против линейной логики

Ключ к ROI лежит в разделении задач на параллельные и последовательные. В финансовых рассуждениях, где подзадачи независимы, мультиагентная координация работает как мощный мультипликатор. Здесь децентрализованная модель позволяет агентам не ждать друг друга, создавая эффект синергии за счет объема вычислений.

Координация агентов радикально улучшает результаты в параллельных процессах, но становится «налогом на глупость» в последовательных.

Данные бенчмарка PlanCraft неумолимы: в сценариях со строгой линейной логикой любая попытка добавить второго агента приводила к обвалу точности. Коммуникационный оверхед в таких случаях генерирует шум, а не смысл. Для сложного планирования вычислительная мощность должна быть сконцентрирована в едином контуре рассуждений одиночного агента (SAS), который не тратит ресурсы на «переговоры» и сохраняет целостный контекст в памяти.

Инженерный расчет вместо хаоса

Главный итог работы Google — прогностическая модель, определяющая оптимальный стек для 87% новых задач. Для CTO и архитекторов это переход от сжигания бюджетов на перебор вариантов к расчету архитектуры по формуле. Мы видим фундаментальный сдвиг от хаотичных оберток над LLM к предсказуемым автономным системам. Вопрос лишь в том, как долго цепочки рассуждений смогут оставаться стабильными: Google признает, что риск каскадной ошибки в длинных последовательностях все еще велик. В мире, где AI переходит от быстрых ответов к затяжным процессам, точность проектирования коммуникаций становится важнее, чем размер используемых весов.

Источник: Google Research Blog →

Оцените материал

★ ★ ★ ★ ★

ИИ-агентыИИ в бизнесеПроизводительностьGoogle DeepMind

Математика против хаоса: Google вывел формулу эффективности AI-агентов

Провал эвристики «More-is-Better»

Механика координации против линейной логики

Инженерный расчет вместо хаоса