AI-агенты: команда или одиночка? Исследование Стэнфорда

Популярным трендом в AI стало создание мультиагентных систем, где несколько моделей работают сообща, спорят и проверяют друг друга. Предполагается, что такой командный подход ведет к более качественным решениям, особенно в задачах, требующих многоступенчатых рассуждений. Однако новое исследование Стэнфордского университета ставит этот тезис под сомнение: при равных вычислительных ресурсах, одиночный ИИ-агент зачастую не уступает, а иногда и превосходит команду.

Суть проблемы, как объясняют исследователи, кроется в неизбежных потерях информации при передаче промежуточных результатов между агентами. Каждый такой «handoff» — это риск упустить что-то важное, в то время как один агент ведет свой мыслительный процесс непрерывно, сохраняя все нюансы. Эксперименты с моделями Qwen3-30B-A3B, DeepSeek-R1-Distill-Llama-70B, Gemini 2.5 Flash и Pro в сравнении с пятью различными командными архитектурами показали: в большинстве случаев, при одинаковом лимите вычислительных мощностей, одиночный агент демонстрировал лучшие или равнозначные показатели, потребляя при этом значительно меньше ресурсов.

Конечно, у этого правила есть исключения. Теоретическое преимущество одиночного агента работает лишь тогда, когда он идеально справляется с контекстом. На практике языковые модели страдают от «контекстуального гниения» (context rot) и эффекта «потерянного в середине» (lost in the middle), когда информация теряется или игнорируется в длинных последовательностях. Именно здесь мультиагентные системы могут вырваться вперед. В экспериментах с намеренно искаженным входным текстом, структурированные команды показали себя лучше одиночного агента, так как распределение задач помогло более эффективно отфильтровать нужную информацию. Команды также демонстрировали большую выгоду при использовании менее мощных базовых моделей. Анализ ошибок показал, что одиночные агенты иногда мыслят слишком узко, тогда как команды «расширяют сеть» и могут находить ответы, упущенные «соло-исполнителем». Архитектура «дебатов» (debate) оказалась наиболее успешной командной конфигурацией.

Что это меняет для бизнеса: необходимость критически оценивать реальную ROI от внедрения мультиагентных ИИ-систем. Инвестиции в дополнительные вычислительные мощности для кооперации ИИ-агентов оправданы лишь в тех специфических сценариях, где сложность задачи и риски потери информации в «контекстном гниении» действительно требуют такого подхода, а не просто являются следствием неэффективного использования одного, но более мощного, агента. Это исследование заставляет пересмотреть стратегию оптимизации расходов на AI-инфраструктуру, ставя под сомнение универсальную выгоду командной работы ИИ.

Источник: The Decoder →

Оцените материал

★ ★ ★ ★ ★

Искусственный интеллектБольшие языковые моделиИИ-агентыПроизводительностьИнвестиции в ИИ

AI-командная работа: когда она окупает затраты, а когда — их раздувает