Мультиагентные системы на базе LLM часто продают как прямой путь к автономному рассуждению, но на практике их масштабирование превращается в сизифов труд с убывающей доходностью. Исследование Блажа Берталанича и Каролины Фортуны из Института Джозефа Стефана подтверждает: кремниевый разум подвержен «эффекту Рингельмана» не меньше человеческого. Индивидуальная эффективность агента падает, как только команда начинает разрастаться. Пока маркетологи спорят, помогает ли «рой» качеству ответов, исследователи вывели математическую формулу масштабирования: R(N) = 1/(1 + c(N-1)N^-β). Этот закон определяет, сколько номинальных агентов действительно создают независимые доказательства, а сколько — лишь генерируют избыточный шум.

Три режима агентской производительности

Вся соль здесь в классификации производительности на три режима, зависящих от экспоненты β. Конфигурация может иметь «жесткий потолок» (β=0), расти сублинейно (0<β<1) или линейно (β≥1). В сценарии с жестким потолком добавление новых агентов дает ровно ноль дополнительного разнообразия: тридцать агентов, спорящих над задачами MMLU-Hard, выдают не больше смысла, чем один. Для большинства моделей на закрытых задачах это означает структурную стену: дальнейшее масштабирование — это просто сжигание бюджета без шансов на прогресс.

«Пилотный запуск на выборке N≤5 позволяет предсказать структурный потолок для N=30. В протестированных конфигурациях только архитектурное разнообразие (гетерогенные команды) снижает коэффициент 'c' и позволяет пробить потолок; изменение режима коммуникации здесь бессильно».

Методология исследования впечатляет: анализ 44 конфигураций на моделях Qwen, Llama, Ministral и Gemini показал, что математическая модель ложится на данные с точностью R2 > 0.99. На свободных математических задачах плотное влияние сверстников и вовсе обрушивает систему из сублинейного роста в режим жесткого потолка. Для техлидов это тревожный звонок: логика часто ломается из-за того, что взаимодействие агентов провоцирует конформизм, а не взаимную проверку ошибок.

Теорема среднего поля и коллапс проектирования

Один из самых прагматичных выводов касается размена между количеством агентов и длительностью дискуссии. Теорема среднего поля предсказывает, что число участников (k) и количество раундов дебатов (τ) влияют на динамику системы только через их произведение — kτ. Говоря проще, толпа агентов математически взаимозаменяема с длинным обсуждением. Этот «коллапс пространства проектирования» позволяет упростить планирование деплоя: вместо многомерного поиска по сетке достаточно провести один короткий пилот.

«В гомогенных командах прирост, который обычно приписывают 'дебатам', на самом деле происходит от переоценки собственных мыслей моделью, а не от контента, полученного от коллег».

Любопытно, что использование «шумового плацебо» для отслеживания самокоррекции подтвердило: в группах из одинаковых моделей польза от дискуссии — это иллюзия. Модель просто перепроверяет саму себя. Текущий тренд на создание «роев» из одной и той же версии LLM выглядит откровенно неэффективным. Единственный способ снизить константу 'c' и выйти за пределы жесткого потолка — это архитектурное разнообразие. Использование гетерогенных команд из разных семейств моделей работает лучше, чем любые попытки настроить протоколы общения или просто добавить еще десяток идентичных агентов.

Для бизнеса это означает жесткий мандат на умное, а не массовое масштабирование. Если ваша команда раздувает пул одинаковых агентов и не видит нелинейного роста, вы, скорее всего, уже расшибли лоб о структурный потолок Берталанича и Фортуны. Архитектурное разнообразие — единственный рычаг, который реально работает. Прежде чем подписывать счета за инференс огромных систем, проведите пилот на N≤5 агентах, вычислите параметры β и 'c' и убедитесь, что ваш вычислительный бюджет не уходит в пустоту. Структурный предел вашей AI-команды, вероятно, гораздо ниже, чем позволяет ваш кошелек.

ИИ-агентыБольшие языковые моделиПроизводительностьИИ в бизнесеСнижение затрат