Тест Superminds: почему масштаб ИИ-агентов не равен интеллекту

Святая вера в то, что масштаб сам по себе порождает эмерджентный интеллект, разбилась о суровую реальность. Исследователи представили Superminds Test — методику оценки коллективного разума в агентских средах на примере платформы MoltBook, где «живут» более двух миллионов автономных агентов. Как следует из отчета, опубликованного на arXiv, фокус индустрии смещается: теперь мы проверяем не мощность отдельной модели, а способность децентрализованной сети решать задачи, которые не под силу одиночному ИИ.

Для проверки архитектуры авторы использовали Probing Agents — специальных агентов-зондов. Эти диагностические инструменты замеряли совместное рассуждение и синтез информации внутри системы. По сути, исследователи предложили смотреть на ИИ-департамент компании не как на набор инструментов, а как на социальный организм, который нужно проверять на структурную эффективность. Результаты аудита MoltBook стали холодным душем для топ-менеджмента: коллективный разум не возник спонтанно из огромной популяции. Данные показывают, что толпа агентов не смогла превзойти базовые frontier-модели в сложных рассуждениях и провалила даже простейшую координацию.

Анализ показал, что взаимодействия внутри сети остаются поверхностными: диалоги редко длятся дольше одной реплики, а ответы чаще всего оказываются шаблонными или не по теме. По оценке авторов исследования, главным тормозом выступает не «глупость» самих языковых моделей (LLM), а несовершенная архитектура связей, которая мешает агентам дополнять работу друг друга. Для технических директоров (CTO) это прямой сигнал: штат из миллиона ботов превращается в бесполезный балласт, если в системе отсутствует инфраструктура обмена знаниями.

Бизнес-вердикт: архитектура иерархического синтеза и связей теперь важнее, чем количество закупленных токенов или мощность базовой модели. Без жесткого тестирования цепочек коллективного рассуждения раздутый ИИ-департамент быстро станет убыточным проектом, застрявшим в бесконечных циклах самоповторов. Если ваши агенты не умеют синтезировать распределенную информацию, вы платите не за «сверхразум», а за миллионную избыточность.

Источник: arXiv cs.AI →

Оцените материал

★ ★ ★ ★ ★

ИИ-агентыИИ в бизнесеБольшие языковые моделиЦифровая трансформацияMoltBook

Ловушка масштаба: почему миллионы ИИ-агентов не заменяют коллективный разум