Фреймворк Metis: гибридная память для саморазвивающихся ИИ-агентов

Архитектура современных ИИ-агентов оказалась в ловушке бинарного выбора: вы либо скармливаете модели гибкие, но склонные к галлюцинациям текстовые инструкции, либо сковываете её жестко запрограммированными инструментами. Первый подход нещадно сжигает токены и страдает от неточности; второй — надежен, но статичен и требует вмешательства разработчика при каждом изменении среды. Исследователи из Китайского университета Гонконга, Huawei и Уханьского технического университета утверждают, что именно это разделение на «мышление» и «действие» мешает агентам выживать в непредсказуемых открытых условиях.

На сцену выходит Metis — фреймворк, который относится к памяти агента как к развивающемуся активу, а не как к статичной библиотеке. Вместо простого логирования истории, Metis использует иерархическую систему двойного представления. Система анализирует результаты задач и выборочно «кристаллизует» успешные планы выполнения в проверенный, вызываемый программный код. Выбирая оптимальный формат — текст для нюансов и контекста или исполняемый код для рутинных вычислений — система гарантирует, что дорогостоящие циклы рассуждений не будут тратиться впустую на уже решенные проблемы.

Главное

Эволюция памяти: автоматический переход от текстовых рассуждений к исполняемым программным модулям. Двойное представление: использование контекстной гибкости LLM совместно с точностью программного кода. Повышение эффективности: значительное снижение затрат на токены за счет повторного использования накопленного опыта.

«Мы переходим от этапа „чтения инструкций“ к „созданию инфраструктуры“ — это трансформация, которая делает внедрение ИИ дешевле и эффективнее по мере его реальной эксплуатации».

Прирост эффективности — это не просто теория. Тесты на платформе AppWorld показывают, что Metis превосходит стандартный паттерн ReAct, демонстрируя скачок точности на 20,6% при одновременном сокращении затрат на исполнение на 22,8%. Это не очередное минорное обновление, а сдвиг в сторону «агентономики», где система окупает собственные накладные расходы, становясь со временем всё более автономной.

Для технических директоров и архитекторов вывод очевиден: эра разовых запросов к языковым моделям без сохранения состояния подходит к концу. Metis демонстрирует реальный путь к созданию систем, которые на лету формируют собственную экспертизу. Это позволяет избежать избыточного расходования токенов на длинные контексты и, наконец, избавляет агентов от повторения одних и тех же ошибок. Чем больше вы используете такие системы, тем компетентнее они становятся.

Источник: arXiv cs.AI →

Оцените материал

★ ★ ★ ★ ★

ИИ-агентыСнижение затратАвтоматизацияБольшие языковые моделиПроизводительность

Эволюция ИИ-агентов: как фреймворк Metis заменяет чтение инструкций на кодинг