Протокол MCP (Model Context Protocol) задумывался как универсальный язык общения ИИ-агентов с внешним миром, но на практике превратился в неповоротливого финансового паразита. Исследователи в препринте «Tool Attention Is All You Need» вскрыли проблему так называемого «налога на инструменты» (Tools Tax): при стандартном использовании MCP система при каждом шаге вливает в контекст полные описания всех доступных инструментов. В многосерверных средах это сжигает от 10 до 60 тысяч токенов за один ход, раздувая KV-кэш до критического состояния. На наш взгляд, это классический пример того, как плохая архитектура убивает здравый смысл: когда заполнение контекста переваливает за 70%, у моделей наступают «точки разрыва» (fracture points) — их способность к рассуждению просто отключается под грузом технического мусора.

Решение, которое предлагают авторы, — механизм Tool Attention. Это промежуточный слой, который заменяет бездумную инъекцию схем умной фильтрацией. Вместо того чтобы заставлять модель заучивать сотни JSON-инструкций, система использует три фильтра: семантический скоринг намерений (ISO), динамический затвор (gating function) и ленивую загрузку схем. В итоге модель видит лишь краткие резюме инструментов, а полная техническая документация подгружается только тогда, когда она действительно необходима для вызова. В бенчмарке на 120 инструментов этот подход сократил объем «инструментальных» токенов на 95% — с безумных 47,3 тысячи до скромных 2,4 тысячи. По сути, полезная емкость контекста подпрыгнула с 24% до 91%. Мозг ИИ наконец-то занят делом, а не чтением мануалов.

Для бизнеса это означает долгожданный переход от абсурдной модели «плати за описание всего склада» к логичной схеме «плати только за использованный молоток». Как отмечается в отчете, именно эффективность протокола, а не длина контекстного окна, стала сейчас узким местом для масштабирования агентов. Без внедрения динамической фильтрации и ленивой загрузки любая сложная агентная система в корпоративном секторе обречена на финансовую неэффективность и техническую деградацию. Если вы строите рабочие процессы с множеством инструментов, отказ от прямой инъекции схем — это уже не опция для энтузиастов, а вопрос выживания вашего бюджета.

ИИ-агентыСнижение затратИИ в бизнесеБольшие языковые моделиMCP