Попытка натравить ИИ-агента на репозиторий в надежде на технологическое чудо обычно заканчивается лишь сожженными бюджетами. Исследование на базе 936 тестов Claude Code в проекте Apache Superset наглядно вскрывает механику этого процесса. Сравнение четырех методов подачи контекста — от примитивного grep (текстовый поиск) до структурных графов (GraphLens), LSP-серверов и проприетарных решений — показало, что архитектурная ошибка при выборе MCP-сервера обходится компании в 10–23 раза дороже на сложных задачах.
На элементарных вопросах в духе «где определен класс» все инструменты демонстрируют схожую точность, различается лишь счет за токены. Но как только агент сталкивается с реальной инженерной нагрузкой — оценкой «радиуса поражения» при изменении сигнатуры или поиском переопределений в сотнях тысяч строк кода — классический grep капитулирует. Его точность падает до 0.71, а стоимость взлетает из-за бесконечных итераций и галлюцинаций. В это время структурные инструменты позволяют модели сохранять адекватность даже при работе с масштабными кодовыми базами.
Главный инсайт для менеджмента: «серебряной пули» не существует. Структурные графы не всегда эффективнее LSP, а их ценность напрямую зависит от типа задач, которые вы делегируете агенту. Без тонкой настройки MCP-серверов под конкретный контекст компания обречена оплачивать «обжиг» токенов Claude Opus там, где с правильной подачей данных справилась бы легкая и дешевая Haiku.
На сложных этапах навигации использование обычного текстового поиска вместо графа увеличивает расходы на токены в 23 раза. Это не просто технический нюанс, а прямой налог на некомпетентность в управлении AI-инфраструктурой. Эффективная автоматизация кодинга сегодня — это не выбор самой мощной модели, а ювелирная работа над тем, что именно эта модель «видит» перед собой.