Новая система Fugu Ultra от Sakana AI выбила 54,2% на бенчмарке SWE-Pro, технично подвинув Opus 4.6 с его 53,4%. Но за этой чехардой десятичных дробей скрывается нечто более важное — признание полной профнепригодности человека в вопросах микрологики ИИ. Пока индустрия бьется в конвульсиях, пытаясь собрать «идеальные» цепочки агентов через LangChain или бесконечные системные промпты, японский стартап решил, что кожаный мешок в этой схеме лишний.

Вместо жестко заданных сценариев Sakana AI внедрила обучаемую малую языковую модель (SLM) в роли диспетчера. Это не просто пайплайн, а интеллектуальный клей: система сама решает, какой «движок» вызвать под конкретный запрос. По сути, это модель, обученная выбирать другие модели. В ходе тренировки Fugu даже освоила рекурсию — она вызывает саму себя для пересмотра стратегий прямо в процессе работы (test-time compute). Вместо возведения монолитного архитектурного собора нам предлагают вырастить грибницу, которая сама адаптируется под рельеф задачи.

Для бизнеса такой подход обещает радикальное снижение стоимости владения (TCO). Sakana берет на себя всю экономику взаимодействия с провайдерами, обещая, что автономная оркестрация обойдется в десятки раз дешевле, чем ручная оплата «зоопарка» API. Вертикализация компании выглядит логично: сначала B2B-агент Marlin для стратегий, теперь потребительская Fugu. Это явная попытка занять нишу операционной системы для фрагментированного рынка, где ценность представляет не «самый умный», а тот, кто заставляет этот коллективный разум работать без сбоев.

Однако попытка лечить галлюцинации одной нейросети надзором другой, более слабой по параметрам, вызывает здоровый скепсис. Насколько малая модель способна удерживать контекст сложного проекта, не превращаясь в «испорченный телефон» при передаче данных между тяжеловесами вроде GPT? Есть риск, что в процессе оркестрации мы получим новые формы цифрового бреда. Тем не менее индустрия официально расписалась в неэффективности ручного промпт-инжиниринга. Будущее — за адаптивными слоями управления, которые избавляют систему от ошибок человеческой логики. Это напоминает вождение современного авто: вы просто крутите руль, пока десятки контроллеров под капотом как-то договариваются между собой без вашего участия.

ИИ-агентыИИ в бизнесеАвтоматизацияЦифровая трансформацияSakana AI