Эпоха дешевых корпоративных подписок по $18 за рабочее место доживает последние дни. Как только мы переходим от простых чат-ботов к полноценным ИИ-агентам, экономика программного обеспечения разбивается о суровую реальность стоимости инференса. Согласно анализу венчурного инвестора Тома Тунгуза, «грязная» стоимость инфраструктуры для работы одного агента на базе передовых моделей сегодня колеблется от $22 до заоблачных $130 в месяц. Это только расходы на вычислительные мощности, без учета оплаты труда разработчиков и маркетинга.
Математика поставщиков выглядит еще менее оптимистично. Если взять средние затраты в $26 на пользователя и применить к ним стандартную для индустрии маржинальность в 75%, цена продукта для бизнеса должна взлететь до $350 в год. А если добавить расходы на хостинг и обслуживание, то реалистичный ценник за работающего почтового агента составит не менее $500 в год даже с учетом скидок за масштаб. На фоне Google Enterprise, который обходится компаниям в $11–18, это выглядит не как обновление софта, а как попытка продать вертолет по цене велосипеда.
Следующие два года станут временем тотальной диеты для нейросетей. Разработчикам придется прекратить использовать тяжелые модели для каждой задачи и научиться грамотно распределять нагрузку. Бессмысленно тратить ресурсы уровня GPT-4 на сортировку спама, с которой десятилетиями справлялись обычные фильтры. Выживут те, кто внедрит жесткую сегментацию: простые задачи передаются малым языковым моделям (SLM) или исполняются локально на GPU пользователя, а тяжелые запросы уходят в облако только в крайнем случае.
Переход на малые модели способен снизить затраты в 10–20 раз, но здесь кроется главный подвох: сможет ли модель, работающая на офисном ноутбуке, сохранить тот уровень логического рассуждения, который выдает кластер за $130 в месяц? Готовность бизнеса платить премию за автономность теперь зависит не от умения нейросети писать вежливые письма, а от способности агента реально сокращать расходы на персонал. Если агент за $500 заменяет ассистента, чье содержание обходится в тысячи долларов — сделка имеет смысл. В противном случае мы просто покупаем очень дорогую версию автоответчика.