Эпоха сверхприбылей проприетарных моделей столкнулась с экзистенциальной угрозой в лице китайской лаборатории Deepseek. Выпуск моделей V4-Pro и V4-Flash с открытыми весами и гибридной архитектурой разреженного внимания (Sparse Attention) окончательно ломает устоявшееся на рынке соотношение цены и производительности. Согласно техническому отчету Deepseek, при 1,6 трлн параметров модель V4-Pro потребляет лишь 27% вычислительных мощностей (FLOPs) и требует всего 10% объема KV-кеша по сравнению с предыдущими итерациями. Для контекстного окна в 1 млн токенов это не просто оптимизация, а настоящий архитектурный демпинг.

Технологическая эффективность трансформируется в агрессивный маркетинг: стоимость использования V4-Flash составляет всего $0,14 за миллион входных токенов. Для сравнения: это дешевле, чем GPT-5.4 Nano от OpenAI, и в несколько раз ниже ценников Gemini 3.1 Pro или Claude 4.6 Sonnet. Да, в Deepseek признают, что V4-Pro отстает от флагманов OpenAI на три-шесть месяцев, однако в бенчмарке GDPval-AA модель лидирует среди всех решений с открытыми весами с показателем 1554 Elo.

Для бизнеса ключевой сдвиг заключается в инфраструктурной гибкости. Модели Deepseek оптимизированы не только под дефицитное оборудование Nvidia, но и под чипы Huawei Ascend, что позволяет застраховаться от рисков в цепочках поставок. Применение дистилляции и продвинутых методов сжатия токенов делает подписки OpenAI и Anthropic неоправданно дорогими для масштабных сценариев с использованием ИИ-агентов. На наш взгляд, Deepseek создали «достаточно хороший» продукт, который превращает ИИ-инфраструктуру из элитарного сервиса в доступный массовый товар.

Для технических директоров (CTO) это четкий сигнал к смене курса: пора уходить от зависимости от западных API в сторону собственной инфраструктуры на базе моделей с открытыми весами. В условиях, когда автономные агенты увеличивают потребление до миллиардов токенов, сокращение требований к KV-кешу на 90% устраняет главное финансовое препятствие. Сегодня вы можете строить сложные агентские системы за малую часть прошлогоднего бюджета, фактически закрывая вопрос ценовой монополии Кремниевой долины.

ИИ в бизнесеСнижение затратОпенсорс ИИБольшие языковые моделиDeepSeek