Компания Cohere наконец-то решилась пойти против отраслевой одержимости принципом «чем больше, тем лучше», сделав ставку на экономичную автономную разработку ПО. Их последний релиз, North Mini Code, представляет собой модель на 30 миллиардов параметров с архитектурой Mixture-of-Experts (MoE), которая работает с хирургической точностью, задействуя всего 3 миллиарда активных параметров. Активируя лишь 8 из 128 экспертов на каждый токен, Cohere наносит прямой удар по высоким затратам на инференс, которые обычно сводят на нет окупаемость внедрения ИИ в ИТ-отделах. Это не просто техническая доработка, а прямой вызов тяжеловесным и ресурсозатратным системам, жертвующим скоростью ради грубой силы.
Настоящий сдвиг здесь заключается в переходе от простого автодополнения кода к полномасштабным агентным рабочим процессам. Как пояснила команда Cohere Code Agents, модель прошла закалку с помощью обучения с подкреплением на основе проверяемых вознаграждений (RLVR), нацеленного на задачи в терминале и сложное проектирование на уровне репозиториев. С результатом 33,4 в рейтинге Artificial Analysis Coding Index модель North Mini Code уже выступает в весовой категории значительно выше своей, опережая раздутых конкурентов вроде Nemotron 3 Super (120B) и Mistral Small 4 (119B). На наш взгляд, это первый реальный фундамент для агентов, способных планировать, исполнять и проверять код в приватных репозиториях без катастрофических расходов на инфраструктуру.
Стратегически выпуск модели под лицензией Apache 2.0 на Hugging Face — это явная попытка перехватить рынок у закрытых экосистем OpenAI и Anthropic. Для технических директоров и лидов это дает высокопроизводительную опенсорс-альтернативу, которая легко вписывается в контейнеризированные среды. Поскольку North Mini Code оптимизирована для многошаговых сценариев вроде OpenCode, логичным шагом будет сравнение эффективности этой модели с 3 млрд активных параметров с вашими текущими расходами. Если вы все еще платите за массивные модели общего назначения для решения повторяющихся инженерных задач, вы фактически субсидируете их неэффективность. Эра универсальных чат-ботов уходит; настало время специализированных и экономичных агентов.
Главное
Архитектура MoE: 30 млрд параметров всего, но лишь 3 млрд активных при каждом запуске. Экономическая эффективность: резкое снижение стоимости инференса по сравнению с гигантами уровня 100B+ параметров. Агентный подход: модель обучена планированию и верификации кода через RLVR. Опенсорс: доступность по лицензии Apache 2.0 открывает путь для внедрения в корпоративные контуры.
«Если вы всё еще платите за массивные модели общего назначения для решения инженерных задач, вы фактически субсидируете их неэффективность».