Пока OpenAI и Anthropic возводят платные стены вокруг своих API, китайская компания MiniMax выпускает M3 — первую модель с открытыми весами, которая превращает «бездонный» контекст из роскоши в базовое право пользователя. С контекстным окном в 1 миллион токенов и нативной мультимодальностью M3 не просто дышит в спину лидерам рынка: по данным SWE-bench Pro, модель набирает 59%, обходя GPT-4o и замахиваясь на территорию еще не вышедших систем уровня GPT-5. Публикация весов такой модели — это не жест доброй воли, а прицельный удар по бизнес-модели западных лабораторий. MiniMax фактически обнуляет ценовую премию за обработку массивов данных, делая элитарные функции массовыми.
Технологический демпинг через математику
В основе этой стратегии лежит технология Sparse Attention. Вместо того чтобы «пережевывать» каждую пару токенов, алгоритм фокусируется только на релевантных блоках данных.
Экономия вычислительных мощностей в 20 раз по сравнению с классическими архитектурами. Ускорение инференса в 9 раз. Оптимизация GPU-ядра до 71,3% утилизации ресурсов.
На практике это означает, что модель способна 12 часов автономно работать над воспроизведением научной статьи или оптимизацией программного кода. Там, где условный Opus 4.7 может сдаться после нескольких итераций, M3 берет измором и математической эффективностью.
Геополитический шах и мат
Геополитический подтекст здесь считывается однозначно: китайские разработчики научились обходить дефицит топового серверного оборудования за счет изящной математики. Если раньше «защитным рвом» для проприетарных систем считался объем контекста и сложность написания кода, то теперь этот ров засыпали бесплатным песком.
Выход M3 доказывает, что технологическое лидерство в корпоративном сегменте больше не гарантируется закрытым кодом. Когда решения с открытыми весами начинают выдавать автономный поиск и кодинг на уровне топовых платных подписок, западным гигантам придется сильно постараться, чтобы обосновать ценность своих экосистем чем-то, кроме маркетингового шума.