Подразделение Microsoft AI представило MAI-Thinking-1 — модель на 35 млрд активных параметров с архитектурой Mixture of Experts (смесь экспертов), которая нацелена на прямую конкуренцию с OpenAI o1 и Claude 3.5 Sonnet. Пока конкуренты соревнуются в объемах энергопотребления, Microsoft делает ставку на «средний вес» и математическую логику. На тестах SWE-Bench Pro этот компактный игрок идет вровень с тяжеловесом Claude Opus 4.6, доказывая: для сложного написания кода не обязательно раздувать нейросеть до размеров Юпитера.

Главный козырь Редмонда здесь не в бенчмарках, а в «чистоте породы». Microsoft открыто дистанцируется от сомнительной практики дистилляции — когда модель обучают на ответах чужих систем. MAI-Thinking-1 тренировали с нуля на проверяемых данных корпоративного уровня. Для бизнеса, который дорожит юридической чистотой и суверенитетом своих данных, это весомый аргумент: вы точно знаете происхождение интеллекта вашей машины, и в нем нет заимствований из сторонних лабораторий.

В основе высокой производительности лежит Hill-Climbing Machine — собственная технологическая цепочка Microsoft, где оборудование и программное обеспечение проектируются в связке. Как отмечает команда разработчиков, система обучается через глубокое подкрепление (RL), а не просто имитирует человеческие паттерны. В слепых сравнительных тестах эксперты предпочли логику MAI-Thinking-1 ответам Sonnet 4.6, что превращает новую модель в мощный инструмент для автономного редактирования и тестирования кода внутри закрытых контуров.

Всю эту техническую мощь в Microsoft упаковали в философию Humanist Superintelligence. Пока рынок обсуждает замену сотрудников алгоритмами, Сатья Наделла и компания продвигают идею «этики служения». На практике это означает создание проверяемых, детерминированных сред, где ИИ-агенты решают задачи под контролем человека, не превращаясь в «черный ящик».

Перед нами редкий случай, когда высокая способность к рассуждению сочетается с компактным весом и прозрачным происхождением, давая техническим директорам реальный путь к автоматизации разработки без потери контроля над инфраструктурой.

Модель построена на архитектуре Mixture of Experts с 35 млрд параметров. Полный отказ от дистилляции в пользу обучения на чистых корпоративных данных. Производительность в кодинге на уровне флагманских моделей конкурентов. Ориентация на локальное развертывание и безопасность данных.

Большие языковые моделиИИ в бизнесеБезопасность ИИMicrosoft