Intel представила DeepMath — легковесного AI-агента для математических рассуждений. В отличие от больших языковых моделей, которые могут быть многословными и склонны к арифметическим ошибкам, DeepMath генерирует небольшие Python-сниппеты для промежуточных вычислений. Эти сниппеты выполняются в безопасной среде (sandbox), что позволяет снизить количество ошибок и сократить длину вывода до 66%. Агент реализован с использованием библиотеки smolagents. В основе DeepMath лежит модель Qwen3-4B, дообученная с помощью GRPO (Group Relative Policy Optimization).

Искусственный интеллектИИ-агентыИИ-инструментыДообучение моделейIntel