Google DeepMind снова напоминает о себе, представив Gemini 3.1 Pro. Модель преподносится как инструмент для решения 'самых сложных задач' в науке, исследованиях и инженерии. Заявлен двукратный прирост в задачах сложного логического анализа: 77.1% на бенчмарке ARC-AGI-2 против прежних ~38% у Gemini 3 Pro. Цифры, достойные сводок новостей о гонке вооружений в AI.
Новая версия уже разошлась по всем фронтам: разработчики получат доступ через API, предприятия — в рамках Vertex AI, а рядовые пользователи — через приложения Gemini и NotebookLM. Google, как водится, намерен встроить эти 'улучшенные когнитивные способности' во все и вся. Скоро наши ассистенты, видимо, будут решать уравнения квантовой физики, пока мы просим их поставить будильник.
Синтетические тесты — это, конечно, занимательно. Но реальный бизнес ждет другого. Пока что Google демонстрирует возможности на примерах вроде генерации анимированных SVG из текста, создания сложных систем авиационного мониторинга или интерактивного дизайна по мотивам литературных произведений. Звучит впечатляюще, но где именно эти 'продвинутые способности к рассуждению' найдут практическое применение, помимо красиво сверстанных демо и научных изысканий, — главный вопрос, пока оставшийся без внятного ответа.
Gemini 3.1 Pro амбициозен, но для бизнеса пока что остаются вопросы о реальной, измеримой пользе этих 'продвинутых способностей к рассуждению' вне синтетических бенчмарков. Конкурентная среда требует не столько обещаний, сколько конкретных кейсов, способных реально изменить бизнес-процессы, а не просто пополнить копилку маркетинговых заявлений.