Google DeepMind вновь пытается убедить рынок, что его новые модели Gemini 2.5 Pro и Flash, а также новичок Flash-Lite, обладают неким «внутренним мышлением». Называемая «бюджетом на размышления» опция, по заверениям компании, позволяет контролировать время обработки запроса ради точности. Отбросив PR-обертку, видим, что Gemini 2.5 Pro — это скорее эволюция прошлогодних наработок, а главное изменение — в ценах. Стоимость входных токенов для Gemini 2.5 Flash взлетела с $0.15 до $0.30 за миллион (выходные подешевели), тогда как разница в цене между версиями с «мышлением» и без него исчезла. Это похоже на попытку причесать тарифы, но может также означать стремление подтолкнуть клиентов к более дорогим опциям.
Новый Gemini 2.5 Flash-Lite позиционируется как самое быстрое и бюджетное решение для массовой классификации и суммирования. Его «мышление» по умолчанию отключено, но активируется через API. Модель поддерживает интеграцию с Google Search и выполнение кода. Введение Flash-Lite явно намекает на попытку Google разделить аудиторию по ценовым сегментам. Flash-Lite, с акцентом на скорость и низкую стоимость, действительно может стать оправданной заменой для тех, кто раньше пользовался предыдущими Flash-моделями, особенно если каждый цент на счету. Для Gemini 2.5 Flash это скорее эволюция, чья привлекательность снижается из-за возросшей стоимости входных данных.
Когда же «думающие» модели станут реальным рабочим инструментом, а не очередной опцией в API? Gemini 2.5 Flash-Lite с его динамическим управлением «бюджетом на размышления» выглядит наиболее перспективным для интеграции в бизнес-процессы, где скорость и цена критичны. Однако, «спящее» по умолчанию «мышление» и акцент на «экономическую эффективность» для чувствительных задач дают понять: реальный ROI от глубоких рассуждений модели будет сильно зависеть от конкретного сценария. Настоящие прорывы, способные что-то принципиально изменить, скорее всего, потребуют более продвинутых и, как следствие, более дорогих версий. Пока что большая часть преимуществ сводится к тонкой настройке производительности и стоимости, а не к принципиально новому уровню интеллекта — скорее, к более дорогой форме прежнего.
Почему это важно: Google DeepMind продолжает свою игру на поле генеративного AI, предлагая более гибкие и, как утверждается, экономичные модели. Обновления Gemini 2.5, особенно Flash-Lite, нацелены на массовый сегмент рынка, где цена и скорость — решающие факторы. Если вы CEO и присматриваетесь к внедрению AI, помните: реальная ценность «думающих» моделей раскроется лишь тогда, когда разработчики научатся эффективно их использовать, и если Google сможет предложить стабильные и понятные тарифы без скрытых подводных камней. Пока что это выглядит как попытка оптимизировать расходы на AI путем перекладывания их на клиентов, маскируя это под «продвинутые рассуждения».