Google DeepMind в очередной раз решил показать, как делать деньги на AI, выпустив Gemini 3.1 Flash-Lite. Это самая быстрая и, что важнее, самая экономичная модель в линейке Gemini, и прямая заявка на удешевление AI-решений для любого бизнеса, которому нужна скорость, а не только понты.

Главная фишка — цена: $0.25 за миллион входных токенов и $1.50 за миллион выходных. По оценкам Artificial Analysis, модель работает в 2.5 раза быстрее предыдущей версии 2.5 Flash по времени до первого ответа и на 45% быстрее по скорости вывода. При этом качество, говорят, либо на месте, либо даже лучше. Для задач, где каждая миллисекунда на счету, это не просто плюс — это шанс.

Flash-Lite уже доступна разработчикам через Gemini API и энтерпрайзу через Vertex AI. Целевая аудитория — те, кто не хочет переплачивать за AI-инфраструктуру. Модель заточена под высокочастотные задачи: от модерации контента и переводов до генерации интерфейсов и работы SaaS-агентов. По сути, Google подсовывает решение для рутинных, но требовательных к скорости задач, где раньше приходилось идти на компромиссы.

Почему это важно? Google предлагает конкретный инструмент для сокращения расходов на AI. Это открывает путь для более глубокой интеграции передовых AI-решений в операционные процессы, делая их доступнее для рынка, который устал от пустых обещаний и высоких счетов.

Искусственный интеллектИИ в бизнесеСнижение затратИИ-инструментыGoogle DeepMind