Google представил Gemini 3.1 Flash Live – очередную аудио-модель, которую, как водится, назвали «самой естественной и надёжной». Забудьте про роботов, которые с трудом выдавливают из себя ответы. В Google обещают, что теперь голосовые ассистенты будут звучать как живые люди, а не как озвучка для второсортного научно-фантастического фильма. По заверениям компании, скорость и ритм речи выводят на новый уровень, делая взаимодействие с пользователем куда более интуитивным. А это значит, что ваши клиенты будут меньше матюгаться, общаясь с ботами.

Какие цифры прилагаются к этим смелым заявлениям? Google хвастается 90.8% на бенчмарке ComplexFuncBench Audio, который имитирует сложные диалоги, и 36.1% на Scale AI’s Audio MultiChallenge, где модель училась понимать команды в условиях реального мира, да ещё и с функцией «думать». Звучит впечатляюще, но реальные кейсы, как всегда, покажут, насколько эти цифры применимы в жизни.

Для бизнеса это прямой сигнал: пора присматриваться к сокращению расходов на поддержку клиентов. Gemini 3.1 Flash Live уже интегрирована в Gemini Enterprise for Customer Experience. Это значит, что компании, которые сейчас тратят астрономические суммы на работу колл-центров, могут начать перекладывать часть этой нагрузки на AI. Да, Verizon и The Home Depot, согласно исходным данным, похвалили новинку и готовы её внедрять. А это уже не просто слова, а первые ласточки серьёзного внедрения.

Похоже, Google всерьёз взялся за голосовые интерфейсы, и цель очевидна: снизить издержки на клиентскую поддержку, заменяя людей машинами. И, судя по всему, у них получается. ИИ-ассистенты обещают стать быстрее, точнее и, что немаловажно, приятнее в общении. Это особенно актуально, когда нужно быстро решить проблему в шумном офисе или на ходу, а ваш клиент не готов слушать скрипучего робота.

Искусственный интеллектGoogle DeepMindГенеративный ИИАвтоматизация