Гибридный оркестратор Perplexity: новый подход к вычислениям

Эпоха бездумного скармливания каждого запроса гигантским облачным кластерам упирается в потолок. Команда Аравинда Сриниваса представила гибридный оркестратор инференса, который в реальном времени распределяет задачи между локальным «железом» пользователя и удаленными серверами. Технология станет частью проекта Personal Computer — того самого «всегда включенного» агента, анонсированного в марте. По сути, Perplexity создает умный диспетчер трафика, который решает, стоит ли гонять электроны через полмира или лучше задействовать ресурсы вашего ноутбука.

Экономика и суверенитет данных

Этот маневр — не просто забота о приватности, а прагматичный расчет юнит-экономики. Индустрия отходит от модели «сжигать деньги инвесторов в облаках» к более устойчивой схеме. Перенос обработки финансовых документов или медицинских данных в локальный контур убивает двух зайцев сразу: снимает вопросы суверенитета данных и разгружает дорогостоящую инфраструктуру. Система разрабатывалась в тесной связке с Intel, однако архитектурно она остается независимой — софт уже готов работать на чипах Nvidia RTX и других графических решениях.

Ставка на автономность и эффективность

Как отмечают в Perplexity, их бизнес-модель поощряет точность ответов, а не бессмысленное потребление вычислительных мощностей. Перекладывание рутинных задач на локальные устройства позволяет компании радикально снизить накладные расходы на содержание серверных ферм. Пока конкуренты пытаются монетизировать каждый токен, Сринивас делает ставку на автономность: агент должен оставаться полезным даже без стабильного (и дорогого) подключения к облаку.

«Гонка за локальные вычисления уже началась», — констатируют в компании, подчеркивая, что программная среда не привязана к конкретному вендору.

Это выглядит как долгожданное признание очевидного: бесконечное масштабирование облаков экономически нецелесообразно для простых повседневных задач. Если стимулом действительно становится эффективность, а не раздувание счетов за инференс, то вопрос лишь в том, как быстро остальные игроки последуют примеру Perplexity и начнут перекладывать свои облачные расходы на кремний в карманах и на столах пользователей.

Локальный ИИAI-чипыСнижение затратИИ в бизнесеPerplexity