ChatGPT Agent против RPA: переход OpenAI к моделям действия

Эра ручного промпт-инжиниринга официально заканчивается, уступая место автономным системам, которые не просто «разговаривают», а действуют. Релиз ChatGPT Agent от OpenAI — это не очередное обновление чат-бота, а функциональный переход от языковых моделей (LLM) к моделям действия (Large Action Models). Объединив навигационные возможности Operator с аналитической глубиной Deep Research, команда Сэма Альтмана фактически вручила нейросети ключи от персонального компьютера. Теперь это не консультант, а полноценный оператор корпоративной среды, способный доводить задачи до финала в собственной виртуальной ОС.

От автоматизации процессов к автономному исполнению

Главный сюжет здесь — конвергенция разрозненных технологий в единый рабочий процесс. Если раньше Operator умел кликать по кнопкам, но «плавал» в анализе, а Deep Research выдавал глубокие отчеты, но пасовал перед закрытыми интерфейсами, то ChatGPT Agent устраняет этот разрыв. Система теперь сама переключается между рассуждением и действием: она заходит на сайты, авторизуется, анализирует данные и на выходе выдает готовые к презентации слайды или таблицы.

«ChatGPT теперь думает и действует, проактивно выбирая инструменты из своего арсенала, чтобы выполнять задачи за вас на собственном компьютере».

Этот сдвиг мгновенно превращает классический RPA (Robotic Process Automation) в устаревшую технологию. В отличие от жестко закодированных и «хрупких» роботов Blue Prism или UiPath, агент OpenAI использует визуальное восприятие интерфейса. Ему не нужны предписанные скрипты, чтобы подготовить бриф к встрече с клиентом или закупить ингредиенты для ужина. Там, где традиционный софт ломается при малейшем изменении верстки сайта, ChatGPT Agent просто «смотрит» и адаптируется.

Архитектура разрешений и биологические риски

Предоставление ИИ прямого доступа к компьютеру — это кошмар для офицера по безопасности, и в OpenAI это понимают. Любопытно, что в стек защиты агента, предназначенного для офисной рутины, включены протоколы мониторинга биологических рисков. Это прозрачный намек на то, насколько серьезные вычислительные мощности и автономия скрыты под капотом. Система работает по модели «человек в контуре» (human-in-the-loop): агент запрашивает разрешение перед любым значимым действием, а пользователь может прервать процесс или перехватить управление браузером в любой момент.

Для бизнеса, обремененного раздутым штатом административного персонала среднего звена, экономические последствия очевидны. ChatGPT Agent берет на себя управление календарями, конкурентный анализ и документооборот, фактически демонтируя привычные должностные инструкции. Пока инструмент доступен пользователям Pro, Plus и Team через режим «agent mode», но стратегический вектор задан: ИИ перестает быть песочницей для чатов и становится реальным исполнительным органом компании. Чтобы оценить масштаб угрозы (или возможности), достаточно поручить системе многоэтапный исследовательский проект и наблюдать, как она самостоятельно управляет цифровой средой.

Источник: OpenAI Blog →

Оцените материал

★ ★ ★ ★ ★

ИИ-агентыАвтоматизацияИИ в бизнесеЦифровая трансформацияOpenAI

Смерть RPA: Как ChatGPT Agent превращает ИИ из советчика в исполнителя

От автоматизации процессов к автономному исполнению

Архитектура разрешений и биологические риски