Безопасность OpenAI Deep Research: отчет System Card

OpenAI опубликовала System Card для своей модели Deep Research — агентской системы на базе ранней версии o3, заточенной под глубокий поиск в сети. В отличие от привычных чат-ботов, этот инструмент не просто выдает справки, а имитирует работу полноценного аналитика: совершает многоступенчатые переходы по сайтам, анализирует PDF и изображения, а затем самостоятельно пишет и запускает Python-код для обработки данных. Переход от пассивной генерации текста к «активной агентности» вынудил компанию прогнать систему через сито Preparedness Framework, чтобы убедиться: модель, работающая в открытом интернете, не выйдет из-под контроля.

Результаты внешнего редтиминга и внутренних тестов OpenAI показывают, что Deep Research балансирует на грани «среднего риска» (Medium) в четырех критических зонах:

Кибербезопасность Убеждение Автономность CBRN (химические, биологические, радиологические и ядерные угрозы)

По протоколам Сэма Альтмана, оценка Medium — это максимально допустимый порог для публичного релиза. Любая категория с рейтингом High или Critical должна немедленно отправлять проект на доработку.

Для бизнеса здесь важна не столько «ядерная» угроза, сколько способность модели сопротивляться промпт-инъекциям, которые она может подхватить на сомнительных ресурсах во время автономного поиска. Без жесткого контроля такие агенты превращаются в идеальный инструмент для компрометации корпоративных данных через внешние веб-страницы.

Меры защиты и стандарты для бизнеса

Чтобы минимизировать риски, OpenAI ограничила исполнение кода изолированными «песочницами» и внедрила фильтры для защиты персональных данных. Систему специально обучали игнорировать деструктивный контент, который может сбить ее с курса или перехватить управление целью исследования. Для технических директоров и риск-менеджеров эти ограничения — не цензура, а новый индустриальный стандарт управления «фронтирными рисками».

Главные выводы

Модели перестают просто отвечать на вопросы и начинают выполнять автономную работу. Ключевой задачей становится контроль за тем, чтобы агент случайно или намеренно не обошел корпоративные протоколы безопасности. Эпоха «диких» AI-агентов без ограничений заканчивается: любая система корпоративного уровня теперь обязана поставляться с четкой оценкой рисков и работать в изолированной среде.

Deep Research наглядно подтверждает: автономная агентность стала регулируемой функцией, где показатели безопасности напрямую диктуют сроки выхода продукта на рынок. Когда модель получает право действовать, ваш фокус безопасности должен сместиться с того, что она говорит, на то, что ей фактически позволено делать.

Источник: OpenAI Blog →

Оцените материал

★ ★ ★ ★ ★

ИИ-агентыБезопасность ИИКибербезопасностьРегулирование ИИOpenAI

Агенты под присмотром: как OpenAI обеспечивает безопасность Deep Research