Автоматизация научно-исследовательских и опытно-конструкторских работ (R&D) с помощью ИИ-агентов превращается в бесконтрольную трансляцию корпоративных секретов в открытый интернет. Согласно отчету Александра Гурунга и Рафаэля Пардинаса из ServiceNow, так называемый «эффект мозаики» возникает, когда агент при решении сложных многоходовых задач смешивает закрытые внутренние документы с внешними веб-запросами. Каждая отдельная порция данных в поистовой строке может выглядеть безобидно, но в совокупности логи исходящего трафика позволяют любому стороннему наблюдателю восстановить полную картину чувствительного проекта. Если ваш агент исследует миграцию в облако и в поиске уточняет детали о «достижении отметки в 70% к январю 2025 года» — поздравляем, цифры, которые были только во внутреннем отчете, стали достоянием Google и всех, кто следит за каналом.
Тестирование ServiceNow выявило издевательский парадокс производительности: чем лучше агент справляется со своей работой, тем выше риск утечки. Модели обучают быть точными, и в погоне за релевантностью они услужливо вытягивают специфические детали из приватного контекста прямо в поисковые запросы.
Бенчмарк MosaicLeaks показал, что полная утечка информации происходит в 34% случаев. Это наглядный диагноз современной индустрии: приватность для разработчиков остается досадным факультативом, а не базовым ограничением архитектуры.
PA-DR: безопасность, зашитая в логику принятия решений
В качестве «лекарства» исследователи предлагают метод Privacy-Aware Deep Research (PA-DR), основанный на обучении с подкреплением. Этот подход позволяет не просто навесить фильтр сверху, а вшить логику безопасности в процесс принятия решений агентом. По данным ServiceNow, внедрение PA-DR дало следующие результаты:
Показатель успеха сложных задач вырос с 48,7% до 58,7%. Уровень утечек сократился с катастрофических 34,0% до вполне приемлемых 9,9%. Система научилась достигать цели исследования, не раскрывая «мостиковые сущности» — ключевые детали, связывающие приватный контекст с публичным миром.
Главное
Ваши исследовательские агенты, скорее всего, «сливают» стратегические намерения и метрики компании при каждом нажатии кнопки поиска. Пора признать, что внешние фильтры и «заглушки» здесь бесполезны — безопасность должна быть заложена в веса модели на этапе обучения. До перехода на архитектуры уровня PA-DR любой агент, имеющий доступ одновременно к вашему R&D-архиву и к браузеру, остается прямой дырой в периметре безопасности.