MosaicLeaks: Риски безопасности ИИ-агентов в корпоративном R&D

Автоматизация научно-исследовательских и опытно-конструкторских работ (R&D) с помощью ИИ-агентов превращается в бесконтрольную трансляцию корпоративных секретов в открытый интернет. Согласно отчету Александра Гурунга и Рафаэля Пардинаса из ServiceNow, так называемый «эффект мозаики» возникает, когда агент при решении сложных многоходовых задач смешивает закрытые внутренние документы с внешними веб-запросами. Каждая отдельная порция данных в поистовой строке может выглядеть безобидно, но в совокупности логи исходящего трафика позволяют любому стороннему наблюдателю восстановить полную картину чувствительного проекта. Если ваш агент исследует миграцию в облако и в поиске уточняет детали о «достижении отметки в 70% к январю 2025 года» — поздравляем, цифры, которые были только во внутреннем отчете, стали достоянием Google и всех, кто следит за каналом.

Тестирование ServiceNow выявило издевательский парадокс производительности: чем лучше агент справляется со своей работой, тем выше риск утечки. Модели обучают быть точными, и в погоне за релевантностью они услужливо вытягивают специфические детали из приватного контекста прямо в поисковые запросы.

Бенчмарк MosaicLeaks показал, что полная утечка информации происходит в 34% случаев. Это наглядный диагноз современной индустрии: приватность для разработчиков остается досадным факультативом, а не базовым ограничением архитектуры.

PA-DR: безопасность, зашитая в логику принятия решений

В качестве «лекарства» исследователи предлагают метод Privacy-Aware Deep Research (PA-DR), основанный на обучении с подкреплением. Этот подход позволяет не просто навесить фильтр сверху, а вшить логику безопасности в процесс принятия решений агентом. По данным ServiceNow, внедрение PA-DR дало следующие результаты:

Показатель успеха сложных задач вырос с 48,7% до 58,7%. Уровень утечек сократился с катастрофических 34,0% до вполне приемлемых 9,9%. Система научилась достигать цели исследования, не раскрывая «мостиковые сущности» — ключевые детали, связывающие приватный контекст с публичным миром.

Главное

Ваши исследовательские агенты, скорее всего, «сливают» стратегические намерения и метрики компании при каждом нажатии кнопки поиска. Пора признать, что внешние фильтры и «заглушки» здесь бесполезны — безопасность должна быть заложена в веса модели на этапе обучения. До перехода на архитектуры уровня PA-DR любой агент, имеющий доступ одновременно к вашему R&D-архиву и к браузеру, остается прямой дырой в периметре безопасности.

Источник: HuggingFace Blog →

Оцените материал

★ ★ ★ ★ ★

ИИ-агентыБезопасность ИИКибербезопасностьИИ в бизнесеServiceNow

Эффект мозаики: почему ваши ИИ-агенты сливают секреты в Google