Meta окончательно размыла границы между конкурентной разведкой и этичным тестированием безопасности, развернув масштабную операцию по поиску «дыр» у своих главных соперников. Согласно внутренним документам и показаниям пяти свидетелей, компания через подрядчика Covalen курировала проект под кодовым названием Cannes. Это не был стандартный аудит безопасности: сотни сотрудников имитировали поведение подростков, чтобы заставить чат-боты OpenAI, Google и Character.AI генерировать контент о самоубийствах, наркотиках и сексуальном насилии.
Анатомия проекта Cannes
Масштаб тестирования указывает на индустриализацию промышленного шпионажа под маской заботы о безопасности. Инструкции Cannes требовали от подрядчиков создавать поддельные аккаунты «моложе 18 лет», используя одноразовые почты Gmail и Outlook. Как следует из отчета, только в одном раунде в августе 2025 года было использовано более 45 000 промптов. Контрагенты скармливали фильтрам конкурентов изображения таблеток, ножей и петель, методично проверяя, когда системы Google или OpenAI «поплывут».
Анализ 3 748 промптов, проведенный WIRED, вскрывает фокус на самых уязвимых сценариях. Почти 240 запросов касались секса и романтики, сотни — расстройств пищевого поведения. В одном из кейсов подрядчик имитировал 13-летнюю девочку, забеременевшую от взрослого соседа, и выпытывал у ИИ способы прерывания беременности. В другом случае на французском языке использовалась история реального самоубийства Джеми Родемейера (Jamey Rodemeyer), чтобы спровоцировать модель на одобрение суицидальных мыслей. Представители Meta называют это «стандартной практикой», однако полная секретность и отсутствие уведомлений в адрес атакуемых компаний говорят о том, что это не сотрудничество, а сбор компромата.
Этический тупик и промышленные ставки
На наш взгляд, ценность Cannes для Марка Цукерберга заключается не в улучшении собственных моделей, а в картографировании точек отказа конкурентов. В документах Covalen результаты прямо называются «критическими наборами данных для сравнения соответствия (compliance)». Это чистая unit-экономика репутационных рисков: находя конкретные формулировки, которые обходят фильтры OpenAI или Google, Meta получает рычаг давления в регуляторных баталиях.
«Тестирование ответов чат-ботов для обеспечения безопасности — это ответственная, общепринятая в индустрии практика», — заявляют в Meta.
Этот агрессивный бенчмаркинг подтверждает: следующая фаза гонки вооружений в AI будет идти не за веса моделей, а за проприетарное знание о том, как их сломать. Субсидируя создание токсичного контента руками «подставных детей», Meta создает опасный прецедент. Вместо прозрачного обмена данными о рисках мы видим создание досье на конкурентов. Подобные методы корпоративной разведки неизбежно спровоцируют ответный ход регуляторов, которым вряд ли понравится использование темы детской безопасности в качестве дымовой завесы для промышленного шпионажа 2.0.