Экспорт Claude Fable 5: политический компромисс Anthropic

Администрация Трампа сняла экспортные ограничения с модели Claude Fable 5, но цена свободы оказалась специфической. По данным источников, знакомых с ходом сделки, Anthropic пошла на технические уступки в вопросах безопасности, которые больше напоминают политический бартер. При посредничестве министра торговли Говарда Лютника доступ к продвинутому ИИ превратился из вопроса национальной безопасности в предмет торга.

Техническая суть сделки — внедрение системы «безопасной деградации». Как сообщает WIRED, любые попытки вытянуть из Fable 5 чувствительную информацию по кибербезопасности или биологии будут пресекаться на корню. Вместо прямого отказа система незаметно перебросит запрос на менее мощную и ограниченную в плане возможностей Opus 4.8.

Этот «костыль» стал ответом на критику Кети Муссурис из Luta Security: она доказала, что ограничения Fable 5 обходятся элементарным перефразированием — достаточно попросить модель «исправить код» вместо «поиска уязвимостей».

Именно этот нюанс заставил чиновников временно приостановить запуск модели, пока Anthropic не пообещала сделать ее «глупее» по требованию регуляторов.

Хотя Центр стандартов ИИ при Минторге дал зеленый свет, в Пентагоне энтузиазма меньше. Министр обороны Пит Хегсет сохраняет в силе приказ от 28 февраля, согласно которому Anthropic считается риском для цепочки поставок. В итоге мы имеем опасный прецедент: отныне «надежность» модели измеряется не результатами тестов, а готовностью вендора добровольно снижать производительность в угоду властям.

Anthropic фактически внедрила модель политического комплаенса, где за выход на глобальный рынок платят частичной «лоботомией» собственного продукта.

Источник: WIRED →

Оцените материал

★ ★ ★ ★ ★

Регулирование ИИБезопасность ИИБольшие языковые моделиAnthropic

Лоботомия ради экспорта: как Anthropic договорилась с администрацией Трампа