Вопрос о том, как использовать мощь языковых моделей и при этом не слить интеллектуальную собственность в облако, наконец-то получил техническое решение. Пока скептики настаивали на развертывании моделей внутри собственного контура (on-premise), что обходится примерно в $4,6 млн только за запуск уровня GPT-3, на горизонте замаячило полное гомоморфное шифрование (FHE).

Эта технология позволяет выполнять вычисления непосредственно над зашифрованными данными, не раскрывая их содержания.

Как отмечают Роман Бредехофт и Джордан Фрери из компании Zama, механика процесса выглядит изящно: данные превращаются в зашифрованные токены, которые сервис-провайдер обрабатывает «вслепую». На выходе получается такой же зашифрованный результат, прочитать который может только владелец ключа.

Техническая реализация

Технически это реализуется через адаптацию моделей (например, из библиотеки Hugging Face) с помощью Concrete-Python, где нелинейные функции заменяются операциями программируемого бутстраппинга (PBS). В итоге качество предсказаний не страдает, а провайдер не видит ни байта исходного текста.

Использование библиотек с открытым кодом для адаптации моделей. Замена стандартных операций на криптографические протоколы. Полная конфиденциальность при сохранении точности ответов.

На наш взгляд, это меняет правила игры для финтеха, медицины и госсектора — индустрий, где комплаенс раньше стоял стеной между бизнесом и облачными LLM. Больше не нужно выбирать между дырой в безопасности и колоссальными затратами на собственную инфраструктуру. Вы получаете доступ к внешним вычислительным мощностям, сохраняя свои данные функционально невидимыми для поставщика услуг.

Итоги и перспективы

FHE фактически отвязывает полезность данных от их доступности для посторонних глаз. Теперь чувствительные рабочие процессы можно прогонять через сторонние модели без необходимости доверять кому-либо на слово. Учитывая, что техническая цена за такую приватность становится приемлемой для бизнеса, мы ожидаем, что зашифрованные вычисления станут входным билетом для ИИ в секторах, где любая утечка оборачивается финансовой катастрофой и судебными исками.

ИИ в бизнесеБезопасность ИИБольшие языковые моделиZama