CyberEvolver: автономные ИИ-агенты для кибербезопасности

Статичная защита в кибербезопасности — это игра с заранее известным проигрышем. Традиционные сценарии, написанные людьми, неизбежно рассыпаются при столкновении с непредсказуемой средой. Группа исследователей из Университета Фудань и Шанхайского института инноваций представила CyberEvolver — фреймворк, который окончательно порывает с практикой жестких промптов и фиксированных рабочих процессов. Вместо того чтобы послушно следовать скрипту, этот агент на базе больших языковых моделей использует четырехслойную эволюционную архитектуру для динамической перестройки собственной структуры прямо «на лету».

Технологический прорыв в адаптации

Техническое ядро CyberEvolver — механизм trace-to-diagnosis, который превращает хаотичные логи исполнения в четкие сигналы для ревизии системы. Когда попытка эксплуатировать уязвимость или пройти тест на проникновение проваливается, агент не просто повторяет тот же запрос в надежде на чудо. Он анализирует отказ, чтобы перестроить свои внутренние алгоритмы. Чтобы эволюция не зашла в тупик, система применяет стратегию популяционного поиска (beam search), сохраняя наиболее жизнеспособные варианты агентов.

В ходе тестов на CTF-челленджах CyberEvolver поднял вероятность успеха базового агента в среднем на 13,6%, оставив позади шесть популярных систем, спроектированных людьми.

Последствия для индустрии и риски

Для бизнеса и технических директоров это означает переход от ИИ как послушного инструмента к ИИ как системе, которая самостоятельно переписывает правила игры для обхода препятствий. Это дает шанс на эффективную борьбу с угрозами нулевого дня (Zero-day), где человеческий опыт еще не успел сформировать шаблоны. Однако автономная адаптация несет и очевидный риск: контроль над самоизменяющимся кодом в критической инфраструктуре становится иллюзорным.

Переход от мониторинга ответов к аудиту эволюции логики. Риск создания неуправляемой цифровой сущности в погоне за эффективностью. Необходимость новых протоколов безопасности для саморазвивающихся систем.

Теперь фокус внимания смещается: нам придется проверять не результат, а сам процесс «мышления» агента, иначе мы рискуем потерять рычаги управления в критический момент.

Источник: arXiv cs.AI →

Оцените материал

★ ★ ★ ★ ★

ИИ-агентыКибербезопасностьБольшие языковые моделиБезопасность ИИCyberEvolver

Эволюция атаки: CyberEvolver научил ИИ-агентов переписывать себя ради взлома