Традиционные периметры кибербезопасности оказываются бессильны перед лицом социальной инженерии нового поколения. Исследователи представили PhySE — фреймворк, объединяющий AR-гарнитуры и большие языковые модели (LLM) для проведения атак в реальном времени. В отличие от предыдущих попыток автоматизировать офлайн-манипуляции, PhySE устраняет задержки при сборе данных благодаря встроенной визуально-языковой модели (VLM). Система мгновенно распознает собеседника, анализирует его цифровой след и выводит атакующему контекстные подсказки прямо на линзы очков, не прерывая живой диалог.
Ключевым звеном системы стал адаптивный психологический агент. Согласно препринту, опубликованному на arXiv, этот ИИ-движок заменяет статичные скрипты динамическими стратегиями поведения. Вместо заученных фраз атакующий получает инструкции, основанные на текущих реакциях жертвы. По сути, PhySE решает проблему «холодного старта» в персонализации: психологический портрет и тактика входа в доверие формируются в ту самую секунду, когда камера очков фиксирует лицо цели. Методологию проверили в ходе исследования с участием 60 добровольцев, на которых отработали 360 сценариев управляемого диалога.
Пока вендоры позиционируют AR-очки как инструмент продуктивности и мгновенного доступа к знаниям, на практике мы получаем идеальное оружие для целевого фишинга «в полях». Разработчики PhySE наглядно продемонстрировали, как связка физического интеллекта и LLM превращает визуальные и вокальные данные топ-менеджеров в детальную карту уязвимостей. Это больше не цифровая угроза, которую можно устранить обновлением ПО — это прямая эксплуатация человеческой психологии, где дополненная реальность служит лишь ширмой для глубокой манипуляции. Личные встречи перестают быть безопасной гаванью, превращаясь в пространство, где каждое ваше слово и мимика могут быть использованы против вас.