Стандартные системы RAG (Retrieval-Augmented Generation) в промышленных масштабах достигли своего предела. По словам Грамы Четана, архитектора Siemens Digital Industries Software, классический подход с делением текста на плоские фрагменты и поиском по векторному сходству систематически дает сбой там, где требуется понимание сложных взаимосвязей. В авиакосмической отрасли цепочка поставок — это не просто библиотека документов, а мультиграф, состоящий из поставщиков, узлов и заводов, связанных временными метками. Исследование восьми архитектур извлечения данных показало: пять классов критически важных для индустрии вопросов физически недоступны для векторного поиска, вне зависимости от «интеллекта» используемой языковой модели.
«В авиакосмической отрасли цепочка поставок — это не библиотека документов, а мультиграф из поставщиков, узлов и заводов, связанных временными метками».
От поиска совпадений к топологической логике
Технологический сдвиг Siemens подразумевает переход от банального извлечения кусков текста к структуре Graph-Augmented Retrieval (извлечение на базе графов). Исследование на примере графа знаний авиакосмической цепочки, включающего 46 узлов и 64 типа связей (ребер), подтверждает: главным «бутылочным горлышком» системы является скудный операторный базис. Архитектура с планировщиком запросов (LLM Query Planner), использующая девять примитивов обхода графа, продемонстрировала F1-меру 0.632 по сравнению с 0.472 у стандартных решений. Система начинает буквально ориентироваться в топологии производства, а не просто искать созвучные слова в массивах данных.
Стандартный векторный поиск не справляется с логическими связями. Графы знаний позволяют модели «видеть» структуру производства. Использование планировщика запросов повышает точность ответов на 34%.
Искоренение галлюцинаций через вычисления
Чтобы исключить галлюцинации в логистике, где ценой ошибки становится остановка конвейера, была внедрена адаптивная модель с шестью инструментами графовых вычислений, включая PageRank и расчет центральности. Это позволяет ИИ решать задачи агрегации и сравнения — например, мгновенно определять список клиентов, не затронутых региональной катастрофой. Подобная задача требует вычисления подграфа «радиуса поражения», а не поиска подходящей цитаты в PDF-отчете. Переход от простого извлечения данных к вычислениям обеспечивает верифицируемость: в критических отраслях каждое пропущенное звено в цепи поставок ведет к тяжелым последствиям.
Пока индустрия одержима расширением контекстных окон и размерностью эмбеддингов, Siemens представляет референсную реализацию на 8154 строки кода. Это четкий сигнал рынку: будущее корпоративного ИИ лежит не в области «улучшенного чтения» текстов, а в предоставлении моделям жесткого математического инструментария для работы со сложными структурами данных.