Традиционный подход к использованию больших языковых моделей (LLM) в науке уперся в потолок, который мы в редакции называем «дефицитом прослеживаемости». Пока стандартные чат-боты упражняются в красноречии, они катастрофически буксуют на многоступенчатых логических цепочках, необходимых в материаловедении. Здесь макроскопические свойства рождаются из сложного сочетания молекулярных структур, дефектов и нюансов обработки. Как справедливо отмечает Субхадип Пал, текстовые ответы в обычных моделях лишены явных причинно-следственных связей. Научное знание остается фрагментированным, а нейросети пытаются склеить его через линейный текст, что в 2024 году выглядит как попытка собрать адронный коллайдер с помощью инструкции к шкафу из ИКЕА.

Архитектура графового мышления

Чтобы закрыть эту брешь, команда исследователей из MIT и Ок-Риджской национальной лаборатории разработала Graph-PRefLexOR — семейство моделей, дообученных с помощью алгоритма GRPO (Group Relative Policy Optimization). В отличие от стандартных систем, выдающих поток токенов по принципу «верю — не верю», Graph-PRefLexOR принудительно структурирует размышления: от исследования механизмов до построения графов и синтеза гипотез. Это не просто «умный поиск», а жесткая привязка нейросетевой генерации к символическим структурам. ИИ буквально заставляют строить карту понятий и отношений вместо написания складно звучащей чепухи.

Такой дизайн связывает нейросетевую генерацию с символической структурой, позволяя конструировать, проверять и повторно использовать причинно-следственные связи.

Этот «графоцентричный» подход открывает путь к концептуальной рекомбинации — способности связывать механизмы и доказательства из изолированных областей знаний. На тестах из 100 открытых вопросов по материаловедению Graph-PRefLexOR показал прирост эффективности на 40–65% по сравнению с базовыми моделями. Но главное здесь не «сухой счет», а аудит: теперь исследователь видит не просто совет «используйте этот сплав», а детальную логическую трассу — почему система пришла к такому выводу и на какие узлы знаний она опиралась.

Метрики достоверности против семантического однообразия

Методология исследования включала анализ векторных представлений (эмбеддингов) и отслеживание состояний скрытых слоев, что позволило доказать: граф действительно меняет способ «мышления» модели. Данные подтверждают, что Graph-PRefLexOR достигает в 2–3 раза большей семантической диверсификации по сравнению с конкурентами. Модель не просто перерабатывает известные факты, а исследует более широкое концептуальное пространство. Выяснилось, что при увеличении вычислительных мощностей во время инференса система не начинает плодить галлюцинации, а находит более глубокие и сложные связи между отдаленными научными концептами.

Анализ эмбеддингов демонстрирует более широкое семантическое исследование и примерно в 2–3 раза большее разнообразие смыслов, чем у базовых моделей.

Переход от генерации текста к манипуляции связями в графе критически важен для воспроизводимости. В разработке материалов, где любая гипотеза должна пройти проверку реальным синтезом в лаборатории, одна галлюцинация ИИ может стоить отделу R&D месяцев впустую потраченного времени. Заземляя логику нейросети на верифицируемый граф, ученые создают базу для автономных систем, способных сопровождать цикл от идеи до готового материала с прозрачностью, недоступной «черным ящикам» классических LLM.

Ключевая ценность метода Graph-native Reinforcement Learning заключается в решении фундаментальной боли индустрии — невозможности проверить «логику» ИИ. Хотя текущие результаты впечатляют, реальная проверка боем ждет Graph-PRefLexOR при внедрении в автономные рабочие процессы, где данные зачастую неполные и противоречивые. На наш взгляд, это четкий сигнал рынку: будущее научного ИИ лежит не в наращивании объема текстов, а в строгой структуризации связей. Эпоха, когда мы верили нейросети на слово, официально заканчивается — наступает эра верифицируемых графов.

Большие языковые моделиДообучение моделейИИ в бизнесеGraph-PRefLexOR