Традиционный поиск новых материалов долгое время напоминал попытку выиграть в казино, где ставками служили годы жизни ученых и бюджеты корпораций. Классические методы моделирования, такие как теория функционала плотности (DFT), настолько требовательны к вычислительным ресурсам, что высокопроизводительный скрининг долгое время оставался лишь мечтой. В статье для журнала Nature Machine Intelligence исследователи подчеркивают: зависимость от медленных симуляций превращала прорывы в области квантовых материалов и оксидов скорее в счастливую случайность, чем в триумф теории. На смену этому хаосу пришел MatterChat — мультимодальная модель, которая отказывается от поверхностных текстовых описаний в пользу глубокого анализа.

Главный архитектурный сдвиг заключается в отказе от примитивных форматов вроде Crystallographic Information Files (CIF), которые не способны передать все нюансы трехмерных связей. MatterChat интегрирует кристаллографические данные и структурные параметры непосредственно в веса модели. По словам авторов исследования, специальный соединительный модуль синхронизирует межатомный потенциал машинного обучения с предварительно обученной большой языковой моделью (LLM). Такая архитектура не просто снижает затраты на обучение, но и позволяет нейросети буквально «видеть» трехмерную среду атомов, не ограничиваясь чтением химических формул.

В ходе тестирования MatterChat превзошел GPT-4 как в предсказании свойств материалов, так и в качестве взаимодействия с экспертами. Там, где графовые методы пасовали перед сложностью научного контекста, новая модель демонстрирует зачатки логического вывода и планирования синтеза. Для бизнеса в полупроводниковом и энергетическом секторах это означает радикальное изменение экономики R&D (НИОКР). Цикл прогнозирования свойств сокращается с лет до месяцев, что напрямую влияет на совокупную стоимость владения (TCO) долгосрочных проектов. Теперь вы можете отсеивать бесперспективные соединения еще на этапе цифрового моделирования, не расходуя миллионы в физических лабораториях.

Впрочем, не стоит питать иллюзий: на данном этапе MatterChat не заменяет пробирку и реактор. Исследователи позиционируют специализированные мультимодальные модели (MLLM) как жесткий фильтр первого уровня. Текстовые модели вроде BERT или Llama существенно проигрывают в точности предсказаний, поскольку не учитывают специфику структуры. MatterChat решает проблему галлюцинаций в расчетах за счет интеграции реальных физико-химических данных и возможности экспертной корректировки через запросы. По нашему мнению, это превращает искусственный интеллект из дорогой игрушки в основной аналитический инструмент, который определяет, какие материалы достойны реальных инвестиций, а какие отправятся в корзину еще до начала испытаний.

Машинное обучениеИИ в бизнесеСнижение затратЦифровая трансформацииMatterChat