Современная вычислительная химия годами билась о стену «галлюцинаций»: нейросети рисовали красивые, но физически невозможные структуры. Как отмечается в публикации Nature Machine Intelligence, даже продвинутые диффузионные модели регулярно выдавали молекулярный мусор, игнорируя базовые законы природы. Группа исследователей решила закончить этот парад алхимии, представив CoCoGraph — архитектуру совместной графовой диффузии с жесткими ограничениями. По сути, разработчики вшили химическую конституцию прямо в «движок» генерации, заставив ИИ соблюдать правила валентности на каждом этапе сборки графа.

Методология CoCoGraph ломает привычный подход «сначала генерируем, потом фильтруем». Вместо того чтобы тратить вычислительные мощности на заведомо мертворожденные структуры, модель использует совместный механизм, который синхронизирует узлы и ребра графа в реальном времени. В Nature Machine Intelligence подчеркивают: при анализе 36 ключевых химических свойств CoCoGraph показал распределение характеристик, почти идентичное реальным соединениям. Исследователи даже провели своеобразный тест Тьюринга для химиков-органиков, и эксперты не смогли отличить «творчество» ИИ от правдоподобных структур. Итогом этой работы стала открытая база на 8,2 миллиона молекул, которые не противоречат фундаментальным законам химии.

Для фармацевтических гигантов это вопрос прямой экономии. Традиционный скрининг in silico часто напоминает поиск иголки в стоге сена, где половина сена — это галлюцинации нейросети. CoCoGraph позволяет сфокусировать бюджеты на исследования и разработки только на валидных кандидатах. С помощью методов инпейтинга модель способна достраивать сложные структуры, сохраняя свойства известных препаратов. Это сокращает путь от идеи до лабораторного синтеза, отсекая мусор еще на этапе проектирования.

Впрочем, радоваться окончательной победе над природой рано. Соблюдение валентности — это лишь гигиенический минимум. Перед разработчиками все еще стоит проблема «синтетической доступности»: молекула может быть идеальной на графике, но абсолютно невоспроизводимой в пробирке. Кроме того, предсказание реальной биологической активности остается серой зоной. Тем не менее, публикация кода на GitHub и датасетов на Zenodo дает четкий сигнал рынку: эпоха бесконтрольного ИИ-творчества в химии прошла, наступает время моделей с жестким физическим контролем.

Искусственный интеллектИИ в здравоохраненииОпенсорс ИИСнижение затратCoCoGraph