Диагностика редких заболеваний — это тупик классического машинного обучения. Когда на всю страну находится пара врачей, способных распознать патологию, надеяться на горы размеченных данных для дообучения (SFT) бессмысленно. Традиционные медицинские ИИ напоминают библиотекарей-стажеров: они находят ответ, только если симптомы идеально вписываются в заранее прописанные индексы и онтологии. Стоит клинической картине выбиться из канона, и система «плывет». Исследователи из Института автоматизации Академии наук Китая и госпиталя Пекинского союза решили взломать эту систему с помощью RareDxR1 — модели, которая ставит крест на диктатуре человеческой разметки.

Интериоризация знаний вместо костылей-онтологий

Разработчики Деян Цзян и Бо Сюй отказались от жестких конвейеров извлечения признаков. Вместо того чтобы полагаться на внешние базы знаний, RareDxR1 буквально впитывает фрагментированную информацию о редких болезнях напрямую в параметры модели. Это позволяет работать с неструктурированными клиническими записями «как есть», не теряя нюансы при попытках втиснуть живой текст в прокрустово ложе медицинских справочников. В отличие от закрытых систем, RareDxR1 оперирует в открытой среде, выявляя состояния, которые обычно оказываются за бортом стандартных медицинских языковых моделей.

«RareDxR1 достигает точности уровня state-of-the-art на различных бенчмарках, что знаменует собой прорыв в диагностике редких заболеваний в открытой области».

В основе системы лежит двухэтапное обучение с подкреплением (Curriculum Reinforcement Learning). Вместо хаотичного поглощения фактов модель осваивает сложность диагностики поэтапно, имитируя путь врача от простых случаев к запутанным дифференциальным диагнозам. Данные показывают, что такой структурный подход купирует главную проблему современных моделей — галлюцинации и неумение выстраивать иерархию клинических доказательств.

Логика выше этикеток: обучение на собственных ошибках

Ключевой козырь RareDxR1 — стратегия Reflection-Enhanced Reasoning Sampling (RERS). Это механизм, который заставляет модель имитировать врачебную рефлексию и учиться на собственных диагностических провалах без участия человека. В клинической практике врач обязан взвешивать противоречивые улики; RareDxR1 делает то же самое, генерируя и уточняя «траектории рассуждений». Методология цепочки рассуждений (Chain-of-Thought) позволяет системе исследовать гигантское пространство вариантов и самостоятельно корректировать маршрут, сокращая разрыв между простой обработкой текста и реальной клинической логикой.

«Чтобы преодолеть пропасть между генерацией модели и экспертным мышлением, мы предложили RERS — стратегию, синтезирующую диагностические траектории экспертного уровня через анализ неудач без человеческой аннотации».

Для R&D-сектора и фармгигантов это означает радикальную смену экономики. Проект, поддержанный Национальным фондом естественных наук Китая, доказывает: специализированный ИИ больше не требует армии дорогостоящих специалистов по разметке данных. Автономия RareDxR1 снижает барьер для входа в разработку диагностических инструментов для миллионов пациентов с редкими патологиями. Мы видим четкий тренд: эпоха RAG-систем, которые просто «подсматривают» в базу данных, уступает место моделям с глубокой интериоризацией доменных знаний. Да, внедрение в реальные клиники потребует жесточайшей верификации, но главный барьер взломан — ИИ научился не просто вспоминать факты, а думать над диагнозом.

ИИ в здравоохраненииИИ-агентыБольшие языковые моделиМашинное обучениеRareDxR1