RadiT: Генеративная модель для синтеза рентгенограмм

Современные ИИ-модели в радиологии часто напоминают нерадивых студентов: вместо глубокого понимания клинической картины они зазубривают статистические «костыли», что приводит к провалам при малейшем изменении условий съемки или смене модели рентгеновского аппарата. Исследовательская группа из Имперского колледжа Лондона и Эдинбургского университета решила покончить с этим, представив RadiT — первую в мире генеративную фундаментальную модель для синтеза снимков грудной клетки, обученную с нуля на масштабе в 1,3 млрд параметров. Отказавшись от привычных диффузионных архитектур в пользу Rectified Flow Transformers, разработчики перешли от простого рисования картинок к созданию систем прецизионного медицинского синтеза.

Отказ от диффузии в пользу Rectified Flow

Техническое ядро модели — это не только 1,6 трлн токенов обучающей выборки, но и архитектурный сдвиг. В отличие от стандартной диффузии, Rectified Flow прокладывает кратчайшие, «прямые» пути между шумом и данными. Это не просто экономит вычислительные ресурсы, но и позволяет захватывать микроскопические детали, которые обычно «замыливаются» традиционными методами. Модель RadiT «переварила» гетерогенный датасет из 1,2 млн снимков, что позволило ей интернализировать разнообразие анатомических вариаций и протоколов съемки, на которых ломаются менее масштабные решения.

Мы значительно продвинули планку реализма в синтезе рентгенограмм: полученные изображения фактически неотличимы от реальных снимков даже для опытных врачей-рентгенологов.

Увеличение количества параметров до миллиардной отметки — это не погоня за красивыми цифрами, а способ решить проблему генерализации. Там, где узкоспециализированные модели пасуют перед новым оборудованием или специфической демографией пациентов, RadiT использует свою масштабную базу знаний для реконструкции анатомии грудной клетки с учетом всех патологий и ракурсов. Это превращает модель из генератора контента в надежный инструмент моделирования реальности.

Клиническая валидация и управляемый синтез

Главная ценность RadiT — возможность управляемого синтеза и редактирования снимков для редких патологий и недопредставленных групп пациентов. В медицине качественная разметка стоит дорого, а статистика по редким болезням всегда скудна, что мешает обучению диагностических систем. Модель решает эту проблему, позволяя «дорисовывать» необходимые кейсы для стресс-тестирования алгоритмов. Реализм этих синтетических данных подтвержден в ходе слепых тестов: эксперты не смогли отличить сгенерированные патологии от настоящих — уровень, который ранее оставался недосягаемым.

Высокоточный синтез рентгенограмм — это прямой путь к диверсификации клинических данных и проверке диагностических моделей на прочность.

Впрочем, редакция призывает сохранять скепсис: при всем техническом совершенстве, RadiT остается генеративной моделью с присущим ей риском галлюцинаций. Исследователи из Имперского колледжа честно признают, что синтетические данные — это костыль для обучения классификаторов и исправления их предвзятости, а не замена реальным архивам при постановке диагноза. Цель проекта — создать «архитектора данных», способного строить надежные модели, которые не «поплывут» при переезде из одной клиники в другую.

Переход к миллиардным Rectified Flow Transformers знаменует трансформацию роли ИИ в радиологии. Вместо того чтобы просто ассистировать врачу, нейросеть начинает проектировать обучающую среду, исправляя исторические перекосы в данных. Однако риск галлюцинаций остается главным техническим барьером: пока мы не научим модель полностью разделять статистическую вероятность и биологическую реальность конкретного пациента, синтетика будет лишь отличным тренажером, но не истиной в последней инстанции.

Источник: arXiv cs.AI →

Оцените материал

★ ★ ★ ★ ★

ИИ в здравоохраненииКомпьютерное зрениеГенеративный ИИRadiT

RadiT: Фундаментальная модель на 1,3 млрд параметров для синтеза рентгенограмм

Отказ от диффузии в пользу Rectified Flow

Клиническая валидация и управляемый синтез