Google DeepMind представила MedGemma 1.5 4B — мультимодальную модель, которая совершила качественный переход от простого анализа медицинских карт к работе со сложным визуальным контентом: КТ, МРТ и данными гистопатологии. В отличие от первой итерации, новая версия построена на единой архитектуре, способной обрабатывать высокоразмерные изображения без потери контекстуальных связей. Разработчики внедрили технологии 3D-слайсинга и специализированного семплирования целых патологических слайдов (WSI). Это позволяет системе не просто сканировать снимок, а точно локализовать патологии с помощью ограничивающих рамок и отслеживать динамику изменений на рентгенограммах грудной клетки в ретроспективе.

Технический отчет Google подтверждает, что компактный размер в 4 миллиарда параметров не ограничивает возможности модели. По сравнению с предшественником точность классификации на данных 3D-МРТ выросла на 11%, а на КТ — на 3%. Настоящий прорыв зафиксирован в цифровой патологии: показатель макро-F1 при генерации отчетов по гистологическим слайдам увеличился на впечатляющие 47%. Даже в классических текстовых бенчмарках, таких как MedQA, модель прибавила 5%, а в задачах по анализу электронных медкарт (EHRQA) — сразу 22%. Похоже, эпоха узкоспециализированных решений для каждой отдельной клинической задачи подходит к концу.

Для руководителей частных клиник и технических директоров медтех-стартапов это прямой сигнал к действию. MedGemma 1.5 автоматизирует наиболее трудоемкие процессы: извлечение данных из лабораторных отчетов и глубокий анализ архивов визуализации. Это не просто инструмент поиска, а реальный способ снизить когнитивную нагрузку на врачей-диагностов, перегруженных рутиной. Благодаря открытым весам модели компании могут дообучать ее на собственных проприетарных данных. Мы рекомендуем уже сейчас оценить стоимость внедрения системы для ваших объемов 3D-данных: Google DeepMind предоставил готовый фундамент, позволяющий строить диагностику следующего поколения, опережая конкурентов.

ИИ в здравоохраненииКомпьютерное зрениеОпенсорс ИИGoogle DeepMind