Традиционный процесс разработки лекарств десятилетиями упирается в «бутылочное горлышко»: ручную интерпретацию гигабайтов изображений клеток. Исследователи из Университета Гонконга совместно с NVIDIA AI Technology Center в своей работе для ICLR 2026 указывают на системную ошибку индустрии: текущие методы анализа часто игнорируют контекст эксперимента — дозировки и типы клеточных линий, — считая их «шумом». На практике это оборачивается катастрофически низкой способностью систем к обобщению.
Интеллектуальный подход к профилированию
Решение проблемы авторы видят в CP-Agent — специализированном агенте на базе мультимодальных больших языковых моделей (MLLM). В отличие от стандартных «черных ящиков», которые выдают сырые визуальные эмбеддинги без семантики, CP-Agent использует модуль CP-CLIP. Он буквально «сшивает» флуоресцентную визуализацию с метаданными эксперимента, заставляя систему понимать, что она видит, а не просто фиксировать изменение пикселей.
Автономное профилирование морфологии клеток. Показатель F1 до 0,896 при определении механизмов действия (MoA). Интеграция контекстных данных (дозировка, тип линии) непосредственно в модель. Генерация структурированных отчетов для R&D-подразделений.
На наш взгляд, здесь важна не столько точность, сколько переход от пассивного распознавания образов к активному научному рассуждению.
Будущее вычислительной биологии
Участие NVIDIA AI Technology Center в проекте лишний раз подтверждает: вычислительная биология стала главным полигоном для обкатки мультимодального интеллекта. Это уже не просто очередной инструмент для лаборанта, а попытка создать автономного эксперта, способного различать схожие морфологии и прогнозировать токсичность без бесконечного ручного проектирования признаков. Мы видим зарождение полноценного конвейера, где гипотезы уточняются кодом, а не интуицией исследователя.