ИИ-агенты в биоинженерии: разбор бенчмарка TadA-Bench

Биоинженерия перерастает стадию простого предсказания свойств белка — эпоху «фиттинга» статических данных сменяет автономное планирование. Как отмечают Цзинь Гао и его коллеги из Шанхайского университета Цзяо Тун (SJTU), индустрия движется к «агентному белковому инжинирингу». Теперь ИИ должен не просто угадывать структуру, а выступать в роли полноценного R&D-ассистента: анализировать историю лабораторных журналов, ранжировать мутации и самостоятельно определять вектор следующего раунда направленной эволюции.

Для проверки этих амбиций исследователи представили TadA-Bench — бенчмарк на миллион вариантов, построенный на данных 31 хронологического раунда эволюции деаминазы TadA. Техническая основа проекта — задача Replay: модели скармливают результаты ранних этапов, после чего она должна расставить приоритеты для вариантов, которые в реальности были синтезированы лишь спустя несколько месяцев. Чтобы очистить «шумные» данные обогащения на уровнях ДНК, РНК и белка, команда применила граф-пайплайн Seq2Graph. Это создает жесткий субстрат для верификации способности ИИ решать проблему «открытия будущих раундов» — ключевого вызова реального производства.

Результаты анализа TadA-Bench стали холодным душем для адептов биологических языковых моделей.

Выяснилось, что текущие системы отлично справляются с интерполяцией внутри известных данных, но их точность обваливается, когда дело доходит до прогнозирования будущих итераций. По словам Декваня Вана и группы исследователей, эволюционное покрытие оказалось куда важнее локальной плотности данных. Для владельцев биотех-компаний и R&D-директоров это означает одно: высокая точность модели на статических тестах — пустая метрика. Модели, проваливающие задачу Replay, неизбежно уведут исследовательские группы в дорогостоящие тупики.

Главные выводы исследования:

Валидация «будущим раундом» становится обязательным фильтром перед любым внедрением автономных систем в реальный R&D-процесс.

Способность к интерполяции старых данных не гарантирует успех в прогнозировании векторов эволюции белков.

Эволюционное покрытие в обучающей выборке критичнее для качества модели, чем объем локальных данных.

Пора прекратить оценивать ИИ по способности мимикрировать под прошлые результаты. TadA-Bench доказывает, что современные модели буксуют перед лицом хронологической сложности лабораторных циклов. Если агент не способен спланировать следующий шаг, он остается не более чем дорогой игрушкой для обработки архивов.

Источник: arXiv cs.AI →

Оцените материал

★ ★ ★ ★ ★

ИИ-агентыМашинное обучениеИИ в здравоохраненииАвтоматизацияTadA-Bench

Эволюция или стагнация: почему ИИ-агенты пока не справляются с биоинженерией