Биологические открытия уперлись в структурную стену, которую не пробить простым увеличением контекстного окна. Как показывают свежие тесты, даже тяжеловесы вроде Claude, GPT и специализированной Biomni позорно проваливают элементарный поиск последовательностей в базе NCBI Virus. Проблема не в «глупости» нейросетей, а в том, что современная научная инфраструктура строилась для людей, а не для автономных операторов. По меткому замечанию Лауры Любберт из Anthropic, попытка запустить ИИ-агентов в текущие базы данных напоминает езду на современном спорткаре по узким улочкам средневекового города, где пролезет только пешеход.

Пока ИИ-кодеры наслаждаются стандартизированными API и контролем версий, био-агенты тонут в идиосинкразических форматах файлов и одноразовых скриптах. Данные команды Anthropic подтверждают: точность моделей при сборке наборов данных оставалась неприемлемо низкой для профессионального использования. Ситуацию удалось исправить лишь внедрением gget virus — детерминированного слоя извлечения данных. С этим костылем точность подскочила почти до 100%, что лишь подчеркивает масштаб катастрофы. Как поясняет Любберт, без повсеместных исполнительных слоев даже самый четкий запрос ученого разбивается о кривой интерфейс базы данных.

Инфраструктура как бутылочное горлышко

В лабораториях цена ошибки критична: неверно извлеченные данные обесценивают всю последующую цепочку интерпретации и эксперимента.

Для индустрии это четкий сигнал: автоматизация науки невозможна без создания «агенто-ориентированной» среды. Anthropic открыто призывает к смене парадигмы — переходу на машиночитаемые сигналы и интерфейсы, зеркально отражающие среду разработки ПО. Без этих «хайвеев» самые мощные модели мира останутся запертыми в лабиринте разнородных метаданных и ручных кликов в браузере. Мы строим двигатели невероятной мощности для мира, который еще не изобрел асфальт, и пока это главная преграда на пути к автономным биолабораториям.

ИИ-агентыИИ в здравоохраненииАвтоматизацияAnthropic