Эра тестирования медицинского ИИ в цифровых «песочницах» официально подошла к концу. Майк Шахерманн и Кэмерон Чен из Google объявили о запуске общенационального рандомизированного исследования в партнерстве с Included Health. Цель — проверить разговорный ИИ не на актерах, а в реальных рабочих процессах виртуальной медицины. Отрасль годами кормилась ретроспективными данными и театральными постановками с симулянтами, но рынок уперся в потолок. Инвесторам и регуляторам больше не интересны презентации о «потенциале», им нужны цифры из реальной клиники, где на кону стоят исходы лечения живых людей.
От синтетических сценариев к доказательной медицине
Исследование выходит за рамки стерильных бенчмарков Nature, которые раньше подтверждали, что ИИ может рассуждать на уровне терапевта в лабораторных условиях. Лаборатория — это не жизнь. По словам Шахерманна и Чена, новый проект — это проспективное исследование с полным согласием пациентов, охватывающее разные регионы и патологии. Это критический сдвиг: анализ прошлых записей (ретроспектива) не способен предсказать непредсказуемую динамику живого интервью.
Исследование ставит целью собрать строгие доказательства того, как ИИ работает в клинических условиях в масштабе всей страны, оставив симуляции в прошлом.
Внедряя стандарты доказательности, принятые в фармакологии, Google и Included Health пытаются преодолеть пропасть недоверия между алгоритмической подсказкой и врачебным решением. Ожидающее одобрения этического комитета (IRB), это рандомизированное контролируемое испытание (РКИ) станет фундаментом для юридической ответственности. В секторе, где одна ошибка в диалоге может стоить жизни, вопрос стоит не в «технологичности», а в создании легитимного фреймворка для работы агентов.
Экономика врачебного времени
Главный бизнес-кейс здесь — радикальное изменение операционных затрат виртуальных клиник. Интеграция ИИ призвана расшить узкое место индустрии — выгорание врачей. Как поясняют руководители исследования, система должна забрать на себя рутину клинического рассуждения и первичного сбора анамнеза, возвращая врачу время на принятие финальных решений. Это прямая попытка оптимизировать TCO (совокупную стоимость владения) медицинским сервисом.
Однако путь к автономности строится поэтапно, чтобы купировать риски галлюцинаций в реальном времени. Предыдущий опыт с медицинским центром Beth Israel Deaconess был сфокусирован на безопасности: сколько раз супервизор-человек вынужден был прервать ИИ. В масштабах страны системам придется столкнуться с гораздо более сложной логикой клинических протоколов и запутанными историями болезней.
Это осознанный уход от идеологии «общего ИИ» в сторону узкоспециализированного клинического инструмента. Подчиняя чат-ботов тем же протоколам испытаний, что и новые лекарства, разработчики перестают продавать софт. Они начинают продавать медицинскую технологию. Переход от симулированного актера к реальному пациенту — это именно тот момент, когда хайп превращается в сертифицированный продукт, готовый к масштабированию в консервативной индустрии здравоохранения.