Фармацевтическая отрасль оказалась в технологическом тупике: до 80% заявок в FDA по-прежнему формируются в системе SAS — платформе, чья надежность сопоставима лишь с ее закрытостью. Эти алгоритмы, проверенные десятилетиями, превратились в изолированные «черные ящики». Хайме Ян из Университета Гаррисберга отмечает, что проприетарные библиотеки макросов, содержащие сотни тысяч строк кода, намертво связывают статистические расчеты с форматированием. В результате ценные данные блокируются внутри RTF-отчетов, становясь нечитаемым мусором для современных ИИ-агентов. Перед техническими директорами обычно стоит нелегкий выбор: либо рискованное переписывание валидированной логики с нуля, либо поверхностное обновление, которое не решает проблему доступа к данным.
Вместо разрушения работающих механизмов Хайме Ян предложил внедрить недеструктивный фреймворк, создающий цифровой метаслой над устаревшими системами. Архитектура, состоящая из типизированного промежуточного представления (IR) и оркестратора, оборачивает старые компоненты, превращая их вывод в структурированный машиночитаемый поток. По сути, это высокотехнологичный переводчик, который позволяет ИИ «понимать» SAS без изменения исходного кода. По оценке Яна, такой подход обеспечивает мирное сосуществование эпох: старые библиотеки продолжают удовлетворять требованиям регуляторов, в то время как нейросети берут на себя глубокую аналитику и автоматизацию фармаконадзора.
Методология прошла проверку на промышленном архиве из 558 компонентов и 373 000 строк кода. Результаты впечатляют: объем проприетарного «информационного шума» удалось сократить на 92%. В тестах отчетности по III фазе клинических исследований паритет данных превысил 80%, а на публичном бенчмарке CDISC система достигла 100% точности — ни одна ячейка не пострадала в процессе трансформации. В экспериментах с LLM исследователь подтвердил, что такая подготовка данных позволяет автоматизировать поиск аномальных побочных эффектов и мгновенно генерировать конфигурации для новых испытаний.
На наш взгляд, это редкий пример прагматичного подхода к ИИ-трансформации, где накопленная годами экспертиза становится активом, а не гирей на ногах R&D. Фреймворк позволяет обойти многолетние циклы миграции данных, сохраняя регуляторную чистоту перед FDA и EMA. И хотя масштабирование на разнородные платформы фармакоинформатики пока требует ручной настройки, для руководителей индустрии это прямой путь к внедрению предиктивной аналитики без остановки операционных процессов. Мы видим здесь реальную возможность ускорить вывод препаратов на рынок, просто перестав игнорировать данные, запертые в старом коде.