ИИ в R&D: почему LLM нельзя доверять расчеты напрямую

Попытки превратить большие языковые модели в цифровых ученых разбились о стену стохастического хаоса. В лабораториях, где важен каждый нанометр, «творческий» подход ИИ превращается в профнепригодность: один и тот же запрос к модели может выдать разные позиции пиков в спектре или внезапно сменить методику аппроксимации данных. Как справедливо отмечают Мариос Адамидис и его коллеги из Университета Крита и института FORTH в своем свежем препринте, отсутствие воспроизводимости — это смертный приговор для любых научных изысканий. Исследователи подчеркивают: когда индустрия слепо полагается на внутренние рассуждения моделей, управляемые общими системными промптами, она получает не результат, а лотерею.

Решение, предложенное командой FORTH, выглядит как архитектурная «лоботомия»: модель лишают права на свободную интерпретацию и вычисления. В рамках концепции типизированного посредничества (typed mediation) ИИ превращается в жестко ограниченного диспетчера. Исследователи формализовали лабораторные процедуры в виде детерминированного софта, оставив нейросети роль оркестратора. Теперь задача модели — лишь понять намерение пользователя и вызвать нужный инструмент с правильными правильными параметрами. Тесты на четырех платформах, включая три коммерческие топовые модели, подтвердили диагноз: если «голые» LLM выдавали разброд в цифрах при четырех идентичных запусках, то подход с типизированным посредничеством обеспечил 100% повторяемость. Магия понимания языка теперь отделена от истины, которая по-прежнему живет в верифицируемом коде.

Помимо борьбы с галлюцинациями, вынос логики из облака на локальную инфраструктуру решает застарелую проблему проприетарных данных. Эммануэль Стратакис и его группа указывают на очевидное: научное оборудование часто генерирует закрытые бинарные форматы или требует лицензионного софта, который невозможно или запрещено переносить в облако. Используя модель как медиатора для локальных инструментов, компании наконец-то могут перестать «кормить» облачных провайдеров секретными разработками. По данным шестимесячного пилота в действующих лабораториях, такой подход сокращает время анализа данных с недель до минут. При этом за пределами заранее описанных инструментов творческий поиск может пострадать от жестких рамок типизации, но это малая цена за избавление от цифровых фантазий.

Для бизнеса этот сдвиг означает смену парадигмы: ценность ИИ в R&D теперь измеряется не абстрактным «интеллектом» модели, а качеством и специфичностью API-инструментов, которыми она управляет. Мы наблюдаем закат мечты об автономном цифровом ученом и рождение высокоскоростного верифицируемого диспетчера. Если вы не можете провести аудит пути, которым ИИ пришел к расчету, такой расчет бесполезен для материаловедения или физики. Будущее корпоративного ИИ — это строительство надежных клеток (типизированных инструментов), которые удержат стохастическую природу языковых моделей от отравления данных.

Источник: arXiv cs.AI →

Оцените материал

★ ★ ★ ★ ★

Большие языковые моделиИИ в бизнесеБезопасность ИИЛокальный ИИFORTH

Конец эпохи цифровых галлюцинаций: как заставить ИИ работать в научных R&D