Флагманские модели от OpenAI, Anthropic и Google уперлись в потолок возможностей, когда дело дошло до серьезных финансов. Согласно отчету AIA Labs хедж-фонда Bridgewater и лаборатории Thinking Machines Lab, которую основала экс-CTO OpenAI Мира Мурати, коммерческие гиганты вроде GPT и Claude с треском провалили внутренние тесты на профпригодность. На базовых промптах их точность болталась в районе 50%, а после «накачки» экспертными инструкциями едва доползла до середины 70-х при необходимом минимуме в 80%. Проблема фундаментальна: специфическая финансовая экспертиза и логика принятия решений Bridgewater никогда не были частью публичного интернета, на котором обучали массовые нейросети.

Ставка на открытые веса и кастомную настройку

Вместо того чтобы ждать милости от Альтмана, команда Bridgewater выбрала модель с открытыми весами Qwen3-235B. Используя платформу Tinker, эксперты фонда провели тонкую настройку на собственных данных и внедрили многоуровневую систему оценки документов. Результат — 84,7% точности, что делает этот «самосбор» пригодным для реальной работы, в отличие от галлюцинирующих универсальных моделей. Кейс наглядно демонстрирует: владение проприетарными данными и ручная разметка экспертами бьют любой «черный ящик», лишенный отраслевых нюансов. Более того, отчет фиксирует закон убывающей отдачи для Frontier-моделей: например, условная GPT 5.4 обходится на 43% дороже версии 5.2 при едва заметном приросте качества.

Экономика суверенитета данных теперь выглядит убедительнее любых маркетинговых лозунгов.

Эксплуатация кастомной модели Bridgewater обходится почти в 14 раз дешевле, чем аренда топовых коммерческих API. Выбирая открытые веса, компания сохраняет полный контроль над своими алгоритмами, данными и оборудованием, не рискуя скормить свою интеллектуальную собственность в общую топку облачных сервисов, где ее может использовать конкурент.

План действий для бизнеса

Проведите аудит вашего текущего стека и выделите процессы, где универсальные модели не дотягивают до планки точности в 80%. Если узким местом является специфический опыт, которого нет в открытом доступе, прекратите сжигать бюджет на дорогостоящие токены OpenAI. Рациональнее перенаправить эти средства на дообучение моделей с открытыми весами, таких как Qwen3-235B, на ваших внутренних логах принятия решений.

ИИ в финансахОпенсорс ИИДообучение моделейСнижение затратBridgewater