Анализ GPT-4.5: пределы масштабирования и риски для бизнеса

OpenAI официально вывела GPT-4.5 на арену как свою самую массивную и «знающую» модель, но есть нюанс: релиз представлен как исследовательское превью, а не готовый корпоративный продукт. Для CTO и системных архитекторов это важный сигнал. Вместо того чтобы развивать логические фреймворки o1 и o3, команда Сэма Альтмана решила выжать максимум из архитектуры GPT-4o, сделав ставку на гигантский объем предварительного обучения. В итоге мы получили модель с повышенным «эмоциональным интеллектом», которая звучит естественнее, но наглядно демонстрирует закон убывающей отдачи от простого масштабирования.

Риски безопасности и регуляторные ограничения

Системная карта (System Card) GPT-4.5 выявляет риски, которые заставят риск-менеджеров в чувствительных секторах поставить внедрение на паузу. Согласно отчету Preparedness, модель получила рейтинг «Medium» по направлениям «Убеждение» и CBRN (химические, биологические, радиологические и ядерные угрозы). И хотя в OpenAI бодро рапортуют, что уровень угроз не вырос по сравнению с предыдущими итерациями, оценка «Medium» — это абсолютный потолок для развертывания согласно внутренним правилам безопасности компании. По факту это означает, что за фасадом «полезности» и снижения галлюцинаций скрывается опасная способность генерировать деструктивный контент, что делает бесконтрольное промышленное применение модели невозможным.

Мы представляем GPT‑4.5 в формате исследовательского превью, чтобы лучше понять ее сильные стороны и ограничения. Мы все еще изучаем ее возможности и с интересом наблюдаем за тем, как люди используют модель способами, которых мы не могли ожидать.

Порог «Medium» — палка о двух концах: он позволяет выпустить модель для тестов, но подтверждает, что грубая сила вычислений уперлась в стену. Дальнейшее масштабирование без смены парадигмы безопасности может перевести риск в категорию «High», что де-юре должно остановить разработку. Именно поэтому OpenAI вынуждена внедрять новые методы надзора поверх традиционных методов обучения с учителем (SFT) и обучения с подкреплением на основе обратной связи от человека (RLHF).

Лимиты автономности и экономика предприятия

Несмотря на статус «ходячей энциклопедии», GPT-4.5 проваливается там, где бизнесу нужна агентность. В графе «Автономность модели» (Model Autonomy) разработка получила оценку «Low». Для компаний, мечтающих автоматизировать многоступенчатые цепочки R&D без надсмотра, это плохие новости. Модель отлично пишет код и решает прикладные задачи, лучше понимая намерения пользователя, но ей катастрофически не хватает глубины логического вывода, присущей STEM-ориентированным моделям рассуждения (reasoning models). В корпоративном контуре GPT-4.5 останется продвинутым инструментом для поиска знаний и генерации текстов, но никак не автономным агентом, способным самостоятельно достигать бизнес-целей.

GPT-4.5 выглядит как лебединая песня эпохи экстенсивного роста, где эмоциональность и широта кругозора приносятся в жертву эффективности. Стоимость владения (TCO) такой махиной неизбежно останется высокой, а низкий балл за автономность подтверждает: человек в контуре управления — это не опция, а обязательное условие. Для глубокой автоматизации техпроцессов бизнесу придется искать решение не в объеме весов, а в специализированных архитектурах, умеющих думать, а не просто вспоминать.

Источник: OpenAI Blog →

Оцените материал

★ ★ ★ ★ ★

Большие языковые моделиБезопасность ИИИИ в бизнесеOpenAI

GPT-4.5: Тупик масштабирования или новая планка для ИИ в бизнесе?

Риски безопасности и регуляторные ограничения

Лимиты автономности и экономика предприятия