Nvidia снова напомнила о своих амбициях, установив новые рекорды на MLPerf Inference v6.0. Компания отчиталась о достижениях с новейшими моделями, такими как DeepSeek-R1 и GPT-OSS-120B, на системе из 288 GPU. Заявляется, что благодаря программным инновациям, включая Nvidia Dynamo и Multi-Token Prediction, пропускная способность почти удвоилась, а затраты на генерацию токенов сократились более чем на 60%. Независимое подтверждение таких впечатляющих цифр, разумеется, покажет только время, но пока — циферки выглядят впечатляюще.
Прямое сравнение этих достижений с предложениями AMD и Intel — задача нетривиальная. Производители используют разные подходы к тестированию и метрики. AMD, например, делает ставку на свои 8-GPU конфигурации, при этом не всегда раскрывая полные результаты по всем моделям, в отличие от Nvidia. Intel же концентрируется на рынке GPU для рабочих станций, демонстрируя приверженность этому сегменту, а не прямую конкуренцию в массовых серверных решениях. Стоит отметить и отсутствие в некоторых категориях бенчмарка таких гигантов, как Google с их TPU, или специализированных компаний вроде Cerebras. Это лишь подчеркивает фрагментацию рынка, из-за которой вам придется самостоятельно разбираться в технологических стратегиях каждого вендора.
AMD и Intel, несмотря на абсолютное лидерство Nvidia в сырых показателях, предлагают альтернативные пути. AMD делает ставку на производительность своих 8-GPU узлов, что может оказаться экономически оправданным за счет более низкой цены за единицу вычислительной мощности при специфических рабочих нагрузках. Intel же укрепляет позиции в сегменте GPU для рабочих станций, где их решения могут предложить более выгодное соотношение цена/производительность для инженеров и дата-сайентистов, работающих локально. Выбор сводится к универсальному, но дорогому решению от лидера, или более сфокусированным, потенциально выгодным предложениям от конкурентов.
Почему это важно: Времена, когда простое превосходство в бенчмарках было решающим фактором при выборе железа для ИИ, уходят в прошлое. Результаты MLPerf от Nvidia впечатляют, но реальная ценность для вашего бизнеса будет определяться тем, насколько эти решения соответствуют вашим конкретным задачам, моделям и бюджету. Фрагментация рынка и разные стратегии производителей означают, что прямое сравнение на бумаге — уже недостаточный инструмент. Настало время для более глубокого анализа и подбора решений, исходя из собственных потребностей, а не только из рекламных цифр.