Amazon Web Services (AWS) решила отправить на свалку истории иерархические сетевые структуры, доминировавшие в дата-центрах с середины 80-х. Пока конкуренты пытаются выжать максимум из классических структур типа «толстое дерево» (fat-tree), команда Мэтта Редера, вице-президента AWS по сетевому инжинирингу, внедрила в эксплуатацию квазирандомную топологию. Технология, получившая название Resilient Network Graphs (RNG), переводит управление данными из жесткой структуры в состояние управляемого хаоса, что на практике означает конец эпохи заторов в кластерах.
Главное в технологии RNG
Устранение узких мест при синхронизации весов моделей с триллионами параметров. Прямое соединение узлов через математически выверенную случайность вместо жестких слоев коммутаторов. Использование ShuffleBox — специализированного оборудования для управления сложной кабельной инфраструктурой. Радикальное снижение энергопотребления за счет сокращения числа промежуточных переходов сигнала.
«Масштабирование случайных графов до уровня промышленного гиганта — это технологический прорыв, который раньше буксовал на стадии теоретических препринтов», — подтверждает профессор Брайтен Годфри из Иллинойсского университета.
Экономика и эффективность для ИИ
Экономическая выгода здесь куда весомее маркетинговых лозунгов. Прямое снижение затрат на электричество и ускорение обмена данными между графическими процессорами (GPU) дают Amazon то самое «инфраструктурное плечо», которое необходимо в гонке за снижение стоимости обучения больших языковых моделей (LLM). Хотя Редер осторожно замечает, что сейчас RNG оптимизирована под общие задачи дата-центров, потенциал для обучения генеративного ИИ очевиден: чем меньше вертикальных уровней проходит сигнал, тем быстрее и дешевле строится интеллект.
Развернутая с конца прошлого года система доказывает, что Amazon перешла от экспериментов к промышленному доминированию в облачной инфраструктуре. Пока Microsoft и Google полируют свои «наследия», AWS фактически переписала правила экономики перемещения данных. Конкурентам придется либо признать эффективность «сетевого хаоса», либо продолжать сжигать бюджеты на обслуживание устаревших жестких архитектур, которые просто не справляются с аппетитами современных нейросетей.