新浪财经

全球超节点争霸:单机柜级640卡ScaleX640分析

架构师技术联盟

关注

中科曙光正式发布了全球首个单机柜级640卡超节点产品 —— scaleX640。ScaleX640 超节点采用“一拖二高密架构设计,单机柜可实现 640 卡超高速总线互联,构建大规模、高带宽、低时延的超节点通信域,双 ScaleX640 超节点可组成 1280 卡计算单元,单机柜算力密度提升 20 倍,在 MoE 万亿参数大模型训练推理场景中,性能较传统方案提升 30-40%。

1、全球首个单机柜级 640 卡超节点 scaleX640

“单机柜级 640 卡”指在一个标准机柜内部集成约 640 张加 速卡(GPU/加速器)以构建高密度、高性能算力节点。中科曙 光的 scaleX640 超节点是公司在 AI 算力基础设施领域的革命 性产品,其核心突破在于高密度集成和高效能互联。

“超节点”(Super Node)在当前 AI 与智算基础设施领域用来 指将几十至数百(甚至数千)颗 AI 加速卡/芯片,通过高带 宽、低时延的互联架构整合为一个逻辑统一的大规模算力单元。

2、曙光 scaleX640 与国内外主要超节点方案对比

目前除中科曙光 scaleX640 “超节点/单柜高密算力方案”之 外,国内外主要的超节点方案还包括华为昇腾 384、阿里磐久 AL128、NVIDIA DGX/SuperPOD 系列等,各家方案在卡数密度、 互联拓扑、冷却方式、是否支持多品牌卡与软件生态几方面存 在明显差异。

总体上来看,scaleX640(中科曙光)在“单柜密度”上处于领 先地位,并且其采用了先进的相变浸没式液冷技术,开放了多 品牌支持以提供较高的兼容性,有利于国内客户打造高密自研 /自控算力,适用于国内希望以高密度降低训练时延和提升吞吐 的客户。

3、曙光 scaleX640 的技术突破与核心优势

具体而言,scaleX640 采用了“一拖二”的高密度架构设计,在单个机柜内实现了 640 张计算卡之间的超高速总线互连,构建出大规模、高带宽、低延迟的超级节点通信域。这 一设计使得单机柜的算力密度提升了高达二十倍,标志着算力集成技术取得了重大进展。 更进一步,双 scaleX640 超级节点可以组合形成千卡级别的计算单元。产品已通过超过三十 天的长期稳定运行可靠性测试,验证了其支持十万卡级别超大规模集群扩展部署的能力, 为未来人工智能大模型的持续演进预留了充分的算力增长空间。 

在性能表现方面,测试数据表明,scaleX640 相比业界同类产品实现了算力性能的成倍 提升。在实际应用场景中,其表现尤为突出,能够将混合专家模型(MoE)的万亿参数级大 模型训练和推理效率提升百分之三十至四十。对于通常需要数周时间完成训练的大模型而言,这一效率的提升直接转化为时间与成本的显著节约,使得人工智能研发团队能够以更 快的速度进行模型迭代、验证假设并部署应用。 

在显著提升算力密度的同时,scaleX640 通过创新性地应用浸没相变液冷技术和高压直 流供电系统,实现了能效比的质的飞跃。这不仅大幅降低了数据中心的电能使用效率值, 更直接削减了运营成本,使得大规模人工智能算力部署在经济层面具备了可持续性。

加载中...