全球超节点争霸：单机柜级640卡ScaleX640分析

架构师技术联盟

2025.11.1308:43

关注

中科曙光正式发布了全球首个单机柜级640卡超节点产品 —— scaleX640。ScaleX640 超节点采用“一拖二”高密架构设计，单机柜可实现 640 卡超高速总线互联，构建大规模、高带宽、低时延的超节点通信域，双 ScaleX640 超节点可组成 1280 卡计算单元，单机柜算力密度提升 20 倍，在 MoE 万亿参数大模型训练推理场景中，性能较传统方案提升 30-40%。

1、全球首个单机柜级 640 卡超节点 scaleX640

“单机柜级 640 卡”指在一个标准机柜内部集成约 640 张加速卡（GPU／加速器）以构建高密度、高性能算力节点。中科曙光的 scaleX640 超节点是公司在 AI 算力基础设施领域的革命性产品，其核心突破在于高密度集成和高效能互联。

“超节点”（Super Node）在当前 AI 与智算基础设施领域用来指将几十至数百（甚至数千）颗 AI 加速卡／芯片，通过高带宽、低时延的互联架构整合为一个逻辑统一的大规模算力单元。

2、曙光 scaleX640 与国内外主要超节点方案对比

目前除中科曙光 scaleX640 “超节点/单柜高密算力方案”之外，国内外主要的超节点方案还包括华为昇腾 384、阿里磐久 AL128、NVIDIA DGX/SuperPOD 系列等，各家方案在卡数密度、互联拓扑、冷却方式、是否支持多品牌卡与软件生态几方面存在明显差异。

总体上来看，scaleX640（中科曙光）在“单柜密度”上处于领先地位，并且其采用了先进的相变浸没式液冷技术，开放了多品牌支持以提供较高的兼容性，有利于国内客户打造高密自研 /自控算力，适用于国内希望以高密度降低训练时延和提升吞吐的客户。

3、曙光 scaleX640 的技术突破与核心优势

具体而言，scaleX640 采用了“一拖二”的高密度架构设计，在单个机柜内实现了 640 张计算卡之间的超高速总线互连，构建出大规模、高带宽、低延迟的超级节点通信域。这一设计使得单机柜的算力密度提升了高达二十倍，标志着算力集成技术取得了重大进展。更进一步，双 scaleX640 超级节点可以组合形成千卡级别的计算单元。产品已通过超过三十天的长期稳定运行可靠性测试，验证了其支持十万卡级别超大规模集群扩展部署的能力，为未来人工智能大模型的持续演进预留了充分的算力增长空间。

在性能表现方面，测试数据表明，scaleX640 相比业界同类产品实现了算力性能的成倍提升。在实际应用场景中，其表现尤为突出，能够将混合专家模型（MoE）的万亿参数级大模型训练和推理效率提升百分之三十至四十。对于通常需要数周时间完成训练的大模型而言，这一效率的提升直接转化为时间与成本的显著节约，使得人工智能研发团队能够以更快的速度进行模型迭代、验证假设并部署应用。

在显著提升算力密度的同时，scaleX640 通过创新性地应用浸没相变液冷技术和高压直流供电系统，实现了能效比的质的飞跃。这不仅大幅降低了数据中心的电能使用效率值，更直接削减了运营成本，使得大规模人工智能算力部署在经济层面具备了可持续性。