英伟达:人工智能霸主之战还远未结束
作者 | Trading Places Research
编译 | 华尔街大事件
有一种说法认为,以英伟达公司(NASDAQ:NVDA )H100 数据中心 GPU为中心的人工智能(AI)数据中心热潮将为整个数据中心硬件生态系统带来提升——CPU、内存、存储和网络。
英伟达的黄金标准 GPU 服务器 DGX H100 确实发挥了一切作用。让我们看一下一些估计的组件成本:
他们使用了英特尔最昂贵的 2 款 CPU,而英特尔只获得了 2.4% 的组件成本。亚马逊的 AWS 就对这些服务器望而却步。他们在构建自己的服务器和数据中心方面拥有丰富的经验,可以跳过英伟达的加价。他们也可以选择不像英伟达那样把所有东西都做到极致,在 CPU、内存、网络或存储方面略微吝啬,但这可能会造成瓶颈。
把顶级 CPU 想象成同样的项目,只不过没有英伟达系列。一台 DGX H100 的价格,一台超分频器就能买到 10 台或更多真正优秀的 CPU 服务器。组件成本分配截然不同。
超大规模企业的资金预算并不是无限的,在未来的几个月和几年里,他们需要做出很多选择。在 CPU 方面,在 AWS 和阿里巴巴云的带动下,ARM 数据中心芯片正在取代英特尔和AMD的 x86 芯片。但对英特尔和AMD来说,更大的问题是10比1(或更高)的价格比,以及超大规模企业必须做出的取舍。
此外,DGX H100 服务器非常巨大,占了 8 个机架 "单元"。而 CPU 服务器只占 1-4 个单元。这意味着,在一个行业标准的 48 个单元的机架中,只能安装 6 台 DGX H100,从而取代 12-48 台 CPU 服务器。GPU 服务器不仅可能在预算上取代 CPU 服务器,还可能在物理占地面积上取代 CPU 服务器。
如果人工智能投资热潮持续下去,昂贵且占用空间的 GPU 计算将取代 CPU 计算。
有证据表明,这种情况已经发生。
纵观 x86 数据中心 CPU 公司,我们发现 AMD 在 2022 年获得了大量市场份额,尽管英特尔在 2023 年上半年夺取了部分市场份额。但这里的情况并不好,
原以为到 2023 年就会复苏,但上半年却又出现了下滑。这是因为 GPU 计算正在消耗云资本预算,取代 CPU 服务器。
这些图表上的线条看起来非常不同。让我们切换到市场份额:
在每家公司的最新报告中,英伟达几乎占数据中心总收入的 45%。一旦他们下周公布财报(预计8 月 23 日盘后发布),这应该会占多数。尽管英特尔拥有 DGX H100 CPU 合同,但他们在双方都受到了挤压。
英伟达拿走所有资金不仅仅影响了其他数据中心硬件公司。他们正在从自己的客户那里窃取利润。AWS 为我们提供了对大规模“云”最清晰的认识,我指的是可租用的计算和存储。
亚马逊季度报告
2022 年上半年,AWS 的营业利润率达到创纪录的 32%,此后便开始走下坡路。微软的智能云部门并没有让我们看到那么清晰的前景(他们将其与传统软件混合在一起)。英伟达也失去了多年的优势。目前,云计算公司面临着许多变化,资本预算有限,利润空间缩小。它们将不得不在人工智能投资热潮带来的增长与这些其他因素之间进行权衡。
有两种方式结束:
人工智能投资热潮消逝。人工智能的投资炒作周期可以追溯到 20 世纪 50 年代,而这可能是另一个投资炒作周期。
英伟达被颠覆,模型训练和推理的硬件成本结构急剧下降。整个技术领域都有巨大的动力来实现这一目标,并且大量资金投入到这项工作中。这并不意味着它很快就会发生。英伟达的护城河是他们从2005年开始开发的软件,最深的部分是CUDA。
亚马逊、微软、谷歌等云公司希望托管更便宜的人工智能硬件,但英伟达不希望如此,因为尽管租金成本非常高,但由于软件护城河,客户仍需要英伟达。自 2012 年以来,英伟达GPU 一直是人工智能的默认选择,这一点明天也不会改变。虽然 H100 的供应紧张,但云提供商必须与英伟达合作以确保获得足够的供应。
战线已经形成,但没有人会承认正在发生战争。