Semianalysis:智能体火爆,CPU成为新的“AI瓶颈”
(来源:网易科技)
随着AI智能体和强化学习(RL)的爆发式增长,原本在AI浪潮初期被边缘化的通用处理器(CPU),正遭遇前所未有的算力挤兑,成为继GPU之后新的基础设施瓶颈。
近期,随着各大科技巨头财报陆续落地,市场对AI基础设施的关注点正在发生微妙转移。投资者不仅紧盯GPU的订单与交付,更开始寻找AI应用落地带来的新增长极。
4月8日,知名半导体分析机构SemiAnalysis首席分析师Dylan Patel在一次深度访谈中指出,由于AI工作负载的范式正在从简单的文本生成向复杂的“智能体(Agents)”和“强化学习(RL)”演进,CPU正面临极其严重的产能短缺。
在AI发展的头几年,核心算力需求几乎全被GPU占据。正如Dylan Patel所言:“在AI的头几年,CPU确实严重滞后……负载很轻。你发一个字符串,它回一个字符串,简单的推理,对CPU需求不大。”
然而,这一局面在过去几个月里发生了颠覆性的变化,核心驱动力正是以OpenAI o1为代表的具备逻辑推理和智能体属性的新一代模型。
智能体与强化学习推升CPU需求
模型不再仅仅是“生成文本”,而是开始自主执行任务、调用数据库并自我验证,这让CPU的工作量呈指数级上升。
Dylan Patel给出了一个极具冲击力的数据:
与此同时,强化学习的训练循环变得越来越紧密。未来的AI不仅要做数学题,还要在物理模拟器中导航,这要求生成器(模型)生成的每一步都需要在CPU集群上进行高频验证。
云厂商疯狂扩容,微软“卖空”CPU已致GitHub不稳
市场需求的骤增直接导致了云端算力的枯竭。为了满足头部AI实验室的需求,大型云厂商甚至牺牲了其他业务的稳定性。Dylan Patel直言:
这种短缺正在逼迫企业进行极端的工程迁移。据透露,OpenAI此前几乎只在x86 CPU上运行,但为了获得算力,他们直接向亚马逊要存量处理器。
关于CPU的市场价格,Dylan Patel说道:
从数据来看,扩容正在全行业上演。“亚马逊安装的CPU服务器数量,今年比去年同比增长了3倍。到处都没有容量了。”
此外,为了不让昂贵的GPU闲置等待,客户必须保持CPU“热池”持续运行,这种商业逻辑进一步放大了对CPU的需求。
硬件淘金热蔓延:存储暴涨,3nm产能全线告急
算力的短缺已经沿着产业链迅速向上传导,不仅英特尔和AMD发出了涨价通知,甚至连面向C端的PC市场也受到波及(如苹果Mac mini脱销)。
Dylan Patel用一句极其生动的话形容当下的硬件市场:
他补充了市场高度关注的存储和芯片制造环节的涨价数据:
更令市场担忧的是晶圆代工产能的挤压。AI芯片正在吸干台积电的最先进制程产能:
这甚至迫使苹果、高通等移动端巨头向下迁移,或者让英伟达将部分订单转移至三星。