xAI:从追赶Anthropic,到反向为其提供算力支撑
环球市场播报
SpaceX 旗下人工智能实验室 xAI 今年动荡不断,高管与核心人员频繁更迭,自研代码大模型进度滞后,不得已寻求外部外援以缩小和 Anthropic 的技术差距。
六位参与相关项目的业内人士透露,外界鲜有知情的是:长久以来 xAI 一直暗中紧盯 Anthropic,想方设法借鉴对方技术打磨自身产品;即便在 Anthropic 切断技术取用权限后,这类博弈仍在持续。正是这段纠葛不断的竞争关系,促成了如今 xAI 向 Anthropic 出租稀缺算力资源的合作。
近段时间接连受挫,市场开始质疑:即将上市的 SpaceX,未来重心究竟是深耕自研 AI,还是靠对外出租算力赚钱。来自 Anthropic 的大额算力租金,有效填补了 xAI 巨额亏损,而这家 AI 子公司的亏损也是 SpaceX 整体一季度业绩大幅走弱的重要诱因。
不过下周 SpaceX 即将冲击史上募资规模空前的 IPO,面对华尔街,公司把自身包装成高成长 AI 标的,自研面向企业与 C 端的 AI 产品被视作集团核心增长板块。
马斯克近日在 X 平台多次表态,和 Anthropic 的算力合作只是短期安排。他在周二发文解释:之所以约定短期合作,是 “预判未来某一刻我们需要收回自用算力”。
马斯克 2023 年创立 xAI,目标直指 OpenAI 等头部 AI 企业,项目累计融资约 420 亿美元,囤积了海量 GPU 算力资源。但在代码大模型这条白热化赛道上,xAI 追赶 OpenAI、Anthropic 的短板暴露无遗。
xAI 虽在 2023 年上线对话机器人 Grok,但首款代码专用模型直到去年 8 月才落地,彼时 Anthropic 与 OpenAI 早已依托自研底座推出商业化成熟代码工具。
差不多同期,Anthropic 开始收紧竞品对自家技术的取用权限:当年 8 月关停 OpenAI 的 API 调用通道,对外媒《连线》称 OpenAI 技术人员违规利用其代码工具、违反服务协议;OpenAI 则辩称,借用竞品 API 做基准性能测试是行业通用惯例。
两名项目知情人士透露,即便 Anthropic 封杀了 OpenAI 等竞争对手,xAI 仍持续取用 Claude 模型输出内容,甚至耗时数月开展模型蒸馏项目,直接基于 Claude 生成数据训练自家代码大模型。
今年 1 月,xAI 联合创始人吴托尼对内通报:Anthropic 正式封禁企业对公 Claude 访问权限。但有知情者证实,部分 xAI 工程师改用个人账户继续调用 Claude,后续 Anthropic 陆续关停了大批关联个人账户。
xAI 还借助 Blackbox AI 中转服务商,通过其加密通道调取别家 AI 模型。两名业内人士表示,就在 5 月中旬,xAI 仍在依托该平台调用 Anthropic 模型,用于基准测评等研发工作;Blackbox AI 未就采访请求予以回复。
马斯克曾在和 OpenAI 的官司庭审中公开承认:xAI 训练 Grok 时确实 “部分参考了 OpenAI 模型”,并称该做法在行业内十分普遍。但马斯克与 xAI 始终没有披露,公司究竟多大程度使用过 Anthropic 技术、以及员工绕开封禁的各类变通手段。
除了获取 Anthropic 技术的渠道接连受阻,近几月 xAI 还遭遇重大研发事故:项目工作人员透露,一次数据迁移过程中,一名员工误删代码模型核心训练数据,损失量等同于团队两三周的全部研发成果。
xAI 官方暂未回应置评请求。
引入外部多方资源救场
一名项目亲历者透露,xAI 原本计划去年年底同步上线新版通用大模型与全新代码模型,最终计划落空,转而把代码能力整合进开发者平台 Grok Build,该产品于今年 5 月正式发布。
直接取用 Anthropic 模型的门路越来越窄,马斯克开始从外部招揽团队补齐代码研发短板。两名特斯拉工程师证实,今年早些时候,特斯拉技术团队率先拿到 Grok Build 内测版本,协助产品优化、反馈使用建议。
马斯克旗下关联企业的资本纽带也持续加深:特斯拉 1 月末宣布向 xAI 投资 20 亿美元;短短数日后,SpaceX 以 2500 亿美元估值完成对 xAI 的收购。收购落地后 xAI 出现大规模人事震荡,剩余八位联合创始人集体离职,同时伴随裁员与预算削减。
3 月马斯克对外透露,特斯拉将携手 xAI 落地名为 Macrohard 的智能办公代理项目,产品定位替代白领人力。三名知情人士称,当月特斯拉、SpaceX 技术高管密集到访 xAI 总部磋商合作,特斯拉自动驾驶、AI 基建、Dojo 超算团队陆续派驻人员入驻 xAI,支援 Macrohard 项目与算力基建研发。
此后马斯克召开内部会议,向员工透露将引入 Cursor、Mistral AI 两家企业的技术人才补齐研发缺口、加速落地产品,他直言自己十分忌惮 Claude 的技术领先优势。
会上明确分工:主打可定制开源模型的法国企业 Mistral 负责模型预训练,代码助手初创公司 Cursor 承接后训练、把基座模型打磨成商用产品,xAI 提供底层算力基础设施。
同时会议通报:是 Anthropic 主动找上门洽谈算力租赁,但马斯克向员工强调,xAI 不会转型沦为单纯的算力出租商。
但没过多久 xAI 战略转向:4 月官宣合作,向 Cursor 开放自有算力,支撑后者自研 Composer 代码模型;协议附带选择权,SpaceX 可在今年晚些时候斥资 600 亿美元全资收购 Cursor,如若放弃收购则需赔付 10 亿美元解约金。
5 月 xAI 敲定重磅大单:Anthropic 按月支付 12.5 亿美元,租用 xAI 数据中心绝大部分算力,首期合约锁定 6 个月,期满后转为月度灵活合约,任意一方可随时终止合作。
另一边,xAI 和 Mistral 的前期接洽没能落地正式合作。知情人士称,Mistral 高管 4 月中旬到访 xAI 总部磋商,几周后谈判中止;此前刚入职 xAI、牵头预训练业务的 Mistral 创始工程师德文德拉・查普洛特,5 月便匆匆离职。Mistral、Anthropic、Cursor 三方均未发表相关评论。
自落地 Cursor 合作以来,Cursor 首席执行官迈克尔・特鲁尔常驻 xAI 办公区,两家企业高频碰头同步研发进展、交换核心技术细节;合作落地后 xAI 开启新一轮工程师裁员。
一名内部人员透露,截至 5 月中旬,xAI 预训练团队仅剩不足 5 人,而去年同期团队规模超 20 人;短短数月内 Grok Code 项目接连换了四任负责人,最新一任负责人李贝贝已于 5 月离职。
SpaceX 的 AI 业务前路尚不明朗:公司 5 月末上线 Grok Build 平台,同步迭代视频、语音生成能力。SpaceX 在 IPO 招股书中表示,自有数据中心仍在持续训练下一代主力 Grok 大模型,但未披露正式上线时间。