马斯克反击“封闭”的OpenAI：开源全球最大参数模型

界面新闻

界面新闻官方账号 2024.03.1817:07

关注

界面新闻记者 | 赵一帆
界面新闻编辑 | 宋佳楠

作为对OpenAI闭源决策的直接反击，马斯克选择开源全球最大参数的大语言模型。

当地时间3月17日，马斯克旗下的人工智能初创公司“xAI”正式开源其大模型Grok-1。官网显示，该模型参数量高达3140亿，远超OpenAI GPT-3.5的1750亿，成为迄今为止全球参数量最大的开源模型。

“xAI”是由马斯克成立的汇集DeepMind、OpenAI等诸多公司原开发人员的小型初创公司，声称要构建一个良好的AGI（通用人工智能）。去年11月，该公司发布了其第一代大语言模型Grok，正式加入了全球大模型混战。

官网介绍称，此次发布的Grok-1是一个由“xAI”从头训练的混合专家模型，且没有针对任何特定应用（例如对话）进行微调。该公司在开源社区GitHub上提供了Grok-1的开放版本，截至发稿，该模型使用人数达到1900人，获得了约1.5万人的收藏。

Grok希望向外界传递的特点在于，它可以通过社交平台“X”（原推特）实时了解世界，并且能够回答许多其他人工智能系统拒绝答复的尖锐问题。但马斯克表示，这一服务只属于“X”订阅者，用户需要上交每月16美元的订阅费用才能访问Grok。

由于马斯克与OpenAI首席执行官山姆·奥特曼之间的较量日趋激烈化，Grok能否赶超GPT，自然也成为舆论关注的焦点。

“xAI”官网去年发布的一则博客显示，在计算推理等基本测试中，Grok-1超过了其计算类别中包括GPT-3.5的所有其他模型。猎豹移动董事长兼CEO傅盛也对界面新闻表示，“（Grok-1）总体来说水平很高，应该超过了ChatGPT，但不如GPT-4。”

更大参数量在提升模型性能的同时，也带来了高昂的训练和运行成本。

3140亿参数的模型复杂性极高，意味着需要更多的训练数据和服务器资源，而高昂的成本一定程度上会降低对业内人士的吸引力。傅盛对此也评价道，“一般公司是用不起的，就算是用，也得8张A100（英伟达芯片）才能勉强装下。”

此外，不同的任务类型还需要不同的数据，例如自然语言处理任务需要文本数据，图像识别任务则需要图像数据进行训练，这也进一步增加了训练模型的难度。

目前已经有多家公司推出了开源的基础模型，像在开源社区备受关注的Mistral AI，已经积累了一定量级的用户基础。一位应用层创业者告诉界面新闻，除非新模型在性能上带来显著飞跃，否则大多数从业者可能不会尝试更换或测试新模型。

知名机器学习研究者Sebastian Raschka也在社交平台表态称：“Grok-1比其他通常带有使用限制的开放权重模型更加开源，但它的开源程度不如Pythia、Bloom和OLMo，后者附带训练代码和可复现的数据集。”

马斯克曾是OpenAI的早期资助者和联合创始人，由于与奥特曼对OpenAI未来方向存在不同意见，2018年马斯克离开了这家公司，并在后续的时间里对OpenAI的某些决策持续表达批评。

自年初起，二人之间的裂痕不断扩大。马斯克认为OpenAI需要恢复开源，从而对OpenAI及其创始人提起诉讼。这位掌管着多家公司的CEO认为，OpenAI未致力于开源通用人工智能，而是变成了“微软的闭源子公司”。

面对马斯克的指控，OpenAI也迅速予以回击。

当地时间3月5日，OpenAI回应称，马斯克曾在2017年底同意OpenAI需要创建一个营利性实体，并希望获得多数股权和董事会控制权、担任首席执行官，但双方没有就营利性条款达成一致。也因此，马斯克在讨论过程中停止了注资。

回应还指出，马斯克曾在2016年的邮件中同意在分享AI应用成果的同时不一定要开源AI技术，意在表明马斯克“心口不一”。

“xAI”自成立后便一直被公众视为“OpenAI的竞争者”。马斯克将xAI视为大型人工智能公司的替代方案，但他也强调，该公司处于萌芽阶段，要赶上OpenAI和谷歌仍需时间。