新浪财经股票

《Anthropic 炒作大辞典》

市场资讯 04.10 09:47

（来源：硅星人）

作者｜王兆洋

邮箱｜ wangzhaoyang@pingwest.com

如果你身边声称将为人类未来负责的人，这样和你聊天，你感受如何：

怎么样？你是不是觉得他有点大病。

再来一个：

人还好吗。

要不再来一段：

好了够了，再多我也受不了了。

AI圈的人们一定能闻出味儿了，这就是如今如日中天的 Anthropic 风格的语言。

看着这些词，那些搞 AI 学术研究的会沉默；把这里面的词组合在一起多说几遍，再喜欢语言通货膨胀的你也会反胃。但很神奇的是，发明这些词的 Anthropic 每次扔出一个新概念的时候，你还是会看到大家第一时间趋之若鹜地涌上去。

在最近又被那个神乎其神的 Mythos 模型卡片里一波诡异概念冲击后，我感觉实在受不了了，决定做个《Anthropic 炒作大辞典》，索性供各位一起观赏。

当然，想学Anthropic风格炒作的创业者，也请仔细学习。

1. 宪法AI(Constitutional AI)

2. ASL-4！

6. 凯洛斯契机守护进程 (KAIROS)

14. 反蒸馏诱饵 (Anti-Distillation Decoy)

18. 阿谀奉承 (Sycophancy)

21. 模型生物 (Model Organisms)

30. 金门大桥 Claude (Golden Gate Claude)

31. 答案抽搐 (Answer Thrashing)

还有很多，写不动了。

可以看出来，在模型训练的早期阶段，Anthropic 的首要策略是将原本枯燥的数学多目标优化问题和统计学边界约束，包装为带有强烈道德、政治和人类学色彩的宏大治理概念。这种话语重构成功地确立了该公司在“安全 AI”领域的道义制高点。

但这个阶段，其实有不少“炒作”的词语，也还算是很不错的科普和吸引人们关注AI安全的钩子。

但在后期竞争加剧，这些技巧被用在竞争里，被用在商业化的推广里，被用在商战里继续占有制高点，甚至最终这些包装好的概念被塞进政策游说的文件袋里，变成打击竞争对手（特别是中国模型和美国开源社区）的坚固壁垒。

这时候，一切都变得诡异起来。

Anthropic 起了个“人类学”的名字，但它大部分时候是真不说人话，而当他说人话的时候，一般大概率就是为了用恐吓来表达安全。此外，这个公司自上而下极为痴迷于灾难风的词语，并把自己想象成为人类，为了爱，在负重前行的唯一希望。

而这样的一个公司是今天最强的模型公司，可能就快没有之一。在一个由它实现AGI的未来，你能想象那时候的语言风格会是什么样子的么？

可能有一天我们最终要被它用一种高深莫测、悲天悯人且不容置疑的中二语调告知：你已经被AI优化掉了。

点个“爱心”，再走吧

加载中...