新浪财经 股票

《Anthropic 炒作大辞典》

市场资讯 04.10 09:47

(来源:硅星人)

作者 | 王兆洋

邮箱 | wangzhaoyang@pingwest.com

如果你身边声称将为人类未来负责的人,这样和你聊天,你感受如何:

怎么样?你是不是觉得他有点大病。

再来一个:

人还好吗。

要不再来一段:

好了够了,再多我也受不了了。

AI圈的人们一定能闻出味儿了,这就是如今如日中天的 Anthropic 风格的语言。

看着这些词,那些搞 AI 学术研究的会沉默;把这里面的词组合在一起多说几遍,再喜欢语言通货膨胀的你也会反胃。但很神奇的是,发明这些词的 Anthropic 每次扔出一个新概念的时候,你还是会看到大家第一时间趋之若鹜地涌上去。

在最近又被那个神乎其神的 Mythos 模型卡片里一波诡异概念冲击后,我感觉实在受不了了,决定做个《Anthropic 炒作大辞典》,索性供各位一起观赏。

当然,想学Anthropic风格炒作的创业者,也请仔细学习。

1. 宪法AI(Constitutional AI)

2. ASL-4!

6. 凯洛斯契机守护进程 (KAIROS)

14. 反蒸馏诱饵 (Anti-Distillation Decoy)

18. 阿谀奉承 (Sycophancy)

21. 模型生物 (Model Organisms)

30. 金门大桥 Claude (Golden Gate Claude)

31. 答案抽搐 (Answer Thrashing)

还有很多,写不动了。

可以看出来,在模型训练的早期阶段,Anthropic 的首要策略是将原本枯燥的数学多目标优化问题和统计学边界约束,包装为带有强烈道德、政治和人类学色彩的宏大治理概念。这种话语重构成功地确立了该公司在“安全 AI”领域的道义制高点。

但这个阶段,其实有不少“炒作”的词语,也还算是很不错的科普和吸引人们关注AI安全的钩子。

但在后期竞争加剧,这些技巧被用在竞争里,被用在商业化的推广里,被用在商战里继续占有制高点,甚至最终这些包装好的概念被塞进政策游说的文件袋里,变成打击竞争对手(特别是中国模型和美国开源社区)的坚固壁垒。

这时候,一切都变得诡异起来。

Anthropic 起了个“人类学”的名字,但它大部分时候是真不说人话,而当他说人话的时候,一般大概率就是为了用恐吓来表达安全。此外,这个公司自上而下极为痴迷于灾难风的词语,并把自己想象成为人类,为了爱,在负重前行的唯一希望。

而这样的一个公司是今天最强的模型公司,可能就快没有之一。在一个由它实现AGI的未来,你能想象那时候的语言风格会是什么样子的么?

可能有一天我们最终要被它用一种高深莫测、悲天悯人且不容置疑的中二语调告知:你已经被AI优化掉了。

点个爱心,再走 吧

加载中...