《Anthropic 炒作大辞典》
(来源:硅星人)
作者 | 王兆洋
邮箱 | wangzhaoyang@pingwest.com
如果你身边声称将为人类未来负责的人,这样和你聊天,你感受如何:
怎么样?你是不是觉得他有点大病。
再来一个:
人还好吗。
要不再来一段:
好了够了,再多我也受不了了。
AI圈的人们一定能闻出味儿了,这就是如今如日中天的 Anthropic 风格的语言。
看着这些词,那些搞 AI 学术研究的会沉默;把这里面的词组合在一起多说几遍,再喜欢语言通货膨胀的你也会反胃。但很神奇的是,发明这些词的 Anthropic 每次扔出一个新概念的时候,你还是会看到大家第一时间趋之若鹜地涌上去。
在最近又被那个神乎其神的 Mythos 模型卡片里一波诡异概念冲击后,我感觉实在受不了了,决定做个《Anthropic 炒作大辞典》,索性供各位一起观赏。
当然,想学Anthropic风格炒作的创业者,也请仔细学习。
1. 宪法AI(Constitutional AI)
2. ASL-4!
6. 凯洛斯契机守护进程 (KAIROS)
14. 反蒸馏诱饵 (Anti-Distillation Decoy)
18. 阿谀奉承 (Sycophancy)
21. 模型生物 (Model Organisms)
30. 金门大桥 Claude (Golden Gate Claude)
31. 答案抽搐 (Answer Thrashing)
还有很多,写不动了。
可以看出来,在模型训练的早期阶段,Anthropic 的首要策略是将原本枯燥的数学多目标优化问题和统计学边界约束,包装为带有强烈道德、政治和人类学色彩的宏大治理概念。这种话语重构成功地确立了该公司在“安全 AI”领域的道义制高点。
但这个阶段,其实有不少“炒作”的词语,也还算是很不错的科普和吸引人们关注AI安全的钩子。
但在后期竞争加剧,这些技巧被用在竞争里,被用在商业化的推广里,被用在商战里继续占有制高点,甚至最终这些包装好的概念被塞进政策游说的文件袋里,变成打击竞争对手(特别是中国模型和美国开源社区)的坚固壁垒。
这时候,一切都变得诡异起来。
Anthropic 起了个“人类学”的名字,但它大部分时候是真不说人话,而当他说人话的时候,一般大概率就是为了用恐吓来表达安全。此外,这个公司自上而下极为痴迷于灾难风的词语,并把自己想象成为人类,为了爱,在负重前行的唯一希望。
而这样的一个公司是今天最强的模型公司,可能就快没有之一。在一个由它实现AGI的未来,你能想象那时候的语言风格会是什么样子的么?
可能有一天我们最终要被它用一种高深莫测、悲天悯人且不容置疑的中二语调告知:你已经被AI优化掉了。
点个“爱心”,再走 吧