新浪科技

MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期

网易新闻

关注

IT之家 4 月 10 日消息,几个月前,一项研究暗示随着人工智能(AI)越来越复杂,其会发展出“价值体系”,例如优先考虑自身福祉而非人类福祉。然而,麻省理工学院(MIT)最近发表的一篇论文却给这种夸张的观点泼了冷水,得出结论认为 AI 实际上并没有任何连贯的价值观。

MIT 研究的共同作者表示,他们的研究结果表明,使 AI 系统“对齐”,即确保模型以人们期望的、可靠的方式行事,可能比通常认为的更具挑战性。他们强调,我们如今所知的 AI 会产生“幻觉”并进行模仿,这使得其在许多方面难以预测。

“我们可以确定的一点是,模型并不遵循许多稳定性、可外推性和可操控性的假设。”MIT 博士生、该研究的共同作者斯蒂芬・卡斯珀(Stephen Casper)在接受 TechCrunch 采访时表示。

据IT之家了解,卡斯珀和他的同事们研究了来自 Meta谷歌、Mistral、OpenAI 和 Anthropic 的多个近期模型,以了解这些模型在多大程度上表现出强烈的“观点”和价值观(例如个人主义与集体主义)。他们还调查了这些观点是否可以被“引导”,即被修改,以及模型在各种情境下对这些观点的坚持程度。

据共同作者称,没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同,它们会表现出截然不同的观点。

卡斯珀认为,这是有力的证据,表明模型高度“不一致且不稳定”,甚至可能根本无法内化类似人类的偏好。

“对我来说,通过所有这些研究,我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说,“相反,它们本质上是模仿者,会进行各种捏造,并说出各种轻率的话。”

【供需格局正发生新变化 稀土永磁板块投资机遇凸显】随着人形机器人行业快速发展,稀土永磁材料需求大增,板块投资机遇凸显。Wind数据显示,5月6日,万得稀土永磁概念指数大涨6.23%。分析人士认为,当前正处稀土板块基本面和情绪面共振时间点,稀土价格中枢提升,而权益端未充分反映,要足够重视板块的“战略性机会”。同时,人形机器人市场规模的爆发式增长预计将为稀土永磁行业带来广阔的增量空间。建议关注技术壁垒高、产能弹性大的稀土永磁企业。(中证报)

核电概念股Constellation Energy Corp.(CEG)收涨10%,创2月21日以来最大单日涨幅。

Palantir收跌12%,创一年来最差单日表现。

【供需格局正发生新变化 稀土永磁板块投资机遇凸显】随着人形机器人行业快速发展,稀土永磁材料需求大增,板块投资机遇凸显。Wind数据显示,5月6日,万得稀土永磁概念指数大涨6.23%。分析人士认为,当前正处稀土板块基本面和情绪面共振时间点,稀土价格中枢提升,而权益端未充分反映,要足够重视板块的“战略性机会”。同时,人形机器人市场规模的爆发式增长预计将为稀土永磁行业带来广阔的增量空间。建议关注技术壁垒高、产能弹性大的稀土永磁企业。(中证报)

核电概念股Constellation Energy Corp.(CEG)收涨10%,创2月21日以来最大单日涨幅。

热门评论

用户7757986744 1
没有意识的语言永远是傻子在说话,当真的人都是同类。
浙江杭州
回复TA

undefined

好的评论会让人崇拜
查看1条评论
请输入评论内容

举报成功

举报

请您选择举报的原因

说说你的看法

意见/建议 反馈入口
  • TOKEN
  • 标题/昵称
  • 反馈内容

已反馈成功~