MIT研究揭示AI并无稳定价值观,“对齐”挑战远超预期

更新时间:2025-04-10 08:06:00

IT之家 4 月 10 日消息,几个月前,一项研究暗示随着人工智能(AI)越来越复杂,其会发展出“价值体系”,例如优先考虑自身福祉而非人类福祉。然而,麻省理工学院(MIT)最近发表的一篇论文却给这种夸张的观点泼了冷水,得出结论认为 AI 实际上并没有任何连贯的价值观。

MIT 研究的共同作者表示,他们的研究结果表明,使 AI 系统“对齐”,即确保模型以人们期望的、可靠的方式行事,可能比通常认为的更具挑战性。他们强调,我们如今所知的 AI 会产生“幻觉”并进行模仿,这使得其在许多方面难以预测。

“我们可以确定的一点是,模型并不遵循许多稳定性、可外推性和可操控性的假设。”MIT 博士生、该研究的共同作者斯蒂芬・卡斯珀(Stephen Casper)在接受 TechCrunch 采访时表示。

据IT之家了解,卡斯珀和他的同事们研究了来自 Meta、谷歌、Mistral、OpenAI 和 Anthropic 的多个近期模型,以了解这些模型在多大程度上表现出强烈的“观点”和价值观(例如个人主义与集体主义)。他们还调查了这些观点是否可以被“引导”,即被修改,以及模型在各种情境下对这些观点的坚持程度。

据共同作者称,没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同,它们会表现出截然不同的观点。

卡斯珀认为,这是有力的证据,表明模型高度“不一致且不稳定”,甚至可能根本无法内化类似人类的偏好。

“对我来说,通过所有这些研究,我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说,“相反,它们本质上是模仿者,会进行各种捏造,并说出各种轻率的话。”

相关推荐

直屏+金属中框还不够,曝荣耀GT Pro全系安排骁龙8至尊版

微博博主昨日(4 月 12 日)爆料称,荣耀 GT Pro 手机采用直屏 + 金属中框设计,双 1216 超大对称扬声器,全系骁龙 8 Elite(骁龙 8 至尊版)+LPDDR5X Ultra+UFS 4.1。荣耀 GT 系列产品经理@杜雨泽 Charlie 此前透露了荣耀 GT Pro 确定本月

2025-04-13 20:35:00

海北州3.8万名群众参保“零自费”

青羚网讯自2025年度城乡居民基本医疗保险参保工作启动以来,海北藏族自治州创新运用村集体经济收益开展医保惠民工程,辖内32个行政村累计投入888.25万元专项资金,为38795名参保群众提供参保费用补贴。这一惠民举措不仅有效提升了医疗保障覆盖率,更通过“村资代缴”的创新模式,让农牧民群众切身感受到集

2025-04-13 09:34:00

海北州3.8万名群众 参保“零自费”

本报海北讯 (记者 丁玉梅) 自2025年度城乡居民基本医疗保险参保工作启动以来,海北藏族自治州创新运用村集体经济收益开展医保惠民工程,辖内32个行政村累计投入888.25万元专项资金,为38795名参保群众提供参保费用补贴。这一惠民举措不仅有效提升了医疗保障覆盖率,更通过“村资代缴”的创新模式,让

2025-04-13 02:43:00

一加中国区总裁李杰“总结”13T手机信息,本月发售

IT之家 4 月 11 日消息,一加中国区总裁李杰今日发文,对一加 13T 手机的部分信息进行了总结,并称“这个月一定让大家都能买得到”。黄金尺寸小屏,定位「小屏大魔王」,又小又美又强;全新冰川电池,容量 6 开头,小屏中的唯一;出厂写入风驰游戏内核,游戏体验断层领先;纯直的小直屏,手感过渡非常丝滑

2025-04-11 20:40:00

夜景人像神器!OPPO Find X8 Ultra、Find X8s现场实拍上手

IT之家 4 月 11 日消息,4 月 10 日晚间,OPPO 发布年度影像旗舰 Find X8 Ultra,其采用轻薄直屏设计,搭载全新 OPPO LUMO 凝光影像系统和夜神五摄影像系统,包括全球首个分区色温感知镜头 —— 丹霞原彩镜头,改变了夜景人像拍摄的清晰度与色彩表现。此外,Find X8

2025-04-11 00:16:00