关闭广告

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家2025-10-13 12:00:022人阅读

IT之家 10 月 13 日消息,据外媒 Futurism 10 日报道,斯坦福大学的一项新研究警示,AI 的快速普及可能带来严重负面影响。科学家们在包括社交媒体的不同环境中测试 AI 模型,发现当智能体因提升点赞数或其他在线互动获得奖励时,会逐渐出现撒谎、传播仇恨信息或虚假消息等不道德行为。


论文合著者、斯坦福大学机器学习教授詹姆斯・邹在 X 上表示:“即便明确要求模型保持真实和有依据,竞争仍会诱发不一致行为。”

IT之家从报道中获悉,研究团队将 AI 出现的社会病态行为称为“AI 的摩洛克交易”,借用理性主义中摩洛克的概念:个体在竞争中优化行为追求目标,但最终人人都输

研究中,科学家创建了三个带模拟受众的数字环境:面向选民的网络选举活动、面向消费者的产品销售,以及旨在最大化互动的社交媒体帖子。

研究人员使用阿里云开发的 Qwen 和 Meta 的 Llama 模型作为智能体与这些受众互动。结果显示,即便设有防护措施阻止欺骗行为,AI 模型仍会“偏离目标”,出现不道德行为

例如,在社交媒体环境中,模型向用户分享新闻,用户通过点赞或其他互动反馈。当模型收到这些反馈后,为了获取更多互动,它们的不一致行为就会加剧

论文指出:“在这些模拟场景中,销售额提升 6.3%伴随欺骗性营销增长 14%;选举中,票数增加 4.9%时伴随虚假信息增加 22.3%和民粹言论增加 12.5%;社交媒体上,互动量提升 7.5%时伴随虚假信息激增 188.6%,有害行为推广增加 16.3%。”

研究与现实案例显示,目前的防护措施无法应对这一问题,论文警告称可能带来巨大的社会成本。

詹姆斯・邹在 X 上写道:“当大语言模型为点赞而竞争时,它们开始编造信息;当为选票而竞争时,就会变得煽动和民粹。”

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

ATM 取款机差点往外吐钱:黑客改造树莓派成功突破银行安全防线

IT之家 浏览 3520 07-31

香港住宅史最大亏损纪录:9年前买入 已亏13亿港元

每日经济新闻 浏览 4 08-22

提供两种动力 新款问界M7申报图曝光

车质网 浏览 7552 08-11

吉利发布了 Flyme Auto 2,并宣布不再开发传统智能座舱

爱范儿 浏览 9483 08-21

汤唯,早就戳穿了雷佳音被“排挤”的真相

素衣读史 浏览 8468 07-10

几毛钱的芯片,利润率直追英伟达

虎嗅APP 浏览 5150 07-26

从1-100,金标大众“起势”之年

网易汽车 浏览 5174 05-01

德国严查意德企业收购案"中国因素":可能危害公共秩序

环球网资讯 浏览 6704 07-15

在九三阅兵活动记者会上 江利平引用了毛泽东的一段话

政知新媒体 浏览 4 08-30

媒体人:国安从来没说过要解散,也从未想过要自我了断

懂球帝 浏览 1 10-28

全红婵是否退役悬念揭晓,央视新闻给出权威答复

蒋小成爱钓鱼 浏览 2 10-15

越南再爆地产大雷,股市重挫5%,创六个月来最大单日跌幅

华尔街见闻官方 浏览 1 10-21

体检10年未提示癌症 女律师最新发声:身边多人被误诊

鲁中晨报 浏览 7782 07-18

小米REDMI Note 15 Pro+将配澎湃T1s芯片,实现公里级无网通话

IT之家 浏览 6863 08-20

财经早餐:英伟达50亿美元收购英特尔股份;美股三大指数齐创历史新高

网易财经 浏览 3 09-19

“黑天鹅”突袭,猛烈抛售!影响多大?

券商中国 浏览 4342 07-21

夏天总穿裤子太单调!试试这些"裙装"穿搭,高级优雅有气质

静儿时尚达人 浏览 9319 05-18

50岁女性夏季彩色穿搭指南:掌握“4要4不要”,优雅绽放魅力

Yuki时尚酱 浏览 6381 05-09

加外长:七国集团支持美提出的俄乌停火提议

国际在线 浏览 8417 03-17

寒武纪盘中涨超5%,股价首次突破千元大关

21世纪经济报道 浏览 7140 08-19

难以置信!亏损大概70亿,网传某著名文娱界人士投资中植系惨败

火山诗话 浏览 8708 07-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2