关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:0113人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

你敢变重6公斤吗?

时尚COSMO 浏览 7 05-09

七鲜小厨:开业第一天订单爆了,目前收到七八千份餐饮品牌报名

封面新闻 浏览 7920 07-23

NVIDIA推出ChronoEdit:让AI图像编辑拥有物理常识的革命性技术

科技行者 浏览 15 11-04

马云夜骑西湖被网友偶遇 同款自行车卖1.85万元

每日经济新闻 浏览 4666 07-18

穆里尼奥:费内巴切是我唯一一个完整赛季却没有夺冠的球队

直播吧 浏览 6147 07-24

为减少对华稀土依赖 美国又盯上电子垃圾回收

澎湃新闻 浏览 7530 07-15

游客发现中午店铺都歇业,山西为何成了午睡大省?

BT财经 浏览 3219 07-28

每体:沙特团队造访巴萨,并邀请巴萨体育部门负责人尤斯特

懂球帝 浏览 15 08-22

迈阿密官方:德保罗手续注册完成,可以出战vs阿特拉斯的联盟杯

直播吧 浏览 1829 07-31

秋天外套不需要准备太多,但一定要拥有一件风衣,洒脱又百搭

静儿时尚达人 浏览 13 09-30

林俊杰带病开唱引争议:资本不顾艺人健康?

想去北极洲 浏览 7950 07-15

罗马仕违反强制认证规定、虚假宣传 被罚没124万

南方都市报 浏览 9 12-15

山姆超市“背刺”中产的瓜,很多人都没吃对地方

深蓝财经 浏览 170 07-19

伊朗称已为任何冲突做好充分准备

看看新闻Knews 浏览 242 04-06

周鸿祎:360最近都采购华为芯片,国产性价比高

南方都市报 浏览 4390 07-24

承德露露,温水煮青蛙

斑马消费 浏览 21 10-24

田栩宁四个绯闻女友时间线,她们竟然互相认识

TVB的四小花 浏览 5079 07-11

委内瑞拉外长:伊朗提出"全方位"合作 共同应对美威胁

界面新闻 浏览 16 12-22

高市早苗当选首相的"助攻手" 重点提携了"汉奸"石平

极目新闻 浏览 23 10-22

三种动力版本 全新奔驰GLA将于2026年上市

车质网 浏览 16 10-16

库明加认为接受两年合同+放弃交易否决权 会让勇士掌握过多控制权

直播吧 浏览 3236 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2