关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2025-11-08 12:00:0111人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:美一系列肆行无忌行径 释放极其危险信号

上观新闻 浏览 10 01-12

陈汉典Lulu“拼好婚”,湾湾怎么总出邪门CP?

仙女事件簿 浏览 14 09-18

特朗普发声后 印度反对党要求公布印军真实损失

环球时报国际 浏览 9523 07-21

世锦赛男子200米蝶泳预赛:陈俊儿第四晋级半决赛,徐放遭遇淘汰

直播吧 浏览 3244 07-29

中国科技股深夜爆发,腾讯飙升9%,首批“政务龙虾”已上线

21世纪经济报道 浏览 2 03-11

三全食品“豪掷”13亿奔赴澳洲,但账上资金不足半数

国际金融报 浏览 5726 07-24

出海成基金重仓依据!公募挖掘业绩增长“第二曲线”

券商中国 浏览 15 09-02

女子被指遭迷信求子的父母"砍手割耳" 警方介入调查

扬子晚报 浏览 13 08-22

吴千语施伯雄逛街被偶遇,勾肩同行幸福甜蜜,有说有笑松弛感拉满

扒虾侃娱 浏览 13 10-26

2026款奔驰EQE上市 售价47.8-62.7万元

车质网 浏览 12 11-27

快讯|奥比中光与地平线、地瓜机器人官宣达成合作

网易科技报道 浏览 2060 08-12

杨子新欢怒怼网友!上位接手黄圣依创立品牌?

萌神木木 浏览 2161 08-17

长春亚泰热身1比0击败定南赣联 球队结构逐步成型

体坛周报 浏览 9 02-05

黄仁勋:我很想买一辆小米汽车

每日经济新闻 浏览 7861 07-17

马斯克宣布重启特斯拉Dojo 3超级计算机项目

不看车bukanche 浏览 8 01-19

腾讯、抖音、快手、B站、DeepSeek等官宣

澎湃新闻 浏览 14 09-02

对话联想ISG黄山:异构算力融合将成为AI应用落地的关键丨ToB产业观察

钛媒体APP 浏览 9618 08-19

布冯:皮奥这样的年轻人有资格赢得国家队征召,这让我们自豪

懂球帝 浏览 10 08-27

你的“龙虾”是否“遵规守纪”?“养虾人”速查风险

环球网资讯 浏览 1 03-17

博洛尼亚-佛罗伦萨,瓦诺利:“这场胜利是为了带来喜悦。将罗科留下的价值观带到场上”

绿茵情报局 浏览 11 01-21

喜马拉雅烟花秀引争议 新华社、人民日报接连发声

21世纪经济报道 浏览 15 09-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2