关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家825人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

岳云鹏八年划水终到头,观众不想再为春晚情怀买单,不看也不演了

肆季娱乐 浏览 162

那英懒理风波现身日本逛街 女儿同行身高近1米7

夏冬爱搞笑 浏览 14312

为了对付这国,日韩要搁置“雷达照射”争议

参考消息 浏览 17832

今年秋冬最时髦的穿法:长外套+长裤,太高级了!

LinkFashion 浏览 996

国家新闻出版署发布2023年进口网络游戏审批信息:共27款游戏获批

Tech星球 浏览 16421

青春归来,76人主场换回艾弗森时期经典LOGO致敬01年总决赛赛季

懂球帝 浏览 807

向太声称女生不要下嫁,网友质疑何超莲窦骁离婚

草莓解说体育 浏览 1123

业内曝娜扎被抢休息室,刘亦菲聊天被保镖监听,好精彩的后台大瓜

萌神木木 浏览 1201

美媒:美国下水一艘新军舰中国已造好三艘 差距惊人

澎湃新闻 浏览 1399

星光730灵犀动力获中汽中心高品质混动认证等奖项

网易汽车 浏览 837

苹果正在为其折叠屏 iPhone 测试下一代超薄柔性玻璃

威锋网 浏览 457

1.5亿利润与12亿负债,祥源文旅为何景区造血,债务“起飞”?

华夏时报 浏览 923

塞纳河“上岸”不易:20年合约、赔350万成为失信人、抑郁症也要赔钱…小偶像们那些年打过的官司

仙女事件簿 浏览 466

丰田探索车载无人机系统:车辆通过复杂路况之前能帮你“探路”

IT之家 浏览 1206

离婚真相曝光不到2月,“一言不发”的唐嫣,给娱乐圈上了一课

金风说 浏览 67

刘越:申花最后的点球判罚的太牵强,阿利米踢球合理简练

懂球帝 浏览 922

E句话| 他骨灰都被人盗了?

仙女事件簿 浏览 875

媒体:日本拥有核武器 只差一把"螺丝刀"

北京日报客户端-长安街知事 浏览 649

体操世锦赛男子个人全能决赛:桥本大辉夺冠,张博恒收获亚军

懂球帝 浏览 984

男子在悬崖边请人拍照滑倒坠下 遗体在水潭底部被找到

封面新闻 浏览 5443

女生在马来西亚丢手机 找回后发现相册里多了两段视频

极目新闻 浏览 4804
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1