关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家1586人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

张子宇加盟首次未登场:前两场正负值均最差 山东女篮加时胜江苏

醉卧浮生 浏览 1006

荷兰政府对安世半导体实施全球运营冻结 闻泰科技回应

财联社 浏览 8593

星巴克和它所代表的一切,正与我们渐行渐远

虎嗅APP 浏览 1631

今年冬天最流行的4组叠穿,让你美出新高度!

LinkFashion 浏览 1467

记者:原梅州客家主帅里斯蒂奇将接任李霄鹏,执教青岛海牛

懂球帝 浏览 1302

今天 | 送别杨振宁!群众含泪相送!队伍望不到头!

天津广播 浏览 1618

火箭惨遭雷霆双杀!杜兰特23中7申京两双 亚历山大连续112场20+分

罗说NBA 浏览 988

视频:单日发射数百架 俄乌无人机互袭更趋激烈

环球网资讯 浏览 1134

高管减持、股东跑路、产品爆炸:上市公司的“中年危机”

诗与星空 浏览 1958

媒体:萝莉岛内部似妓院配置 牙医椅子让人浮想联翩

新民周刊 浏览 5252

AI重塑就业版图 专项政策护航转型之路

北京商报 浏览 942

新机发售之际,荣耀手机影像专家言论争议不断、引翻车质疑

观察者网 浏览 2040

米体:罗马想冬窗租借齐尔克泽,若晋级欧冠会自动触发买断

懂球帝 浏览 1365

《骄阳似我》顾漫花巨资买《遇见》《信仰》不是为庄序偏爱太明显

亦暖追剧随笔 浏览 1030

剑指Anthropic十亿美元级市场!谷歌杀入AI编码大战,与Replit达成多年合作

华尔街见闻官方 浏览 1421

韩华航空航天公司与挪威签署9.22亿美元火箭发射器供应合同

财闻 浏览 828

这个「疯批」星二代,撕碎了娱乐圈的滤镜

独立鱼 浏览 957

5万美元筛选「超级婴儿」, 智商提升15点?马斯克被曝是客户!

新智元 浏览 1834

俄在日本海演习击沉假想敌潜艇

参考消息网 浏览 1586

刘欢,早已走上另一条大道

奥字侃剧 浏览 1797

徐艺洋三亚美照惊艳

悦君兮君不知 浏览 1377
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1