“用魔法打败魔法 ” 南开大学最新研究成果让AI“识破”AI

2025年08月29日 来源: 点击:

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。

图为南开大学研究团队提出的DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)  近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。

图为AI生成内容检测示意图。(南开大学 供图)  多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。(完)

相关文章
  • 双桥飞渡北盘江:从烽火记忆到复兴之路的钢索跨度
    双桥飞渡北盘江:从烽火记忆到复兴之路的钢索跨度

    2025年8月25日世界第一高桥花江峡谷大桥顺利完成荷载实验进入通车预准备阶段预计9月底正式通车运行北盘江劈开黔西南的层峦叠嶂以千米深峡勾勒出一道“地球裂缝”其险峻自古便是滇黔锁钥之地在这条奔涌的峡谷咽喉处两座跨越时空的桥梁花江铁索桥与花江峡谷...

  • 水利部和中国气象局联合发布红色山洪灾害气象预警
    水利部和中国气象局联合发布红色山洪灾害气象预警

    中新网8月28日电 据中国水利微信公众号消息,水利部和中国气象局8月28日18时联合发布红色山洪灾害气象预警:预计,8月28日20时至8月29日20时,四川中部和中北部等地部分地区发生山洪灾害可能性大(橙色预警),局地发生山洪灾害可能性很大(红色预警),预警区域涉...

  • 8岁少年暑假出行方式“曝光”,有点意思
    8岁少年暑假出行方式“曝光”,有点意思

    最近,杭州“高铁少年”王慕清又有新动作。四天时间里,他坐了六趟高铁,串联起八座高铁站,亲身体验列车技术细节,甚至用硬币测试隧道风压。这趟“急行军旅行”不仅是玩乐,更是一次深入的科学探究。为啥要这么密集地坐高铁?王慕清今年8岁,是杭州市采...

  • 看见美丽中国丨三江源20年蜕变:千湖归来 “中华水塔”焕新生
    看见美丽中国丨三江源20年蜕变:千湖归来 “中华水塔”焕新生

    二十年前在浙江安吉余村,一粒思想的种子破土而生——时任浙江省委书记的习近平同志,在余村调研时,首次提出“绿水青山就是金山银山”的重要论述。“两山论”成为习近平生态文明思想的核心理念。党的十八大以来,以习近平同志为核心的党中央,把生态文...

  • “羊都不吃”的羽衣甘蓝爆火:当健康焦虑正中资本下怀
    “羊都不吃”的羽衣甘蓝爆火:当健康焦虑正中资本下怀

    羽衣甘蓝正带着“健康”的铭牌成为食品市场新贵。两年前批发价0.8元/斤无人问津,如今3.5元/斤还供不应求。喜茶“夺冠纤体瓶”新上市,单月就消耗掉10万斤羽衣甘蓝,瑞幸羽衣轻体果蔬茶上线两周就狂卖1120万杯。是名副其实还是徒有虚名?在我们再次心安理得...

  • 和总书记面对面 - 青山常在路更长
    和总书记面对面 - 青山常在路更长

    一场雨后,浙江安吉余村绿意浸染、蝉鸣悠扬。穿过山清水秀的村口,沿着村主干道往里走,“春林山庄”的招牌赫然醒目。五年前,2020年3月,习近平总书记来到余村,走进这一全村最早的农家乐“春林山庄”。山庄主人潘春林热情将总书记迎进院内,向总书记介...

友情链接