精准识别AI生成内容:让AI“识破”AI
让AI“识破”AI
本报讯(中青报·中青网记者 胡春艳 通讯员 高雨桐)近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC国产大模型逐渐变成人们学习、工作中的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,即“AI幻觉”;依赖AI工具代写作业甚至毕业论文,冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。
近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,还创新性地提出了“直接差异学习”优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025接收。
目前AI生成内容检测主要有两种路线:一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种标准进行分类。
多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前曾有媒体报道,《荷塘月色》《流浪地球》等作品被某常用论文AI率检测系统检出高AI率。
为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”
“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。
为此,研究团队另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。
“我们的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。
团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近10万条人类-AI文本对。
“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。
MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用团队的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。
“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。
中青报·中青网记者 胡春艳 通讯员 高雨桐
来源:中国青年报 2025年08月18日 08版
-
花样取暖设备齐上阵,这样的日子怎么过才安全?冷空气持续发力今天,我们迎来秋季最后一个节气——霜降这一时节草木凝霜,万物敛藏随着寒意渐浓秋天“体验卡”即将到期“凉爽模式”向“寒冷模式”切换瑟瑟发抖的“怕冷星”人纷纷拿出自己的“续命”妙招:穿上一层又一层保暖秋裤贴上暖宝宝、打开“小...
-
亮点速览、“干货满满”!这场发布会介绍和解读党的二十届四中全会精神→央视网消息:10月24日上午,中共中央举行新闻发布会,介绍和解读党的二十届四中全会精神。中央政策研究室主任江金权介绍,全会最重要的成果是审议通过了《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》。党的二十大确定到2035年基本实现社...
-
增强必胜信心 赢得战略主动——党的二十届四中全会锚定中国式现代化发展新目标党的二十届四中全会审议通过了《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》,擘画了中国未来五年的发展蓝图,提出了“十五五”时期经济社会发展的主要目标,宣示了乘势而上、接续推进中国式现代化的坚定决心。全党全军全国各族人民正...
-
牛奶vs豆浆,到底哪个更营养?更适合你?牛奶 vs 豆浆,到底哪个更营养?更合适你?答案和很多人想的不一样清晨的餐桌上,有人离不开一杯牛奶,有人喜欢热腾腾的豆浆。它们看起来都是“健康饮品”,但从营养构成到适合人群,却各有特色。那么,牛奶和豆浆到底谁更营养呢?喝的时候又该选择哪个?...
-
数说中国|从“十四五”成就看“十五五”经济社会发展主要目标制作:张维革 崔文 张子彧 钟睿 曲振东 孟丽静 周大庆 郑悦 胥晓璇 秦迎 李雪施鳗珂策划:徐金泉 王迎 李真 陈琛...
-
新闻1+1丨“十五五”,承上启下的关键五年10月23日,二十届四中全会公报发布。如何看待“十五五”时期在中长期发展蓝图中的战略定位?经济社会发展的目标又有哪些新变化?怎样在积极识变、应变、求变中,集中力量办好自己的事?《新闻1+1》本期节目连线中国社会科学院国家金融与发展实验室主任张晓...