清华瑞莱联合团队:“安全增强版DeepSeek”可为应用提供坚实基座
中新网北京2月24日电 (记者 张素)2月23日,清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1。研发团队代表介绍说,实验数据表明RealSafe-R1安全性提升显著,“安全增强版DeepSeek”可为更多应用提供可靠坚实基座。
连日来,国产开源大模型DeepSeek的优异表现备受关注,其在自然语言处理和多任务推理方面的能力展现了强大的技术实力,尤其是在复杂问题解决和创造性任务中表现出色。业内专家同时提醒,DeepSeek R1和V3在面对一些安全性挑战时仍存在一定的局限性。
针对“安全对齐机制不足”这一当前开源大模型的通病,清华瑞莱联合团队提出基于模型自我提升的安全对齐方式。“大模型的安全性瓶颈是本质的,只有通过持续投入和攻坚补齐短板弱项,人工智能产业才能真正实现高质量发展。”瑞莱智慧首席执行官田天说。
据介绍,研发团队将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。具体来说,研发团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。
实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间“跷跷板”现象。有评论认为,这为开源大模型安全发展与风险治理提供了创新性解决方案。
田天表示,RealSafe-R1各尺寸模型及数据集,将于近期向全球开发者开源。他进一步指出,这一创新成果将为开源大模型的安全性加固提供有力支持,也为政务、金融、医疗等场景的应用提供更为可靠的坚实基座。(完)
-
花样取暖设备齐上阵,这样的日子怎么过才安全?冷空气持续发力今天,我们迎来秋季最后一个节气——霜降这一时节草木凝霜,万物敛藏随着寒意渐浓秋天“体验卡”即将到期“凉爽模式”向“寒冷模式”切换瑟瑟发抖的“怕冷星”人纷纷拿出自己的“续命”妙招:穿上一层又一层保暖秋裤贴上暖宝宝、打开“小...
-
亮点速览、“干货满满”!这场发布会介绍和解读党的二十届四中全会精神→央视网消息:10月24日上午,中共中央举行新闻发布会,介绍和解读党的二十届四中全会精神。中央政策研究室主任江金权介绍,全会最重要的成果是审议通过了《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》。党的二十大确定到2035年基本实现社...
-
增强必胜信心 赢得战略主动——党的二十届四中全会锚定中国式现代化发展新目标党的二十届四中全会审议通过了《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》,擘画了中国未来五年的发展蓝图,提出了“十五五”时期经济社会发展的主要目标,宣示了乘势而上、接续推进中国式现代化的坚定决心。全党全军全国各族人民正...
-
牛奶vs豆浆,到底哪个更营养?更适合你?牛奶 vs 豆浆,到底哪个更营养?更合适你?答案和很多人想的不一样清晨的餐桌上,有人离不开一杯牛奶,有人喜欢热腾腾的豆浆。它们看起来都是“健康饮品”,但从营养构成到适合人群,却各有特色。那么,牛奶和豆浆到底谁更营养呢?喝的时候又该选择哪个?...
-
数说中国|从“十四五”成就看“十五五”经济社会发展主要目标制作:张维革 崔文 张子彧 钟睿 曲振东 孟丽静 周大庆 郑悦 胥晓璇 秦迎 李雪施鳗珂策划:徐金泉 王迎 李真 陈琛...
-
新闻1+1丨“十五五”,承上启下的关键五年10月23日,二十届四中全会公报发布。如何看待“十五五”时期在中长期发展蓝图中的战略定位?经济社会发展的目标又有哪些新变化?怎样在积极识变、应变、求变中,集中力量办好自己的事?《新闻1+1》本期节目连线中国社会科学院国家金融与发展实验室主任张晓...