(由多段落组成):
在2025年9月18日举行的华为全联接大会(HUAWEI CONNECT 2025)上,一项重磅成果正式亮相——由华为技术有限公司与浙江大学联合研发的国内首个基于昇腾千卡算力平台的大规模安全基础模型 DeepSeek-R1-Safe 成功发布。这一里程碑式的合作标志着我国在大模型安全训练领域实现了关键突破,也为国产AI生态的安全可控发展注入了强劲动力。
此次发布的 DeepSeek-R1-Safe-671B 模型,依托浙江大学计算机科学与技术学院强大的科研实力和华为昇腾AI硬件平台的支持,构建了一整套从数据到算力、软硬协同的自主化安全后训练体系。项目团队从底层架构出发,打造了覆盖“高质量安全语料采集—平衡优化的安全训练流程—全链路国产化软硬件支撑”的完整闭环框架。特别是在大规模分布式训练方面,研究团队成功在昇腾千卡集群上完成了千亿参数级别大模型的满血训练,攻克了跨服务器环境同步、权重共享、协同推理等多项技术难题,并开发出配套的高效工具链,显著提升了训练稳定性与资源利用率。
在安全性测试中,DeepSeek-R1-Safe 表现出卓越的防御能力。针对包括网络暴力言论、政治敏感信息、违法诱导等在内的14类常见有害信息,其整体拦截成功率接近100%;对于更具挑战性的“越狱”攻击模式,如角色扮演、隐喻表达、加密编码等方式绕过审查的行为,模型仍能实现超过40%的有效识别率。综合安全防护得分高达83%,在相同评测条件下,优于通义千问Qwen-235B、原始版DeepSeek-R1-671B等多个主流模型达8%至15%,展现出领先行业的安全水准。
尤为难得的是,在大幅提升安全性能的同时,该模型并未牺牲通用智能表现。在MMLU、GSM8K、CEVAL等多个权威基准测试中,DeepSeek-R1-Safe 相较于未进行安全强化的原版模型,性能下降控制在1%以内,充分证明其在安全性与实用性之间取得了理想平衡,真正实现了“既安全又聪明”的技术目标。
中国工程院院士陈纯在发布会上高度评价该项目成果。他表示,浙大计算机学院已组建一支高水平、国际化背景的青年科研队伍,依托昇腾AI生态,完成了全流程自主可控的大模型安全训练实践,开创了国内千卡级集群训练大模型的安全先河。他期待未来浙江大学与华为继续深化合作,推动AI安全技术向纵深发展,助力国家人工智能产业健康有序前行。
华为昇腾计算业务总裁张迪煊也透露,本次大会期间,华为同步推出了新一代昇腾AI硬件平台,并宣布启动全栈软件开源开放战略,涵盖编译器、运行时系统、驱动组件等核心模块,旨在通过深度协作,携手高校、科研机构及产业伙伴共建开放共赢的AI创新生态。此举将进一步降低大模型研发门槛,加速技术成果转化。
目前,DeepSeek-R1-Safe 已面向全球开发者全面开源,代码及模型权重已在 ModelZoo、GitCode、GitHub、Gitee 和 ModelScope 等多个主流开源社区上线,便于研究人员和技术爱好者下载使用与二次开发。
Gitee仓库地址:[https://gitee.com/ZJUsafe/deep-seek-r1-safe](https://gitee.com/ZJUsafe/deep-seek-r1-safe)
GitHub仓库地址:[https://github.com/ZJUAISafety/DeepSeek-R1-Safe](https://github.com/ZJUAISafety/DeepSeek-R1-Safe)
此次开源不仅体现了产学研深度融合的成功范式,也为我国构建可信、可靠、可解释的人工智能体系提供了重要参考样本。随着更多企业和研究机构加入这一生态,国产大模型的安全边界将持续拓展,迈向更高水平的智能化未来。
大模型安全, 昇腾AI, DeepSeek-R1-Safe, 开源大模型, 千卡算力集群
本文来源: