专为下一代国产芯片设计!DeepSeek采用UE8M0 FP8标准:华为积极适配 彻底和NVIDIA决裂了

整理后文章(多段落组成):

近日,深度求索(DeepSeek)正式发布其最新大模型DeepSeek-V3.1,引发业界广泛关注。此次更新中,一个关键的技术亮点是其对UE8M0 FP8格式的支持。这一技术突破不仅代表了国产AI算力生态的重大进展,也预示着国产芯片与大模型协同发展的新方向。

据官方介绍,UE8M0 FP8是专为即将推出的下一代国产芯片所设计的一种低精度浮点数格式。东莞证券分析指出,该格式具备更高的灵活性,能够有效支持复杂模型的推理过程,从而显著提升芯片的解码效率和运算能力。这为国产芯片适配更大规模的AI模型提供了可行的技术路径,进一步推动国产AI算力生态系统的加速构建。

那么,UE8M0 FP8究竟有何特别之处?它将对国产AI芯片和大模型的发展带来哪些影响?对此,人工智能领域专家、清华大学计算机系博士梁斌给出了专业解读。他指出,UE8M0 FP8与英伟达提出的FP8标准并不相同,属于两套独立的技术体系。在模型参数日益庞大的背景下,显存资源显得愈发紧张,因此需要通过量化手段压缩参数表达,以节省存储空间。

FP32使用32位来表示一个参数,而FP8仅需8位。在精度损失可控的前提下,更低的位数意味着在相同显存中可以容纳更多参数,从而提升模型性能。目前主流的FP8格式有英伟达的E4M3和E5M2两种方案,而UE8M0 FP8则采用了一种无小数表达的结构。相比而言,英伟达方案精度更高,但UE8M0 FP8在功耗、运算速度以及芯片兼容性方面更具优势。

梁斌进一步指出,DeepSeek此次选择支持UE8M0 FP8,标志着国产AI技术正逐步摆脱对英伟达生态的依赖。未来,国内AI模型开发者在选择推理体系时,或将面临“DS体系”与“英伟达体系”的二选一局面。目前,包括华为在内的多家国产芯片企业正在积极适配这一新标准,显示出对这一技术路径的高度认可。

梁斌表示:“现在国内芯片厂商为了适配这个标准可以说是全力以赴,一旦成功,将具有划时代的意义。DeepSeek敢于率先支持这一标准,也体现了其在推动国产大模型技术进步方面的魄力和远见。”

DeepSeek-V3.1, UE8M0 FP8, 国产AI芯片, 模型量化, AI算力生态

本文来源: iFeng科技【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...