DeepSeek-V3.1首搭UE8M0 FP8精度技术 适配下一代国产芯片

近日,国内人工智能企业DeepSeek在其官方渠道发布消息称,已正式推出全新版本模型——DeepSeek-V3.1。此次更新在多个技术维度上进行了优化与调整,进一步提升了模型的性能和适用性。

据官方介绍,DeepSeek-V3.1在训练过程中采用了UE8M0 FP8 Scale参数精度技术。这一技术的引入,不仅有助于提升模型的计算效率,还为其在新一代国产芯片上的部署打下了良好基础。官方也在微博置顶留言中特别指出,UE8M0 FP8是专为即将发布的下一代国产芯片量身打造的技术方案。

除了底层技术的升级,DeepSeek-V3.1还在分词器(Tokenizer)和对话模板(Chat Template)方面进行了较大改动。这些调整使得V3.1版本在交互体验和逻辑处理能力上与前一版本DeepSeek-V3存在明显差异,也意味着开发者和用户在使用过程中需要适应新的模型特性。

针对部分网友提出的疑问,即为何在网页端、App、小程序或API平台看到的模型版本并非显示为“V3.1”,DeepSeek官方回应称,目前所有对外提供的服务端模型均已统一更新至新版本,且该模型的自我认知也为“DeepSeek-V3”。但该版本确实已融合V3.1的核心特性,属于技术层面的同步更新。

此次DeepSeek的版本升级,不仅体现了其在大模型领域的持续创新能力,也反映出其对国产芯片生态系统的深度适配与支持,未来有望在更多本土化应用场景中发挥作用。

DeepSeek-V3.1, FP8参数精度, 国产芯片适配, 分词器优化, 模型版本更新

本文来源: iFeng科技【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...