标签:昇腾NPU

华为盘古Ultra大模型:基于昇腾NPU原生开发,135B参数引领大规模语言模型深度学习与自然语言处理新纪元

终于,华为盘古大模型系列推出了全新的昇腾原生通用千亿级语言大模型。当前,各大科技公司纷纷发布百亿、千亿级模型,但大部分模型的训练依赖于英伟达的 GPU。在这种情况下,国内研究团队难以获得足够的计算资源,这限制了国内大模型技术的快速发展。然而,华为盘古发布的这项新研究表明,基于全国产的昇腾平台,同样可以实现领先的大规模语言模型的研究与开发。 技术报告Pangu Ultra: 推动 Ascend NPUs 上密集大型语言模型的极限 技术报告地址:[https://github.com/pangu-tech/pangu-ultra/blob/main/pangu-ultra-rep...