华为发布AI超节点服务器Atlas 850，支持128台1024卡超节点集群

（由多段落组成）：

在2025年华为全联接大会期间，华为重磅发布全新AI超节点服务器Atlas 850，标志着其在人工智能算力基础设施领域的又一次重大突破。此次发布的Atlas 850是业界首款支持风冷部署的企业级AI超节点服务器，单台搭载8张昇腾NPU芯片，具备强大的模型后训练与多场景推理能力。更引人注目的是，该设备支持灵活的多柜扩展架构，最高可实现128台服务器、共计1024张AI加速卡的大规模集群部署，成为当前唯一可在标准风冷数据中心环境中运行超节点架构的高性能算力解决方案。

本次发布会由华为董事、ICT BG CEO杨超斌主讲，主题为“超节点架构创新，开源开放共筑全场景算力底座”。他指出，随着AI大模型的迅猛发展，传统服务器堆叠模式已难以满足对高算力利用率和低通信时延的需求，往往出现集群规模越大、效率反而越低的问题。为此，华为基于自主研发的灵衢互联协议，开创性地推出“超节点”架构，将多台物理服务器深度整合，在逻辑上形成如同单一计算单元般的高效协同系统，真正实现算力随规模线性增长、稳定性大幅提升的技术目标。

超节点架构的核心优势在于资源池化、无损扩展与长稳可靠。通过统一内存编址与高带宽低延迟互联技术，华为实现了计算与存储资源的高度融合。目前，基于该架构的Atlas 900 A3 SuperPoD已累计部署超过300套，广泛服务于互联网、金融、电信、能源及制造等多个关键行业，验证了其在真实业务场景中的卓越性能与稳定性。

除了Atlas 850之外，华为还同步推出了多款面向不同应用场景的超节点产品矩阵。其中包括专为超大规模AI训练设计的全液冷AI集群Atlas 950 SuperPoD，采用正交无缆电连接和浮动盲插液冷技术，支持从64卡起步、最大达8192卡的无收敛全互联拓扑；另有新一代AI标卡Atlas 350，搭载昇腾950PR芯片，向量算力提升两倍，并支持细粒度Cacheline访问，在推荐系统等推理任务中性能提升高达2.5倍。此外，华为还发布了全球首款通用计算超节点——Taishan 950 SuperPoD，具备百纳秒级延迟和TB级带宽，显著优化数据库、虚拟机迁移和大数据处理等传统业务负载。

在生态建设方面，华为坚持“硬件开放 + 软件开源”的双轮驱动策略。一方面，全面开放灵衢协议规范与超节点参考设计，提供包括NPU模组、AI标卡、级联卡、风冷/液冷刀片在内的多种基础硬件模块，助力合作伙伴快速开发定制化行业解决方案。另一方面，操作系统层面的灵衢组件将逐步并入openEuler等主流开源社区，昇腾CANN平台及Mind系列工具链也实现全面开源，并优先兼容PyTorch、vLLM等主流AI框架，极大降低开发者门槛，推动技术创新与生态繁荣。

华为强调，智能化浪潮正在深刻重塑千行百业，而坚实、普惠、开放的算力底座是这一变革的核心支撑。未来，华为将持续投入超节点架构研发，携手产业链上下游伙伴，共同打造覆盖大型数据中心、企业私有云到边缘工作站的全场景AI算力体系，加速各行各业迈向智能时代。

AI超节点服务器, 华为Atlas 850, 灵衢互联协议, 昇腾NPU, 全场景算力

本文来源：