谷歌最强 AI 平台：第七代 TPU 架构 Superpod 曝光，9216 个芯片 + 192GB HBM

在 2025 年 Hot Chips 大会上，谷歌首次全面公开其第七代 TPU 架构——代号为“Ironwood”的超级计算平台。这一消息由科技媒体 WccfTech 于 8 月 25 日率先报道，随后被多家科技资讯平台转载。作为谷歌在人工智能芯片领域的又一重大突破，Ironwood Superpod 的性能表现令人瞩目。

谷歌在今年 4 月首次宣布 Ironwood 架构时，就声称其性能是目前全球最先进超级计算机的 24 倍。此次大会上，谷歌进一步披露了该架构的硬件组成与系统设计细节。与 2022 年发布的 TPU v4 和 2023 年的 TPU v5p 相比，Ironwood 在多个关键指标上实现了显著提升。

具体来看，单个 Ironwood Superpod 集成了 9216 个芯片，每个芯片配备高达 192GB 的高带宽内存（HBM），内存带宽达到 7.4TB/s，峰值算力更是高达 4614 TFLOPs。这意味着，Ironwood 的单芯片性能相比 TPU v4 提升了超过 16 倍。谷歌通过模块化设计将每四颗芯片集成到一块主板上，16 块主板组成一个机架，共计 64 芯片节点。

为了实现高效互连，谷歌采用了自主研发的 InterChip Interconnect（ICI）技术，将多达 43 个 64 芯片模块连接在一起，构建出一个具备 1.8PB/s 网络带宽的超级计算集群。在物理架构上，Ironwood 延续了前几代所采用的 3D Torus（立方环网）拓扑结构，每个逻辑单元由 4×4×4 的节点阵列组成，即 64 芯片，封装在一个机架中。

一个完整的 Superpod 包含 144 个这样的机架，并配备光学交换机以实现跨模块通信，同时设有冷却分配单元（CBU）以支持液冷系统。互连方式上，谷歌采用了 PCB 走线、铜缆和光纤混合连接，以提升系统的灵活性和扩展能力。

在机架设计方面，Ironwood 在顶部设有泄漏检测盘用于监控液冷系统的运行状态，底部则集成供电模块，支持双路电源域输入。系统将 416V 交流电整流为直流电后供芯片使用。整套系统采用液冷散热方案，满负载运行时功耗可超过 100kW。

值得一提的是，TPU（Tensor Processing Unit）是谷歌专为加速机器学习任务而设计的专用芯片，特别擅长处理矩阵运算。Superpod 则是由多个 TPU 组成的计算集群，通过高速互联网络协同工作。HBM（High Bandwidth Memory）是一种高速存储技术，能够显著提升数据传输效率。TFLOPs（万亿次浮点运算每秒）则是衡量芯片计算性能的重要指标。

谷歌此次发布的 Ironwood 架构，标志着其在 AI 芯片与超级计算领域的又一次飞跃，也为未来的大规模人工智能训练与推理任务提供了强有力的硬件支持。

谷歌TPU,Ironwood架构,超级计算平台,液冷系统,机器学习芯片

本文来源：