AI时代新突破:黄仁勋与NVIDIA推出Blackwell Ultra,助力DeepSeek推理加速,致敬Vera Rubin精神,下代架构性能将翻倍提升

随着AI技术的飞速发展,GTC大会已成为全球关注的焦点。英伟达CEO黄仁勋在会上表示,GTC已从“伍德斯托克音乐节”进化为“AI的超级碗”,并且每个人都能成为赢家。北京时间3月19日凌晨,加州圣何塞SAP中心吸引了全世界的目光,期待英伟达揭示AI领域的未来方向。

老黄的Keynote演讲流畅自然,未使用提词器。以下是重点Blackwell架构的AI加速卡已全面投产,其需求和产量惊人。这是由于人工智能进入了一个拐点,推理系统和智能体系统的训练大幅增加了计算量。下一代产品Blackwell Ultra将于2025年下半年上市,而Vera Rubin架构则将在2026年推出。

搭载分布式推理系统Dynamo的Blackwell NVLink 72性能是Hopper的40倍。根据最新路线图,英伟达正在构建三种AI基础设施:云、企业以及机器人领域。发布会上,老黄再次展示了从2012年AlexNet开始的AI发展曲线,目前我们处于生成式AI阶段,即将进入智能体时代,随后是物理AI时代。

DeepSeek R1推动了测试时间扩展(Test-Time Scaling),为机器智能带来了新的发展曲线。每个阶段都需要强大的算力支持,因此尽管DeepSeek R1的高效率令人震撼,但英伟达对未来AI算力的需求仍然保持乐观。数据显示,仅2024年,全球前四大云服务运营商就采购了130万片Hopper架构芯片,预计数据中心投资将很快达到1万亿美元。

AI计算正在经历通货膨胀,而非萎缩。老黄提出了两个增长曲线:一是软件因AI加速,二是人类编写的文字提示转变为AI生成的结果。未来,每个企业都将拥有物理工厂和AI虚拟工厂。

英伟达推出了CUDA X软件库,包括cuPYNUMERIC、cuQUANTUM、CUDA-Q、NCCL和cuBLAS等工具,所有这些都依赖CUDA核心完成工作。此外,Blackwell超大杯版本性能大幅提升,Blackwell Ultra NVL72配备了更强大的FP4推理能力和FP8训练能力,互联带宽和内存速度也显著提升。

下一代架构Vera Rubin计划于2026年推出,其全机架性能将是Blackwell Ultra的3.3倍,并且支持更快的NVLink和更大的内存容量。Feynman架构预计将在2028年亮相。

NVIDIA Photonics是迄今为止最强大的以太网互联,可以大幅提升GPU之间的传输速度,支持大规模GPU集群。新产品中还包括面向笔记本电脑和台式机的Blackwell RTX Pro系列图形产品。

展望未来,AI的下一波浪潮将是物理世界的AI,主要形式包括工业机器人、自动驾驶车辆和人形机器人。这些机器人需要强大的预训练、模拟环境和端侧算力支持。英伟达提供了预训练模型平台Cosmos、GROOT N1以及Omniverse来帮助构建物理AI生态。其中,GROOT N1是一个通用的机器人基础模型,采用双系统架构,灵感来源于人类认知原理。

最后,黄仁勋展示了与迪士尼和DeepMind联合开发的机器人平台Newton及其打造的《星球大战》风格机器人Blue。他强调,每个人都应该关注机器人领域,这可能是最大的产业。

本文来源: 机器之心【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...