整理后文章(多段落组成):
近日,据海外科技媒体 The Information 报道,由于美国政府对高性能计算芯片的出口限制政策持续收紧,英伟达 H20 芯片在中国市场的供应出现明显短缺。这一变化直接影响了国内AI初创企业 DeepSeek 的大模型研发进程,导致其下一代人工智能模型 DeepSeek-R2 的开发进度被迫延后。
公开资料显示,DeepSeek 在训练上一代模型 R1 时,共动用了约 5 万块基于 Hopper 架构的 GPU 显卡,其中包括 3 万块 H20、1 万块 H800 和 1 万块 H100。这些关键硬件设备主要由其投资方高毅资产(High-Flyer Capital Management)负责采购。然而,随着 H20 芯片的进口受限,R2 模型的研发工作面临前所未有的挑战。
知情人士透露,尽管 DeepSeek 团队在过去几个月内加快了 R2 模型的优化与测试节奏,但公司 CEO 梁文锋仍认为当前版本在性能表现上尚未达到预期标准。因此,团队仍在进行深度调优和迭代,新模型暂时无法投入实际应用场景。
此外,H20 芯片的断供不仅影响新一代模型的研发,也对现有 DeepSeek-R1 的部署和运行造成了一定冲击。目前,大多数用户仍然依赖 H20 芯片来运行 R1 模型。随着供应链紧张局势加剧,如何保障算力资源已成为 DeepSeek 必须面对的重要课题。
分析指出,在当前国际形势下,中国 AI 企业正面临越来越严峻的技术自主化考验。未来,是否能够构建起稳定的国产替代方案,将成为相关企业在竞争中保持优势的关键所在。
英伟达 H20 芯片, DeepSeek-R2, 美国出口限制, AI模型研发, GPU显卡供应
本文来源:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...