标签:DeepSeek R2

DeepSeek-R2神秘现身大模型竞技场,Steve模型身份成谜引发热议

神秘模型steve现身竞技场,自称来自DeepSeek 近日,在知名大模型评测平台“大模型竞技场”中,一个名为 steve 的神秘模型悄然上线,引发网友热议。尽管在公开页面上无法直接搜索到该模型的信息,但通过查看前端代码,仍然能发现它的存在痕迹。 令人意外的是,当用户询问其开发机构时,steve明确回应称自己来自于 DeepSeek。这一回答迅速点燃了社区讨论的热情:它究竟是传闻已久的 DeepSeek-R2?还是 V4?亦或是某个旧版本的升级版? steve身份成谜,网友众说纷纭 关于steve的真实身份,网友们展开了激烈讨论。有人认为它是...

消息称 DeepSeek-R2 AI 模型开发进程因美国当局英伟达 H20 芯片出口限制而延迟

整理后文章(多段落组成): 近日,据海外科技媒体 The Information 报道,由于美国政府对高性能计算芯片的出口限制政策持续收紧,英伟达 H20 芯片在中国市场的供应出现明显短缺。这一变化直接影响了国内AI初创企业 DeepSeek 的大模型研发进程,导致其下一代人工智能模型 DeepSeek-R2 的开发进度被迫延后。 公开资料显示,DeepSeek 在训练上一代模型 R1 时,共动用了约 5 万块基于 Hopper 架构的 GPU 显卡,其中包括 3 万块 H20、1 万块 H800 和 1 万块 H100。这些关键硬件设备主要由其投资方高毅资产(High-Flyer Capital...