标签:国产芯片
蚂蚁集团自研AI大模型采用国产芯片训练,混合专家MoE技术优化计算成本,深度解析开源技术优势与未来发展潜力
(由多段落组成) 蚂蚁集团近期在AI大模型领域取得了显著进展,针对媒体关于其百灵大模型训练成本的报道,蚂蚁方面向界面新闻回应称,公司正通过优化不同芯片性能来降低AI应用成本,并计划逐步通过开源方式分享技术成果。 据此前媒体报道,蚂蚁集团正在利用中国制造的半导体开发AI模型训练技术,预计可将成本降低20%。知情人士透露,蚂蚁集团采用了来自阿里巴巴和华为等厂商的芯片,并结合混合专家(MoE)机器学习方法进行模型训练。结果显示,这种方案能够达到与使用英伟达H800等高端芯片相似的效果。 尽管如此,蚂蚁集...
国产大模型突破:清华团队推出基于国产芯片的清程极智赤兔引擎,大幅提升大模型推理引擎效率,FP8模型适配更灵活,DeepSeek推理成本减半速度翻番
随着技术的不断进步,「国产大模型 + 国产引擎 + 国产芯片」的技术闭环正在加速形成。DeepSeek 的推出引发了市场对大模型私有化部署的热烈讨论,而模型部署的效率与成本成为了企业 AI 落地的关键瓶颈。 近日,清华系科创企业清程极智与清华大学翟季冬教授团队联合宣布开源了一款名为「赤兔」(Chitu)的大模型推理引擎。这一引擎首次实现了非 H 卡设备(如英伟达 Hopper 架构之前的 GPU 卡以及各类国产卡)运行原生 FP8 模型的突破。在 A800 集群上的实测数据显示,使用赤兔引擎部署 DeepSeek-671B 满血版推理服务时,相比 ...