标签:DeepSeek

DeepSeek-R1:中国AI大模型低成本高效训练,开源技术创新引领未来

来自中国的AI大模型DeepSeek-R1震撼全球,成本仅为国外竞品的三十分之一 近日,中国的一家AI创业公司DeepSeek(深度求索)正式发布了其最新的大模型DeepSeek-R1。这款模型在数学、代码和自然语言推理等任务上的表现与OpenAI的o1版本相当,甚至在某些基准测试中略胜一筹。DeepSeek-R1的发布在全球AI圈引起了巨大反响。 在AIME 2024数学基准测试中,DeepSeek-R1取得了79.8%的得分率,而OpenAI-o1为79.2%。在MATH-500基准测试中,DeepSeek-R1的得分率为97.3%,OpenAI-o1为96.4%。在编码任务中,DeepSeek-R1超越了96.3%的人类...

Meta紧急应对开源大模型DeepSeek,高预算投入AI创新引发内部恐慌,英伟达技术助力深度分析

深入解析 DeepSeek 对美国 AI 公司的冲击 最近,国内 AI 创业公司 DeepSeek 的一系列动作引起了广泛关注,尤其是开源大模型的发布,让许多美国科技巨头感到震惊。其中,Meta 的生成式 AI 团队似乎是最先陷入恐慌的公司之一。根据匿名职场社区 TeamBlind 上的一篇帖子,DeepSeek 的低成本高效率让 Meta 无法解释其高昂预算的合理性。 DeepSeek-V3 和 DeepSeek-R1 引发的连锁反应 这一切始于 DeepSeek-V3 的发布,该模型在基准测试中超越了 Llama 4 等其他知名模型。更令人瞩目的是,DeepSeek 只用了 558 万美元的训练成本...

DeepSeek新模型代码能力媲美OpenAI,开源模型引发热议,LiveCodeBench实测表现卓越,网友戏称今年编程只需Tab键

DeepSeek新模型表现优异,开源引发热议 近日,DeepSeek发布了其最新的大模型DeepSeek-R1-Preview,该模型在代码基准测试LiveCodeBench中表现出色,与OpenAI的o1中档推理设置相当。这一消息引起了广泛的关注和讨论。值得注意的是,这并不是之前已发布的轻量预览版DeepSeek-R1-Lite-Preview,而是使用了更大规模的基础模型,性能更加强劲。 DeepSeek团队不仅在评估过程中帮助LiveCodeBench团队解决了评分系统的一些bug,还展示了DeepSeek-R1-Preview的思考过程。此前,DeepSeek已经宣布R1模型将开源,这意味着一个与OpenAI o...

全网热议的DeepSeek团队,清北应届生如何凭借AI大模型和MLA注意力机制在GRPO强化学习领域脱颖而出撑起一片天

深度解析DeepSeek团队:清北应届生撑起一片天 近期,AI圈被一款名为DeepSeek-v3的大模型震撼。这款大模型仅用1/11的算力就超越了Llama 3 405B的性能,引发了广泛关注。随之而来的还有雷军以千万年薪挖角DeepSeek研究员罗福莉的消息,使得DeepSeek团队成为全网热议的焦点。 团队年轻化与创新精神 DeepSeek团队最显著的特点是其成员年轻化。大量来自清华大学和北京大学(简称“清北”)的应届生、在读生活跃其中。这些年轻人不仅参与了从DeepSeek LLM v1到v3的全程研发,还提出了多项关键创新,如MLA新型注意力机制和GRPO强...
18910