标签：DeepSeek-R1

DeepSeek-R1突破性成果登《自然》杂志，开源AI引领大模型推理与强化学习新纪元

（由多段落组成）： 2024年9月17日，中国AI团队DeepSeek再次刷新全球人工智能研究的历史——其核心研究成果《DeepSeek-R1：基于纯强化学习的大模型推理能力演化》正式登上国际顶级学术期刊《自然（Nature）》封面。这是全球首个经过完整同行评审并被权威科学期刊认证的主流大语言模型研究，标志着国产AI在科研严谨性与技术创新上的双重突破。该论文由DeepSeek团队联合撰写，梁文锋担任通讯作者，首次系统揭示了仅通过强化学习即可激发大语言模型自主推理能力的技术路径。不同于依赖大量人工标注思维链数据的传统方法，DeepS...

来源：

智东西【阅读原文】
Tags：（关键词用逗号间隔分隔）： DeepSeek-R1 大模型推理开源AI 强化学习自然杂志

11个月前

端侧AI算力需求爆发，国产高端芯片产能亟需突破倚赖先进制程与EDA软件支持DeepSeek R1模型应用

整理后的随着人工智能技术的快速发展，AI在多个领域的应用正逐渐显现。年初，DeepSeek发布了其最新版本R1，性能与OpenAI的o1相当，并通过一系列优化手段大幅降低了算力成本，为AI推理应用的突破奠定了基础。这一进展使得AI技术在云端和终端的应用逐步增强。英伟达的GB200以及各大云服务提供商（CSP）自主研发的ASIC芯片开始大规模量产，同时GB300和HBM4等新一代技术正在商业化进程中。这些硬件基础设施的持续迭代，进一步推动了算力水平的提升。在终端市场，AI应用的商业化步伐明显加快。AI手机和AI PC的市场渗透率迅...

来源：

界面新闻【阅读原文】
Tags：AI算力 DeepSeek-R1 EDA软件先进制程高端芯片

1年前 (2025)

DeepSeek R1新版发布，开源AI编程能力与性能对比引发外国网友热议，智能指数再创新高

几天前，DeepSeek 在没有预热和发布会的情况下低调发布了 DeepSeek R1（0528）的更新。这次更新引起了海外媒体的广泛关注，尤其是其幻觉率削减了约 45%-50%，性能接近 OpenAI 的 o3 和 Google 的 Gemini 2.5 Pro。开发者和研究人员在社交媒体上热议这一新版本的能力，尤其是在与科技巨头旗舰模型的对比中。在 reddit 和其他 AI 社区中，用户们对 DeepSeek R1 的表现进行了测试和讨论。有用户表示，R1 在 LiveCodeBench 上的表现几乎与 OpenAI 的 O3 模型持平，这被视为开源社区的巨大胜利。此外，R1 在数学问题和编程方面...

来源：

iFeng科技【阅读原文】
Tags：DeepSeek-R1 开源 AI 性能对比智能指数编程能力

1年前 (2025)

DeepSeek R1新版深度学习模型发布，编程能力优化显著，开源胜利直追OpenAI o3性能表现实测

DeepSeek新版R1强势发布：直追OpenAI o3！实测揭秘“小版本升级”背后的大动作网友热议：开源的胜利量子位报道，DeepSeek在端午节前推出了新版本——DeepSeek-R1-0528。从名字上看，这似乎只是一次小版本更新，但实际上却让人眼前一亮。根据实测结果，这款新模型在LiveCodeBench上的表现几乎与OpenAI的o3-high持平！不少网友甚至戏称：“这不就是R2吗？” 新版R1不仅解决了旧版的一些问题，还成功应对了诸如“9.9-9.11=？”这样的难题，这一问题曾难倒了包括o3、Gemini 2.5 pro和Claude 4在内的多个顶流大模型。新模型已...

来源：

量子位【阅读原文】
Tags：- 深度学习模型 DeepSeek-R1 openai o3 开源胜利编程能力优化

1年前 (2025)

Qwen3与DeepSeek-R1在数据分析领域的实力较量：AI模型语义识别哪家强？

整体评测：Qwen3与DeepSeek-R1在数据分析领域的对比分析随着AI技术的快速发展，大模型在企业级数据分析和智能决策场景中的应用越来越广泛。近日，阿里巴巴开源了新一代通义千问模型Qwen3，而数势科技的数据分析智能体SwiftAgent也迅速完成了对Qwen3的全面适配，并发布了详细的测评报告。本文将从多个维度对比Qwen3与DeepSeek-R1的表现。一、上下文改写在实际应用中，用户输入的查询语句往往不够规范，因此需要对输入语句进行改写以提高准确性。测试结果显示，在不同的语境下，Qwen3-32B表现尤为突出，尤其是在不需要改...

来源：

量子位【阅读原文】
Tags：AI模型 DeepSeek-R1 Qwen3 数据分析语义识别

1年前 (2025)

NVIDIA Blackwell助力DeepSeek-R1模型，通过TensorRT-LLM优化GPU推理性能，树立AI行业新标杆

随着科技的飞速发展，人工智能领域不断迎来新的突破。近日，英伟达在 NVIDIA GTC 2025 大会上宣布了一项重大成果：其 NVIDIA Blackwell DGX 系统成功创下 DeepSeek-R1 大模型推理性能的世界纪录。这项成就不仅展示了硬件与软件结合的强大潜力，还为未来的高性能计算奠定了坚实的基础。具体来说，在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行的 DeepSeek-R1 模型（参数规模达到 6710 亿）实现了每用户每秒超 250 token 的响应速度，系统最高吞吐量更是突破了每秒 3 万 token。这一性能的提升得益于 NVIDIA 平台在最新...

来源：

IT之家【阅读原文】
Tags：DeepSeek-R1 GPU NVIDIA Blackwell TensorRT-LLM 推理性能

1年前 (2025)

DeepSeek-R1引领AI图像生成革新，Krea图像编辑工具大幅提升用户体验

在R1推理模型的热潮之后，DeepSeek迅速被多个平台集成，包括硅基流动这样的大型模型云服务平台、腾讯元宝这样的聊天机器人，甚至微信这样的顶级流量平台。然而，AI图像类产品中接入DeepSeek R1的消息却寥寥无几。令人惊讶的是，从DeepSeek-R1发布到Krea宣布上线新功能，仅用了短短10天时间，这在图像产品中堪称最快反应。 Krea率先“吃螃蟹”，降低用户门槛在Krea之前，已有部分平台集成了聊天机器人的生图和改图功能，如ChatGPT，但用户体验并不理想。尽管这些平台通过聊天机器人理解用户意图，但在实际生成和修改图片时...

来源：

白鲸出海公众号【阅读原文】
Tags：AI图像生成 DeepSeek-R1 Krea 图像编辑用户体验

1年前 (2025)

标题：小红书AI搜索革新生活决策，DeepSeek-R1带来全新搜索体验，点点能否撑起小红书的未来？

小红书的AI搜索新篇章：点点与DeepSeek-R1的强强联合近日，小红书旗下的独立AI搜索应用“点点”推出了备受瞩目的“深度思考”功能。据《钛媒体》报道，该功能背后的技术支持很可能是来自开源模型DeepSeek-R1。在微信、抖音等超级App纷纷构建闭环生态的大背景下，小红书选择绑定DeepSeek-R1，无疑是为了快速补齐技术和用户体验上的短板，并在AI搜索领域占据一席之地。然而，从长远来看，这更像是一场“借力”与“自立”的平衡游戏。那么，小红书为何要推出独立的AI搜索应用？点点接入DeepSeek-R1后，搜索能力有何提升？实际使用体...

来源：

AI新榜公众号【阅读原文】
Tags：AI搜索 DeepSeek-R1 小红书搜索体验生活决策

1年前 (2025)

标题：火山引擎推出AI云原生解决方案，DeepSeek-R1实现500万TPM与20ms TPOT云端部署及GPU优化性能突破

部署 DeepSeek 模型的潮流与趋势 DeepSeek 系列模型，尤其是推理模型 DeepSeek-R1 的部署已经成为不可忽视的趋势。AI 和云服务商纷纷采用这些模型来提供先进的 AI 服务，而许多企业和组织也通过部署 DeepSeek 模型来提升自身业务能力，如支持员工工作或增强服务质量。此外，一些学校也在引入 DeepSeek-R1 来辅助教育，并帮助学生建立正确的 AI 使用价值观。例如，中国人民大学、北京交通大学、浙江大学和上海交通大学等高校已经采用了本地部署「满血版」DeepSeek-R1 的做法。本地部署 vs. 云端部署的选择虽然本地部署提...

来源：

机器之心【阅读原文】
Tags：AI云原生 DeepSeek-R1 GPU优化云端部署火山引擎

1年前 (2025)

DeepSeek官方推荐：如何通过Temperature设置、文件上传和模型绕过思维优化R1性能，提升中文查询效果

如何优化部署DeepSeek-R1以获得最佳体验家人们，如何才能让DeepSeek-R1发挥出最佳性能？DeepSeek官方给出了详细的设置建议。以下是我们整理的四个关键设置步骤，帮助你更好地使用DeepSeek-R1。一、不使用系统提示词根据DeepSeek官方推荐，所有的指令应直接包含在用户提示词中，而不是通过系统提示词来传达。这种做法的原因在于R1模型是按照这种方式训练的，确保了更自然和一致的交互效果。二、调整Temperature参数为了防止输出重复或不一致，DeepSeek建议将Temperature参数设置为0.6。具体来说，官方文档指出，将T...

来源：

量子位【阅读原文】
Tags：DeepSeek-R1 Temperature设置中文查询模型绕过思维

1年前 (2025)