标签：性能对比

DeepSeek R1新版发布，开源AI编程能力与性能对比引发外国网友热议，智能指数再创新高

几天前，DeepSeek 在没有预热和发布会的情况下低调发布了 DeepSeek R1（0528）的更新。这次更新引起了海外媒体的广泛关注，尤其是其幻觉率削减了约 45%-50%，性能接近 OpenAI 的 o3 和 Google 的 Gemini 2.5 Pro。开发者和研究人员在社交媒体上热议这一新版本的能力，尤其是在与科技巨头旗舰模型的对比中。在 reddit 和其他 AI 社区中，用户们对 DeepSeek R1 的表现进行了测试和讨论。有用户表示，R1 在 LiveCodeBench 上的表现几乎与 OpenAI 的 O3 模型持平，这被视为开源社区的巨大胜利。此外，R1 在数学问题和编程方面...

来源：

iFeng科技【阅读原文】
Tags：DeepSeek-R1 开源 AI 性能对比智能指数编程能力

1年前 (2025)

「DeepSeek-R1接棒OpenAI，基于强化学习的多模态模型开源，引发AI圈性能对比热潮」

国内创业公司实现 OpenAI 愿景，多模态模型 K1.5 和 DeepSeek-R1 引领 AI 领域最近，大模型领域再次掀起热潮。国内创业公司月之暗面发布了数学、代码和多模态推理能力全面对标 OpenAI 的满血版 o1 的多模态思考模型 K1.5。与此同时，备受瞩目的 DeepSeek 也正式推出了其新版本 DeepSeek-R1，在数学、代码和自然语言推理等任务上与 OpenAI 的 o1 正式版不相上下。去年 12 月开源的 DeepSeek-V3 刚刚引发了一阵热潮，实现了诸多不可能的任务。此次发布的 R1 大模型更是让众多 AI 研究者感到震惊。AutoAWQ 作者 Casper Hans...

来源：

机器之心【阅读原文】
Tags：DeepSeek-R1 多模态模型开源模型强化学习性能对比

2年前 (2025)