标签:性能对比

DeepSeek R1新版发布,开源AI编程能力与性能对比引发外国网友热议,智能指数再创新高

几天前,DeepSeek 在没有预热和发布会的情况下低调发布了 DeepSeek R1(0528)的更新。这次更新引起了海外媒体的广泛关注,尤其是其幻觉率削减了约 45%-50%,性能接近 OpenAI 的 o3 和 Google 的 Gemini 2.5 Pro。开发者和研究人员在社交媒体上热议这一新版本的能力,尤其是在与科技巨头旗舰模型的对比中。 在 reddit 和其他 AI 社区中,用户们对 DeepSeek R1 的表现进行了测试和讨论。有用户表示,R1 在 LiveCodeBench 上的表现几乎与 OpenAI 的 O3 模型持平,这被视为开源社区的巨大胜利。此外,R1 在数学问题和编程方面...

「DeepSeek-R1接棒OpenAI,基于强化学习的多模态模型开源,引发AI圈性能对比热潮」

国内创业公司实现 OpenAI 愿景,多模态模型 K1.5 和 DeepSeek-R1 引领 AI 领域 最近,大模型领域再次掀起热潮。国内创业公司月之暗面发布了数学、代码和多模态推理能力全面对标 OpenAI 的满血版 o1 的多模态思考模型 K1.5。与此同时,备受瞩目的 DeepSeek 也正式推出了其新版本 DeepSeek-R1,在数学、代码和自然语言推理等任务上与 OpenAI 的 o1 正式版不相上下。 去年 12 月开源的 DeepSeek-V3 刚刚引发了一阵热潮,实现了诸多不可能的任务。此次发布的 R1 大模型更是让众多 AI 研究者感到震惊。AutoAWQ 作者 Casper Hans...