标签:Seed-Thinking-v1.5
字节跳动推出200B参数Seed-Thinking-v1.5推理模型,基于强化学习与MoE技术超越满血DeepSeek-R1
字节跳动旗下的豆包团队最近发布了一篇关于其新型推理模型 Seed-Thinking-v1.5 的技术报告。根据报告,这款模型采用 MoE 架构设计,总参数量高达 200B,但在运行时仅激活其中的 20B 参数。尽管规模相对紧凑,但其性能表现却极为出色,在多个领域基准测试中超越了拥有 671B 参数的 DeepSeek-R1 模型。有业内人士猜测,这可能是当前豆包正在使用的深度思考模型。 值得注意的是,字节跳动在近期的一次活动推文中提到,4 月 17 日将在杭州举办的「2025 火山引擎 Force Link AI 创新巡展」上首次亮相一款全新的豆包模型。外界普...