标签:原始性创新
字节Seed开源代码模型助力AI普惠,小模型管理数据范式引领原始性创新突破
字节跳动旗下的Seed项目近期首次开源了其代码模型——Seed-Coder,这款8B参数规模的模型在多个基准测试中取得了SOTA(State of the Art)的表现。Seed-Coder不仅超越了Qwen3等现有模型,还提出了一种创新的数据管理范式,即通过小模型自主生成和筛选高质量训练数据,从而大幅提升代码生成能力。 模型版本与特性 Seed-Coder提供了三个主要版本:Base、Instruct和Reasoning。其中,Instruct版本在编程任务上表现出色,拿下了两个测试基准的SOTA;而推理版本则在IOI 2024比赛中超越了QwQ-32B和DeepSeek-R1。该模型拥有32K上下文...