苹果发布 DiffuCode-7B-cpGRPO 编程 AI 模型:基于 Qwen2.5-7B,可不按顺序生成代码

近日,苹果公司在 Hugging Face 平台上悄然发布了一款名为 DiffuCode-7B-cpGRPO 的开源 AI 模型。这款模型专注于代码生成任务,并展现出与传统大语言模型(LLM)不同的创新特性。据 IT之家了解,该模型不仅在性能上接近当前主流的顶级开源编码模型,还在生成逻辑上进行了重要改进。

目前大多数 LLM 在生成文本或代码时,通常采用“自回归”方式,即按照从左到右、从上到下的顺序逐字生成。这种方式虽然稳定,但限制了模型在生成过程中的灵活性。此外,这些模型还会使用一个称为“温度”(Temperature)的参数来控制输出结果的随机性。较低的温度值意味着更倾向于选择概率最高的 token,而较高的温度则允许模型尝试更多可能性。

苹果此次发布的 DiffuCode-7B-cpGRPO 则采用了另一种生成机制——扩散模型(Diffusion Model)。这类模型广泛应用于图像生成领域,其核心思想是从一个充满噪声的数据起点开始,通过多次迭代逐步去除噪声,最终得到符合用户需求的结果。将这一机制引入代码生成,使得模型能够在生成过程中跳脱传统的顺序限制,实现更为灵活的代码构建流程。

根据相关论文《DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation》介绍,DiffuCode-7B-cpGRPO 是基于阿里开源的 Qwen2.5-7B 模型进行改造而来。研究人员依照论文中提出的策略,将原本基于自回归结构的模型重构为基于扩散机制的解码器,并进一步优化其指令理解能力。

为了提升模型的表现力,开发团队还使用了超过 20,000 个高质量编程样例对模型进行了微调训练。测试结果显示,在不依赖固定生成顺序的前提下,DiffuCode-7B-cpGRPO 在主流代码评测基准上的表现优于现有扩散模型约 4.4%,显示出其在代码生成领域的巨大潜力。

这一新模型的推出,标志着苹果在 AI 编程工具的研发方面迈出了重要一步,也为未来代码生成技术的发展提供了新的思路和方向。

苹果AI模型, DiffuCode-7B-cpGRPO, 代码生成, 扩散模型, 开源模型

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...