大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜

当然可以！以下是根据您提供的原文，模仿人工撰写方式整理出的文章。文章在保留核心信息的基础上进行了语义重构和语言优化，更符合SEO搜索习惯，并增强可读性。

## （由多段落组成）

AI编程新突破：开源模型首次实现代码图理解，无需Agent即可修复Bug

近日，一项由蚂蚁集团研究团队主导的AI研究成果引发广泛关注。他们提出了一种全新的代码处理方法——Code Graph Model（CGM），该模型首次实现了对代码图结构的直接理解，从而大幅提升代码修复效率，在SWE-Bench开源榜单中名列前茅。

与以往依赖复杂Agent流程或闭源模型不同，CGM完全基于开源架构构建，却在性能上达到了媲美GPT-4等商业大模型的水平。这一突破标志着AI辅助软件工程迈入了一个新的阶段。

CGM技术亮点：融合图结构与自然语言模态

CGM的核心创新在于将传统大语言模型（LLM）与代码仓库的图结构深度融合。通过引入“图-语言”跨模态建模机制，模型能够同时理解代码的语义及其项目结构关系，从而更高效地完成如Bug修复、代码补全等任务。

具体而言，CGM将代码仓库中的函数、类、文件等元素抽象为图节点，并通过调用、继承等关系建立边连接，形成一个完整的项目依赖图谱。随后，利用小型编码器（如CodeT5+）对这些图节点进行压缩表示，并通过适配器映射至LLM嵌入空间，使模型具备处理大规模代码上下文的能力。

此外，CGM还引入了图感知注意力掩码机制，让模型在生成代码时能精准识别节点间的依赖关系，避免传统模型因上下文混乱而导致的错误。

两阶段训练策略：从结构理解到问题泛化

为了提升模型对代码图的理解能力，研究团队设计了两阶段训练框架：

1. 子图重构预训练：通过“图生代码”的方式，训练模型根据部分图结构重建原始代码片段。该过程采用层级化拼接策略，确保输出代码在结构和逻辑上的连贯性。
2. 噪声增强微调：使用真实GitHub问题与修复数据集进行微调，并在提示中加入一定比例的干扰信息，以增强模型在复杂场景下的鲁棒性和泛化能力。

这种训练方式不仅提升了模型的准确性，也增强了其在实际应用中的适应性。

推理框架升级：Graph-RAG替代传统Agent系统

传统的AI代码修复方案通常依赖复杂的Agent系统，涉及多个模块的协同工作，推理路径长且容易出错。而CGM则采用了轻量化的Graph-RAG框架，简化了整个推理流程。

Graph-RAG包括四个核心组件：

– 检索器（Retriever）：结合语义与结构信息检索关键子图；
– 重排器（Reranker）：筛选最关键的信息用于后续生成；
– 生成器（Reader）：基于子图与提示生成最终代码补丁。

相比传统Agent系统，Graph-RAG不仅减少了模块数量，还显著提升了处理效率，实现了更快速、更精准的代码修复。

实验结果亮眼：多项指标登顶开源榜单

在多个权威基准测试中，CGM展现出了卓越的性能表现：
– 在SWE-bench Lite榜单中，CGM以44%的解决率位居开源模型榜首；
– 在SWE-bench Verified中，达到50.40%，优于现有最佳开源模型7.33%；
– 针对Java项目，在SWE-bench-java Verified上取得14.29%的成绩，领先同类型模型4.4个百分点；
– 在代码补全任务中，CGM在ComplexCodeEval和CrossCodeEval等指标上也大幅领先于同类开源模型。

值得一提的是，CGM具备良好的通用性，可在不同基座模型（如CodeLlama-7B、DeepSeek-Coder-7B）上部署，并展现出超越传统RAG系统的性能优势。

开源开放，助力开发者与企业落地应用

作为一款完全开源的解决方案，CGM不仅提供了完整的技术论文、模型权重，还包括训练数据与核心代码，方便开发者自由探索与二次开发。

这不仅降低了AI辅助编程的门槛，也为企业和科研机构提供了一个透明、可控、可定制的智能代码处理工具。对于希望摆脱对闭源模型依赖、追求自主可控的团队来说，CGM无疑是一个极具吸引力的选择。

目前，CGM的相关资源已在GitHub和HuggingFace平台发布，感兴趣的读者可以通过以下链接获取更多信息：

– 技术论文：[https：//arxiv.org/abs/2505.16901](https：//arxiv.org/abs/2505.16901)
– 开源代码：[https：//github.com/codefuse-ai/CodeFuse-CGM](https：//github.com/codefuse-ai/CodeFuse-CGM)
– 模型权重：[https：//huggingface.co/codefuse-ai/CodeFuse-CGM-72B](https：//huggingface.co/codefuse-ai/CodeFuse-CGM-72B)
– 训练数据：[https：//huggingface.co/datasets/codefuse-ai/CodeGraph](https：//huggingface.co/datasets/codefuse-ai/CodeGraph)

AI代码修复, 开源大模型, Code Graph Model, SWE-Bench榜单, 图语言多模态

本文来源：

量子位【阅读原文】

文章版权归作者所有，未经允许请勿转载。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜

AI滤镜助力生成式AI营销，Infinix携手Snapchat打造品牌本地化新玩法提升用户互动体验

阿里新版Qwen VLo多模态模型震撼上线，支持指令编辑图片与AI视觉创作，免费体验媲美GPT-4o的图像生成能力

相关文章

暂无评论

AI最新资讯