168 小时 AI 狂写 300 万行代码造出浏览器!Cursor 公开数百个智能体自主协作方案

(由多段落组成):

2025年,AI在软件开发领域的边界再次被打破。Cursor 创始人 Wilson Zlin 宣布了一项堪称“工程奇迹”的实验成果——通过数百个 AI 智能体协同工作整整七天,从零开始构建出一个可运行的 Web 浏览器,项目代号 FastRender。这一浏览器虽尚未达到 Chrome 或 Firefox 的成熟度,但已能稳定加载并渲染谷歌首页等基础网页,标志着 AI 自主编程迈入全新阶段。更令人震撼的是,该项目完全由 AI 生成,产出代码量超过 300 万行,核心包括一个用 Rust 语言从头编写的渲染引擎,甚至集成了自研的 JavaScript 虚拟机。所有源码已开源发布于 GitHub,供全球开发者研究与复现。

支撑这场大规模自动化开发的核心,是 OpenAI 在2025年12月推出的 GPT-5.2-Codex 模型。该模型被官方定义为“专为复杂软件工程设计的智能体级编码模型”,不再局限于传统的代码补全功能,而是具备任务规划、模块重构、漏洞检测和长期逻辑追踪等类人类工程师能力。其关键技术之一是“上下文压缩”(Context Compaction),能在处理百万行级代码库时保持思维连贯性,避免信息丢失或逻辑断裂。在 SWE-Bench Pro 和 Terminal-Bench 2.0 等权威评测中,GPT-5.2-Codex 均刷新了性能纪录,同时因其强大的安全分析能力,曾帮助研究人员发现 React 框架中的高危漏洞,被誉为“目前最安全的代码生成模型”。

然而,真正让 FastRender 成为可能的,并非单一 AI 的强大,而是 数百个 AI 智能体如何高效协作。初期尝试采用扁平化架构时,问题频发:智能体因文件锁机制频繁等待,导致并发效率极低;部分智能体崩溃后未释放资源,引发系统死锁;更严重的是,在缺乏明确分工的情况下,多数智能体会“挑软柿子捏”,回避关键难题,造成项目停滞。经过多次试错,Cursor 团队最终引入“三层分层架构”:顶层为 规划者(Planner),负责拆解目标、制定任务路线图,并可创建子规划者实现并行策略;中层为 工作者(Worker),专注执行具体编码任务,互不干扰;底层为 裁判(Judge),定期评估进度并决定是否重启迭代流程,确保方向不偏。这种职责分明的设计极大减少了冲突,实现了高吞吐量下的稳定协作。

实验过程中也揭示了一些反直觉的发现。例如,在长时间自主运行场景下,通用型的 GPT-5.2 模型在任务规划方面表现优于专门训练的 GPT-5.1-Codex;而 Anthropic 的 Claude Opus 4.5 则倾向于快速完成任务并交还控制权,更适合人机交互模式,却不适合长周期独立运作。团队强调,提示词工程(Prompt Engineering) 的质量远比模型选择更重要——如何引导 AI 行为、防止“摸鱼”或陷入死循环,需要精心设计指令结构与反馈机制。这些经验对未来的 AI 工程系统设计具有重要参考价值。

FastRender 的成功引发了科技圈广泛讨论。OpenAI 联合创始人 Greg Brockman 称其为“窥见未来软件工厂的一扇窗”。Stability AI 前 CEO Emad Mostaque 估算,整个项目消耗约 30 亿 Token,若按当前价格计算成本仍较高,但随着大模型推理成本持续下降,AI 编程的边际成本正快速趋近于零。尽管如此,质疑声依然存在:有观点指出,训练数据中本就包含大量 Chromium 和 WebKit 的开源代码,AI 实际上是在“重组知识”而非真正创造;此外,数百万行由 AI 生成的代码如同“黑箱”,后续维护与调试将给人类工程师带来巨大挑战。Cursor 团队坦承系统尚不完美,如规划者响应延迟、个别智能体过度运行等问题仍需优化。但这次实验证明了一个关键结论:通过扩展智能体数量来放大 AI 编程能力,是一条切实可行的技术路径。

展望未来,软件开发的范式或将发生根本性变革。人类的角色将更多转向系统架构设计、AI 行为监督与最终成果验证,而具体的编码、测试、优化等繁重任务,则由大规模 AI 智能体集群自动完成。Cursor 正在将本次实验中的协作框架、调度机制与评估体系逐步整合进其商业产品中,推动 AI 编程工具迈向工业化应用。FastRender 不只是一个浏览器,它更像是一个信号:属于 AI 原生开发的新时代,已经悄然开启。

AI写代码, 多智能体协作, GPT-5.2-Codex, FastRender浏览器, 自主编程

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...