168 小时 AI 狂写 300 万行代码造出浏览器！Cursor 公开数百个智能体自主协作方案

（由多段落组成）：

2025年，AI在软件开发领域的边界再次被打破。Cursor 创始人 Wilson Zlin 宣布了一项堪称“工程奇迹”的实验成果——通过数百个 AI 智能体协同工作整整七天，从零开始构建出一个可运行的 Web 浏览器，项目代号 FastRender。这一浏览器虽尚未达到 Chrome 或 Firefox 的成熟度，但已能稳定加载并渲染谷歌首页等基础网页，标志着 AI 自主编程迈入全新阶段。更令人震撼的是，该项目完全由 AI 生成，产出代码量超过 300 万行，核心包括一个用 Rust 语言从头编写的渲染引擎，甚至集成了自研的 JavaScript 虚拟机。所有源码已开源发布于 GitHub，供全球开发者研究与复现。

支撑这场大规模自动化开发的核心，是 OpenAI 在2025年12月推出的 GPT-5.2-Codex 模型。该模型被官方定义为“专为复杂软件工程设计的智能体级编码模型”，不再局限于传统的代码补全功能，而是具备任务规划、模块重构、漏洞检测和长期逻辑追踪等类人类工程师能力。其关键技术之一是“上下文压缩”（Context Compaction），能在处理百万行级代码库时保持思维连贯性，避免信息丢失或逻辑断裂。在 SWE-Bench Pro 和 Terminal-Bench 2.0 等权威评测中，GPT-5.2-Codex 均刷新了性能纪录，同时因其强大的安全分析能力，曾帮助研究人员发现 React 框架中的高危漏洞，被誉为“目前最安全的代码生成模型”。

然而，真正让 FastRender 成为可能的，并非单一 AI 的强大，而是数百个 AI 智能体如何高效协作。初期尝试采用扁平化架构时，问题频发：智能体因文件锁机制频繁等待，导致并发效率极低；部分智能体崩溃后未释放资源，引发系统死锁；更严重的是，在缺乏明确分工的情况下，多数智能体会“挑软柿子捏”，回避关键难题，造成项目停滞。经过多次试错，Cursor 团队最终引入“三层分层架构”：顶层为规划者（Planner），负责拆解目标、制定任务路线图，并可创建子规划者实现并行策略；中层为工作者（Worker），专注执行具体编码任务，互不干扰；底层为裁判（Judge），定期评估进度并决定是否重启迭代流程，确保方向不偏。这种职责分明的设计极大减少了冲突，实现了高吞吐量下的稳定协作。

实验过程中也揭示了一些反直觉的发现。例如，在长时间自主运行场景下，通用型的 GPT-5.2 模型在任务规划方面表现优于专门训练的 GPT-5.1-Codex；而 Anthropic 的 Claude Opus 4.5 则倾向于快速完成任务并交还控制权，更适合人机交互模式，却不适合长周期独立运作。团队强调，提示词工程（Prompt Engineering）的质量远比模型选择更重要——如何引导 AI 行为、防止“摸鱼”或陷入死循环，需要精心设计指令结构与反馈机制。这些经验对未来的 AI 工程系统设计具有重要参考价值。

FastRender 的成功引发了科技圈广泛讨论。OpenAI 联合创始人 Greg Brockman 称其为“窥见未来软件工厂的一扇窗”。Stability AI 前 CEO Emad Mostaque 估算，整个项目消耗约 30 亿 Token，若按当前价格计算成本仍较高，但随着大模型推理成本持续下降，AI 编程的边际成本正快速趋近于零。尽管如此，质疑声依然存在：有观点指出，训练数据中本就包含大量 Chromium 和 WebKit 的开源代码，AI 实际上是在“重组知识”而非真正创造；此外，数百万行由 AI 生成的代码如同“黑箱”，后续维护与调试将给人类工程师带来巨大挑战。Cursor 团队坦承系统尚不完美，如规划者响应延迟、个别智能体过度运行等问题仍需优化。但这次实验证明了一个关键结论：通过扩展智能体数量来放大 AI 编程能力，是一条切实可行的技术路径。

展望未来，软件开发的范式或将发生根本性变革。人类的角色将更多转向系统架构设计、AI 行为监督与最终成果验证，而具体的编码、测试、优化等繁重任务，则由大规模 AI 智能体集群自动完成。Cursor 正在将本次实验中的协作框架、调度机制与评估体系逐步整合进其商业产品中，推动 AI 编程工具迈向工业化应用。FastRender 不只是一个浏览器，它更像是一个信号：属于 AI 原生开发的新时代，已经悄然开启。

AI写代码, 多智能体协作, GPT-5.2-Codex, FastRender浏览器, 自主编程

本文来源：