智能体摩尔定律：AI能力每7个月翻倍，任务完成时间跨度显著缩短，METR指标下的Agent发展新纪元

（由多段落组成）

近年来，AI技术的飞速发展引发了广泛关注。近期，Nature发表了一篇关于“智能体摩尔定律”的文章，揭示了AI在完成长期任务方面的惊人进步速度。根据非营利研究机构METR的研究发现，AI的能力大约每七个月翻一番。这意味着，在未来五年内，AI有望自动完成许多目前需要人类一个月才能完成的任务。

为了更好地衡量AI完成任务的能力变化，研究人员提出了“50%-任务完成时间跨度”这一指标。该指标以50%任务成功率为基准，用于评估AI模型在不同时间段内的表现。例如，假设2019年AI完成某项任务所需的时间相当于人类10分钟的工作量，那么7个月后，这项任务对应的人类工作时间将变为20分钟。这表明AI能够处理越来越复杂和耗时的任务。

2024年，AI能力的增长速度进一步加快，部分最新模型的能力甚至每三个月翻一番。按照这一趋势，预计到2028年11月，AI可能达到能够完成人类一个月任务的能力；而在较为保守的估计下，这一目标可能在2031年2月实现。

METR团队通过一系列实验验证了这一趋势的可靠性。他们选择了三个不同的任务套件来评估AI模型的表现：HCAST任务、RE-Bench任务和SWAA任务。这些任务涵盖了软件工程、机器学习、网络安全等多个领域，难度从几分钟到几十小时不等。研究团队还招募了800多名专业人员参与实验，并记录了他们在完成任务时所需的时间。这些数据被用作衡量任务难度的标准。

随后，研究人员评估了从2019年到2025年发布的13个前沿AI模型，包括GPT系列和o1、Sonnet 3.7等。通过运行这些模型并记录其完成任务的成功率，团队引入了一个新的指标——“50%任务完成时间跨度”。这个指标反映了AI模型在50%成功率下能够完成的任务平均时间长度。研究表明，自2019年以来，AI模型的时间跨度呈现出指数级增长，每七个月左右翻一番。

此外，研究人员还进行了多项实验以验证结果的外部有效性。例如，他们分析了任务的“混乱度”对AI性能的影响，并在其他数据集上应用相同方法进行对比。结果显示，无论任务的复杂程度如何，AI的性能都在稳步提升。这进一步证明了“智能体摩尔定律”的可靠性。

总之，随着AI技术的不断发展，智能体将迎来爆发式增长。虽然研究仍存在一些局限性，但“智能体摩尔定律”为未来AI的发展提供了重要的参考依据。

本文来源：