(由多段落组成)
近年来,AI技术的飞速发展引发了广泛关注。近期,Nature发表了一篇关于“智能体摩尔定律”的文章,揭示了AI在完成长期任务方面的惊人进步速度。根据非营利研究机构METR的研究发现,AI的能力大约每七个月翻一番。这意味着,在未来五年内,AI有望自动完成许多目前需要人类一个月才能完成的任务。
为了更好地衡量AI完成任务的能力变化,研究人员提出了“50%-任务完成时间跨度”这一指标。该指标以50%任务成功率为基准,用于评估AI模型在不同时间段内的表现。例如,假设2019年AI完成某项任务所需的时间相当于人类10分钟的工作量,那么7个月后,这项任务对应的人类工作时间将变为20分钟。这表明AI能够处理越来越复杂和耗时的任务。
2024年,AI能力的增长速度进一步加快,部分最新模型的能力甚至每三个月翻一番。按照这一趋势,预计到2028年11月,AI可能达到能够完成人类一个月任务的能力;而在较为保守的估计下,这一目标可能在2031年2月实现。
METR团队通过一系列实验验证了这一趋势的可靠性。他们选择了三个不同的任务套件来评估AI模型的表现:HCAST任务、RE-Bench任务和SWAA任务。这些任务涵盖了软件工程、机器学习、网络安全等多个领域,难度从几分钟到几十小时不等。研究团队还招募了800多名专业人员参与实验,并记录了他们在完成任务时所需的时间。这些数据被用作衡量任务难度的标准。
随后,研究人员评估了从2019年到2025年发布的13个前沿AI模型,包括GPT系列和o1、Sonnet 3.7等。通过运行这些模型并记录其完成任务的成功率,团队引入了一个新的指标——“50%任务完成时间跨度”。这个指标反映了AI模型在50%成功率下能够完成的任务平均时间长度。研究表明,自2019年以来,AI模型的时间跨度呈现出指数级增长,每七个月左右翻一番。
此外,研究人员还进行了多项实验以验证结果的外部有效性。例如,他们分析了任务的“混乱度”对AI性能的影响,并在其他数据集上应用相同方法进行对比。结果显示,无论任务的复杂程度如何,AI的性能都在稳步提升。这进一步证明了“智能体摩尔定律”的可靠性。
总之,随着AI技术的不断发展,智能体将迎来爆发式增长。虽然研究仍存在一些局限性,但“智能体摩尔定律”为未来AI的发展提供了重要的参考依据。
本文来源: