(由多段落组成):
近年来,人工智能领域的发展如火如荼,但关于其核心技术路径的争议也从未停歇。在一场长达两个半小时的深度访谈中,AI界传奇人物安德烈·卡帕西(Andrej Karpathy)——前特斯拉AI总监、OpenAI创始成员之一,分享了他对当前AI技术现状与未来趋势的犀利见解。他直言:“强化学习其实很糟糕,但遗憾的是,其他所有方法更糟。” 这句看似矛盾却充满哲思的话,揭示了当前AI研发中的现实困境。
卡帕西认为,尽管大语言模型(LLM)展现出惊人的能力,例如Claude、Codex等已能辅助编程和生成,但我们距离真正意义上的“智能体时代”仍有相当距离。他预测,通用人工智能(AGI)的全面实现至少还需要十年时间。为什么是十年?因为他强调,真正的智能体不应只是工具,而应具备像实习生一样协同工作的能力——能够理解上下文、执行复杂任务、持续学习并适应新环境。然而目前的系统在多模态理解、计算机操作能力和长期记忆方面仍存在明显短板,认知架构尚未成熟,难以支撑真正的自主行为。
在谈到当前主流的训练方式时,卡帕西对强化学习提出了尖锐批评。他指出,当前基于“试错+结果反馈”的强化学习机制本质上是一种高成本、低效率的学习方式。以解数学题为例,模型会生成数百种解法路径,只要最终答案正确,整个过程就会被整体奖励,哪怕其中包含大量错误推理步骤。这种“结果导向”的训练方式充满了噪声,容易固化错误逻辑,远不如人类通过反思与归纳来优化思维的过程高效。相比之下,卡帕西更期待在预训练阶段引入类似“思考消化”的机制,让模型不仅能预测下一个词,更能真正整合信息、构建知识体系。
对于AGI的社会影响,卡帕西持理性乐观态度。他认为,AGI并不会带来所谓的“智力爆炸”或经济断层式跃迁,而是将继续维持过去两个世纪以来约2%的年均GDP增长率。这一观点源于他对自动化历史的观察:从工业革命的物理自动化,到软件时代的数字自动化,再到如今的智能自动化,每一次变革都是渐进式的替代与增强。未来的AGI将扮演“自主性滑块”的角色——处理80%的常规任务,剩余20%由人类监督完成,从而实现人机协作的最优平衡。
谈及自动驾驶为何进展缓慢,卡帕西结合自己在特斯拉五年的实战经验给出了深刻解释。他表示,从技术演示到可落地的产品之间存在着巨大鸿沟,尤其在安全攸关的场景下,“9的进度”至关重要。每提升一个“9”的可靠性(如从99%到99.9%),所需投入的工程量呈指数级增长。现实中无数边缘案例需要逐一攻克,任何微小漏洞都可能导致严重后果。正因如此,自动驾驶的研发注定是一场持久战,无法一蹴而就。
作为现已全职投身教育的技术领袖,卡帕西也畅谈了他对未来教育的构想。他希望打造一所现代化的技术学府,提供接近“一对一导师制”的个性化学习体验。以他自己学习韩语的经历为例,优秀的导师能快速洞察学生的认知水平,并设计恰到好处的挑战。而当前的大模型虽然强大,尚不具备这种动态诊断与适应能力。为此,他正在开发一门名为LLM101N的高质量AI课程,其中Nanochat项目便是学生动手实践的核心环节。他还计划组建助教团队、完善中间教学,致力于让每位学习者都能获得顶尖的学习旅程。
这场信息密度极高的对话引发了广泛讨论。有网友认同卡帕西对LLM“健忘症”和泛化能力不足的批评,也有开发者表示,如今的编码智能体已在实际工作中表现出高度可靠性。无论如何,卡帕西的观点提醒我们:AI的进步不能仅靠堆算力和数据,更需要在认知架构、学习机制和人机交互层面进行根本性创新。
AGI, 强化学习, 大语言模型, 自动驾驶, 教育科技
本文来源: