标签:卡帕西
卡帕西大模型横评方法太好玩!四大AI匿名参赛评分,最强出乎意料
(由多段落组成): 最近,AI圈又掀起了一股新风潮——斯坦福知名AI专家安德烈·卡帕西(Andrej Karpathy)推出了一款名为“大模型议会”(LLM Council)的趣味性Web应用,瞬间引爆开发者社区和AI爱好者讨论。这个项目不仅设计新颖,还巧妙融合了多个大模型协同决策机制,堪称一次对AI智能边界的大胆探索。 与传统单模型对话不同,“大模型议会”模拟了一个类似“专家评审团”的工作流程。当用户提出一个问题后,系统会通过OpenRouter接口同时调用四个主流大模型:GPT-5.1、Gemini 3 Pro Preview、Claude Sonnet 4.5 和 Grok-4,让...
卡帕西:强化学习很糟糕,但其他所有方法都更糟
(由多段落组成): 近年来,人工智能领域的发展如火如荼,但关于其核心技术路径的争议也从未停歇。在一场长达两个半小时的深度访谈中,AI界传奇人物安德烈·卡帕西(Andrej Karpathy)——前特斯拉AI总监、OpenAI创始成员之一,分享了他对当前AI技术现状与未来趋势的犀利见解。他直言:“强化学习其实很糟糕,但遗憾的是,其他所有方法更糟。” 这句看似矛盾却充满哲思的话,揭示了当前AI研发中的现实困境。 卡帕西认为,尽管大语言模型(LLM)展现出惊人的能力,例如Claude、Codex等已能辅助编程和生成,但我们距离真正意义上...
卡帕西用nanochat手搓ChatGPT,百元大模型训练教程揭秘LLM实现全过程
(由多段落组成): 2025年10月,AI教育领域的传奇人物Andrej Karpathy(卡帕西)重磅回归,推出全新开源项目 nanochat —— 一个仅用8000行代码从零构建的类ChatGPT全栈训练与推理系统。该项目成本极低,仅需约100美元即可在云GPU上完成训练,最快4小时就能拥有一个可对话、能写诗讲故事、甚至解答基础数学题的语言模型。这一“手搓大模型”的实践教程迅速引爆GitHub社区,上线不久Star数便突破4.8k,网友惊呼:“跑完这个项目,简历上直接写‘机器学习工程师’!” nanochat的核心理念是极简、透明、可读性强,旨在为开发者和学...