标签：卡帕西

卡帕西大模型横评方法太好玩！四大AI匿名参赛评分，最强出乎意料

（由多段落组成）：最近，AI圈又掀起了一股新风潮——斯坦福知名AI专家安德烈·卡帕西（Andrej Karpathy）推出了一款名为“大模型议会”（LLM Council）的趣味性Web应用，瞬间引爆开发者社区和AI爱好者讨论。这个项目不仅设计新颖，还巧妙融合了多个大模型协同决策机制，堪称一次对AI智能边界的大胆探索。与传统单模型对话不同，“大模型议会”模拟了一个类似“专家评审团”的工作流程。当用户提出一个问题后，系统会通过OpenRouter接口同时调用四个主流大模型：GPT-5.1、Gemini 3 Pro Preview、Claude Sonnet 4.5 和 Grok-4，让...

来源：

量子位【阅读原文】 Tags：gemini 3 卡帕西大模型

8个月前

卡帕西：强化学习很糟糕，但其他所有方法都更糟

（由多段落组成）：近年来，人工智能领域的发展如火如荼，但关于其核心技术路径的争议也从未停歇。在一场长达两个半小时的深度访谈中，AI界传奇人物安德烈·卡帕西（Andrej Karpathy）——前特斯拉AI总监、OpenAI创始成员之一，分享了他对当前AI技术现状与未来趋势的犀利见解。他直言：“强化学习其实很糟糕，但遗憾的是，其他所有方法更糟。” 这句看似矛盾却充满哲思的话，揭示了当前AI研发中的现实困境。卡帕西认为，尽管大语言模型（LLM）展现出惊人的能力，例如Claude、Codex等已能辅助编程和生成，但我们距离真正意义上...

来源：

量子位【阅读原文】 Tags：卡帕西

9个月前

卡帕西用nanochat手搓ChatGPT，百元大模型训练教程揭秘LLM实现全过程

（由多段落组成）： 2025年10月，AI教育领域的传奇人物Andrej Karpathy（卡帕西）重磅回归，推出全新开源项目 nanochat —— 一个仅用8000行代码从零构建的类ChatGPT全栈训练与推理系统。该项目成本极低，仅需约100美元即可在云GPU上完成训练，最快4小时就能拥有一个可对话、能写诗讲故事、甚至解答基础数学题的语言模型。这一“手搓大模型”的实践教程迅速引爆GitHub社区，上线不久Star数便突破4.8k，网友惊呼：“跑完这个项目，简历上直接写‘机器学习工程师’！” nanochat的核心理念是极简、透明、可读性强，旨在为开发者和学...

来源：

量子位【阅读原文】
Tags：（关键词用逗号间隔分隔） LLM训练教程 nanochat 卡帕西手搓ChatGPT 百元大模型

9个月前