标签：gemini 3

卡帕西大模型横评方法太好玩！四大AI匿名参赛评分，最强出乎意料

（由多段落组成）：最近，AI圈又掀起了一股新风潮——斯坦福知名AI专家安德烈·卡帕西（Andrej Karpathy）推出了一款名为“大模型议会”（LLM Council）的趣味性Web应用，瞬间引爆开发者社区和AI爱好者讨论。这个项目不仅设计新颖，还巧妙融合了多个大模型协同决策机制，堪称一次对AI智能边界的大胆探索。与传统单模型对话不同，“大模型议会”模拟了一个类似“专家评审团”的工作流程。当用户提出一个问题后，系统会通过OpenRouter接口同时调用四个主流大模型：GPT-5.1、Gemini 3 Pro Preview、Claude Sonnet 4.5 和 Grok-4，让...

来源：

量子位【阅读原文】 Tags：gemini 3 卡帕西大模型

8个月前

谷歌Gemini 3把GPT-5.1打成计量单位！马斯克奥特曼都服了

（由多段落组成）： 2025年AI领域迎来一场震撼变革——谷歌正式发布Gemini 3系列大模型，凭借其前所未有的综合能力，迅速在多个权威基准测试中超越GPT-5.1与Claude 4.5等顶尖模型，成为当前人工智能领域的“新王者”。尤其在AGI导向的高难度挑战如ARC-AGI-2、数学竞赛AIME 2025（借助工具实现满分），以及长期被大模型视为“禁区”的LiveCodeBench Pro编程任务上，Gemini 3 Pro不仅破局，更刷新纪录，展现出接近人类智能的推理与执行能力。这一突破性进展甚至让科技圈两位重量级人物——埃隆·马斯克和萨姆·奥特曼——罕见地公开点赞...

来源：

量子位【阅读原文】 Tags：Gemini gemini 3 谷歌

8个月前