标签:gemini 3

卡帕西大模型横评方法太好玩!四大AI匿名参赛评分,最强出乎意料

(由多段落组成): 最近,AI圈又掀起了一股新风潮——斯坦福知名AI专家安德烈·卡帕西(Andrej Karpathy)推出了一款名为“大模型议会”(LLM Council)的趣味性Web应用,瞬间引爆开发者社区和AI爱好者讨论。这个项目不仅设计新颖,还巧妙融合了多个大模型协同决策机制,堪称一次对AI智能边界的大胆探索。 与传统单模型对话不同,“大模型议会”模拟了一个类似“专家评审团”的工作流程。当用户提出一个问题后,系统会通过OpenRouter接口同时调用四个主流大模型:GPT-5.1、Gemini 3 Pro Preview、Claude Sonnet 4.5 和 Grok-4,让...

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

(由多段落组成): 2025年AI领域迎来一场震撼变革——谷歌正式发布Gemini 3系列大模型,凭借其前所未有的综合能力,迅速在多个权威基准测试中超越GPT-5.1与Claude 4.5等顶尖模型,成为当前人工智能领域的“新王者”。尤其在AGI导向的高难度挑战如ARC-AGI-2、数学竞赛AIME 2025(借助工具实现满分),以及长期被大模型视为“禁区”的LiveCodeBench Pro编程任务上,Gemini 3 Pro不仅破局,更刷新纪录,展现出接近人类智能的推理与执行能力。 这一突破性进展甚至让科技圈两位重量级人物——埃隆·马斯克和萨姆·奥特曼——罕见地公开点赞...