对抗 OpenAI GPT-5.2:谷歌祭出 Gemini Deep Research 深度研究智能体并首次向开发者开放,DeepSearchQA 因果链测试基准重磅开源

(由多段落组成):

近日,随着OpenAI推出GPT-5.2,科技巨头之间的AI竞赛再度升温。谷歌迅速回应,发布了全新的Gemini Deep Research——一款专为复杂研究任务设计的深度智能代理系统。该模型基于性能更强的Gemini 1.5 Pro架构打造,在长周期信息收集与综合分析方面实现重大突破。相比以往版本,其幻觉率显著下降达40%,被官方称为迄今为止“最注重事实准确性”的AI模型之一。

此次更新不仅提升了模型本身的能力,更标志着人工智能在自主研究领域的工业化落地迈出关键一步。Gemini Deep Research具备自主规划研究路径的能力,能够反复执行搜索、阅读、识别知识盲区并再次检索的闭环流程。这种多轮迭代式推理机制,使其在处理跨领域、高复杂度的研究问题时表现出色。据谷歌DeepMind产品经理卢卡斯・哈斯(Lukas Haas)透露,该智能体已在内部测试中达到SOTA(当前最优水平),在全新评估基准DeepSearchQA上得分高达46.4%,在公开挑战集BrowseComp中的表现可与GPT-5 Pro媲美,而运行成本仅为后者的十分之一左右。

为了更科学地衡量AI在真实研究场景下的能力,谷歌同步开源了一项重要工具——DeepSearchQA,这是一个面向复杂检索任务的新型评测基准。该数据集涵盖17个专业领域、共计900个“因果链”型研究问题,每个步骤都依赖前序分析结果,要求模型完成多跳推理和全面信息整合。这不仅提高了评估的真实性,也为开发者提供了诊断“思考时间”对输出质量影响的有效手段。初步实验表明,增加推理和搜索步骤能显著提升回答准确率,这一方向将在后续版本中持续优化。

目前,Gemini Deep Research已在金融、生物医药、市场调研等多个高精度需求行业展开试点应用。例如,在金融服务领域,企业利用其自动化完成尽职调查前期的信息聚合工作,包括市场趋势捕捉、竞争对手分析及合规风险筛查,大幅缩短研究周期。生物科技公司Axiom Bio则借助该系统进行药物毒性相关的文献综述,实现了更高颗粒度的知识挖掘,有效加速新药研发进程。

对于开发者而言,谷歌此次还推出了全新的Interactions API,首次将Deep Research能力开放给第三方应用构建者。通过Google AI Studio获取API密钥后,开发者即可调用该接口实现文件解析(支持PDF、CSV等格式)、结构化输出(如JSON Schema)、精细化引用管理以及自定义报告模板等功能。用户可通过提示词控制输出结构,生成包含标题、表格和来源标注的专业级研究报告,极大增强自动化系统的可用性与可信度。

展望未来,谷歌计划进一步拓展该技术的应用边界。除了即将在Google Search、NotebookLM、Google Finance和Gemini App中集成Deep Research功能外,还将为Interactions API加入原生图表生成功能,并扩展对Model Context Protocol(MCP)的支持,以接入更多私有或定制化数据源。此外,企业级平台Vertex AI也将上线该服务,助力组织构建专属的智能研究引擎。

感兴趣的开发者可访问谷歌官方博客和技术文档,查看DeepSearchQA数据集、排行榜、Colab示例及详细的技术白皮书,深入了解其架构设计与实践潜力。

Gemini Deep Research, Interactions API, DeepSearchQA, AI自主研究, 谷歌AI

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...