对抗 OpenAI GPT-5.2：谷歌祭出 Gemini Deep Research 深度研究智能体并首次向开发者开放，DeepSearchQA 因果链测试基准重磅开源

（由多段落组成）：

近日，随着OpenAI推出GPT-5.2，科技巨头之间的AI竞赛再度升温。谷歌迅速回应，发布了全新的Gemini Deep Research——一款专为复杂研究任务设计的深度智能代理系统。该模型基于性能更强的Gemini 1.5 Pro架构打造，在长周期信息收集与综合分析方面实现重大突破。相比以往版本，其幻觉率显著下降达40%，被官方称为迄今为止“最注重事实准确性”的AI模型之一。

此次更新不仅提升了模型本身的能力，更标志着人工智能在自主研究领域的工业化落地迈出关键一步。Gemini Deep Research具备自主规划研究路径的能力，能够反复执行搜索、阅读、识别知识盲区并再次检索的闭环流程。这种多轮迭代式推理机制，使其在处理跨领域、高复杂度的研究问题时表现出色。据谷歌DeepMind产品经理卢卡斯・哈斯（Lukas Haas）透露，该智能体已在内部测试中达到SOTA（当前最优水平），在全新评估基准DeepSearchQA上得分高达46.4%，在公开挑战集BrowseComp中的表现可与GPT-5 Pro媲美，而运行成本仅为后者的十分之一左右。

为了更科学地衡量AI在真实研究场景下的能力，谷歌同步开源了一项重要工具——DeepSearchQA，这是一个面向复杂检索任务的新型评测基准。该数据集涵盖17个专业领域、共计900个“因果链”型研究问题，每个步骤都依赖前序分析结果，要求模型完成多跳推理和全面信息整合。这不仅提高了评估的真实性，也为开发者提供了诊断“思考时间”对输出质量影响的有效手段。初步实验表明，增加推理和搜索步骤能显著提升回答准确率，这一方向将在后续版本中持续优化。

目前，Gemini Deep Research已在金融、生物医药、市场调研等多个高精度需求行业展开试点应用。例如，在金融服务领域，企业利用其自动化完成尽职调查前期的信息聚合工作，包括市场趋势捕捉、竞争对手分析及合规风险筛查，大幅缩短研究周期。生物科技公司Axiom Bio则借助该系统进行药物毒性相关的文献综述，实现了更高颗粒度的知识挖掘，有效加速新药研发进程。

对于开发者而言，谷歌此次还推出了全新的Interactions API，首次将Deep Research能力开放给第三方应用构建者。通过Google AI Studio获取API密钥后，开发者即可调用该接口实现文件解析（支持PDF、CSV等格式）、结构化输出（如JSON Schema）、精细化引用管理以及自定义报告模板等功能。用户可通过提示词控制输出结构，生成包含标题、表格和来源标注的专业级研究报告，极大增强自动化系统的可用性与可信度。

展望未来，谷歌计划进一步拓展该技术的应用边界。除了即将在Google Search、NotebookLM、Google Finance和Gemini App中集成Deep Research功能外，还将为Interactions API加入原生图表生成功能，并扩展对Model Context Protocol（MCP）的支持，以接入更多私有或定制化数据源。此外，企业级平台Vertex AI也将上线该服务，助力组织构建专属的智能研究引擎。

感兴趣的开发者可访问谷歌官方博客和技术文档，查看DeepSearchQA数据集、排行榜、Colab示例及详细的技术白皮书，深入了解其架构设计与实践潜力。

Gemini Deep Research, Interactions API, DeepSearchQA, AI自主研究, 谷歌AI

本文来源：

IT之家【阅读原文】

文章版权归作者所有，未经允许请勿转载。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

对抗 OpenAI GPT-5.2：谷歌祭出 Gemini Deep Research 深度研究智能体并首次向开发者开放，DeepSearchQA 因果链测试基准重磅开源

当字节的AI洪水，试图漫过微信们的堤坝

OpenAI发布GPT最新升级版本：GPT-5.2来了 OpenAI最新发布

相关文章

暂无评论

AI最新资讯