Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

整理后的

#(由多段落组成)

6月21日,IT之家报道了一则关于智能体技术的重要进展。据“月之暗面 Kimi”公众号透露,Kimi团队的首个智能体模型Kimi-Researcher于6月20日正式进入小范围灰度测试阶段。这款基于端到端自主强化学习(end-to-end agentic RL)技术开发的新一代Agent,专为解决复杂研究任务而设计。

为了保证最终输出的质量和全面性,Kimi-Researcher采用异步执行模式,给予更多时间用于逐步推理、检索以及撰写。用户最终将获得两份交付成果:一份是万字以上的深度研究报告,包含详尽的信息和可追溯的信源引用,平均引用26个高质量来源;另一份则是动态可视化报告,以结构化排版和思维导图形式呈现,便于快速掌握整体框架与核心结论,同时支持在线分享链接。

在性能评估方面,Kimi-Researcher在AI领域的高难度基准测试中表现出色。例如,在专为AI设计的“人类最后一次考试(Humanity’s Last Exam, HLE)”中,Kimi-Researcher的Pass@1准确率为26.9%,Pass@4准确率为40.17%。这一成绩超越了Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%)等知名模型,与OpenAI Deep Research(26.6%)及Gemini-Pro的Deep Research Agent(26.9%)表现相当,成为当前已知的最高水平之一。

此外,在红杉中国发布的xbench基准测试中,Kimi-Researcher在DeepSearch任务上的平均通过率达到了69%,显著领先于榜单中的其他模型。未来,“月之暗面”计划逐步开源Kimi-Researcher的基础预训练模型及其强化学习后的版本,为行业提供更多参考价值。

需要注意的是,本文提供的对外跳转链接(如超链接、二维码等形式)旨在传递更多信息,节省用户甄选时间,仅供参考。所有IT之家文章均包含此声明。

智能体,Kimi-Researcher,端到端强化学习,深度研究报告,动态可视化报告

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...