Kimi-Researcher深度研究助手:基于自主强化学习的Moonshot AI通过HLE测试性能媲美OpenAI与Gemini

(由多段落组成)

6月23日,快科技报道了一则关于人工智能领域的最新动态。据悉,Moonshot AI(月之暗面)正式推出了其首款智能Agent产品——Kimi-Researcher深度研究助手),并且已经进入小范围灰度测试阶段。这款产品凭借端到端自主强化学习技术(end-to-end agentic RL)构建而成,在HLE测试中表现突出,性能不仅超越了Claude 4 Opus、Gemini 2.5 Pro以及OpenAI Deep Research等知名模型,还与Gemini-Pro的Deep Research Agent处于同一水平线。

作为一款高度自主的智能研究助手,Kimi-Researcher能够独立规划任务流程,并最终交付完整的成果。相比其他类似产品,它采用了独特的零结构设计,无需依赖复杂的提示词或预设流程,完全依靠自身的自主决策能力在动态环境中运行。例如,当面对信息冲突时,它可以自行判断权衡策略;在任务节点切换时,也能准确把握时机;对于中间信息的取舍,也有明确的标准。这一切的核心驱动力都源自于对任务实际解决效果的关注。

值得一提的是,Kimi-Researcher是一款专为深度研究设计的模型,整合了来自多个来源的数据,并支持每条引用的直接追溯功能,从而确保研究的严谨性,同时有效减少了“幻觉”问题的发生。Moonshot AI表示,未来将逐步开源Kimi-Researcher的基础预训练模型及其强化学习优化版本,以促进Agent强化学习领域的进一步探索与发展。

本文来源: 快科技【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...