大语言模型与智能体融合:ICLR 2025北京论文分享会跨模态扩散模型最新进展本周日等你来探索

(由多段落组成)

从 OpenAI o1 到 DeepSeek R1,推理模型已经迈入了全新的发展阶段。这些模型所展现的「慢思考、强推理」能力正加速推动从语言智能到认知智能的演进,并为未来的人工通用智能(AGI)奠定了重要基础。与此同时,学术界对大语言模型的研究仍在深入展开,扩散模型不断向主流的自回归架构发起挑战。

在 2025 年智能体元年,大语言模型(LLM)驱动的智能体通过手机等移动终端落地,彻底改变了人机交互的方式。此外,多模态大模型的竞争也愈发激烈,各大厂商不仅致力于提升跨模态理解与生成能力,还注重实现低成本和低门槛的应用场景。

为了帮助从业者全面了解人工智能领域的最新创新成果和发展趋势,机器之心计划于 4 月 20 日在北京举办「ICLR 2025 论文分享会」。本次分享会将围绕训练推理、多模态、智能体(Agent)等热门主题,邀请顶级专家、论文作者以及现场观众共同交流。作为机器学习和深度学习领域的顶级会议,ICLR 每年都吸引了大量研究机构和高校参与。今年 ICLR 2025 共收到 11,565 篇投稿,录用率为 32.08%。此次分享会设置了 Keynote、论文分享、圆桌对话、Poster 交流等多个环节,旨在为国内 AI 人才提供一个高水平的交流平台。

以下是论文分享会的具体日程安排及嘉宾信息:

Keynote 嘉宾及演讲主题

上午 Keynote:陈键飞
– 主题:基于量化稀疏的高效训练推理:理论及算法
– 分享人介绍:陈键飞,清华大学计算机系准聘副教授,从事高效机器学习研究,谷歌学术引用超 5000 次。他将探讨如何通过量化和稀疏技术路线设计高效的前馈神经网络计算加速方法,同时解决训练过程中的不稳定问题。

下午 Keynote:李崇轩
– 主题:LLaDA:语言模型新范式
– 分享人介绍:李崇轩,中国人民大学高瓴人工智能学院准聘副教授,主要研究机器学习和深度生成模型。他将聚焦生成式智能是否只能依赖自回归建模的问题,并介绍基于掩码的扩散语言模型 LLaDA 的研究成果。

圆桌讨论嘉宾

本次分享会特别设置了一场以「LLM 驱动的 Agent:技术瓶颈与融合路径」为主题的圆桌讨论,邀请了四位专家学者进行现场探讨。主持人张群英将与李崇轩、李庆、吴承霖和杨林易博士共同分析当前 LLM 驱动的智能体技术面临的挑战及未来发展方向。

Poster 展示

在本次论文分享会中,多位论文作者将进行论文分享与 Poster 展示。感兴趣的读者可以通过活动海报了解具体信息。

直播平台

此次活动将在机器之心视频号以及黄大年茶思屋科技网站两个平台同步直播,欢迎关注并预约观看。

合作伙伴

– 黄大年茶思屋科技网站:一个致力于推动科学与技术交流的开放平台。
– 腾讯青云计划:聚焦 AI 大模型等领域,面向全球招募顶尖实习生和毕业生。
– 真格基金:国内最早的天使投资机构之一,专注于早期创业团队的投资。
– 博世集团:全球领先的技术和服务供应商,在多个领域持续深耕。

本文来源: 机器之心【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...