AMD科研AI助手o1-preview显著降低科研成本,节省84%
AMD最新推出的科研AI系统“Agent Laboratory”正在改变科学研究的面貌。这款由大语言模型(LLM)驱动的AI助手,能够自动化完成文献综述、实验设计和报告撰写等复杂任务。特别是在o1-preview版本中,其表现尤为出色,不仅在研究质量上超越其他版本,还帮助研究人员节省了高达84%的研究经费。
# 一、Agent Laboratory的工作流程
Agent Laboratory通过三个主要阶段实现高效科研:
1. 文献综述:
– PhD Student角色负责检索相关论文并进行摘要抓取和全文提取。
– 这个过程是迭代式的,直到达到指定数量的相关文献为止。
2. 实验设计与执行:
– PhD Student和Postdoc通过对话制定详细的实验计划。
– ML Engineer使用Python准备数据,并借助mle-solver模块运行实验。
– mle-solver会不断优化代码,确保实验结果的准确性和稳定性。
3. 报告撰写:
– 最后,PhD Student和Professor利用paper-solver模块生成符合学术标准的完整报告。
– 该模块可以访问arXiv拓展文献资料,并通过多轮编辑和评审提升报告质量。
# 二、o1-preview的表现评估
为了评估不同版本的科研能力,研究人员用GPT-4o、o1-mini和o1-preview完成了15篇论文。结果显示,o1-preview在研究质量和有用性方面表现最佳,而o1-mini则在实验质量上得分最高。相比之下,GPT-4o的整体表现最弱。
# 三、自动审稿与人工审稿的差异
自动审稿系统倾向于高估论文分数,平均为6.1/10,而人工审稿则更为严格,评分为3.8/10。这表明自动审稿系统在某些方面仍需改进。
# 四、背后团队简介
Agent Laboratory背后的团队成员超过半数为华人,他们来自全球顶尖学府和知名企业。例如,Samuel Schmidgall曾是霍普金斯大学博士生,Yusheng Su专注于模型架构优化,Ze Wang曾在Facebook AI实习,等等。这些专家共同致力于推动AMD在AI领域的创新和发展。
本文来源: 量子位【阅读原文】