AI助手Claude全面评测:自动化GUI框架助你轻松完成游戏操控与办公任务,如自动搞定崩铁日常、创建炉石卡组

11月25日,快科技报道,新加坡国立大学的研究团队近期对AI助手Claude的电脑操控能力进行了全面测试,涵盖了20多个不同场景。测试结果显示,Claude不仅能够自动完成手游中的日常任务,还能处理复杂的办公任务

在手游方面,研究人员选择了米哈游的《崩坏:星穹铁道》作为测试对象。用户只需简单指令,如“帮我完成今天的模拟宇宙”,Claude就能自动完成各种任务,包括启动自动战斗、等待战斗结束并退出。值得注意的是,这些操作并非简单的机械重复,Claude能够智能理解游戏规则和目标,并根据不同的任务动态调整策略。

除了《崩坏:星穹铁道》,Claude还展示了其在《炉石传说》中的表现,能够自动创建和重命名牌组、使用英雄技能等。为了实现这些功能,研究团队基于Claude Computer Use的API设计了一个自动化GUI框架,该框架包含系统提示、状态观察、推理范式等六个关键部分。

在办公场景中,Claude通过这一框架能够执行多种任务,如网页搜索、工作流程建模、办公生产力软件操作等。例如,它可以在Amazon和Apple官方网站上成功完成购物任务,包括选择颜色配置、填写地址等操作。尽管在某些复杂任务中仍有失败情况,但总体而言,Claude的表现已经非常出色。

研究团队还公开了所有测试用例的具体信息,为其他研究者和开发者提供了宝贵的参考资源。

本文来源: 快科技【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...