每日AI快讯
字节跳动推出AGILE框架:运用强化学习优化大语言模型(LLM)Agent端到端能力全面升级
大语言模型(Large Language Models, LLMs)的快速发展推动了LLM Agent的进步。为了增强LLM Agent的能力,最近的研究提出了多个关键组件和工作流。然而,如何将这些核心要素整合进一个统一的框架,并进行端到端优化,仍然是一个挑战。来自字节跳动(ByteDance)的研究人员提出了一种基于强化学习(Reinforcement Learning, RL)的LLM Agent框架——AGILE。 在AGILE框架下,Agent具备多种能力,包括记忆、工具使用、规划、反思、与外界环境交互及主动求助专家。通过强化学习,所有这些能力都能进行端到端的训练。特别是,AGILE...
中兴通讯基于“AI for All”的战略理念
通讯技术的每一次重大革新,往往标志着一个新时代的到来。19世纪的电报、电话与有线通讯,20世纪的无线电、手机与移动通讯,再到21世纪的电脑与互联网、智能手机与移动互联网,都见证了人类社会的巨大进步。如今,生成式AI在全球迅速崛起,各行各业纷纷寻求借助AI实现转型。通讯行业再次站在技术变革的前沿,试图通过AI找到下一个时代的入口。 在2024年的国际信息通信展览会上,中兴通讯展示了其在连接、智算、数实融合和终端四个领域的最新成果,为未来的发展描绘了无限可能。 在终端展区,中兴通讯基于“AI for All”的战...
萨姆·奥特曼乐观预测:人工智能发展虽引发变革,但学生和就业者在未来的就业市场中依旧充满机遇,OpenAI等技术将创造更多新工作形态而非导致大规模失业
近日,美国知名招聘平台Indeed的首席执行官克里斯·海姆斯主持了一场访谈,邀请了OpenAI的掌门人萨姆·奥特曼参与讨论。在这次深度对话中,奥特曼针对人工智能可能导致大规模失业的担忧发表了自己的看法,并向学生提出了积极应对的建议。 奥特曼强调,虽然人工智能的发展可能会改变一些工作的方式,但未来的就业市场仍然充满机遇。他表示:“我认为未来的工作机会将会非常丰富,只是这些工作可能会与我们现在所熟知的不同。”他还补充说,人类社会似乎总能找到新的事情去做,因此不必过分担心AI会导致失业问题。 此外,奥特曼...
支小宝:在人人需要AI助手的时代,如何通过智能体提升生活效率与个性化服务
《钢铁侠》中的贾维斯给许多人留下了深刻的印象,只需简单的指令,贾维斯就能迅速准确地执行任务,多次帮助钢铁侠脱离险境。现实中,虽然我们不能像钢铁侠那样拥有一个高科技的AI助手,但拥有一位能够解决生活琐事、提高生活效率的AI助手已经不再是奢望。 在最近举行的云栖大会上,AI时代下的云计算技术和产品进展成为了焦点。随着AI技术的快速发展,人们的生活方式也在悄然发生变化。AI大模型的加速落地不仅提升了自身的性能,还极大地改善了人们的生活服务效率。正如阿里巴巴集团CEO吴泳铭所说:“生成式AI的最大潜力在于...
B200双芯封装技术
英伟达下一代旗舰消费级显卡RTX 5090引起了广泛关注。知名爆料人kopite7kimi透露,该显卡将配备32GB GDDR7内存和21760个CUDA核心。相比之下,RTX 5080的内存容量仅为16GB,是5090的一半。一些网友猜测,5090的GPU可能是通过双芯片拼接而成,类似于B200等服务器GPU的做法。 此外,kopite7kimi还提到,RTX 5090的TGP功耗将达到600W,比4090高出三分之一。对此,老牌科技网站Gizmodo调侃道,5090启动时,周围的街区灯光都会变暗。尽管功耗问题显著,但仍有不少网友预计5090会大卖。一方面,对于游戏玩家来说,虽然未必需要如此...
加州州长否决SB 1047人工智能安全创新法案:探讨创新与安全的平衡
近日,美国加州州长加文·纽森(Gavin Newsom)正式否决了一项备受争议的法案——《前沿人工智能模型安全创新法案》(简称 SB 1047)。纽森在否决声明中详细阐述了其决定背后的多个因素,包括该法案对人工智能公司带来的负担、加州在这一领域的领导地位以及法案本身的广泛性问题。 根据IT之家的报道,SB 1047法案原本旨在为那些训练成本超过1亿美元或达到特定算力的人工智能模型制定安全标准,确保这些大规模模型的安全开发。该法案要求开发者采取一系列预防措施,如部署前测试、模拟黑客攻击、安装网络安全保障,并为举报人提...
揭示提升效率的秘密:运用Gemini结合谷歌AI模型,探索多模态个人顾问的7个实用技巧
一、洞察流行趋势 Gemini 是谷歌推出的一款多模态AI模型,能够处理文本、图像、音频、视频和代码等多种信息。基于Gemini大语言模型,谷歌还开发了一款名为Gemini AI的聊天机器人。尽管Gemini具有强大的语言理解和生成能力,但如果用户提供的提示不够准确,可能会导致结果不尽人意。为了帮助用户更高效地使用Gemini,外媒总结了7个常用功能及其提示技巧。例如,Gemini能够实时搜索互联网以帮助用户了解最新的流行趋势。它不仅能分析文字中的热点话题,还能通过图像和视频捕捉视觉上的流行元素。如果用户想了解最新的TikTok舞...
YC孵化的9家美国前沿创企:从AI芯片革新、精准天气预测技术到无人机物流的应用
一、Entangl:自动化检测工程项目错误并提供解决方案 Entangl是一家专注于工程设计自动化的初创公司。它利用AI代理在工程团队工作过程中自动检测错误,并提供详细的分步解决方案,从而预防潜在的高成本问题。该公司已与亚马逊CEO安迪·贾西讨论了数据中心验证自动化的合作,并与AWS和沃达丰建立了合作关系。 二、Exa Laboratories:研发高效节能的AI芯片 Exa Laboratories专注于为AI应用提供高效的节能芯片。其芯片针对每个AI架构进行优化,能够显著提升速度和能效。初步测试显示,Exa芯片的效率比Nvidia的H100s高出近28...
AMD 首推小语言 AI 模型“Llama-135m ”,能力可减少 RAM 占用
IT之家报道,9月29日,AMD公司在Huggingface平台上发布了自家首款“小语言模型”——AMD-Llama-135m。该模型具备推测解码功能,并拥有6700亿个token,采用了Apache 2.0开源许可。用户可以通过以下链接访问模型(点击这里)。 据官方介绍,AMD-Llama-135m的主要特点是其推测解码能力。该技术的基本原理是利用小型草稿模型生成一组候选token,再通过更大规模的目标模型进行验证。这种方式使得每次前向传递可以生成多个token,同时不会对性能产生负面影响,从而显著减少了RAM占用量,提升了整体效率。 AMD透露,这款模型是在四个A...
创造历史:阿里通义开源模型Qwen2.5在Chatbot Arena上超越Llama,引领大语言模型潮流
近日,基准测试平台Chatbot Arena公布了最新的大模型盲测排行榜,阿里巴巴的通义千问开源模型Qwen2.5再次成功跻身全球前十。具体而言,Qwen2.5-72B-Instruct在大语言模型(LLM)榜单中排名第10,成为唯一进入前十名的中国大模型。此外,Qwen系列中的视觉语言模型Qwen2-VL-72B-Instruct也在Vision榜单中排名第九,是当前得分最高的开源大模型。 与此同时,Qwen系列在全球开源社区中的影响力显著提升,基于Qwen系列的衍生模型数量已突破7.43万个,超过了Llama系列的7.28万个。这标志着通义千问Qwen已经成为世界上最大的生成式...