每日AI快讯

13款手机AI比拼 小米拿下金牌!

(由多段落组成): 近日,国内权威人工智能测评机构SuperCLUE正式发布了首期《AgentCLUE-Mobile手机GUI Agent(离线)评测报告》,引发业界广泛关注。本次测评聚焦于移动端智能体在真实用户场景下的表现,旨在评估AI助手在中文环境中的实际操作能力。作为国内首个针对手机图形用户界面(GUI)智能代理的系统性评测,该报告为行业提供了极具参考价值的技术指标与性能数据。 在参与测试的13款国内外主流智能体产品中,小米集团推出的MiMo-VL-7B-RL-2508表现尤为突出,凭借高达90.01的综合得分荣登榜首,成功斩获本次评测的“...

拜拜了GUI!中科院团队“LLM友好”计算机使用接口来了

(由多段落组成): 近年来,随着大模型智能体(LLM Agent)在自动化任务中的广泛应用,其与计算机图形界面(GUI)的交互瓶颈日益凸显。尽管AI能力不断提升,但在实际操作中,许多Agent仍频繁“翻车”,执行效率低下、成功率不高。中国科学院软件研究所的一项突破性研究揭示:问题根源并非模型不够聪明,而是我们沿用了40多年的图形用户界面(GUI)本身——它为人类设计,却与大语言模型的能力结构严重错配。 传统GUI采用的是“命令式”交互模式,即用户必须通过一系列精确的点击、拖拽和导航来完成目标。这种模式依赖于视觉识别...

《大西洋月刊》:去技能化时代

(由多段落组成): 在人工智能迅速发展的今天,一个日益引发关注的话题浮出水面:AI究竟是在拓展人类的思维能力,还是正在悄然削弱我们的认知技能?近年来,“ChatGPT影响下的大脑”“人工智能正让你变笨”等标题频繁出现在媒体上,反映出公众对“去技能化”现象的深切忧虑。教师们开始注意到学生批判性思维的退化,医生在依赖AI诊断后判断力下降,律师借助AI撰写法律文书却失去了独立分析的能力——这些并非危言耸听,而是真实发生的技术副作用。 这种现象被称为“去技能化”(de-skilling),即随着技术介入,人类原本掌握的技能...

谷歌 Gemini 获得新技能:一个提示词、一份文件就能生成 PPT

(由多段落组成): 谷歌近日为其AI助手Gemini的免费协作工具Canvas推出了一项实用新功能,旨在帮助学生和职场人士更高效地制作演示文稿。据Engadget于10月26日报道,这项更新让Gemini能够根据用户的一个简单指令自动生成完整的PPT幻灯片,极大简化了传统繁琐的制作流程。 该功能特别适合需要快速整理报告、课程展示或项目提案的用户。使用者不仅可以通过输入提示词如“生成一份关于人工智能发展趋势的PPT”,还能上传文档、Excel表格或学术论文等资料,让Gemini基于具体智能生成结构清晰、逻辑严谨的演示文件。如果参考资料...

马斯克冤家,挖到脑机接口猛将

(由多段落组成): 近日,OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)在科技圈再次掀起波澜。据海外媒体最新消息,他已正式邀请知名生物分子工程专家米哈伊尔·夏皮罗(Mikhail Shapiro)加入其即将推出的脑机接口初创企业——Merge Labs。这一举动不仅标志着阿尔特曼在人工智能之外,正式进军神经科技领域,也揭示了该公司未来技术路线的核心方向:非侵入式、基于超声波的脑机交互系统。 夏皮罗目前是加州理工学院化学工程与医学工程领域的马克斯·德尔布鲁克讲席教授,同时担任该校分子与细胞医学研究中心主任,并为霍华...

OpenAI被曝瞄准AI音乐赛道商业化,Suno首当其冲

(由多段落组成): 近年来,AI技术在创意领域的渗透愈发深入,而音乐创作正成为下一个风口。据最新消息,OpenAI正在秘密布局AI音乐生成领域,或将推出一款具备专业级作曲与编曲能力的模型,直接冲击当前由初创企业主导的市场格局。这一动向不仅引发了行业震动,也让估值高达20亿美元的明星初创公司Suno面临前所未有的挑战。 据悉,OpenAI已与全球顶尖艺术学府——茱莉亚学院展开合作,组织学生参与乐谱标注工作,为训练高质量音乐模型积累数据资源。作为孕育了约翰·威廉姆斯、马友友等艺术大师的殿堂级院校,茱莉亚的加入无...

AI创作平台酣战,受伤的却是真人创作者?

(由多段落组成): 近年来,国内AI创作工具市场持续升温,阿里巴巴旗下夸克近日推出全新AI生成平台“造点”,正式加入这场科技与创意的角逐。作为阿里在AI领域的又一重磅布局,“造点”集成了AI图像生成与AI视频生成两大核心功能,并率先接入通义万相Wan2.5模型,成为国内少数支持音画同步生成的AI平台之一。这一动作不仅标志着阿里在AIGC赛道的深度切入,也意味着腾讯元宝、字节豆包、即梦AI、快手可灵等主流平台之间的竞争格局或将迎来新一轮洗牌。 视频生成是“造点”的另一大亮点。用户既可通过上传图片并添加文字描述来...

Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来

(由多段落组成): 近期,一场名为“Alpha Arena”的AI炒币大赛在科技圈与加密货币社区掀起轩然大波。这场由nof1平台发起的真实资金投资对决,将六大人气AI模型——通义千问Qwen、DeepSeek、Grok、GPT-5、Gemini 2.5 Pro等推上擂台,每家配备1万美元本金,在真实币市中展开博弈。不同于纸上谈兵的模拟测试,这是一场真金白银的较量,市场波动、杠杆策略、风险控制全部暴露无遗。 比赛初期,外界普遍看好来自美国的闭源巨头GPT-5和Gemini,认为它们凭借强大的训练数据和推理能力会一骑绝尘。然而现实却出人意料:这两款AI在高...

女子用AI做流浪汉闯入家中照片骗老公 官方提醒:可能犯法

(由多段落组成): 近日,一段利用AI生成“流浪汉闯入家中”图片进行恶搞的视频在社交平台上迅速走红,引发广泛讨论。不少网友为了测试伴侣或家人的反应,故意将经过AI合成的陌生人进入住宅的图像发送给亲人,试图制造紧张气氛以观察对方的情绪波动。这种看似无害的玩笑,实则暗藏风险。 据央视新闻报道,安徽铜陵一名男子在外地饮酒时收到妻子发来的一张图片——画面中一名流浪汉正坐在自家餐厅内。男子顿时惊慌失措,以为家人遭遇危险,立即向警方报警求助。当地民警接警后火速赶赴现场,破门而入却发现并无异常,所谓的“入...

消息称 OpenAI 正开发新的生成式音乐工具,可为视频添加配乐

(由多段落组成): 近日,据科技媒体《The Information》披露,人工智能领军企业OpenAI正在秘密研发一款全新的音乐生成工具。该工具具备根据文本描述或音频输入自动生成配乐的能力,标志着其在AIGC(人工智能生成)领域的又一次重要拓展。这一创新功能有望为视频创作者、音乐制作人乃至普通用户提供高效便捷的背景音乐创作方案。 据悉,这款尚在开发阶段的音乐生成系统能够实现多种应用场景。例如,用户可上传一段无配乐的视频,通过输入简单的文字提示(如“轻快的爵士乐”或“紧张的悬疑氛围”),系统即可自动生成契合情绪...
16566676869443