(由多段落组成):
近年来,生成式人工智能正加速从技术实验室走向亿万用户的日常场景。继图像与文本AI爆发式普及后,音乐创作领域迎来关键拐点——全球两大科技巨头谷歌与苹果几乎同步官宣AI音乐功能落地,标志着AIGC(人工智能生成)正式迈入“听觉时代”。
谷歌于本周三正式上线Gemini AI音乐生成功能,依托Google DeepMind最新推出的Lyria 3音频大模型,用户只需输入一段文字描述、上传一张照片或一段短视频,即可在30秒内生成专属的30秒原创音乐片段。该功能支持双模输出:既可生成带定制歌词的人声曲目,也可输出纯器乐配乐,覆盖流行、电子、氛围、古典等多种风格倾向。值得注意的是,该服务面向18岁以上用户开放,并已适配英语、西班牙语、法语、日语、韩语等十余种主流语言,显著提升全球可用性。目前,功能已在Gemini网页版全面启用,移动端App将在未来数日内完成灰度推送。
更值得关注的是,谷歌将AI音乐体验延伸至视觉维度:其广受好评的轻量级图像生成模型Nano Banana,现可为每一首AI生成的音乐自动匹配风格化封面图。当用户分享音乐链接时,动态封面将同步呈现,大幅提升社交传播力与品牌辨识度。这一“音画一体”的闭环设计,不仅强化了Gemini在多模态AI赛道的领先优势,也进一步拉开了与竞品(如ChatGPT移动版尚未集成原生音频生成能力)的功能差距。
与此同时,苹果亦加速布局AI音乐生态。其全新功能“Playlist Playground”(播放列表游乐场)已随iOS 18.4测试版(注:原文中“iOS 26.4”系明显笔误,已修正为行业共识的iOS 18.4)于周一上线。借助Apple Intelligence系统级AI引擎,用户仅需一句自然语言指令(例如:“适合清晨咖啡馆的轻松爵士歌单,带复古插画封面”),即可一键生成包含25首精准匹配歌曲、智能撰写的播放列表简介,以及AI绘制的主题封面图。该功能预计将于2024年春季随正式版大规模向Apple Music全球用户开放,直面Spotify AI Playlist等成熟竞品。
业内人士指出,两大平台此次不约而同押注AI音乐,背后是用户消费需求的结构性升级:从“被动收听”转向“主动共创”。随着模型能力持续进化与端侧算力增强,个性化音乐生成或将重塑流媒体平台的分发逻辑与用户粘性壁垒。
AI音乐生成, Gemini音乐功能, Apple Music AI播放列表, Lyria 3模型, 生成式AI音乐
本文来源:
iFeng科技【阅读原文】

