每日AI快讯
AI日报:天工SkyMusic开启公测;UP主用AI技术“复活”巨人族;通义千问开源代码模型CodeQwen1.5;免费AI音乐生成工具Sonauto
昆仑万维推出两款创新AI模型——「天工3.0」和「天工SkyMusic」,公测开启,展现公司在AI领域的技术领先地位。其中,「天工3.0」作为全球最大开源MoE模型,拥有超过4000亿参数,提供多轮搜索和图表绘制等功能;而「天工SkyMusic」是中国首个音乐SOTA模型,支持多种方言,能进行端到端音乐生成。此外,CodeQwen1.5是基于Qwen1.5的代码模型,具备7B参数和92种编程语言支持,显著提升开发者效率。Spline发布的3D生成工具AI3D Generation,提供了直观界面和AI辅助设计,推动3D设计进步。CTRL-F-VIDEO项目则实现了视频内搜索,通过O...
亚马逊 Amazon Music 宣布开启 AI 生成歌单功能 Maestro 测试
在音乐领域,AI技术正逐步改变用户体验。近日,亚马逊在其Amazon Music应用中推出了一项创新功能——Maestro,这是一项AI生成歌单的服务,目前正处于美国部分用户的测试阶段。Maestro允许用户通过各种创意输入,如文字、表情符号或它们的组合,快速创建个性化的音乐播放列表。例如,输入?将得到一个充满电子和机器人主题的音乐列表。此外,亚马逊还提供了官方推荐的提示,如?和吃?(意大利面),或者激发怀旧情绪的“Myspace 社交网络时代的音乐”。 Maestro功能对Amazon Music的Unlimited订阅用户开放,他们可以无限制试听并保...
看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3
AI初创公司Reka近期推出了创新的多模态语言模型Reka Core,该模型展现出理解图像、音频和视频等多元数据的卓越能力,成为继谷歌Gemini Ultra之后的又一瞩目之作。Reka Core在性能上与GPT-4相当,证明了其研发团队的努力成果。这款模型是通过数千台H100设备训练得出,支持32种语言和大量词汇上下文,尤其擅长处理长篇文档。Reka Core不仅在视频感知测试中超越Gemini Ultra,在图像任务的MMMU基准测试中也有出色表现,与行业领先模型相媲美。尽管训练时间较短,但其性能已超越许多顶级AI模型。值得注意的是,Reka Core具备强大...
斯坦福大学最新AI报告出炉:中国AI专利全球第一!
近期,斯坦福大学以人为本人工智能研究所发布了一份详尽的《2024年人工智能指数报告》,该报告由华裔女科学家、“人工智能教母”李飞飞共同指导。这份长达501页的报告揭示了全球AI领域的最新动态,被誉为研究所至今最全面的研究成果。据报告所示,2021年至2022年间,全球人工智能专利授权量显著增长62.7%,与2010年相比,授权的AI专利数量增加了31倍以上。 中国在人工智能专利数量上占据主导地位,2022年贡献了全球61.1%的AI专利,远超美国的20.9%。自2010年以来,美国在这方面的份额已从54.1%持续下滑。然而,在顶尖人工智能...
清华团队推出新平台:用去中心化AI打破算力荒
近日,一个由清华团队创立的海外公司NetMind.AI推出了NetMind Power,这是一个去中心化的AI算力共享平台,旨在打破AI领域日益严重的算力瓶颈问题。随着OpenAI的Sora等大模型对GPU需求的激增,GPU供应面临挑战。NetMind Power通过构建去中心化的计算网络,整合全球闲置算力资源,为AI产业提供经济高效的算力服务。 NetMind Power的四大核心特点包括:1) 去中心化动态集群技术,构建可靠的AI应用环境;2) 完整的AI生态系统,降低算力使用门槛,扩大应用场景;3) 异步训练算法,克服网络限制,充分利用闲置算力;4) 模型加密与...
李彦宏大模型“创业”400天
在当前的生成式AI热潮中,许多创业者和开发者处于“FOMO”(Fear Of Missing Out)状态,既激动又担忧。百度创始人李彦宏在最近的演讲中提到,一些大模型初创企业选择“双轮驱动”策略,兼顾模型开发和应用构建,以应对模型能力的快速发展和应用市场的变化。然而,他指出,这种策略并不适合所有创业者,因为资源有限,专注单一任务的成功率更高。对于大多数资源有限的开发者,建议在现有大模型基础上开发应用,例如金山办公等公司也采取这种方式。李彦宏强调,大模型的价值在于催生满足市场需求的AI应用。百度的文心一言在近400...
中国电信开源 TeleChat-12B 星辰语义大模型,年内开源千亿级参数大模型
中国电信近期推出了一项重大开源项目,开放了120亿参数的TeleChat-12B星辰语义大模型,并计划年内发布千亿级参数模型。这个新版本相比于1月的7B版本,整体性能提升了30%,特别是在多轮推理和安全问题处理上超过40%的提升。TeleChat-12B通过增加训练数据量至3TB,优化数据清洗和标注策略,以及采用专项任务SFT数据,显著提高了数据质量和模型问答效果。模型结构上,采用词嵌入层与输出层解耦的设计,增强了训练稳定性和收敛性。训练数据涵盖广泛领域,如书籍、百科、新闻等,通过优化清洗策略提高了数据质量。训练方法上,运...
刘强东AI数字人直播首秀,京东两大采销直播间观看人次均逾千万
在4月16日傍晚6点18分,京东集团的创始人刘强东以独特的“采销东哥AI数字人”身份,同步登陆了京东家电家居与京东超市两大采购销售直播间,拉开了他的直播首演序幕。根据界面新闻的报道,刚开始的6点18分,京东家电家居直播间的观众数达到了299.2万人次,而京东超市的则是224.3万人次。短短两分钟后,这两个直播间的观看人次分别增长至339.6万和300.7万。在直播进行到20分钟后,两个平台的观看人次均成功突破500万大关,展现出强大的吸引力。至晚上7点,随着刘强东AI形象的直播结束,京东家电家居与京东超市的直播观看量均超过...
AI助力脑机接口研究,纽约大学突破性神经语音解码技术,登Nature子刊
神经失语症严重影响生活,但深度学习和脑机接口(BCI)技术的进步为开发神经语音假肢提供了可能性。纽约大学的研究人员开发了一种新型可微分语音合成器,使用轻量级卷积神经网络将语音编码为可解释的参数,如音高、响度和共振峰频率。此系统可以将神经信号映射到这些参数,重构出自然的语音,尤其适用于小数据量情况。研究发表在《Nature Machine Intelligence》上,展示了高准确性和因果操作的能力,可用于左、右脑半球的语音解码。
倒计时1天|在中国AIGC产业峰会,一天看尽AIGC最新趋势
明日即将盛大开启的中国AIGC产业峰会,聚焦于AIGC领域的最新动态和应用,诚邀您的参与。4月17日的峰会分为上午和下午两部分,早上9:30揭开序幕,下午14:00继续深入探讨。由于现场席位有限,建议参会者尽早签到,还有机会获得图灵教育提供的书籍赠品。坚持到最后的观众还将获得精心准备的峰会定制纪念品。本次峰会有众多重量级嘉宾出席,包括高通公司AI产品技术中国区负责人万卫星、亚马逊云科技大中华区产品部技术总监王晓野以及微软大中华区Azure事业部总经理李冕等,他们将在峰会上分享宝贵经验和见解。立即预约直播,共...