标签:深度学习
斯坦福大学AI优化研究突破:深度学习助力生成超强CUDA内核,性能提升显著,华人主创团队成果惊人
斯坦福大学的一项新研究揭示了AI生成的内核在性能上超越了人类专家优化的结果。这些由AI优化的内核在常见的深度学习操作中表现卓越,最高提升了近400%的性能。 具体来说,在NVIDIA L40S GPU上的基准测试显示: - 矩阵乘法(Matmul,FP32):性能达到PyTorch torch.matmul的101.3%。 - 二维卷积(Conv2D):性能达到torch.nn.Conv2D的179.9%。 - Softmax:性能达到torch.softmax的111.8%。 - 层归一化(LayerNorm):性能达到torch.nn.LayerNorm的484.4%。 - Conv2D+ReLU+Maxpool组合操作:性能达到PyTorch参考实现的290.1%...
深度学习赋能手语翻译:谷歌DeepMind推出多模态模型SignGemma,革新医疗AI与海豚声音分析领域
近年来,AI技术在跨语言和跨模态翻译领域取得了显著进展。2023年5月31日,谷歌旗下的DeepMind团队宣布推出了一款名为SignGemma的手语翻译模型。这款模型是目前最先进的手语识别与翻译工具之一,能够将手语转化为口语化的文本输出。据官方透露,SignGemma将在今年晚些时候作为开源项目加入到Gemma模型家族中。 值得一提的是,SignGemma主要针对美国手语(ASL)和英语进行了深度优化,并支持多语言功能。由于其开源特性,开发者可以自由使用并进一步改进该模型。DeepMind希望通过这项技术帮助手语使用者打破沟通障碍,在工作...
AI幻觉减少:深度学习推动AGI进步,Claude Opus 4与Dario Amodei引领Anthropic新突破
随着人工智能技术的快速发展,AI模型的“幻觉”问题逐渐成为行业关注的焦点。据TechCrunch报道,在Anthropic公司举办的首届开发者大会“Code with Claude”期间,CEO达里奥·阿莫代伊(Dario Amodei)在媒体发布会上分享了他对AI幻觉现象的独特见解。他认为,当前AI模型出现虚假信息的概率可能低于人类,尽管其表现形式更为出人意料。 阿莫代伊进一步解释称,幻觉现象并不会阻碍Anthropic实现AGI(通用人工智能)。他强调,自己是AGI领域最为乐观的支持者之一,并在去年的一篇论文中预测AGI最快可能于2026年问世。他在发布会上表...
香港中文大学提出RXTX算法,加速矩阵乘法并优化组合问题,助力深度学习与节能计算
(由多段落组成) 矩阵乘法作为计算机科学与数值线性代数中的核心问题,其计算效率直接影响到数据分析、深度学习以及无线通信等领域的性能表现。香港中文大学的一项最新研究成果提出了一种名为RXTX的新算法,该算法能够显著提升特定结构矩阵乘法的计算效率。 在训练和推理过程中,矩阵乘法占据了大部分算力消耗。不论是统计分析还是大规模模型训练,优化矩阵乘法的计算效率一直是研究热点。然而,对于特殊结构矩阵(如XXt)的乘法优化研究相对较少。针对这一问题,香港中文大学的研究团队通过结合机器学习搜索方法与组合优...
华为盘古Ultra大模型:基于昇腾NPU原生开发,135B参数引领大规模语言模型深度学习与自然语言处理新纪元
终于,华为盘古大模型系列推出了全新的昇腾原生通用千亿级语言大模型。当前,各大科技公司纷纷发布百亿、千亿级模型,但大部分模型的训练依赖于英伟达的 GPU。在这种情况下,国内研究团队难以获得足够的计算资源,这限制了国内大模型技术的快速发展。然而,华为盘古发布的这项新研究表明,基于全国产的昇腾平台,同样可以实现领先的大规模语言模型的研究与开发。 技术报告Pangu Ultra: 推动 Ascend NPUs 上密集大型语言模型的极限 技术报告地址:[https://github.com/pangu-tech/pangu-ultra/blob/main/pangu-ultra-rep...
朱啸虎谈AI应用与深度学习:投资机会下的出海策略与壁垒认知
4月伊始,在中关村论坛的活动现场,知名投资人朱啸虎以一身休闲装扮亮相,并分享了他对当前AI投资趋势的见解。尽管此前因对人形机器人领域发表“冷水”言论引发热议,但朱啸虎本人表现得十分从容。在参与论坛之前,他还特意抽空游览了颐和园。 在此次演讲中,朱啸虎并未直接回应近期关于“批量退出人形机器人项目”的争议,而是将重点放在了AI应用领域的投资机会上。他指出,当下正是投资AI应用的最佳时机。“我们可以看到许多专注于AI应用的企业正在经历爆发式增长,其增速几乎与当年团购行业的扩张速度相当,这确实令人惊叹。”...
三维生成技术与AI建模新突破:基于VAE模型和深度学习的3D建模框架Craftsman3D&Dora革新资产生成与编辑方法
香港科技大学谭平教授团队在CVPR 2025上发表了两项三维生成技术框架,并将核心代码全部开源,旨在推动三维生成技术的发展与普及。其中,Craftman3D获得了三位评委的一致满分评价,并被多家知名企业引用和认可,如全球最大的多人在线游戏创作平台Roblox、腾讯混元Hunyuan3D-2、XR实验室的XR-3DGen以及海外初创公司CSM的3D创作平台等。这些技术已融入光影焕像的三维生成平台及产品中,用户只需简单操作即可开启专属三维创作之旅。 光影焕像3D生成平台(主站):https://triverse.ai/zh-cn/ 光影焕像3D生成平台(国内备用)...
Predibase发布全球首个端到端强化微调平台,支持Qwen2.5大模型训练与深度学习无服务器方法
随着人工智能技术的快速发展,大模型训练和开发平台的需求日益增加。近日,Predibase 推出了一款全新的端到端强化微调(RFT)平台,该平台完全托管且无需服务器支持,为用户提供了更加便捷高效的解决方案。 Predibase 表示,DeepSeek-R1 的开源引发了全球 AI 领域的高度关注,许多人开始意识到强化学习微调在大模型训练中的重要性。基于这一启发,Predibase 开发了这款无服务器的端到端强化微调平台。与传统的监督式微调相比,RFT 不需要大量标注数据,而是通过奖励机制和自定义函数实现持续强化学习,同时支持从数据管理、...
深度学习驱动的AI翻译大模型:子曰翻译2.0,英文文献翻译质量媲美人工,仅用2天精心挑选,为你呈现最强大的翻译工具。
做AI自媒体的从业者,阅读前沿学术论文并不断学习以完善自己的知识体系是不可或缺的一部分。为了跟上时代的发展步伐,我们往往需要全力以赴才能不被淘汰。然而,不得不承认的是,我的英语水平实在有限,最熟悉的英语表达可能就是那句“I'm fine, thank you. And you?”了。 在研究各类文献的过程中,尽管有大模型辅助翻译,但依然面临诸多挑战。例如,昨天豆包分享了一篇关于AI图像处理的论文。我尝试回顾他们之前发布的SeedEdit论文进行对比学习时发现,这类论文通常逻辑紧密且包含大量高度专业化的术语和学术用语,如“Out-o...
7B级形式化验证小模型全面开源,媲美满血版DeepSeek-R1,推动大模型与AI4Math在自然语言处理和深度学习领域的创新与发展
研究团队介绍 香港科技大学、中国科学院软件研究所、西安电子科技大学和重庆大学共同组成了一个跨学科的研究团队。该团队的核心成员包括香港科技大学的研究助理教授曹嘉伦,主要研究领域涵盖AI与软件工程(AI&SE)、人工智能测试及形式化验证等;以及中国科学院软件研究所的副研究员陆垚杰,专注于大语言模型及其应用。 形式化推理与验证的需求增长 随着DeepSeek-R1的流行和AI4Math研究的深入,大模型在辅助形式化证明写作方面的需求日益增长。作为数学推理最直接的应用场景,形式化推理与验证(formal reasoning and v...