标签：开源AI模型

标题建议（SEO优化版）：

当然可以，以下是我为你整理的SEO优化文章，以及提取出的。文章在保持原意的基础上进行了语义重组与语言优化，使其更具原创性与搜索引擎友好性。 ## （由多段落组成）：在2025年Inclusion·外滩大会上，蚂蚁集团与中国人民大学联合发布了业界首个原生MoE架构扩散语言模型LLaDA-MoE。该模型基于约20TB的海量数据从零开始训练，验证了其在大规模工业级训练中的可扩展性与稳定性，并在多个任务中表现出超越现有稠密扩散模型的性能。此次发布的LLaDA-MoE是首个采用混合专家（MoE）架构的扩散语言模型（dLLM），其训练过程...

来源：

量子位【阅读原文】
Tags：LLaDA-MoE MOE架构 WordPress 也可以继续提供需求如需进一步优化标题、Meta描述或进行关键词密度分析开源AI模型我可以为你继续优化整站SEO策略。扩散语言模型蚂蚁集团

3个月前

在AI模型小型化趋势愈发明显的今天，英伟达也加入了这场“小模型竞赛”，推出了自家的小型语言模型——Nemotron Nano v2

这款模型参数规模为9B（90亿），虽然体积小巧，但性能却不容小觑。根据技术报告，其在复杂推理任务中的准确率与Qwen3-8B相当甚至更优，同时在处理速度上提升了6倍。与当前主流的大模型不同，Nemotron Nano v2的设计初衷是打造一个兼顾推理与非推理任务的统一模型。这意味着它不仅适用于日常的问答与指令执行，还能胜任逻辑推理、数学计算等高难度任务。英伟达还引入了“思考预算控制”功能，用户可以设定模型在推理过程中使用的token数量，从而在速度与准确性之间取得平衡。值得一提的是，该模型支持跳过中间推理步骤，直...

来源：

量子位【阅读原文】
Tags：Nemotron Nano v2 Qwen3 小型语言模型开源AI模型预训练数据集

3个月前

在人工智能领域，音频理解正逐渐成为提升用户体验的重要技术

近日，小米公司正式开源了其声音理解大模型——MiDashengLM-7B。这款模型在22个公开评测集中刷新了多模态大模型的最佳性能记录（SOTA），并在推理效率方面展现出显著优势，标志着小米在音频AI领域迈出了重要一步。 MiDashengLM-7B的核心架构由Xiaomi Dasheng音频编码器与Qwen2.5-Omni-7B Thinker解码器组成。通过采用通用音频描述训练策略，该模型能够统一理解语音、环境音和音乐等多种声音类型，实现跨模态的声音感知能力。这一能力不仅提升了模型的泛化性，也为构建全场景智能生态奠定了基础。目前，Xiaomi Dasheng系列模...

来源：

智东西【阅读原文】
Tags：多模态AI 大模型小米开源开源AI模型音频理解大模型音频编码器

4个月前

谷歌AI新应用上线，借助Google AI Edge Gallery和开源AI模型，实现离线运行功能，Prompt Lab助力手机无网状态下玩转AI，轻松画图写代码

6月1日，谷歌在上周低调发布了一款全新应用程序，让用户能够在智能手机上运行来自Hugging Face AI开发平台的多种开源AI模型。这款名为Google AI Edge Gallery的应用已经登陆安卓系统，并计划很快推出iOS版本。用户可以利用该应用搜索、下载并运行兼容的AI模型，支持图像生成、问答对话、代码编写与编辑等多种功能。所有模型均可在本地离线状态下运行，无需联网，仅通过设备处理器即可完成任务。尽管云端运行的AI模型通常更加强大，但它们也存在一些局限性。部分用户可能出于隐私考虑，不愿将个人或敏感数据上传至远程数据...

来源：

快科技【阅读原文】
Tags：Google AI Edge Gallery Prompt Lab 开源AI模型离线运行谷歌AI

6个月前

Meta Llama 3-405B：史上最强大开源AI模型，扎克伯格力推，多模态参数高达4050亿，7月23日震撼发布

在科技领域的一次重大突破中，Meta 公司即将于 7 月 23 日揭开其最新的开源人工智能模型——Llama 3-405B 的神秘面纱。据The Information报道，这款AI模型是基于内部员工的爆料而曝光的，它将加入已有的80亿和700亿参数版本，带来一个前所未有的4050亿参数版本，被赞誉为最强大的开源大型语言模型。Meta首席执行官马克·扎克伯格在4月份推出Llama 3时曾提及这个4050亿参数的模型，但并未提供详细细节。 Llama 3-405B 不仅仅是一个语言模型，它具备多模态能力，能够理解和处理图像、文本等多种媒体形式的内容，拓宽了人工智能的...

来源：

IT之家【阅读原文】
Tags：Llama 3-405B Meta 多模态开源AI模型扎克伯格

1年前 (2024)