标签：Qwen3

在AI模型小型化趋势愈发明显的今天，英伟达也加入了这场“小模型竞赛”，推出了自家的小型语言模型——Nemotron Nano v2

这款模型参数规模为9B（90亿），虽然体积小巧，但性能却不容小觑。根据技术报告，其在复杂推理任务中的准确率与Qwen3-8B相当甚至更优，同时在处理速度上提升了6倍。与当前主流的大模型不同，Nemotron Nano v2的设计初衷是打造一个兼顾推理与非推理任务的统一模型。这意味着它不仅适用于日常的问答与指令执行，还能胜任逻辑推理、数学计算等高难度任务。英伟达还引入了“思考预算控制”功能，用户可以设定模型在推理过程中使用的token数量，从而在速度与准确性之间取得平衡。值得一提的是，该模型支持跳过中间推理步骤，直...

来源：

量子位【阅读原文】
Tags：Nemotron Nano v2 Qwen3 小型语言模型开源AI模型预训练数据集

11个月前

通义灵码AI IDE上线，深度适配Qwen3，首创自动记忆功能，助力开发者工具在AI编程领域实现新突破

通义灵码AI IDE现已正式上线，作为阿里云推出的首个AI原生开发环境工具，深度适配了Qwen3大模型，并且创新性地引入了自动记忆功能。这款工具旨在为开发者提供更智能、高效的编程体验。通义灵码AI IDE不仅全面集成了通义灵码插件能力，还拥有编程智能体、行间建议预测、行间会话等功能。它不仅可以辅助写代码、修复BUG，还具备自主决策、MCP工具调用、工程感知、记忆感知等能力，从而帮助开发者完成复杂的编程任务。在模型层面上，通义灵码AI IDE与自家开源模型Qwen3进行了深度适配，其代码能力达到了行业领先水平。同时...

来源：

量子位【阅读原文】
Tags：AI编程 Qwen3 开发者工具自动记忆功能通义灵码

1年前 (2025)

Qwen3与DeepSeek-R1在数据分析领域的实力较量：AI模型语义识别哪家强？

整体评测：Qwen3与DeepSeek-R1在数据分析领域的对比分析随着AI技术的快速发展，大模型在企业级数据分析和智能决策场景中的应用越来越广泛。近日，阿里巴巴开源了新一代通义千问模型Qwen3，而数势科技的数据分析智能体SwiftAgent也迅速完成了对Qwen3的全面适配，并发布了详细的测评报告。本文将从多个维度对比Qwen3与DeepSeek-R1的表现。一、上下文改写在实际应用中，用户输入的查询语句往往不够规范，因此需要对输入语句进行改写以提高准确性。测试结果显示，在不同的语境下，Qwen3-32B表现尤为突出，尤其是在不需要改...

来源：

量子位【阅读原文】
Tags：AI模型 DeepSeek-R1 Qwen3 数据分析语义识别

1年前 (2025)