标签:模型 能力 信息 语言 问题 内容 代码生成 图像 技术 资源 整体 准确性 集上 长度 骆驼 苗正 数据 汉字 老舍 作者 微调 亚洲 版本 幻觉 跨文化 数学计算 领域 芯片 严重错误 关键 文本 可靠性 代码 架构 产生 方面 模态 情况 全球化 语种 外媒 任务

NDeepSeek小更新,多步推理表现提高43%

近日,DeepSeek在其官方微信群发布消息,宣布其线上模型已升级至最新版本V3.1。此次升级不仅将模型的上下文处理长度扩展至128K,还在多个核心能力方面实现了显著优化,包括推理能力、多语言支持以及信息输出的准确性等。 DeepSeek V3.1是继V3版本之后的一次重要更新,发布于2025年3月24日。相较于前代模型,新版本在执行复杂任务时展现出更强的逻辑推理能力。据测试数据显示,V3.1在多步骤推理任务上的表现提升了43%,尤其适用于数学运算、代码生成以及科研分析等高要求场景。 在上下文处理方面,128K的长度大约可容纳10万...