整理如下:
部分:
1. Kimi K2正式发布,开启开源新篇章
近日,国内知名大模型公司“月之暗面”正式开源其最新旗舰模型——Kimi K2。这款基于MoE架构的大模型,总参数量高达1万亿(1T),激活参数为320亿(32B),标志着国内AI模型研发迈入新阶段。目前,Kimi K2已上线Kimi Web端与App端,用户可直接体验其强大功能。
作为月之暗面首款开源旗舰模型,Kimi K2在多个基准测试中表现优异,尤其在编程能力(SWE Bench Verified)、智能体任务(Tau2)和工具调用(AceBench)方面达到了开源模型的SOTA水平。
2. 多项能力超越竞品,仍有提升空间
在自主编程、工具调用和数学推理等核心能力维度上,Kimi K2超越了DeepSeek-V3-0324、Qwen-235B-A22B等主流模型。尽管如此,在部分测试中仍略逊于Claude 4 Opus和OpenAI GPT-4.1等国际顶尖模型。
Kimi K2采用了名为“MuonClip”的新型优化器进行训练,有效提升了Token的利用效率,并缓解了高质量训练数据不足的问题。此外,该模型还融合了大规模Agentic Tool Use数据合成和通用强化学习技术,进一步增强了其智能表现。
3. API服务同步上线,定价透明
Kimi K2的API服务也已同步上线,支持最长128K上下文长度。计费方面,输入每百万tokens收费4元,输出每百万tokens收费16元,价格为DeepSeek V3的两倍。用户可通过无问芯穹Infini-AI异构云平台(cloud.infini-ai.com/genstudio/)调用该模型,费用与官方API一致。
目前,Kimi K2系列已开源两个版本:未经过指令微调的基础模型Kimi-K2-Base,适用于科研与自定义开发;以及经过通用指令微调的Kimi-K2-Instruct版本,适用于问答和智能体任务。
4. 编程能力显著提升,实测效果尚有差距
根据官方博客披露,Kimi K2在前端开发任务中能生成具有设计感和视觉表现力的代码,支持粒子系统、可视化和3D场景等复杂效果。例如,Kimi K2可生成昼夜循环的山川峡谷3D景观及粒子特效银河等高级视觉。
尽管如此,智东西实测发现,Kimi K2生成的网页渲染效果尚未达到官方Demo的水准,交互性和功能丰富度仍有一定差距。在个人网站开发任务中,Kimi K2展现出良好的结构规划能力,但UI设计水平与前代Kimi K1.5相比提升有限。
5. 工具调用能力增强,支持复杂任务处理
Kimi K2具备更强的指令解析能力,能够将复杂需求自动拆解为可执行的ToolCall结构。开发者可将其接入owl、Cline、RooCode等智能体或编程框架,实现自动化任务处理。
通过API接口,Kimi K2已具备一定的Agent能力。例如,在处理13万行数据时,Kimi K2能够自动分析远程办公比例对薪资的影响,生成统计图表与回归模型解读,并输出专业图表如小提琴图、箱线图和散点图等,最终整理成完整报告。
此外,Kimi K2还能帮助用户制定个性化计划,如为Coldplay粉丝定制演唱会行程规划,并生成HTML格式的日历和行程概览,甚至可自动发送邮件。
6. 风格化写作与通用推理能力提升
Kimi K2在风格化写作方面也有所突破,能够模仿如苹果广告文案等特定风格,提升生成的多样性与表现力。同时,在通用知识推理、数学计算和任务规划方面,Kimi K2也有明显进步,能够处理较为复杂的数字逻辑问题。
7. 未来规划:视觉理解与思考能力将陆续上线
据月之暗面介绍,Kimi K2采用MuonClip优化器进行训练,有效缓解了大规模模型训练中的Attention Logits偏大问题,提升了训练稳定性和Token使用效率。整个训练过程共计使用15.5T Token,未出现Loss Spike。
未来,月之暗面计划为Kimi K2增加视觉理解和思考能力,进一步拓展其应用场景。
本文来源: