月之暗面Kimi K2爆火！万亿参数MoE开源模型，追Claude 4成本仅20%，兼容 API，开发者狂赞开源标杆- 大数跨境

首页

月之暗面Kimi K2爆火！万亿参数MoE开源模型，追Claude 4成本仅20%，兼容 API，开发者狂赞开源标杆

元龙数字智能科技

2025-07-15

导读：月之暗面 Kimi K2 爆火！

月之暗面 Kimi K2 爆火！

万亿参数 MoE 开源模型

追 Claude 4成本仅 20%，兼容 API

开发者狂赞开源标杆

在人工智能领域的激烈竞争中，国内大模型独角兽月之暗面近期发布的 Kimi K2 模型引发了全球关注。这款采用 MoE 架构的万亿参数级基础模型，不仅在技术性能上实现突破，更在开源生态和实际应用中展现出强大的竞争力。其推出后迅速在海外掀起热议，推出不到两天，在大模型 API 聚合平台 OpenRouter 的 token 使用量就超越了马斯克创立的 xAI，而 xAI 前不久刚发布号称 “全球最强 AI” 的 Grok 4，Kimi K2 也由此成为开源模型领域的新标杆。

Kimi K2 的总参数量达到 1 万亿（1T），激活参数为 32B，现已在 Kimi Web 端和 App 端中上线。在代码、Agent、工具调用这三方面的相关基准测试中，该模型均取得开源模型中的 SOTA 成绩。开发者实测显示，其编码能力与 Claude 4 相当，但成本仅为后者的 20%。一位开发者将 Kimi K2 连接到 Claude Code 进行测试，发现其编程能力能平替原版的 85%，而使用 DeepSeek 驱动时仅能平替 60%。此外，Kimi K2 在 Python 数据分析、前端开发等实际场景中表现出色，可生成兼具设计感与视觉表现力的代码，并能自动拆解需求为可执行的 ToolCall 结构。有用户分享了用 Kimi K2 几乎写完一整个前端组件库的案例，且过程完全由该模型自主实现，没有引用任何外部组件库，“只用非常简单的提示词，但是出来的效果超级好！” 对于 Python 数据分析任务，Kimi K2 也能一次性搞定，还可以生成一个网站，“成本仅需几分钱”，测试用户这样表示。

在 Agent 工具调用能力方面，前 Anthropic AI 工程师、MagicPath 创始人兼 CEO Pietro Schirano 评价称，Kimi K2 是自 Claude 3.5 Sonnet 之后首款让他在生产环境中放心使用的非 Anthropic 模型，其并行调用工具和 “知道何时停止” 的能力显著提升了任务处理效率。创意写作和角色扮演评测中，Kimi-K2-Instruct 也超越了 o3 等模型，展现出强大的泛化能力。这几天，陆续有开发者分享测试与体验 Kimi K2 的使用感受以及与其他国内外知名大模型的能力对比情况，值得一提的是，Kimi K2 在开发者群体中的各种实测不仅没掉 “链子”，而且表现似乎比官方给的预期更令人惊喜，在提到 Kimi K2 的帖子中，充斥着 “不输 Claude 4 但便宜 80%!、唯一超越 R1 的存在...” 等此类评价。

Kimi K2 的高性能背后是多项技术创新。预训练阶段采用的 MuonClip 优化器，通过 qk-clip 技术有效解决了万亿参数模型训练中的注意力 logit 爆炸问题，确保训练稳定性。与传统的 AdamW 优化器相比，Muon 优化器显著提升了 token 利用效率，在 Moonlight 项目中已证明其训练效果更优。“严格来说，在预训练数据集近似有限且模型配置固定的情况下，token 利用率更高的优化器能产生更多智能。我们此前开发的 Moonlight 项目已证明，用于大语言模型训练时， Muon 优化器的性能显著优于广泛使用的 AdamW 优化器。” 月之暗面相关介绍如是说。

架构设计上，Kimi K2 与 DeepSeek V3 高度相似，但通过减少注意力头数量、增加 MoE 稀疏性，进一步优化了长上下文效率和 token 利用率。这种调整基于缩放律分析，在保持模型性能的同时降低了计算复杂度。月之暗面在技术博客中解释道，Kimi K2 的设计目的是进一步扩展 Moonlight，其架构与 DeepSeek-V3 相似。基于缩放律分析，他们减少了注意头的数量以提高长上下文效率，并增加了 MoE 的稀疏性以提高 token 效率。在扩展过程中，他们还遇到一个持续的挑战：由爆炸性注意力 logit 引起的训练不稳定性，这个问题在实验中更频繁地出现在 Muon 上，而在 AdamW 上则较少出现；现有的解决方案，如 logit 软上限和查询 - 键归一化，被发现不足以解决问题。为此，他们才决定引入了 MuonClip 优化器，通过其提出的 qk-clip 技术改进 Muon。具体来说，qk-clip 通过在 Muon 更新后直接重新调整查询和键投影的权重矩阵来稳定训练，从而在源头上控制注意力 logit 的规模。

此外，大规模 Agentic Tool Use 数据合成和引入自我评价机制的通用强化学习，使模型能够自主掌握复杂工具调用能力，适应多样化场景。据介绍，为了让模型掌握复杂的工具使用能力，他们借鉴 ACEBench 开发了一套全面的流程，可大规模模拟现实世界中的工具使用场景，系统性地扩展了包含数千种工具的数百个领域（既包括真实的 MCP（模型上下文协议）工具，也包括合成工具），随后生成了具备多样化工具集的数百个智能体。

值得注意的是，Kimi K2 的 API 服务具备强通用性，兼容 OpenAI 和 Anthropic 两种格式，支持最长 128K 上下文，方便用户将现有框架无缝迁移至该模型。其输入输出价格分别为 4 元 / 百万 tokens 和 16 元 / 百万 tokens，虽高于 DeepSeek V3，但性能优势明显。不少用户踊跃测试了 Kimi K2 的真实编码能力，采取的方式为：直接将该模型连接到了 Claude Code。可以这样操作的原因正是 Kimi K2 的 API 服务具备强通用性，能够兼容 OpenAI 和 Anthropic 两种 API 格式，也可以与各类框架良好兼容。一位开发者在对比了模型性能情况与 token 价格后，得出的结果是：K2 的编码能力卓越，基本与 Claude 4 相当，但只需花费 Claude 4 的 20% 成本，唯一缺点是 API 有点慢。多年 AI 行业从业者刘小排在使用「K2 版 Claude Code」后的感受则是：“Kimi K2 驱动下的 Claude Code，编程能力和原版 Claude Code 差别不大，能平替 85%。如果用 DeepSeek 驱动，我认为只能平替 60%。” 有网友这样评价，“Claude Code 可以用 Kimi K2 的模型，这件事就很有意思。它证明了 Claude 这套 Agent 架构，基本可以适用于任何模型，理论上也支持 Gemini、Grok、o3。选择永远都在用户手里，而不在大模型公司的手里。”

Kimi K2 的开源策略为开发者提供了低成本、高性能的解决方案。其开源版本包括基础预训练模型 Kimi-K2-Base 和通用指令微调版本 Kimi-K2-Instruct，前者适合科研与自定义场景，后者适用于多数问答与 Agent 任务。这种开放性吸引了众多开发者的关注和参与，例如 Perplexity CEO 表示可能利用 Kimi K2 进行后训练，进一步扩展其应用潜力。

用户反馈显示，Kimi K2 在实际使用中表现超出预期。除了前面提到的前端组件库和 Python 数据分析案例，还有用户仅用简单提示词便生成了包含粒子系统、昼夜光照变化的 3D HTML 场景。这些案例证明了 Kimi K2 在创意和工程实践中的双重价值。除了基准性能测试，Kimi K2 在多个实际场景中也展现出更强的能力泛化和实用性，包括在前端开发任务中生成兼具设计感与视觉表现力的代码、自动将需求拆解为一系列格式规范和可直接执行的 ToolCall 结构和准确控制各种输出风格来改写文本等。

Kimi K2 的发布被视为开源模型的又一胜利。其性能表现和成本优势对闭源模型形成了挑战，例如用户评价其 “不输 Claude 4 但便宜 80%”，这种高性价比可能推动更多企业和开发者转向开源生态。HuggingFace 联合创始人 Thomas Wolf 称，K2 令人难以置信，开源模型正在挑战最新的闭源权重模型。有网友为月之暗面点赞称，“这是开源模型的又一胜利，太棒了。”“K2 的中文创意写作能力应该是唯一的超越 R1 的存在。” 还有用户这样反馈道。

在与 DeepSeek 的竞争中，Kimi K2 的发布被视为月之暗面重新站稳脚跟的关键。此前 DeepSeek 凭借低价策略和性能表现抢占市场，而月之暗面通过技术创新和开源生态建设，再次成为行业焦点。据悉，DeepSeek 0 广告投放却爆火后，月之暗面就叫停了在各平台的大面积投流，之后将重心转到基础模型上。此前有消息称，其对 AI 医疗产品进行了布局，用于提升旗下产品 Kimi 在专业领域的搜索质量，并且探索 Agent 等产品方向，发布了 Deep Research 等。在 Kimi K2 发布的当晚，其联合创始人张宇韬在朋友圈转发文章时直言，"Make Kimi Great Again"，显然，月之暗面内部对 Kimi K2 寄予了厚望，并将其视作在 DeepSeek 冲击 AI 圈后、再度站稳脚跟的关键成果。

Kimi K2 的成功不仅是技术上的突破，更反映了中国 AI 行业在压力下的创新能力。面对高端芯片受限的挑战，月之暗面通过巧妙的路由策略和架构设计，在非英伟达硬件上实现了万亿参数模型的流畅运行，为打破硬件垄断提供了新思路。有网友感叹道，“万亿参数级模型已开始能在非英伟达硬件上流畅运行…… 如果中国实验室能通过巧妙的路由策略，在更少的芯片上实现更强的智能，那么英伟达对 AI 硬件体系的垄断地位就会开始动摇。这是典型的 ' 压力下的创新’：拿不到高端芯片？没关系，我们重新设计一切，让自研硬件能发挥出更优性能。” 这种 “压力下的创新” 可能推动整个产业链的技术升级。

未来，月之暗面计划进一步扩展 Kimi K2 的能力，例如加入视觉理解和思考功能，并深化在 AI 医疗等专业领域的应用。随着政策支持和算力基础设施的完善，中国 AI 大模型有望在全球竞争中占据更重要的地位。

综上所述，Kimi K2 的发布标志着开源模型在性能和实用性上的重大突破。其技术创新、开源生态和实际应用价值，不仅为开发者提供了新选择，也为行业发展注入了新活力。在人工智能的赛道上，月之暗面凭借 Kimi K2 重新回到舞台中央，而这场技术竞赛的最终受益者，将是能够高效利用这些工具的企业和用户。随着更多类似 Kimi K2 的模型涌现，我们有理由期待一个更开放、更创新的 AI 未来。这几天，陆续有开发者分享测试与体验 Kimi K2 的使用感受以及与其他国内外知名大模型的能力对比情况，Kimi K2 在开发者群体中的各种实测不仅没掉 “链子”，而且表现似乎比官方给的预期更令人惊喜，相信在未来，Kimi K2 会给我们带来更多的惊喜，推动 AI 行业的进一步发展。

END

【声明】内容源于网络

元龙数字智能科技

永做第一使命第一向善第一

内容 901

粉丝 0

元龙数字智能科技永做第一使命第一向善第一

总阅读2.5k

粉丝0

内容901