

国产之光，Kimi k2 Thinking

十二AI编程

2025-11-08

导读：Kimi 还是太强了！！！

大家好，我是十二。专注于分享AI编程方面的内容，欢迎关注。另有 Cursor、Claude Code、Codex 的优惠渠道，欢迎私信。

年底了，各大模型厂商都在拼命的发新模型，这不，月之暗面带着最新的开源模型，Kimi K2 Thinking 登场了。

月之暗面说这是他们迄今为止最优秀的开源思考模型，事实也确实如此。

Kimi K2 Thinking 在多项测试榜单中都位列第一，超过了OpenAI 和 Anthropic 闭源的旗舰模型。

目前，Kimi K2 Thinking 已经在 Kimi 官网上线，直接通过聊天模式就能使用，但月之暗面也表示，为了确保快速、轻量级体验，Kimi 官网的聊天模式下仅选择性使用部分工具，并减少工具调用轮次。因此，在 Kimi 官网上聊天体验可能无法复现基准测试成绩。

完整智能体模式将在近期更新，以展示 K2 Thinking 的全部能力。你也可以通过 Kimi K2 Thinking API 接入使用。

作为 AI 编程博主，比较关注 Kimi K2 Thinking 模型的编程能力，先看下官方关于编程能力的介绍：

K2 Thinking 在编程与软件开发任务上展现出显著的进步。

它在多项专业评测中取得优异成绩：

SWE-Multilingual：61.1%

SWE-Bench Verified：71.3%

Terminal-Bench：47.1%

这些成绩表明，K2 Thinking 在不同编程语言与智能体框架（agent scaffolds）间具备极强的泛化能力。

在 HTML、React 及依赖大量组件的前端开发任务中，模型表现尤为突出，能够将抽象的想法转化为完整可运行、响应迅速的产品。

在智能体编程场景下，K2 Thinking 能够一边推理，一边调用开发工具，并顺畅地融入软件智能体中，精准且灵活地执行复杂的多步骤开发流程。

从这份对比图中也能看出，K2 Thinking 的编程能力已经接近 GPT-5（High），但跟 Claude Sonnet 4.5（Thinking）还有一定的差距。

不过 Claude Sonnet 4.5 本身就是专门针对编程研发的模型，K2 Thinking 作为六边形战士，能在编程方面做到如此，已经很不错了。

但还是希望国内早点出一款专门用于编程的新模型，能超过 Claude Sonnet 4.5，毕竟大家苦 Claude 久矣。

交流群

另外，我建了个AI编程交流群，欢迎进群交流（进群送一份AI资料）。关注公众号，点击【进交流群】，扫描二维码加我好友，我拉你进群。

谢谢你看我的文章，如果觉得不错，随手点个赞、在看、转发三连吧。关注我，获取更多AI内容。我们，下次再见。（如果想第一时间收到推送，也可以给我个星标。)

【声明】内容源于网络

十二AI编程

专注AI编程、AI工具提效、AI副业搞钱等内容的分享。

内容 50

粉丝 0

十二AI编程专注AI编程、AI工具提效、AI副业搞钱等内容的分享。

总阅读915

粉丝0

内容50