大数跨境
0
0

国产之光,Kimi k2 Thinking

国产之光,Kimi k2 Thinking 十二AI编程
2025-11-08
0
导读:Kimi 还是太强了!!!
大家好,我是十二。专注于分享AI编程方面的内容,欢迎关注。另有 Cursor、Claude Code、Codex 的优惠渠道,欢迎私信。
年底了,各大模型厂商都在拼命的发新模型,这不,月之暗面带着最新的开源模型,Kimi K2 Thinking 登场了。
月之暗面说这是他们迄今为止最优秀的开源思考模型,事实也确实如此。
Kimi K2 Thinking 在多项测试榜单中都位列第一,超过了OpenAI 和 Anthropic 闭源的旗舰模型。
目前,Kimi K2 Thinking 已经在 Kimi 官网上线,直接通过聊天模式就能使用,但月之暗面也表示,为了确保快速、轻量级体验,Kimi 官网的聊天模式下仅选择性使用部分工具,并减少工具调用轮次。因此,在 Kimi 官网上聊天体验可能无法复现基准测试成绩。
完整智能体模式 将在近期更新,以展示 K2 Thinking 的全部能力。你也可以通过 Kimi K2 Thinking API 接入使用。
作为 AI 编程博主,比较关注 Kimi K2 Thinking 模型的编程能力,先看下官方关于编程能力的介绍:
K2 Thinking 在编程与软件开发任务上展现出显著的进步。
它在多项专业评测中取得优异成绩:
SWE-Multilingual:61.1%
SWE-Bench Verified:71.3%
Terminal-Bench:47.1%
这些成绩表明,K2 Thinking 在不同编程语言与智能体框架(agent scaffolds) 间具备极强的泛化能力。
在 HTML、React 及依赖大量组件的前端开发任务中,模型表现尤为突出,能够将抽象的想法转化为完整可运行、响应迅速的产品。
在智能体编程场景下,K2 Thinking 能够一边推理,一边调用开发工具,并顺畅地融入软件智能体中,精准且灵活地执行复杂的多步骤开发流程。
从这份对比图中也能看出,K2 Thinking 的编程能力已经接近 GPT-5(High),但跟 Claude Sonnet 4.5(Thinking)还有一定的差距。
不过 Claude Sonnet 4.5 本身就是专门针对编程研发的模型,K2 Thinking 作为六边形战士,能在编程方面做到如此,已经很不错了。
但还是希望国内早点出一款专门用于编程的新模型,能超过 Claude Sonnet 4.5,毕竟大家苦 Claude 久矣。
交流群
另外,我建了个AI编程交流群,欢迎进群交流(进群送一份AI资料)。关注公众号,点击【进交流群】,扫描二维码加我好友,我拉你进群。
谢谢你看我的文章,如果觉得不错,随手点个赞、在看、转发三连吧。关注我,获取更多AI内容。我们,下次再见。(如果想第一时间收到推送,也可以给我个星标。)

【声明】内容源于网络
0
0
十二AI编程
专注AI编程、AI工具提效、AI副业搞钱等内容的分享。
内容 50
粉丝 0
十二AI编程 专注AI编程、AI工具提效、AI副业搞钱等内容的分享。
总阅读915
粉丝0
内容50