大数跨境
0
0

网心算力云上线 Kimi K2 Thinking

网心算力云上线 Kimi K2 Thinking 网心云
2025-11-17
1

2025 年 7 月,万亿参数基础模型 Kimi K2 横空出世;9 月,K2 - 0905 代码能力升级,上下文窗口跃升至 256K;昨夜,聚焦 Agent 与推理能力的 Kimi K2 Thinking 震撼发布,并开放全场景使用,网心算力云平台已率先接入。

图 | 模型API服务

模型介绍

作为新一代开源思考模型,Kimi K2 Thinking 以“模型即 Agent”为核心理念,原生支持“边思考边用工具”,在推理、搜索浏览、编程等多场景达成 SOTA 表现。具体来说:

图 | 模型基准测试

✅ 强劲的智能体能力

Artificial Analysis 数据显示,Kimi K2 Thinking 在 τ²-Bench Telecom(智能体工具使用基准)中得分 93% ,为独立测量的最高值。其在智能体场景中的工具使用能力上较前代有显著提升,支持自主 200 - 300 轮工具调用和多轮思考。[1]

图 | Artificial Analysis

✅ INT4 精度的效率优化

经 INT4 精度优化,Kimi K2 Thinking 模型体积压缩至约594GB,较前代 FP8 精度(超1TB)实现两大突破:推理与训练效率约 2 倍提升,且同时兼容早期硬件设备(因 pre-Blackwell 架构的 NVIDIA GPU 不支持 FP4,INT4 更具兼容性)[1]

模型表现

在涵盖 100 + 专业领域的 Humanity's Last Exam 测试中,Kimi K2 Thinking 在工具辅助下取得 44.9% 的成绩,超越 GPT-5、Grok-4 等模型。

图 | Artificial Analysis

官方示例中,模型在面对 Humanity's Last Exam 测试题目时,经过 5 轮深入的循环搜索和推理,最终给出了答案:

>> 下滑查看更多 <<

在 Open AI 的 BrowseComp 基准测试中,Kimi K2 Thinking 以 60.2% 的成绩拔得头筹。模型尤其擅长“刨根问底”,分解模糊问题,通过“思考→搜索→验证”循环获取精准结果。

图 | Artificial Analysis

* BrowseComp 是 OpenAI 于 2025 年开源的AI 代理网络浏览能力基准测试,旨在评估模型在真实互联网环境中解决复杂信息检索任务的能力。

模型在一轮确认公司身份的挑战中,凭借股票回购信息定位目标公司,再检索 SEC 官网回购公告,迅速输出了准确答案。

>> 下滑查看更多 <<

此外,模型在 SWE-Multilingual、SWE-bench Verified 等基准测试中的表现也非常亮眼,尤其擅长 HTML、React 等前端任务,如复刻 Word 文字编辑器、创作体素艺术(voxel art)作品等。

图 | Word 文字编辑器

图 | 创作体素艺术

同时,Kimi K2 Thinking 也对通用基础能力进行了全面的升级:如创意写作风格连贯、情感饱满;学术研究、论文分析更加严谨;情感咨询也更具同理心,能提供细致建议。

以下是模型辅助解读论文的例子:

>> 下滑查看更多 <<


引用:

[ 1 ] https://x.com/ArtificialAnlys/status/1986541785511043536


END


点击底部“阅读原文”注册账号,就能快速接入国内主流模型及API服务。平台不仅提供覆盖全流程的工具链,更配备了充足的算力支持,助力开发者、企业用户将这项强大的模型能力部署到实际业务环境中,实现效率跃升。



【声明】内容源于网络
0
0
网心云
网心云是业界领先的边缘计算服务商—深圳市网心科技有限公司推出的智能边缘计算平台。
内容 107
粉丝 0
网心云 网心云是业界领先的边缘计算服务商—深圳市网心科技有限公司推出的智能边缘计算平台。
总阅读21
粉丝0
内容107