继上个月在DeepResearch Bench基准测试中斩获国内第一后,中国移动自主研发的九天DeepInsight深度研究智能体,在全球权威评测榜单DeepResearch Bench II中力压群雄,正式登顶全球第一! 这标志着我国在复杂AI认知与高阶科研自动化领域实现了真正的超越与自主可控。
破译“全球第一”
拿下深度研究领域的权威“试金石”
能在这个榜单登顶绝非易事
作为目前全球评估大模型
深度研究综合能力的权威基准
DeepResearch Bench II
堪称名副其实的“试金石”
该榜单的评测体系极度复杂且严苛,全面覆盖了横跨22个不同学科领域的132个博士级别复杂研究任务。为了尽可能贴近真实的专业审阅标准,来自全球的领域专家学者耗费了超过400个工时,精心打磨出高达9430余项细致入微的二元评分细则,要求智能体必须在信息召回、深度分析和报告呈现这三大核心维度上经受住极端考验。能在这样一套标准的检视下摘得桂冠,足见九天DeepInsight扎实的技术底子。
一键唤醒“虚拟专家团”
重塑知识生产
告别“手搓”的底气
来源于九天DeepInsight
在长流程自动化编排
与多智能体协同上的切实突破
它如同一支全天候在线的“虚拟专家团队”,只需输入宏观研究命题,系统便会在后台精准拆解任务,并发穿梭于广袤的互联网与企业本地知识库中提取核心数据。在撰写链路中,它更是具备多轮自适应反思能力,能自动识别信息缺口并进行逻辑补全。最终生成的研报不仅图文并茂,更做到了每一处关键数据与应用案例均可一键追溯原始出处,从源头上极大降低了“AI幻觉”的风险。
无缝嵌入千行百业
深度赋能全场景业务决策
作为一款高度自主可控的
深度研究智能体
九天DeepInsight正灵活穿梭在
五花八门的高价值业务场景中
为各类场景提供智力支持
前沿技术洞察
秒级追踪全球科技动态,快速生成前瞻性的技术研判,帮研究人员把时间省下来,完成真正需要“脑力激荡”的任务。
行业与金融分析
自动汇总产业链上下游的海量数据,做足交叉比对,带你一眼看穿复杂的市场格局和潜在“风口”。
政务与舆情分析
快速理顺庞杂的政策脉络与社会热点,拨开信息迷雾,给政企机构和公共管理递上最及时的“参考答案”。
企业经营与战略决策
深度融合企业自家业务数据与外部公开信息,打破内部认知壁垒,辅助公司管理层决策。
从告别繁琐的案头检索
到实现运筹帷幄的智能协同
九天DeepInsight的突破
不仅是国际榜单上的领跑
更是中国移动在AI“深水区”
扎实耕耘的生动缩影
未来
中国移动将继续致力于
把前沿的复杂研究技术融入真实业务
让高阶的AI认知能力真正转化为
千行百业触手可及的“生产力引擎”
END
来源丨中国移动
初审 | 刘溪汇
复审 | 李 佳
终审 | 宋 坤

