中国移动“九天”3.0开源亮相:零幻觉、全开源、性能跃升
7月26日,在2025世界人工智能大会“AI 焕新 产业共赢”企业人工智能产业发展论坛上,中国移动隆重发布了其自主研发的 “九天”基础大模型3.0。此次发布不仅彰显了中国移动在大模型领域的深厚自研实力和持续创新能力,更标志着其在人工智能产业化发展道路上迈出了坚实一步。
语言模型“九天中擎”
• MoE架构,支持万亿参数扩展,15T token多阶段预训练
• GPQA-Diamond 77.67分、ArenaHard 67.2分,均列全球前二
• 通过过程内化实现专业场景“零幻觉”,复杂推理提升35%多模态模型“九天山智”
• 首创时空流匹配+局部可控注意力,支持图文视频多轮精准编辑
• MMStar 82.2、HallusionBench 64.3、OCRBench 94.9,领先行业垂直模型
• 代码模型覆盖10+语言,EvalPlus等榜单居前列
• 数学模型短/长思维模式均达SOTA开源大礼包
• GitHub、HuggingFace、Gitee同步上线:模型权重、推理代码、技术报告
• 首发TReB结构化数据评测与CCR-Bench行业复杂指令集,共200+高难场景
中国移动表示,将以“高安全、高可控、全国产、全产业”持续迭代,携手开发者共建AI产业新生态。
蚂蚁数科推出金融推理大模型 Agentar-Fin-R1
在今日举行的世界人工智能大会论坛上,蚂蚁数科隆重推出其最新研发的金融推理大模型 ——Agentar-Fin-R1。这款模型是基于阿里巴巴的通义千问 Qwen3大模型打造,专注于金融行业的专业性、推理能力以及安全合规能力,旨在为金融机构提供一个 “可靠、可控、可优化” 的智能中枢。
Agentar-Fin-R1在多个权威评测基准上表现出色,不仅超越了同尺寸的开源通用大模型 Deepseek-R1,还在 FinEval1.0和 FinanceIQ 等金融大模型评测中取得了优异的成绩。这一成果表明,蚂蚁数科在金融领域的 AI 应用已然迈入了新的高度。
为了满足不同金融机构在多样化场景下的需求,Agentar-Fin-R1提供了32B 和8B 参数两个版本,此外还有非推理版本的14B 和72B 参数模型。蚂蚁数科的 CEO 赵闻飙在发布会上表示,当前通用大模型与产业实际应用之间存在 “知识鸿沟”,因此构建专业的金融大模型是金融与 AI 深度融合的必然之路。未来,金融大模型的应用深度将成为金融机构竞争力的关键因素。
在数据层面,蚂蚁数科构建了一个业内最全面的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景。借助千亿级金融专业数据语料和专家标注的金融长思维链(CoT)构造机制,Agentar-Fin-R1展现出其 “天生懂金融” 的能力。
OpenAI遭遇发展瓶颈:GPT-5项目受挫,Orion模型降级为GPT-4.5,但估值仍达3000亿美元
此次挫折揭示大模型进入深水区的共性难题:如何留住顶尖人才、如何高效利用有限数据、如何在商业压力与技术周期之间找到平衡。

