大数跨境
0
0

一盈据全|中国移动“九天”3.0开源亮相;蚂蚁数科推出金融推理大模型;OpenAI遭遇发展瓶颈

一盈据全|中国移动“九天”3.0开源亮相;蚂蚁数科推出金融推理大模型;OpenAI遭遇发展瓶颈 盈数智能
2025-08-04
1

中国移动“九天”3.0开源亮相:零幻觉、全开源、性能跃升

7月26日,在2025世界人工智能大会“AI 焕新 产业共赢”企业人工智能产业发展论坛上,中国移动隆重发布了其自主研发的 “九天”基础大模型3.0。此次发布不仅彰显了中国移动在大模型领域的深厚自研实力和持续创新能力,更标志着其在人工智能产业化发展道路上迈出了坚实一步。


  1. 语言模型“九天中擎”
    • MoE架构,支持万亿参数扩展,15T token多阶段预训练
    • GPQA-Diamond 77.67分、ArenaHard 67.2分,均列全球前二
    • 通过过程内化实现专业场景“零幻觉”,复杂推理提升35%

  2. 多模态模型“九天山智”
    • 首创时空流匹配+局部可控注意力,支持图文视频多轮精准编辑
    • MMStar 82.2、HallusionBench 64.3、OCRBench 94.9,领先行业

  3. 垂直模型
    • 代码模型覆盖10+语言,EvalPlus等榜单居前列
    • 数学模型短/长思维模式均达SOTA

  4. 开源大礼包
    • GitHub、HuggingFace、Gitee同步上线:模型权重、推理代码、技术报告
    • 首发TReB结构化数据评测与CCR-Bench行业复杂指令集,共200+高难场景

中国移动表示,将以“高安全、高可控、全国产、全产业”持续迭代,携手开发者共建AI产业新生态。

蚂蚁数科推出金融推理大模型 Agentar-Fin-R1

在今日举行的世界人工智能大会论坛上,蚂蚁数科隆重推出其最新研发的金融推理大模型 ——Agentar-Fin-R1。这款模型是基于阿里巴巴的通义千问 Qwen3大模型打造,专注于金融行业的专业性、推理能力以及安全合规能力,旨在为金融机构提供一个 “可靠、可控、可优化” 的智能中枢。

Agentar-Fin-R1在多个权威评测基准上表现出色,不仅超越了同尺寸的开源通用大模型 Deepseek-R1,还在 FinEval1.0和 FinanceIQ 等金融大模型评测中取得了优异的成绩。这一成果表明,蚂蚁数科在金融领域的 AI 应用已然迈入了新的高度。

为了满足不同金融机构在多样化场景下的需求,Agentar-Fin-R1提供了32B 和8B 参数两个版本,此外还有非推理版本的14B 和72B 参数模型。蚂蚁数科的 CEO 赵闻飙在发布会上表示,当前通用大模型与产业实际应用之间存在 “知识鸿沟”,因此构建专业的金融大模型是金融与 AI 深度融合的必然之路。未来,金融大模型的应用深度将成为金融机构竞争力的关键因素。

在数据层面,蚂蚁数科构建了一个业内最全面的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景。借助千亿级金融专业数据语料和专家标注的金融长思维链(CoT)构造机制,Agentar-Fin-R1展现出其 “天生懂金融” 的能力。


OpenAI遭遇发展瓶颈:GPT-5项目受挫,Orion模型降级为GPT-4.5,但估值仍达3000亿美元

OpenAI 的 GPT-5 项目正遭遇双重夹击:核心研究员接连被竞争对手挖角,导致关键节点人力断档;优质文本数据接近枯竭,模型训练“无米下锅”。曾被寄予厚望的 Orion 版本因性能未达预期,已被降格为 GPT-4.5。

尽管技术受阻,OpenAI 仍完成 83 亿美元融资,估值冲至 3000 亿美元,显示资本对其长期能力的信心。业内普遍认为,单纯堆算力、堆数据的路径已现边际递减,合成数据、多模态融合与小样本学习成为新探索方向。
此次挫折揭示大模型进入深水区的共性难题:如何留住顶尖人才、如何高效利用有限数据、如何在商业压力与技术周期之间找到平衡。

【声明】内容源于网络
0
0
盈数智能
苏州盈数智能科技有限公司是一家基于模型、用例落地、价值驱动的数据治理公司。致力为客户提供从数据生产端到数据使用端的数据标准化和自动化专业服务。以“让企业数据变得简单,助力企业数字化转型升级”为使命,提供准确、高效、实用的数字化软件和服务。
内容 69
粉丝 0
盈数智能 苏州盈数智能科技有限公司是一家基于模型、用例落地、价值驱动的数据治理公司。致力为客户提供从数据生产端到数据使用端的数据标准化和自动化专业服务。以“让企业数据变得简单,助力企业数字化转型升级”为使命,提供准确、高效、实用的数字化软件和服务。
总阅读11
粉丝0
内容69