据知情人士透露,马云支持的蚂蚁集团使用中国制造的半导体开发了训练人工智能模型的技术,可将成本降低 20%。
知情人士称,蚂蚁金服使用了包括关联公司阿里巴巴集团控股有限公司 和华为技术有限公司在内的国产芯片,利用所谓的混合专家机器学习方法训练模型。他们表示,它得到的结果与 Nvidia Corp. 芯片(如 H800)的结果类似,由于这些信息尚未公开,他们要求匿名。
一位知情人士表示,总部位于杭州的蚂蚁金服仍在使用 Nvidia 进行人工智能开发,但目前其最新型号主要依赖其他公司提供的芯片,包括超威半导体公司 (AMD) 和中国芯片。
这些模型标志着蚂蚁金服加入了中美公司之间的竞争,自从 DeepSeek 展示了如何以远低于 OpenAI 和 Alphabet Inc. 旗下谷歌数十亿美元的投资来训练强大的模型以来,这场竞争愈演愈烈。它凸显了中国公司如何尝试使用本地替代品来替代最先进的 Nvidia 半导体。虽然 H800 不是最先进的,但它是一款相对强大的处理器,目前被美国禁止进入中国。
该公司本月发表了一篇研究论文,声称其模型在某些基准测试中有时表现优于 Meta Platforms Inc.,彭博新闻社尚未独立核实这一说法。但如果它们像宣传的那样有效,蚂蚁金服的平台可能标志着中国人工智能发展又向前迈进了一步,因为它降低了推理或支持人工智能服务的成本。
随着各大公司向人工智能投入大量资金,多级分解模型已成为一种流行选择,谷歌和杭州初创公司 DeepSeek 等公司也对其应用表示认可。该技术将任务划分为更小的数据集,就像拥有一个由专家组成的团队,每个专家专注于工作的一部分,从而使流程更加高效。蚂蚁金服在电子邮件声明中拒绝置评。
然而,MoE 模型的训练通常依赖于高性能芯片,例如 Nvidia 销售的图形处理单元。迄今为止,成本对于许多小公司来说过高,限制了更广泛的采用。Ant 一直在研究如何更有效地训练 LLM 并消除这一限制。其论文标题明确说明了这一点,因为该公司设定的目标是“不使用高级 GPU”来扩展模型。
这与 Nvidia 的初衷背道而驰。首席执行官黄仁勋认为,即使 DeepSeek 的 R1 等更高效的模型出现,计算需求仍将增长,他认为公司需要更好的芯片来创造更多收入,而不是更便宜的芯片来削减成本。他坚持打造具有更多处理核心、晶体管和更大内存容量的大型 GPU 的策略。
彭博行业研究怎么说
蚂蚁集团的论文强调了中国人工智能领域的创新不断增加和技术进步的步伐加快。如果得到证实,该公司的说法将凸显出中国正在朝着人工智能自给自足的方向迈进,因为中国正在转向成本更低、计算效率更高的模型,以绕过英伟达芯片的出口管制。
— 高级 BI 分析师 Robert Lea
蚂蚁集团表示,使用高性能硬件训练 1 万亿个 token 的成本约为 635 万元人民币(88 万美元),但其优化方法将使用低规格硬件将成本降至 510 万元人民币。token 是模型为了解世界并为用户查询提供有用响应而获取的信息单位。
知情人士表示,该公司计划利用其开发的大型语言模型 Ling-Plus 和 Ling-Lite 的最新突破,为医疗保健和金融等行业提供 AI 解决方案。
蚂蚁集团今年收购了中国在线平台好大夫,以加强其在医疗保健领域的人工智能服务。该公司周一在另一份声明中表示,蚂蚁集团创建了“AI医生助手”,以支持好大夫旗下的29万名医生完成医疗记录管理等任务。
该公司还拥有一款名为“智小宝”的人工智能“生活助手”应用程序和一款名为“马小财”的人工智能金融咨询服务。
在英语理解方面,蚂蚁金服在论文中表示,Ling-Lite 模型在一项关键基准测试中的表现优于 Meta 的 Llama 模型之一。在中文基准测试中,Ling-Lite 和 Ling-Plus 模型均优于 DeepSeek 的同类模型。
北京人工智能解决方案提供商盛商科技有限公司首席技术官罗宾·余表示:“如果你找到一个攻击点来打败世界上最优秀的功夫大师,你仍然可以说你打败了他们,这就是为什么现实世界的应用如此重要。”
Ant 已将 Ling 模型开源。Ling-Lite 包含 168 亿个参数,这些参数是可调节的设置,就像旋钮和刻度盘一样,可以控制模型的性能。Ling-Plus 有 2900 亿个参数,在语言模型领域算是比较大的了。相比之下,据《麻省理工技术评论》报道,专家估计 ChatGPT 的 GPT-4.5 有 1.8 万亿个参数。DeepSeek-R1 有 6710 亿个参数。
该公司在训练的某些方面面临挑战,包括稳定性。该公司在论文中表示,即使是硬件或模型结构的微小变化也会导致问题,包括模型错误率的激增。
蚂蚁集团周一表示,已打造了专注于医疗保健的大型模型机器,目前已在北京和上海等城市的七家医院和医疗保健提供商中使用。该公司表示,大型模型利用了 DeepSeek R1、阿里巴巴的 Qwen 和蚂蚁集团自己的 LLM,可以开展医疗咨询。该公司还表示,已推出两款医疗人工智能代理——Angel,已为1000多家医疗机构提供服务,以及支持医疗保险服务的医保尔。去年9月,该公司在其支付应用程序支付宝中推出了人工智能医疗经理服务。
免责声明:
关注我们,一起探索AWM!
近期热点
2025-03-10
2025-03-07
2025-02-28




