省75%成本_这个数字到底是怎么算出来的- 大数跨境

AI数据推进器

2026-06-02

导读：高通CEO安蒙在COMPUTEX给出分布式AI成本模型：省75%成本。本文拆解这个数字怎么算的、对工业场景意味着什么，以及你的现场条件适不适合走边缘路线。

高通CEO安蒙在台北COMPUTEX（全球最大科技展会之一）的开幕主题演讲上，说了一句话，值得所有做工业AI落地的人停下来想一想。

以前这类话大多是分析师说的，或者咨询公司的白皮书里写的。但这次不一样。一是说话的人——高通的CEO，这家公司的芯片装在全球绝大多数物联网设备里。二是说话的场合——COMPUTEX开幕主题演讲，不是随便接受采访，不是某个论坛的分会场，是全年最重要的科技展会上最黄金的讲台。三是给的数字——不是定性判断，是有模型的定量结论。

他说的是分布式智能体AI可以省75%的成本。

这个数字我在不同场合看到过好几次解读。大部分都聚焦在"智能体来了"、"AI Agent爆发"这些概念上。但我觉得没说到点子上。75%这个数字真正值钱的地方，不是它有多惊人——是它第一次给争论了三年的问题提供了一个有数据支撑的答案：工业AI的算力到底应该放在哪。

我们先拆一下75%是怎么算出来的。

安蒙提了一个分布式AI的成本模型。核心逻辑不复杂：端侧做预处理，边缘做初步推理和过滤，云端只处理高价值的复杂推理。三层过滤，每一层都在减少传输量和计算量。结果是大概60%的Token消耗节省，对应到成本上就是大概75%的降低。

这个模型有意思的地方在哪呢。

它并不是一个纯粹的技术最优解。从技术角度说，把所有算力集中到云端、用最大的模型跑最高的精度，当然是上限最高的方案。但工业场景从来不考虑高限，考虑的是投产比。分布式架构牺牲的那点点精度上限，换来的东西很多——传输成本归零、推理延迟从秒级降到毫秒级、数据不用出厂、断网也能跑。工业场景里经常不需要99.9%的精度，需要的是断电不停、网络不稳不掉、有人碰了设备三秒内能喊停。这三个要求，集中式架构一个都做不到。

我自己的观察是，工业AI领域这两年的争论焦点一直放在"云端还是边缘"这个二元选择上。但安蒙这个模型给出了第三种答案。不是二选一，是分层。什么在端侧处理，什么交给边缘，什么必须上云——这应该是一个分层决策，不是一个架构选择。

分布式架构的本质不是把算力分散到各处，是把算力放在它最该放的地方——消费级用不到的Token在端侧过滤掉，工业场景需要的确定性在边缘兜底，只有价值最高的推理才交给云端。

坦白说，这个思路跟我在一些项目里看到的落地方式高度一致。

那高通那句话说"工业领域不是需求受限，而是方案受限"就很到位了。

需求一直摆在那里——水厂的加药精准控制、输油管线的第三方施工预警、工程机械的故障诊断——这些场景的需求不是近两年才冒出来的，十年前就有人想做。但为什么一直做不成。不是算法不够好，是方案不够便宜。一套集中式的AI方案，服务器、网络、运维、数据上云的成本加在一起，大部分甲方算完账都会说"先看看吧"。

分布式架构把算力成本降下来之后，很多场景的ROI第一次变成正的了。

高通同时说了另一个判断。

现有物联网设备完全无法承载智能体AI，工业IoT将迎来史上最大规模的硬件升级周期。

这句话对做工业AI落地的人来说，比75%成本那个数字可能更重要。意思很明确：如果你想跑Agent级别的AI，现在的PLC、SCADA、边缘盒子基本都不够用。硬件需要换代。

这不是一个渐进式升级，是代际切换。

我举一个典型的例子。某个自来水厂，规模不大不小，日产十万吨左右。SCADA系统是七年前上线的，上位机用的工控机硬盘只有256G，跑了一套组态软件之后剩余空间不到80G。没有专门的AI推理硬件。厂里的工业交换机是百兆的，不支持大数据回传。光纤只铺到了中控室和几个主要工艺段，沉淀池和加药间之间还在用老式串口通信。想做一套加药AI优化，发现模型可以跑，但数据采集率不够——关键参数每十五分钟才有一条记录，AI需要的秒级数据完全不具备。最后方案做了两轮：第一轮是先补数据采集点，第二轮才是上推理模型。光第一轮就花了大半年。

这不是个例。大量存量工业现场的设备都处在同一个状态——还能跑原来的自动化控制，但没有余量跑任何AI负载。不是不想上AI，是底层的数采和通信基础压根没给AI留位置。这就出现了一个尴尬的时间差：业务想做AI转型，底层的硬件不支持，改硬件需要一笔额外预算，预算申请需要ROI论证，而ROI论证又需要先跑通一个试点。

在这个链条里，最容易跳过的就是硬件规划。

但反过来想，存量设备的算力天花板，恰好是增量方案的机会地板。

这也是我们在水厂项目里坚持用边缘路线的原因。我们跑过的几个水厂，架构都是中心服务器训练、边缘节点推理、端侧传感器做预处理。边缘节点用低成本工业级硬件，一个节点管一到两个工艺段，数据采到节点上做第一层过滤，只有高价值的数据才会传到中心。实际跑下来，传到推理层的数据量只有传统方案的百分之四五十，Token消耗节省在55%到60%的量级，跟高通给出的模型基本吻合。

不是边缘比云端更先进。是从ROI的角度，它是工业场景里的经济最优解。

安蒙这个预判还有一个实际价值——它给了数字化负责人一个向上汇报的论据。不是我要升级设备，是全行业的判断——如果不做AI-ready的硬件准备，三到五年后会被卡住。这个话由高通的CEO说出来，比你在PPT里写三页都有用。

但到底哪些场景适合走边缘路线，哪些还是可以把算力放在云端。说三个自检问题，你可以拿自己的现场条件对照。

先看你的控制回路是不是闭环。加药是自动加还是人工加，加完药多久能看到效果，化验结果是小时级还是分钟级。如果你的控制周期以小时计，云端推理延迟完全能接受，实时性不是你的瓶颈。但如果你是输油管线的安全监测，要求传感器触发的三秒内给出判断，那延迟必须在毫秒级——边缘推理不是可选项，是硬门槛。

再看你的数据能不能出厂。很多水务集团的规矩是生产数据不允许出厂区，模型只能在厂内跑。如果数据必须留在厂内，上云这条路一开始就不存在，不管你愿不愿意走边缘，都得走。

最后看现场断网了怎么办。水厂的网络情况比你想象的要差。不是骨干网不行，是末端经常有问题——某个工艺段的工业交换机重启了，光纤被施工挖断了，无线网桥信号被天气影响了。如果你的AI系统在断网时必须继续运行，边缘节点就是你的底线保障。

这三个问题走完一遍，大体上知道你该走哪条路。

75%的成本节约是有前提的——如果你的现场已经具备了AI-ready的硬件基础，这个数字你可以期待。如果数据采集都还没做到秒级，优先要解决的问题不是选边缘还是上云，是先铺底层的数采能力。

工业AI这件事有一个大致的判断框架。你的场景和数据会告诉你选哪条路，供应商不会。

高通只是给了这个判断框架一个有力的数据锚点。但锚是锚，导航还是要自己做。

【声明】内容源于网络

AI数据推进器

专注数据治理与AI应用，解码技术实战与政策风向。数据是燃料，AI是引擎，让企业决策突破边界。关注获取前沿洞察，驱动数智化增长核动力

内容 214

粉丝 0

AI数据推进器专注数据治理与AI应用，解码技术实战与政策风向。数据是燃料，AI是引擎，让企业决策突破边界。关注获取前沿洞察，驱动数智化增长核动力

总阅读608

粉丝0

内容214