大数跨境

省75%成本_这个数字到底是怎么算出来的

省75%成本_这个数字到底是怎么算出来的 AI数据推进器
2026-06-02
2
导读:高通CEO安蒙在COMPUTEX给出分布式AI成本模型:省75%成本。本文拆解这个数字怎么算的、对工业场景意味着什么,以及你的现场条件适不适合走边缘路线。

 

高通CEO安蒙在台北COMPUTEX(全球最大科技展会之一)的开幕主题演讲上,说了一句话,值得所有做工业AI落地的人停下来想一想。

以前这类话大多是分析师说的,或者咨询公司的白皮书里写的。但这次不一样。一是说话的人——高通的CEO,这家公司的芯片装在全球绝大多数物联网设备里。二是说话的场合——COMPUTEX开幕主题演讲,不是随便接受采访,不是某个论坛的分会场,是全年最重要的科技展会上最黄金的讲台。三是给的数字——不是定性判断,是有模型的定量结论。

他说的是分布式智能体AI可以省75%的成本。

这个数字我在不同场合看到过好几次解读。大部分都聚焦在"智能体来了"、"AI Agent爆发"这些概念上。但我觉得没说到点子上。75%这个数字真正值钱的地方,不是它有多惊人——是它第一次给争论了三年的问题提供了一个有数据支撑的答案:工业AI的算力到底应该放在哪。

我们先拆一下75%是怎么算出来的。

安蒙提了一个分布式AI的成本模型。核心逻辑不复杂:端侧做预处理,边缘做初步推理和过滤,云端只处理高价值的复杂推理。三层过滤,每一层都在减少传输量和计算量。结果是大概60%的Token消耗节省,对应到成本上就是大概75%的降低。

这个模型有意思的地方在哪呢。

它并不是一个纯粹的技术最优解。从技术角度说,把所有算力集中到云端、用最大的模型跑最高的精度,当然是上限最高的方案。但工业场景从来不考虑高限,考虑的是投产比。分布式架构牺牲的那点点精度上限,换来的东西很多——传输成本归零、推理延迟从秒级降到毫秒级、数据不用出厂、断网也能跑。工业场景里经常不需要99.9%的精度,需要的是断电不停、网络不稳不掉、有人碰了设备三秒内能喊停。这三个要求,集中式架构一个都做不到。

我自己的观察是,工业AI领域这两年的争论焦点一直放在"云端还是边缘"这个二元选择上。但安蒙这个模型给出了第三种答案。不是二选一,是分层。什么在端侧处理,什么交给边缘,什么必须上云——这应该是一个分层决策,不是一个架构选择。

分布式架构的本质不是把算力分散到各处,是把算力放在它最该放的地方——消费级用不到的Token在端侧过滤掉,工业场景需要的确定性在边缘兜底,只有价值最高的推理才交给云端。

坦白说,这个思路跟我在一些项目里看到的落地方式高度一致。

那高通那句话说"工业领域不是需求受限,而是方案受限"就很到位了。

需求一直摆在那里——水厂的加药精准控制、输油管线的第三方施工预警、工程机械的故障诊断——这些场景的需求不是近两年才冒出来的,十年前就有人想做。但为什么一直做不成。不是算法不够好,是方案不够便宜。一套集中式的AI方案,服务器、网络、运维、数据上云的成本加在一起,大部分甲方算完账都会说"先看看吧"。

分布式架构把算力成本降下来之后,很多场景的ROI第一次变成正的了。

高通同时说了另一个判断。

现有物联网设备完全无法承载智能体AI,工业IoT将迎来史上最大规模的硬件升级周期。

这句话对做工业AI落地的人来说,比75%成本那个数字可能更重要。意思很明确:如果你想跑Agent级别的AI,现在的PLC、SCADA、边缘盒子基本都不够用。硬件需要换代。

这不是一个渐进式升级,是代际切换。

我举一个典型的例子。某个自来水厂,规模不大不小,日产十万吨左右。SCADA系统是七年前上线的,上位机用的工控机硬盘只有256G,跑了一套组态软件之后剩余空间不到80G。没有专门的AI推理硬件。厂里的工业交换机是百兆的,不支持大数据回传。光纤只铺到了中控室和几个主要工艺段,沉淀池和加药间之间还在用老式串口通信。想做一套加药AI优化,发现模型可以跑,但数据采集率不够——关键参数每十五分钟才有一条记录,AI需要的秒级数据完全不具备。最后方案做了两轮:第一轮是先补数据采集点,第二轮才是上推理模型。光第一轮就花了大半年。

这不是个例。大量存量工业现场的设备都处在同一个状态——还能跑原来的自动化控制,但没有余量跑任何AI负载。不是不想上AI,是底层的数采和通信基础压根没给AI留位置。这就出现了一个尴尬的时间差:业务想做AI转型,底层的硬件不支持,改硬件需要一笔额外预算,预算申请需要ROI论证,而ROI论证又需要先跑通一个试点。

在这个链条里,最容易跳过的就是硬件规划。

但反过来想,存量设备的算力天花板,恰好是增量方案的机会地板。

这也是我们在水厂项目里坚持用边缘路线的原因。我们跑过的几个水厂,架构都是中心服务器训练、边缘节点推理、端侧传感器做预处理。边缘节点用低成本工业级硬件,一个节点管一到两个工艺段,数据采到节点上做第一层过滤,只有高价值的数据才会传到中心。实际跑下来,传到推理层的数据量只有传统方案的百分之四五十,Token消耗节省在55%到60%的量级,跟高通给出的模型基本吻合。

不是边缘比云端更先进。是从ROI的角度,它是工业场景里的经济最优解。

安蒙这个预判还有一个实际价值——它给了数字化负责人一个向上汇报的论据。不是我要升级设备,是全行业的判断——如果不做AI-ready的硬件准备,三到五年后会被卡住。这个话由高通的CEO说出来,比你在PPT里写三页都有用。

但到底哪些场景适合走边缘路线,哪些还是可以把算力放在云端。说三个自检问题,你可以拿自己的现场条件对照。

先看你的控制回路是不是闭环。加药是自动加还是人工加,加完药多久能看到效果,化验结果是小时级还是分钟级。如果你的控制周期以小时计,云端推理延迟完全能接受,实时性不是你的瓶颈。但如果你是输油管线的安全监测,要求传感器触发的三秒内给出判断,那延迟必须在毫秒级——边缘推理不是可选项,是硬门槛。

再看你的数据能不能出厂。很多水务集团的规矩是生产数据不允许出厂区,模型只能在厂内跑。如果数据必须留在厂内,上云这条路一开始就不存在,不管你愿不愿意走边缘,都得走。

最后看现场断网了怎么办。水厂的网络情况比你想象的要差。不是骨干网不行,是末端经常有问题——某个工艺段的工业交换机重启了,光纤被施工挖断了,无线网桥信号被天气影响了。如果你的AI系统在断网时必须继续运行,边缘节点就是你的底线保障。

这三个问题走完一遍,大体上知道你该走哪条路。

75%的成本节约是有前提的——如果你的现场已经具备了AI-ready的硬件基础,这个数字你可以期待。如果数据采集都还没做到秒级,优先要解决的问题不是选边缘还是上云,是先铺底层的数采能力。

工业AI这件事有一个大致的判断框架。你的场景和数据会告诉你选哪条路,供应商不会。

高通只是给了这个判断框架一个有力的数据锚点。但锚是锚,导航还是要自己做。

 


【声明】内容源于网络
0
0
AI数据推进器
专注数据治理与AI应用,解码技术实战与政策风向。数据是燃料,AI是引擎,让企业决策突破边界。关注获取前沿洞察,驱动数智化增长核动力
内容 214
粉丝 0
AI数据推进器 专注数据治理与AI应用,解码技术实战与政策风向。数据是燃料,AI是引擎,让企业决策突破边界。关注获取前沿洞察,驱动数智化增长核动力
总阅读608
粉丝0
内容214