风云涌动中,围绕大模型开闭源的白刃战超过一年半。但至今谁也说服不了谁,谁也未取得决定性胜利,未来走向扑朔迷离。唯一能确定的是,对公众和企业来说,无论路线如何,解决不了最后一公里难题,开闭源都一文不值。对所有大模型而言,其真正考验如同科大讯飞创始人刘庆峰所说,在最后一公里的应用和商业化落地上。
最近,在华为开发者大会2024上,华为云 “盘古大模型5.0” 真的是狠狠的秀了一把肌肉,在场的很多人都在惊叹,华为的AI 就是世界AI 的另一级,自从前两年Chatgpt 出来以后,国内百模大战的小作文已经是全网满天飞了,那华为这个大模型,他的特点又是什么呢?直接说结论,就是四个字“分层”+“解耦”。

那么现在市面上很多的大模型,它是既不分行业也不分场景的,都是通用的一套算法,而华为的不一样,它是一个横纵交错、分层立体的结构,大模型的第一层是基础大模型,它上面的第二层是行业通用模型,再往上的第三层是客户自己可以训练的细分场景模型,举个简单的例子就很容易明白了,就把它想象成家里的插线板,它本身是个可以通电的容器,这就像是第一层,但是为了适应插不同的插头,在上面就会设计三孔的、两孔的、扁孔的、圆头的,这就像第二层,假设要出国旅游,因为每个国家的插孔和我们的不一样,这个时候上面插个转换头就可以了,这是第三层,虽然它是这么一个多层级的结构,但他们并没有耦合成一个整体,反倒是他们相互之间是一个“解耦’的关系,彼此的依赖和羁绊都很少,所以客户就可以在上面随意的去升级,优化自己想要的那部分代码。
华为的这套大模型,到底是想做什么用呢?是画画、写诗还是聊天、写小作文呢,其实都不是,华为一直以来想为TO B行业服务的战略定力,从来没改变过,他的目的是想用AI来“重塑千行万业” ,当其他的模型还在聊天写段子的时候,华为已经在下矿井、做气象预测、开发新药、风控信贷、处理政务等等了,比如天津港码头很多货物的装卸已经是AI化了,代码一输入,从船上自动把集装箱搬下来,然后直接上车就运走了,比如山西的煤矿在地下室采用了5G+AI,它大大降低了井下的人工巡检工作,让矿工可以在地面的控制室里工作,再比如原来研发一款新药平均需要花10年,花费10亿美金,现在用AI就发现了全球40年以来首个新靶点、新类别的抗生素,并且它将先导药的研发周期缩短到了一个月,研发成本降低了70%。
然而到了这个阶段华为的思考又上了一个新的台阶,那就是如何进行”端云结合”,这里的端指的是终端设备,它可以是手机、汽车、电脑,还可以是具身智能的机器人,以前那种纯云的终端的模式,传输的时候有时候会延时,现在的“端云结合”可以简单理解成,终端设备也部署了AI算力,做了AI赋能,然后再和远程的“云服务”进行结合,来提高数据效率,优化用户服务,就比如在此次大会上演示的具身智能人形机器人,就是一个很好的例子,过去想向机器人下指令是需要绕一大圈的,先是需要开发者写一段编程,然后把这段程序放到云端去运行,接着再从云端下达指令给到终端,再来让它动作,但是这次的演示是没有输入任何的程序命令,只是用咱们的语言说了一句:“你给我炒一份西兰花炒虾仁吧”,这时机器人马上回应:“好的 “,然后就看到机器人揭开锅盖,拿起盘子里的菜倒进锅里。
这个变化的过程,其实就是机器人这个终端也有了AI的算力,它把人说的话在本地”翻译”成了它能够理解的指令,然后和云端通过数据的交互,开始抄起菜来,说到这其实都已经感觉到了,端云结合,大模型走向端侧,是未来AI在应用领域非常重要的方向之一,比如这次盘古大模型加持问界的车载小艺,结合电脑Matebook,增强Mate60 的云拍照,搭载鸿蒙云手机等等,他们其实都是端云结合的延伸。
“我们能走多远,取决于我们是否拥有自主开发的、可控的基础能。”这是大模型如何解放生产力、释放每个人、每家企业,甚至每位开发者想象力的关键。
“合抱之木,生于毫末,九层之台,起于垒土。”如同刘庆峰的说法,这正是大模型能力阶段跨越的体现——意味着大模型从技术附加工具,转向引领行业变革、助力企业降本增效、普惠大众生活的关键阶段。而针对更多商业化模式的探索,也正悄然形成“模型越强、落地越多、用户越广、算力越大”的增长飞轮。从这个角度看,只要能做大生态,加速产业最后一公里的落地,无论是大模型技术路线是闭源,还是开源,其实一点都不重要。

