天生拥有爱国光环围绕于身的华为,每次的产品发布都让人对它充满期待!而这一次,盘古大模型的更新,又是否能让国人对“中国版”的GPT发展重拾信心?
(点击关注!分享最新行业热点、供需双方撮合交易、资源高效对接!)
最近,华为盘古大模型在朋友圈和各大券商处被又一次吹爆,借助人民日报的官方“顺带”点名,整个周末在各种投资平台都随处可见吹捧华为盘古概念股的讯息,典型的如常山北明、拓维信息、特发信息等,在周五也基本都是涨停板。
结合近期随着大众被OpenAI的一顿骚操作整下来,无论是对话机器人的文本式应用还是AI绘图类应用等,都使得大家对大模型有了相对广泛的接触和认知,也因此,再配合上华为的光环附体,和各路资本的争相吹捧,鼓动着大家对它的期待。


那“人气”如此火爆的华为盘古大模型,究竟是啥?是不是又一次资本市场的联合鼓动,先拉涨停,然后周末放消息、发酵,周一散户积极入场跟风,而主力则借机出货抛售,给广大朋友埋坑?客观看待之。

早在2021年4月,华为云即发布了盘古系列超大规模预训练模型,包括30亿参数的全球最大视觉(CV)预训练模型之一,以及与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的全球最大中文语言(NLP)预训练模型,发布初期主要是为了解决开发者的效率问题。
当时天下苦AI开发久矣。包括从零建模、独立调优、艰难迭代、推倒重来,很多地方需要耗费开发者的大量精力,若是规模稍大一些,要做模型训练,还需要开发者手工编写大量的并行、切分和通讯代码,说的俗些,有点类似传统的“手工作坊”。
结合现实的发展,我们可以感受到工业制造的魅力,它极大的解放了人类的生产能力,而类比到AI领域,是不是也存在这样一种工厂模式呢?
简单说,华为云盘古大模型就是这样一种AI开发的工厂模式,曾经的盘古大模型是“预训练+下游微调”的形式,和当时全球主流的大模型Bert类似,如今技术路线被颠覆,GPT占据了上风,这次即将要推出的更新版大模型,想必也会做出适当的打磨和修正。
而这种工厂化的模式一大优点就在于拥有极强的泛化能力,也就是举一反三的能力,同样的一个模型,可以在多个场景中适用,也正基于此,有了华为盘古大模型的推出与市场。

首先华为拥有海量的技术人员储备,其次对于盘古大模型的推出也做了非常久的筹备,在具体实现方式上则主要依托于:CANN算子和MindSpore框架。

其中CANN算子是华为推出的异构计算架构,2018年推出1.0版本,已经迭代到了3.0版本,目前不仅使用于推理、训练场景,还能够实现“端边云协同”。这就意味着不必在不同的终端,再去开发不同的算子,大大提高了效率。例如基于CANN,就能让ResNet-50模型的训练时间降低到28s。
MindSpore框架则是华为于2019年推出的全场景AI计算框架,其中的一大特色,就是具有全自动混合并行方案。
而华为云盘古大模型的实现,还需要了三种并行技术的融合:模型并行、数据并行和流水线并行,如此一来,开发者就只需要编写单机算法代码、添加少量并行标签,就可以实现模型训练的自动切分。

此外,盘古的设计有三个核心能力,即:可以吸收海量数据的超大型神经网络、强壮的网络结构、优秀的泛化能力,而华为盘古大模型的整体表现都不错,在权威的中文语言理解评测基准CLUE榜单中,总成绩及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录,总成绩得分83.046。

盘古,具备开天辟地之寓意。
从名字上即可以看出华为对其定位的战略高度,面对如今中美科技竞争的军备竞赛压力,华为这一“国之重器”也承载了我们无数的期盼,从华为云官网可以看到,横向来看,盘古大模型具备四大方向,分别是自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型、科学计算大模型。

一件事情的做成,需要的是方方面面,前面我们看过了Robin李彦宏在百度文心一言发布会上也提到了百度在芯片、算力、平台、应用等各层面的布局和生态。

而华为作为基础ICT领域的领头羊,中间又经历过了老美对底层硬件技术和产品的封锁,技术能力和应用生态都不断被磨练到十分强大,引用浙商的研究报告可以看到非常详细的层级和相应的构成。
因此,在整个生态链上,华为比一众互联网企业更具备技术实力的话语权,特别是从底层的芯片、到服务器整机、中间件、操作系统、数据库等方面都具备其它互联网公司所不可比拟的优势。
而借助于华为多年打造的黑土地能力,如华为沃土计划2.0将围绕鲲鹏展翅、沃土云创、昇腾万里子计划持续投入,累计将投入2.2亿美金。发布“沃土云创计划”:投入1亿美金资金扶持,聚焦6大技术领域(容器/微服务、SaaS化、大数据、AI、视频、智能边缘)等可以体会到华为对生态伙伴的重点建设和投入。
这次人民日报和各大券商如此力挺华为的盘古大模型,伴随其即将进行的隆重更新和发布,其具体表现和实力是否会超过所有人的预期,努力扛起国之重器的大旗?目前来看,在已有的技术底层、供应链配件、芯片、整机、云平台、算法、模型、应用之上,结合背后站着的14000多家咨询类伙伴、6000多家技术类伙伴,和230多万开发者的力量,在未来的科技军备竞赛中,确实有可能重振我们久违的信心!
延伸阅读:

整理不易,感谢你的支持和关注!欢迎点赞、转发,让更多的朋友能够看到!公众号内还可直接回复“入群”,即刻加入DEIA数字经济产业联盟3群,和超过3500家智囊团、行业专家、厂商伙伴、甲方客户和投融资机构一起高质量链接!同时收获最新最热的行业资讯,一同成长、合作共赢!
再次感谢!