华为AI芯片的发展还得“好事多磨”- 大数跨境

芯华舍

2018-10-12

导读：导读华为正式发布了它们的两款AI芯片，号称其最强的昇腾910的半精度算力达到256 TFLOPs，比目前广受

导读

华为正式发布了它们的两款AI芯片，号称其最强的昇腾910的半精度算力达到256 TFLOPs，比目前广受市场认可的NVIDIA的V100高出了一倍，看起来华为是决心要在AI芯片市场有所作为了，不过要在目前的AI芯片市场打开局面它还要经历许多困难，前面并非一片坦途。

AI芯片并不仅仅比拼性能

AI芯片是一个新发展起来的领域，与目前市场容量极大的服务器芯片市场有很大的不同，当前服务器芯片市场主要为Intel所占有，其占有服务器芯片市场超过九成的市场份额，NVIDIA则很好的抓住了AI芯片市场的特点发展成为该领域的王者。

NVIDIA是做显卡起家，不过它很早就认识到自家的GPU可以干更多的事情，GPU拥有强大的并行计算、低精度计算等能力，因此早在数年前就开始打造自己的CUDA平台，在AI逐渐成为潮流之下，NVIDIA打造的CUDA平台意外的在AI行业迅速获得认可，目前全球的神经训练网络绝大多数都是采用其CUDA平台。

NVIDIA打造的CUDA平台能在AI行业获得认可在于它的通用性，在AI计算当中有诸多的算法和任务，例如语音识别、图像识别、自动驾驶等就有很大的不同，CUDA平台的建立则很好的适应了AI的各种需求，用户在开发了自己的算法之后可以根据不同的需要建立自己的AI运算系统。

NVIDIA在AI行业获得认可后，也正强化建立自己的生态，希望依靠这种生态建立自己的护城河。千万不要小看生态，Intel能在服务器芯片市场长久成为霸主就是因为它在服务器芯片市场建立了自己的生态，导致ARM阵营始终难以进入服务器芯片市场，AMD在显卡市场与NVIDIA齐名，其GPU同样拥有强大的并行计算能力、低精度运算能力等不过在AI行业却始终难以与NVIDIA竞争。

最终比拼的还是生态

华为的达芬奇架构是一个出色的架构，与Nvidia的GPU和Google的TPU相比性能并不落下风，但是其可伸缩性却远好于GPU和TPU，能快速部署到多个不同算力等级的应用中。为了能充分发挥可伸缩性强的优势，华为的AI芯片必须能尽快进入多个不同的应用领域，因此最终比拼的还是综合生态而非一两个特定应用上的性能对比，正如两军交战最终看的是能否实现战略意图而并不比纠结于一两座城市的得失。那么，在与Google和Nvidia等生态玩家的比拼中，华为有哪些优势和挑战呢？

从公司基因来看，Google是一家技术驱动的互联网公司，Nvidia是芯片硬件公司，而华为则是设备提供商。Google一切业务的源头都是互联网，因此也希望把一切新扩展的业务规划到互联网的范畴中。Google属于第一批看到人工智能潜力的公司，在自己的业务中早早就用上了人工智能，并开发了全球最流行的深度学习框架TensorFlow。

当人工智能得到更多认可后， Google Cloud上开放了深度学习应用接口给用户使用，并且在发现人工智能计算需要新一代芯片后着手研发了TPU。对于Google来说，最关键的生态环节在于人工智能入口即TensorFlow，一旦TensorFlow成为人工智能的绝对主流框架，那么Google就将成为制订下一代人工智能标准化实施方案的主导者，这可以说与当年Google把握了互联网搜索入口如出一辙。另一方面TPU其实只是其生态中并不怎么重要的一环，事实上TPU最早是给Google内部自己使用以节省云计算功耗并加速训练模型用的，Google并没有强烈的让所有用户都用上TPU的决心。

Nvidia则是底层芯片硬件公司，最关注的是GPU是否能卖得足够好，CuDNN和TensroRT可以认为是GPU在人工智能时代的驱动程序，但却不是Nvidia的主要盈利点，而Nvidia更不会尝试去做人工智能时代入口之类的尝试，而是会更倾向于把自己定义为“人工智能计算的赋能者”。

相比Google和Nvidia，华为事实上在一个更中间的位置，因为华为是一个解决方案提供商，最终是为了解决客户的需求，因此其解决方案中既要包含硬件又要包含软件。华为在底层硬件和上层软件接口上都有与Nvidia和Google重合竞争的部分，但是其解决方案提供者的地位则是与Nvidia以及Google都没有任何竞争。

举例来说，如果中国某零售巨头要做智能零售解决方案，需要高速边缘服务器，这样的公司将会是华为的目标客户，却并非Google或Nvidia的目标客户，因为这三家公司中只有华为有意愿给这样的客户提供服务器软硬件以及云端接入的完整解决方案。而此次发布的Ascend芯片则很明显是瞄准了安防、智能零售等新兴机器视觉解决方案市场，在这些市场Nvidia和Google的基因决定了它们都不会涉足。

虽然目前华为和Google以及Nvidia在边缘计算解决方案领域并没有直接竞争，但是随着华为在云端布局加深，与Nvidia和Google将会有正面竞争。如前所述，Google的TensorFlow是手中的一张王牌，凭着TensorFlow的开放性以及社区建设，目前TensorFlow已经能完美支持多种不同的硬件平台，另一方面华为的MindSpore配合CANN则更像是面对自家芯片做的定制化解决方案，性能卓越但是开放性却可能会成为一个挑战。另一方面，在硬件层面，达芬奇如果想彻底战胜Nvidia的GPU或许还需要在芯片架构上更进一步，如果无法对GPU有数量级的性能优势，最终恐怕还是会陷入苦战。

华为AI芯片的发展还得“好事多磨”

华为目前推出的AI芯片昇腾系列强调在性能方面已大幅超越NVIDIA，这是值得可喜可贺的事情，不过这仅仅是起始的第一步，它要在AI行业与NVIDIA竞争还需要经过许多努力才能获得行业的认可。

华为首先需要建立AI芯片的计算平台，让用户可以更容易的基于它的AI芯片建立AI运算系统，这与它在手机芯片市场面临的问题是相似的。华为的麒麟芯片在性能方面已达到一流水平，不过在整合度方面与高通和联发科还有差距，尚未形成自己的一套解决方案，这就导致它需要建立一个终端研发部门，专门为它采用麒麟芯片的手机服务；相比之下高通有QRD解决方案，联发科有turnkey解决方案，手机企业拿到它们的方案之后可以说只要搭上外壳就开发出自己的手机，华为自己的手机出货量当中有近半是采用这两家手机芯片企业的解决方案基本上都由ODM企业完成就可见一斑。

华为的AI芯片刚刚推出，它要形成自己的生态同样需要一番努力，当前由于NVIDIA已打造了自己的完整生态，全球数十万开发者为它开发相应的AI应用，华为从零起步显然面临着许多困难。这与华为一直宣称自己正在开发手机操作系统，但是由于缺乏自己的生态却一直在犹豫是否要推出自己的手机操作系统的一样的问题。

对于客户来说，华为则与客户形成了同业竞争。华为希望自己在AI云计算领域占有一席之地，建立了自己的云计算业务，2017年的统计数据显示国内前十大云计算企业当中就包括了华为云，而诸多竞争对手则有阿里、腾讯、百度等，在同业竞争的影响之下这些竞争对手要采用华为的AI芯片自然要掂量掂量，而这些竞争对手同样有投资开发自己的AI芯片，因此华为的AI芯片最终会不会如手机芯片一样最终只能依靠自己的云计算业务支持发展而难以获得行业的认可呢？

当然对于华为来说它也有其他业务可以支持AI芯片的发展，除了自家的云计算业务之外，它也是全球知名的服务器供应商，去年更已跻身全球前四大服务器供应商之列，这倒是有利于它推广自己的AI芯片的，不过最终结果会如何就得看市场的发展了，但很明显前路并非一片坦途。

参考资料：

柏颖漫谈 2018-10-10

半导体行业观察 2018-10-12

推荐阅读