

中国AI芯片的创新之路：GTIC 2020 AI芯片创新峰会

新产研中心

2020-12-14

导读：12月1日，GTIC 2020 AI芯片创新峰会在北京成功举办，探讨了2020年AI芯片产业经历的机遇与挑战，为新基建风口下AI芯片加速落地、未来AI芯片的创新之路等问题提出了具有启发性的解决方案和破

12月1日，GTIC 2020 AI芯片创新峰会在北京成功举办。本次峰会聚集了AI芯片以及各个细分赛道的产、学、研精英人士，分别从产业潜力、前沿技术、场景化应用等角度，探讨了2020年AI芯片产业经历的机遇与挑战，为新基建风口下AI芯片加速落地、未来AI芯片的创新之路等问题提出了具有启发性的解决方案和破题思路。

尹首一教授：AI芯片分类及中国AI芯片发展概况

国内AI芯片学术领军人物、清华大学微纳电子系副主任、微电子所副所长尹首一教授首登GTIC舞台，通过主旨演讲深入浅出地探讨中国AI芯片的创新之路，为AI芯片产业的发展趋势与创新机会进行了更为系统的梳理与预判。

按技术路线划分，目前的AI芯片主要包括深度神经网络（DNN）处理器和神经形态处理器两类。

DNN处理器：可细分为指令集处理器、数据流处理器、存内计算处理器，以及可重构AI处理器。

神经形态处理器：重要研究方向有CMOS SNN（脉冲神经网络）处理器和神经形态器件，前者主要是对人脑活动的一种数学抽象，后者则是真正设计一种物理器件，并在物理上模拟人类的神经元行为。

在尹首一教授看来，无论是哪种技术路线，最终目标都是实现对深度神经网络的计算加速。

回顾AI芯片的阶段性发展，尹首一教授总结道：（1）目前AI芯片仍处于起步阶段，在科研和产业应用方面具有广阔的创新空间。（2）AI芯片从算法和应用角度给行业提出了许多创新需求，促使人们探索更多的颠覆性技术，有望彻底突破传统架构的性能和能效瓶颈，实现集成电路的跨越式发展。（3）中国AI芯片产业创新正与国际同步，有着最全面的技术路线、最丰富的应用领域，伴随着人工智能产业的快速发展，我国AI芯片领域大有可为。

企业在AI芯片领域的新进展

黑芝麻智能自动驾驶计算芯片的突围之径

黑芝麻智能作为国内汽车芯片初创公司中的佼佼者，是一支成立不到四年、但包揽了芯片、视觉、汽车等领域老将的创业团队。

本次峰会上，黑芝麻智能首次公布产品路线图。从技术来讲，黑芝麻智能提供完整端到端的解决方案，包括前端摄像头或者传感器的定制。另外，基于车规级的高性能计算平台，围绕领先的图像处理能力、神经网络加速器技术，黑芝麻智能提供完整的自动驾驶方案。

今年6月，黑芝麻智能科技举办了华山二号系列芯片线上发布会，成功发布了国产最强性能智能驾驶感知芯片——华山二号A1000芯片和华山二号A1000L(A1000 Lite)。华山二号(A1000)芯片具备40-70TOPS的强大算力，小于8W的功耗及优越的算力利用率，工艺制程16nm，符合AEC Q-100、单芯片ASILB、系统ASIL D汽车功能安全要求，是目前能支持L3及以上级别自动驾驶的唯一国产芯片，有望赋能整个自动驾驶生态圈，助力中国智能汽车方向的技术创新与产业转型。为了应对不同的市场需求，黑芝麻同步发布了华山二号A1000L，同样符合车规级要求。

基于华山二号A1000芯片，黑芝麻提供了四种智能驾驶解决方案：1）单颗A1000L芯片适用于ADAS辅助驾驶；2）单颗A1000芯片适用于L2+自动驾驶；3）双A1000芯片互联可达140TOPS算力，支持L3等级自动驾驶；4）四颗A1000芯片则可以支持L4甚至以上的自动驾驶需求。另外，黑芝麻还可以根据不同的客户需求，提供定制化服务。

地平线车规级AI芯片的软硬件协同

地平线是当前中国唯一实现车规级AI芯片前装量产的AI芯片公司，是我国发展最快的AI独角兽之一。

目前，地平线已经推出了征程2和征程3两款车规级AI芯片。征程2芯片采用28nm制程工艺，算力为4TOPS（万亿次/秒），功耗为2W。

征程3芯片采用16nm制程工艺，算力为5TOPS（万亿次/秒），功耗为2.5W，它可以支持高级别辅助驾驶、智能座舱、自动泊车辅助及众包高精地图定位等多种应用场景。通过多颗征程3芯片组成计算平台，还可以支持L3级别的自动驾驶功能。可以看到，地平线的芯片在算力上并不突出，其优势在于有非常高的计算精度，因此算力的有效利用率很高。征程3 是地平线基于自研的BPU2.0 架构，针对高级别辅助驾驶场景推出的新一代高效能车规级 AI 芯片，已通过 AEC-Q100 认证。征程3 不仅支持基于深度学习的图像检测、分类、像素级分割等功能；也支持对 H.264 和 H.265 视频格式的高效编码，是实现多通道 AI 计算和多通道数字视频录像的理想平台，例如可实现高级别辅助驾驶（ ADAS ），驾驶员监控（ DMS ），及自动泊车辅助（ APA ）等功能。

与此同时，地平线还提出了MAPS评估法，即“在精度有保障范围内的平均处理速度”，得到一个直面物理世界的全面、完整、客观、真实的评估，以此作为评估芯片AI真实性能的标准。

地平线将通过打造完整的数据闭环，提供“芯片+工具链”、“芯片+工具链+算法”等不同解决方案，赋能产业链。构建这一计算闭环需要长期做三件事：一是持续提升芯片的有效算力，二是提升算法效率，三是根据解决物理世界的实际问题联合调优得到最优解。

安谋中国依托Arm计算架构推出周易AIPU

安谋中国依托Arm世界领先的生态系统资源与技术优势，面向中国市场独立研发了周易AIPU。周易AIPU定义了一套新的适用于AI算法的指令集，通过指令来驱动里面的向量处理单元和固定的AI算法处理单元，从而完成各种复杂网络的组合的操作。

面向AIoT领域，安谋中国构建的AIoT技术生态已覆盖CPU、GPU、AIPU等各类产品，同时提供强大软件工具链。其中，安谋中国在今年发布的自主研发AI专用处理器周易Z2 AIPU，主要面向中高端安防、智能座舱和ADAS、边缘服务器等应用场景，单核算力达4TOPS，同时可扩展32个核心，单SoC算力可扩展至128TOPS。

目前周易AIPU已被多个芯片公司使用，并已开发出智能语音的相关产品，一些采用了搭载周易AIPU芯片的智能音箱产品也将很快面世。另外，安谋中国客户面向中高端安防领域也很快有产品推出，面向智能座舱的产品也将在明年初对外界发布。

比特大陆新基建风口下的云边端AI芯片

比特大陆是区块链行业巨头之一，此前已在AI芯片行业耕耘数年。比特大陆AI业务线CEO王俊分享道，目前公司已推出面向云边端的四款AI芯片，并已为北京市海淀区、福建福州等地提供了AI超算中心以支撑智慧城市建设。

比特大陆的第三代AI芯片BM1684相比第二代，性能提升了6倍。BM1684内置张量计算模块TPU，该TPU模块包含64个NPU运算单元，每个NPU包括16个EU单元，总共有1024个EU运算单元。BM1684为视频处理做了特别优化，单芯片最高支持32路H264/H265的解码能力，每秒480帧JPEG/PNG图片编解码，960 fps@1080p视频解码能力，更内置了视频图像前后处理硬件加速模块。最终，基于台积电12nm工艺，在16w功耗下，BM1684FP32精度算力达到2.2 TFlops，INT8算力可高达17.6Tops，在Winograd卷积加速下，INT8算力可提升至35.2Tops。

除了性能和功耗表现，还有值得一提的是BM1684芯片内置Trustzone、secureboot以及多种加解密算法；芯片内置的加密算法可以可保护客户的数据、模型安全可靠，也就是说别人把你的算法从一个BM1684芯片拷贝到另外一个BM1684芯片是没有办法工作的。另外，BM1684 还支持16个PCIE3.0lane、2个千兆以太口，支持多芯片级联等。

比特大陆以自研AI芯片为核心，打造了覆盖云和边缘的高性能AI加速产品矩阵，涵盖了智能计算盒、AI加速卡、智能服务器及AI超算中心。同时提供灵活易用的开发工具链，积极与AI算法、应用、硬件等生态伙伴合作，共同打造多场景、全链条的AI解决方案，为智慧城市建设提供有力支撑。

Imagination 边缘推理及云端推理芯片落地

Imagination是全球领先的GPU、AI加速器IP公司，全球包含ImaginationIP的芯片累计出货已超110亿，其中移动GPU IP市占率约38%，汽车GPU IP市占率则高达43%。

Imagination全新推出的第四代神经网络加速器（NNA）IP单核以不到一瓦的功耗提供12.5TOPS，多核则高达600TOPS的算力，满足物联网、消费电子、智能安防、自动驾驶等场景对边缘推理芯片的高算力要求。此外，Series4还可以凭借Imagination创新性的Tensor Tiling技术将任务在多个内核之间进行有效的划分，减少对外部存储的访问，从而将带宽需求降低多达90％。

今年，Imagination还全新发布了IMG B系列多核GPU，功耗较前代产品降低30％，面积缩减25％，算力可达6TFLOPS，支持移动、桌面、汽车、服务器等全应用场景。GPU+NNA可形成异构计算平台，兼具高算力和灵活性，是众多应用的完美解决方案。

注：根据峰会专家观点整理。

【声明】内容源于网络

新产研中心

新兴科技产业的研究、咨询、交流、推广及应用

内容 114

粉丝 0

新产研中心新兴科技产业的研究、咨询、交流、推广及应用

总阅读69

粉丝0

内容114