大数跨境
0
0

中国AI芯片的创新之路:GTIC 2020 AI芯片创新峰会

中国AI芯片的创新之路:GTIC 2020 AI芯片创新峰会 新产研中心
2020-12-14
0
导读:12月1日,GTIC 2020 AI芯片创新峰会在北京成功举办,探讨了2020年AI芯片产业经历的机遇与挑战,为新基建风口下AI芯片加速落地、未来AI芯片的创新之路等问题提出了具有启发性的解决方案和破

12月1日,GTIC 2020 AI芯片创新峰会在北京成功举办。本次峰会聚集了AI芯片以及各个细分赛道的产、学、研精英人士,分别从产业潜力、前沿技术、场景化应用等角度,探讨了2020年AI芯片产业经历的机遇与挑战,为新基建风口下AI芯片加速落地、未来AI芯片的创新之路等问题提出了具有启发性的解决方案和破题思路。




尹首一教授:AI芯片分类及中国AI芯片发展概况



国内AI芯片学术领军人物、清华大学微纳电子系副主任、微电子所副所长尹首一教授首登GTIC舞台,通过主旨演讲深入浅出地探讨中国AI芯片的创新之路,为AI芯片产业的发展趋势与创新机会进行了更为系统的梳理与预判。

按技术路线划分,目前的AI芯片主要包括深度神经网络(DNN)处理器神经形态处理器两类。

DNN处理器:可细分为指令集处理器、数据流处理器、存内计算处理器,以及可重构AI处理器。

神经形态处理器:重要研究方向有CMOS SNN(脉冲神经网络)处理器和神经形态器件,前者主要是对人脑活动的一种数学抽象,后者则是真正设计一种物理器件,并在物理上模拟人类的神经元行为。

在尹首一教授看来,无论是哪种技术路线,最终目标都是实现对深度神经网络的计算加速。

回顾AI芯片的阶段性发展,尹首一教授总结道:(1)目前AI芯片仍处于起步阶段,在科研和产业应用方面具有广阔的创新空间。(2)AI芯片从算法和应用角度给行业提出了许多创新需求,促使人们探索更多的颠覆性技术,有望彻底突破传统架构的性能和能效瓶颈,实现集成电路的跨越式发展。(3)中国AI芯片产业创新正与国际同步,有着最全面的技术路线、最丰富的应用领域,伴随着人工智能产业的快速发展,我国AI芯片领域大有可为。





企业在AI芯片领域的新进展


黑芝麻智能  自动驾驶计算芯片的突围之径

黑芝麻智能作为国内汽车芯片初创公司中的佼佼者,是一支成立不到四年、但包揽了芯片、视觉、汽车等领域老将的创业团队。

本次峰会上,黑芝麻智能首次公布产品路线图。从技术来讲,黑芝麻智能提供完整端到端的解决方案,包括前端摄像头或者传感器的定制。另外,基于车规级的高性能计算平台,围绕领先的图像处理能力、神经网络加速器技术,黑芝麻智能提供完整的自动驾驶方案

今年6月,黑芝麻智能科技举办了华山二号系列芯片线上发布会,成功发布了国产最强性能智能驾驶感知芯片——华山二号A1000芯片和华山二号A1000L(A1000 Lite)。华山二号(A1000)芯片具备40-70TOPS的强大算力,小于8W的功耗及优越的算力利用率,工艺制程16nm,符合AEC Q-100、单芯片ASILB、系统ASIL D汽车功能安全要求,是目前能支持L3及以上级别自动驾驶的唯一国产芯片,有望赋能整个自动驾驶生态圈,助力中国智能汽车方向的技术创新与产业转型。为了应对不同的市场需求,黑芝麻同步发布了华山二号A1000L,同样符合车规级要求。

基于华山二号A1000芯片,黑芝麻提供了四种智能驾驶解决方案:1)单颗A1000L芯片适用于ADAS辅助驾驶;2)单颗A1000芯片适用于L2+自动驾驶;3)双A1000芯片互联可达140TOPS算力,支持L3等级自动驾驶;4)四颗A1000芯片则可以支持L4甚至以上的自动驾驶需求。另外,黑芝麻还可以根据不同的客户需求,提供定制化服务


地平线  车规级AI芯片的软硬件协同

地平线是当前中国唯一实现车规级AI芯片前装量产的AI芯片公司,是我国发展最快的AI独角兽之一。

目前,地平线已经推出了征程2和征程3两款车规级AI芯片。征程2芯片采用28nm制程工艺,算力为4TOPS(万亿次/秒),功耗为2W。

程3芯片采用16nm制程工艺,算力为5TOPS(万亿次/秒),功耗为2.5W,它可以支持高级别辅助驾驶、智能座舱、自动泊车辅助及众包高精地图定位等多种应用场景。通过多颗征程3芯片组成计算平台,还可以支持L3级别的自动驾驶功能。可以看到,地平线的芯片在算力上并不突出,其优势在于有非常高的计算精度,因此算力的有效利用率很高。征程3 是地平线基于自研的BPU2.0 架构,针对高级别辅助驾驶场景推出的新一代高效能车规级 AI 芯片,已通过 AEC-Q100 认证。征程3 不仅支持基于深度学习的图像检测、分类、像素级分割等功能;也支持对 H.264 和 H.265 视频格式的高效编码,是实现多通道 AI 计算和多通道数字视频录像的理想平台,例如可实现高级别辅助驾驶( ADAS ),驾驶员监控( DMS ),及自动泊车辅助( APA )等功能。

与此同时,地平线还提出了MAPS评估法,即“在精度有保障范围内的平均处理速度”,得到一个直面物理世界的全面、完整、客观、真实的评估,以此作为评估芯片AI真实性能的标准。

地平线将通过打造完整的数据闭环,提供“芯片+工具链”、“芯片+工具链+算法”等不同解决方案,赋能产业链。构建这一计算闭环需要长期做三件事:一是持续提升芯片的有效算力,二是提升算法效率,三是根据解决物理世界的实际问题联合调优得到最优解



安谋中国  依托Arm计算架构推出周易AIPU

安谋中国依托Arm世界领先的生态系统资源与技术优势,面向中国市场独立研发了周易AIPU。周易AIPU定义了一套新的适用于AI算法的指令集,通过指令来驱动里面的向量处理单元和固定的AI算法处理单元,从而完成各种复杂网络的组合的操作。

面向AIoT领域,安谋中国构建的AIoT技术生态已覆盖CPU、GPU、AIPU等各类产品,同时提供强大软件工具链。其中,安谋中国在今年发布的自主研发AI专用处理器周易Z2 AIPU,主要面向中高端安防、智能座舱和ADAS、边缘服务器等应用场景,单核算力达4TOPS,同时可扩展32个核心,单SoC算力可扩展至128TOPS。

目前周易AIPU已被多个芯片公司使用,并已开发出智能语音的相关产品,一些采用了搭载周易AIPU芯片的智能音箱产品也将很快面世。另外,安谋中国客户面向中高端安防领域也很快有产品推出,面向智能座舱的产品也将在明年初对外界发布。


比特大陆  新基建风口下的云边端AI芯片

比特大陆是区块链行业巨头之一,此前已在AI芯片行业耕耘数年。比特大陆AI业务线CEO王俊分享道,目前公司已推出面向云边端的四款AI芯片,并已为北京市海淀区、福建福州等地提供了AI超算中心以支撑智慧城市建设。

比特大陆的第三代AI芯片BM1684相比第二代,性能提升了6倍。BM1684内置张量计算模块TPU,该TPU模块包含64个NPU运算单元,每个NPU包括16个EU单元,总共有1024个EU运算单元。BM1684为视频处理做了特别优化,单芯片最高支持32路H264/H265的解码能力,每秒480帧JPEG/PNG图片编解码,960 fps@1080p视频解码能力,更内置了视频图像前后处理硬件加速模块。最终,基于台积电12nm工艺,在16w功耗下,BM1684FP32精度算力达到2.2 TFlops,INT8算力可高达17.6Tops,在Winograd卷积加速下,INT8算力可提升至35.2Tops。

除了性能和功耗表现,还有值得一提的是BM1684芯片内置Trustzone、secureboot以及多种加解密算法;芯片内置的加密算法可以可保护客户的数据、模型安全可靠,也就是说别人把你的算法从一个BM1684芯片拷贝到另外一个BM1684芯片是没有办法工作的。另外,BM1684 还支持16个PCIE3.0lane、2个千兆以太口,支持多芯片级联等。

比特大陆以自研AI芯片为核心,打造了覆盖云和边缘的高性能AI加速产品矩阵,涵盖了智能计算盒、AI加速卡、智能服务器及AI超算中心。同时提供灵活易用的开发工具链,积极与AI算法、应用、硬件等生态伙伴合作,共同打造多场景、全链条的AI解决方案,为智慧城市建设提供有力支撑。


Imagination  边缘推理及云端推理芯片落地

Imagination是全球领先的GPU、AI加速器IP公司,全球包含ImaginationIP的芯片累计出货已超110亿,其中移动GPU IP市占率约38%,汽车GPU IP市占率则高达43%。

Imagination全新推出的第四代神经网络加速器(NNA)IP单核以不到一瓦的功耗提供12.5TOPS,多核则高达600TOPS的算力,满足物联网、消费电子、智能安防、自动驾驶等场景对边缘推理芯片的高算力要求。此外,Series4还可以凭借Imagination创新性的Tensor Tiling技术将任务在多个内核之间进行有效的划分,减少对外部存储的访问,从而将带宽需求降低多达90%。

今年,Imagination还全新发布了IMG B系列多核GPU,功耗较前代产品降低30%,面积缩减25%,算力可达6TFLOPS,支持移动、桌面、汽车、服务器等全应用场景。GPU+NNA可形成异构计算平台,兼具高算力和灵活性,是众多应用的完美解决方案。



注:根据峰会专家观点整理。


           



【声明】内容源于网络
0
0
新产研中心
新兴科技产业的研究、咨询、交流、推广及应用
内容 114
粉丝 0
新产研中心 新兴科技产业的研究、咨询、交流、推广及应用
总阅读69
粉丝0
内容114