大数跨境

加速器给芯片设计带来新的挑战!

加速器给芯片设计带来新的挑战! 芯华舍
2017-08-15
3
导读:在数据资料不断增加、机器学习特殊演算法需要、芯片微缩相对收益降低、粒度(granularity)需求提高等诸

在数据资料不断增加、机器学习特殊演算法需要、芯片微缩相对收益降低、粒度(granularity)需求提高等诸多因素共同推动下,使得在将性能视为是重要因素的设备(如accelerator,加速器 )正在逐渐成为大多数硬件设计不可或缺的组成部分。


加速器的采用不仅提高了设备计算性能,更重要的是,改变了以往电子系统内数据传输,以及应该在那里处理这些数据的基本假设。

 

此处所谓加速器包括在软件中进行特定操作的定制化专用集成电路(ASIC)、标准GPU芯片、可以进行平行计算的异构CPU核心,以及分立与嵌入式现场可编程门阵列(FPGA)芯片等。

 

根据Semiconductor Engineering报导,性能可以最大幅度地改变总体拥有成本(Total cost of ownership),而加速器在提高性能上具有无与伦比的能力。

 

不过加速器也为设计团队带来挑战。设计人员需要更多规划、更深入了解软件和算法是如何在设备中运作,并且必须要非常具体。由于加速器往往是为应对特别计算需求而设计的,因此在不同工作环境下使用同一个加速器,将会是非常困难的,就算是可编程逻辑芯片也是如此。

 

此外,由于加速器的导入,也使得原有的芯片整体设计理念发生了变化,由专注在如何使单一芯片配置更多核心来降低功耗的方式,转向采用更为粒化的取向(granular approach)来提高性能。并且在提高性能的同时,往往也能保持功耗的平稳或试图降低功耗。

 

因此在理念上,将具有专门功能的多种异构类型处理器或核心为优先思考重点,而不是思考要如何尽可能将所有功能都配置到单一CPU上。

 

再者,由于加速器设计在知识产权(IP)的使用组合上,也会与先前的整合方式有所不同,因此也会对IP的再使用带来新的挑战。加速器可能会涉及到如芯片、chiplet层面、高频宽存储堆叠,以及不同基板等多个部分。

 

伴随这些变化,也需要对整个软件层叠架构(Software Stack)进行优化,以便让软件的运行能够具有更高的效率与执行速度

 

近年软件发展几乎已经独立于硬件开发,只需要能配合编程层面(programming interface),以及专注在不同操作的优先排序和调度就可以了。然而如此一来,虽然软件能够提供正确功能,但由于编码笨重,使得运行速度缓慢、功耗过高。此外,由于编码太过复杂,软件的安全性将进一步下降。

 

就现今而言,最为人们熟知的加速器应用领域,当属机器学习。尤其是如NVIDIA的GPU,借着数千颗可以平行执行浮点计算(floating point calculations)的核心,已被广泛用于机器学习的训练阶段。

 

至于机器学习下一阶段的推理任务,则是会由长于进行定点计算(fixed-point calculations)的FPGA芯片数字信号处理器(DSP)等加速器来处理。

 

片上网路(Network on Chip;NoC)IP供应商ArterisIP行销副总裁Kurt Shuler表示,就机器学习三个阶段,感知、决定和行动而言,决定是最具创新部分。虽然目前该阶段尚不具有最好架构,但已有许多创新性算法出现。这些算法的执行都需要借着加速器来提高性能,尤其是在控制功耗方面,以及要达到的即时反馈。

 

然而由于机器学习的复杂性,一套通用的算法不太可能应对所有的需求,再加上这些算法在CPU、GPU,以及单指令多数据(SIMD)架构上的运行表现均不佳,因此随着各种算法的出现,就必须要开发出能配合各算法的新加速器。

 

NoC技术和工具供应商NetSpeed Systems行销和业务发展副总统Anush Mohandass表示,虽然在理论上将加速器完全融入指令集中是最佳设计方式,然而过去几年,也能见到在同一封装中,加速器以独立区块来存在的实例。例如将FPGA与系统单芯片(Soc)封装在一起,以及将半定制化IP与FPGA放在一起。

 

固然为了使加速器达到最佳效益,各个部分必须要紧密相连。然而在效益前提下,仍然会有不少其他可能的设计。

 

除机器学习领域外,数据中心也是嵌入式FPGA(eFPGA)加速器使用量快速成长的另一领域。借着可编程芯片,可以处理标准CPU无法处理的数据类型。

 

而随着数据中心规模的扩大,为避免在扩增过程中因为要对原有交换机或网路层面芯片等进行更换而造成浪费,各厂商也纷纷开始采用可编程芯片解决方案。如此一来就可以对先前协议(protocol)进行更改,以继续使用原有设备。

 

虽然eFPGA可以随着协议的更新与不同软件来重新编程,但eFPGA加速器在设计时,仍须提前明确需要使用的核心规模才行。

 

Semiconductor Engineering的报导显示,由于市场与技术的根本性转向,使得芯片产业聚焦在加速器上。虽然目前此领域的市场将会如何发展,以及需要支援的数据中心协议和机器学习算法的问题上,仍然存有很大的不确定性。但可以预计的是,加速器将会是这些解决方案的关键部分。

 

除了机器学习与数据中心外,电信基站、微控制器、军用与航空,以及安全加密∕解密等市场都已表现出对加速器的兴趣。而在半导体制程方面,GPU也已开始在加速光罩曝光上应用。

 

至于消费电子方面,由于汽车电子具有较高单价,预计会是最先导入加速器的消费性商品。然而未来包括手机,甚至洗碗机都将可能配备加速器。

 

虽然通用型芯片仍然会在半导体产业占有一席之地,但相较于加速器,通用型芯片受限于成本与物理特性限制,往往无法在每代产品间呈现出显著的性能或效率提升。

 

虽然为特殊应用而定制的加速器是更有效的解决方案,但也为芯片设计带来了新的挑战。

戳下面的原文阅读,更有料

【声明】内容源于网络
0
0
芯华舍
内容 397
粉丝 0
芯华舍
总阅读60
粉丝0
内容397