大数跨境
0
0

英伟达研发主管谈人工智能如何改进芯片设计

英伟达研发主管谈人工智能如何改进芯片设计 太湖湾信息技术产业园
2022-04-20
2
导读:英伟达已经开始使用人工智能来有效地改进和加速GPU设计。


英伟达已经开始使用人工智能来有效地改进和加速GPU设计。


编译来源:hpcwire


英伟达正在开发和内部使用的人工智能工具来改进自己的产品——这是一个巧妙的反向推销。例如,英伟达已经开始使用人工智能来有效地改进和加速GPU设计。

 

英伟达的Bill Dally在他的家庭“车间”中

 

Dally在今年的演讲中描述道,“我们是一个约300人的团队,试图展望英伟达产品的发展前景。我们有点像远光灯,试图照亮远方的事物。供应部分提供了为GPU供电的技术。它使GPU本身变得更好,从电路到进入GPU和GPU系统的VLSI设计方法、架构网络、编程系统和存储系统。”

 

“英伟达研究的需求方试图通过开发需要GPU运行良好的软件系统和技术来推动对英伟达产品的需求。我们拥有三个不同的图形研究小组,因为我们不断推动计算机图形学的最新发展。我们有五个不同的AI组,因为使用GPU运行AI目前是一件大事,而且规模越来越大。我们还有从事机器人和自动驾驶汽车的小组。我们有许多按地理顺序排列的实验室,比如我们的多伦多和特拉维夫人工智能实验室,”他说。

 

有时,英伟达会从几个团队中发起Moonshot项目——例如,其中一个团队生产了英伟达的实时光线追踪技术。

 

这与Dally上一年的谈话有重叠,但也有新的信息。该集团小组的规模肯定从2019年的175人左右往上增长。毫不奇怪,支持自动驾驶系统和机器人的技术已经加强。Dally说,大约一年前,英伟达从斯坦福大学招募了Marco Pavone来领导其新的自动驾驶汽车研究小组。他没有过多谈论CPU设计工作,但这无疑也在加强。

 


这里展示的是Dally对英伟达在设计芯片中越来越多地使用AI(经过轻微编辑)的一小部分


 映射电压降


“作为AI专家,我们很自然地希望采用该AI并用它来设计更好的芯片。我们以几种不同的方式做到这一点。第一种也是最明显的方法是我们可以采用现有的计算机辅助设计工具结合人工智能。例如,我们有一张地图,可以绘制我们GPU中的电源使用位置图,并预测电压网格下降的程度——即所谓的IR下降,即电流乘以电阻下降。在传统的CAD工具上运行它需要三个小时,”Dally指出。

 

“因为这是一个迭代过程,这对我们来说变得非常困难。相反,我们想做的是训练一个AI模型来获取相同的数据;我们在一堆设计中这样做,然后基本上可以输入功率图。得到的结果就是推理时间仅为三秒。当然,如果包括特征提取的时间,则为18分钟。我们可以很快得到结果。在这种情况下,类似的事情不是使用卷积神经网络,而是使用图神经网络,我们这样做是为了估计电路中不同节点切换的频率,这实际上驱动了前面示例的电源输入。再一次,我们能够比使用传统工具更快地获得非常准确的功率估计,而且时间很短,”Dally说。

 



 预测寄生

 

“几年前我作为电路设计师花了相当多的时间用图神经网络预测寄生效应。过去,电路设计是一个非常迭代的过程,需要在其中绘制原理图,就像左边这张带有两个晶体管的图片一样。但是,直到布局设计师采用该原理图并进行布局,提取寄生参数,然后才能运行电路仿真并发现不符合某些规格,之后才会知道它的性能。”Dally指出。

 

“你会回去修改你的原理图并再次通过布局设计师检查,这是一个非常漫长、反复且不人道的劳动密集型过程。现在我们可以做的是训练神经网络来预测寄生参数将是什么,而无需进行布局。因此,电路设计人员可以非常快速地进行迭代,而无需在循环中手动执行布局步骤。与基本事实相比,我们对这些寄生因素的预测非常准确。”

 


 布局和布线挑战


“我们还可以预测路由拥塞;这对我们的芯片布局至关重要。正常的过程是我们必须制作一个网表,运行布局和布线过程,这可能非常耗时,通常需要几天时间。只有这样我们才能得到实际的拥塞,发现我们初始位置是不够的。我们需要对其进行重构并以不同的方式放置宏以避免这些红色区域(如下图片),这是有太多电线试图穿过给定区域的地方,有点像交通堵塞。我们现在可以做的是无需运行布局和路由,我们可以获取这些网络列表并使用图神经网络基本上预测拥塞将在哪里并且相当准确。它并不完美,但它显示了存在问题的领域。”

 


 自动化标准单元迁移


“现在这些方法都在使用人工智能来批评人类所做的设计。更令人兴奋的是使用AI来实际进行设计。我给你举两个例子。第一个是我们称为NVCell的系统,它结合使用模拟退火和强化学习来基本设计我们的标准单元库。因此,每当我们获得一项新技术时,比如说我们正在从7nm技术转向5nm技术,我们就有了一个细胞库。一个单元就像一个与门和或门,一个全加器。实际上,我们有成千上万的这些单元必须在新技术中重新设计,并具有一套非常复杂的设计规则,”Dally说。

 

“我们基本上使用强化学习来放置晶体管。但更重要的是,放置后,通常会出现一堆设计规则错误,并且几乎就像电子游戏一样。事实上,这正是强化学习所擅长的。一个很好的例子是在Atari视频游戏中使用强化学习。所以这就像一个Atari视频游戏,但它是一个用于修复标准单元中的设计规则错误的视频游戏。通过使用强化学习来检查和修复这些设计规则错误,我们能够基本完成标准单元的设计。”

 

“这对我们有两个好处。一是节省了大量劳动力。一个大约10人的小组,将花费一年的大部分时间来移植一个新技术库。现在我们可以用几个GPU运行几天来做到这一点。然后人类可以处理那些没有自动完成的8%的细胞。在许多情况下,我们最终也会得到更好的设计。所以它比人工设计更节省劳动力。”




 *声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。




本文来源:半导体产业纵横

【声明】内容源于网络
0
0
太湖湾信息技术产业园
太湖湾信息技术产业园官方信息发布平台
内容 1390
粉丝 0
太湖湾信息技术产业园 太湖湾信息技术产业园官方信息发布平台
总阅读346
粉丝0
内容1.4k