大数跨境

独家对话| 国产GPU不能挂羊头卖狗肉,应坚持自主通用|天数智芯CTO吕坚平

独家对话| 国产GPU不能挂羊头卖狗肉,应坚持自主通用|天数智芯CTO吕坚平 问芯
2022-07-27
5
导读:上海天数智芯刚刚宣布完成超10亿元人民币的C+轮及C++轮融资,其中一个大亮点是Arm与厚朴投资合资的厚安创

上海天数智芯刚刚宣布完成超10亿元人民币的C+轮及C++融资,其中一个大亮点是Arm与厚朴投资合资的厚安创新基金成为C++轮领投,透露出Arm与天数智芯对于未来数字化世界有相同的愿景,未来有机会藉由Arm广大的生态客户来推进天数智芯GPU广泛的落地。
《问芯Voice》独家专访天数智芯CTO吕坚平,聊一聊近期热度十分高昂的国产GPU市场,他也从技术角度去拆解这一波GPU大浪潮下的的

谈到加入天数智芯的起源,CTO吕坚平笑言:在正式加入团队之前,就把这家公司从里到外、从头到尾都彻底看了一遍。
20204月天垓100流片前夕,他以顾问的身份帮公司的产品做全方位的深度把脉,他对这个团队印象十分深刻。
吕坚平在芯片设计领域拥有超过30年技术经历,以外商企业为主,包括英伟达、三星等,因此他特别重视方法学以及团队合作。他认为芯片设计涉略的领域非常广,不是只把一颗芯片设计出来而已,尤其GPU这类复杂的大芯片一定要有很完整且严谨的方法学以及团队合作。
我当顾问时很频繁要求技术团队交报告和数据,通常三天内一定可以拿到,且报告品质十分严谨,看得出团队的精神纪律严密。吕坚平告诉《问芯Voice》。
吕坚平随后继续担任公司顾问,参与研发,最后决定于去年9月正式加入天数智芯担任CTO
天数智芯发布采用7nm工艺的首款通用GPU—天垓100去年9月正式量产后,打入的客户群100%都是原本英伟达的客户,同时更积极推动百大应用,涵盖算力中心、运营商、生物医疗、安防、金融、教育、存储等非常多元的领域与面向,客户使用天数智芯的产品基本都是无痛迁移,可以在最短的时间内达到适配。
眼前国产GPU创业潮红红火火,齐聚了大批从外商出走的明星研发人员、寻找中国英伟达的好故事,加上资本大力点火,吸引来自四面八方的镁光灯聚集。对于国产GPU热潮,你看得是热闹?还是看得出真正的门道?
很多号称是国产GPU的产品走向挂羊头卖狗肉,基本上可以分成两类,吕坚平告诉《问芯Voice》。第一类是以内建AI加速器达成少数性能指标,宣称胜出英伟达;第二类是拿第三方GPU IP授权,宣称自主可控。
AI加速器来充当国产GPU的做法,就像是家里的活都是加速器在做,算力的主力是来自AI加速器,但对外却说这是一颗GPU处理器,这是投机取巧的做法。最后反映在测试性能上,确实数字会很漂亮,甚至可和主流产品一较高下,但真正落实到用户端时,会出现通用性不足、适配场景十分受限等各种问题。吕坚平解释。
这就是为什么我一直强调天数智芯必须深耕百大应用的策略,唯有适配场景够广,各种应用场景都能进入,才能反映出一颗通用GPU的真正优势。一颗国产GPU,不能只是在测试数字上击败主流产品,表面上有很漂亮的性能数字,但通用性不足,实际上很多应用场景都无法适配。” 吕坚平进一步对《问芯Voice》强调。
他解释,AI独特之处就是靠数据解决问题,因此各种AI算法才会层出不穷,但如果依赖AI算法来找出加速的方式,万一场景是超越算法的设想,就会出现不适配的问题。
再者是GPU IP授权问题。吕坚平强调,天数智芯的GPU是全自研架构,与许多自称是国产GPU但却是授权自第三方IP公司不相同。
很多人会问:那很多国产CPU,甚至是苹果的行动处理器CPU不也是授权自Arm?他解释,GPUCPU的状况不一样。 Arm CPU的授权方式有IP和架构两套,拿Arm CPU的架构授权只是取得实现Arm指令集许可,代码仍需自行开发,实现IP自主开发。GPU的状况不同,很多所谓架构授权其实本质上是IP授权,不能跟Arm CPU架构授权相比。拿任何形式的IP授权都不代表拥有该IP,也谈不上自主可控。
吕坚平进一步解释,IP架构自主很重要,因为硬科技产品需要迭代,如果不是自己的IP怎么做到技术迭代?
谈到GPU如何捞过界,在众多图形之外的应用领域,大放异彩。吕坚平解释,GPU原本的角色就是做渲染,因为图形游戏开发商希望能在特效及创意等方面超越对手,因此要求GPU架构师在原本是固定的图形管线,开放部分管线节点供他们利用通用计算池来编程。
渐渐地,图形开发者越来越愿意运用可编程的通用计算池做图形渲染,形成渲染与通用计算彼此互相影响,最后甚至演变成通用计算已经超越原本支援图型渲染的角色。
关于新创企业是从渲染切入GPU,还是进入通用计算比较适合?大家有不同的看法。吕坚平认为,通用计算和图形有很多重叠性,但随着AI的日新月异,新创公司以通用为起点比较适合。
做通用GPGPU还要有一个必要门槛,就是要能进入数据中心,所以算力一定要够强,而且能够以集群方式管理并扩张算力。如果推出的GPU进不了数据中心,那只能退而求其次去做单机单卡。
另外,GPUAI训练和推理都要能做,因为训练是用来开发新算法,而推理是将算法广泛实现。两者不可或缺。天数智芯的首颗AI推理芯片智铠100 会在近期问世。
这一波国产GPU热潮有一的很大特色,就是融资金额高,那是因为GPU是一个非常烧钱的产业,关键时间就在头3年,每一家新创公司都要集中火力推出产品,并成功达成迭代任务。
天数智芯这一轮融资的目的,除了量产AI推理芯片智铠100,还有开发第二、三代的AI训练芯片天垓200300。天垓200是沿着100的坚实基础去发展,300除了计算能力上更卓越,还会增加图形渲染的能力,并融合AI在光线追踪及超分等方向强化图形。
更重要的是,未来元宇宙/数字孪生的社会中,图形渲染要做到极致,使虚拟世界逼真模拟及影响现实,AI也要能经由现实世界构建虚拟世界。因此,GPU需要不断创新,应对AI计算和图型渲染云端融合的新要求。天数智芯未来的产品也会朝AI与图形融合,支援元宇宙/数字孪生,进一步促进数字化社会。
关于国内半导体产业的人才问题,吕坚平认为,硬科技投资碎片化是缺才一个很大的原因,加上很多大型系统公司加入自研芯片,自然造成人才缺口扩大。公司求才要找与公司文化相契合,彼此有共同成长目标的人,不是去求神,也不喜欢追求短期暴利的员工,而且公司产品发展要不断迭代,会很珍惜资深员工,希望员工能在未来十年里很踏实地与公司一起成长。

【声明】内容源于网络
0
0
问芯
AI、机器人和未来。
内容 628
粉丝 0
问芯 AI、机器人和未来。
总阅读45
粉丝0
内容628