
在2023年耀途资本AGM投资人年会上,耀途资本执行董事于光主持了题为“中国算力基础设施投资机遇与挑战”圆桌对话,壁仞科技联席CEO李新荣,瀚博半导体创始人兼CTO张磊,云豹智能董事长兼CEO萧启阳,电科星拓CEO李丹,赛勒科技董事长甘甫烷五位嘉宾展开讨论。
五位半导体行业老兵分享了投身产业界的心路历程,以及面对巨无霸一样存在的友商,如何做出产品的差异化,又是怎么克服技术、团队、资金、客户等各方面的挑战,并透露了最新的落地进展和未来展望。
以下是论坛实录,经过了不改变原意的编辑:
于光:李总在加入壁仞科技之前是AMD中国区GM,张磊总是AMD加拿大fellow,想先请两位分享下半导体职业生涯和感悟,为什么选择从大公司出来创业或者加入创业公司,以及不论是之前所在的AMD,还是现在所做的方向,都绕不开英伟达,你们如何看待英伟达这样的庞然大物?
壁仞科技联席CEO李新荣
2021 年我离开AMD,离开主要是觉得过去自己一直站在巨人的肩膀上,取得了不错的成绩,一切都很舒适,那么现在想要离开巨人的肩膀,脚踏实地地再看自己的能力。
我偏向于工程师的视角来看事情,希望把事情简单化,只看三样:市场、客户、产品。公司明确定位了一个市场,然后依靠产品去获取客户,一切交给产品来说话,那么NVIDIA对我们来讲就是一个参考标准,它给市场定位了高标准,那当我们在定位市场、定位产品时,也会时刻以高标准为基准。
瀚博半导体创始人兼CTO张磊
于光:谢谢李总和Louis(张磊)分享。请另外三位介绍一下个人从业多年感受和公司情况,其中萧总和甘博与MIT都有些渊源,萧总是斯坦福AI的硕士和博士,在创立RMI 之前在MIT任教;甘博是MIT硅光子的博士毕业,回国后在微系统所做研究工作,也请你们分享下从学术界切换到工业界的心路历程。
云豹智能董事长兼CEO萧启阳
我在MIT做教授期间其实有三块重要工作,教书、研究还有融资,和我当前创业融资也是一样的,只是宣讲对象不同,我们当时向政府机构、产业巨头募资。当我离开MIT时,累计融资额超过2000万美元,这在20多年前并不是一个小数目。
云豹智能不是我第一次创业,之前创办过一家芯片公司RMI,最后被博通37亿美元收购了。在我看来,从学术界转向工业界最大的区别是商业化落地,需要经过客户验证和量产,这些是我们在学校做研究时不用关注的。而选择2020年创立DPU公司云豹智能也是看到了国内云计算机会。
电科星拓CEO李丹
同时因为自身将近 20 年的工作经历,拥有丰富、完整的硬件方向人才、产业链和客户资源,我们也聚集了一支有战斗力的团队。
电科星拓成立于2019年底,经过近三年的发展,我们的团队已经颇具规模,并在北京、上海、深圳等地设立了研发中心。目前,公司已经成功推出了多款芯片,并赢得了国内多家数据中心等行业客户的订单。
赛勒科技董事长甘甫烷
大模型现在很火,带起来了新一波AI,对于强互联的需求也更高。打个比方,GPU相当一个聪明的大脑,但如果缺少了灵敏的眼耳嘴等来与外界互联互通,那效果也是要打折的。英伟达对光模块的需求也在不断升级,原来一个数据中心,可能一个光模块对应 8 个CPU,但现在一个 GPU 对应 9 个 800G 光模块。AI 深度学习算法要求每个 GPU 之间互连互通更高的及时性。
做学术和做产业不同,做学术时你定个大方向就继续往前走,只要追求单个指标的极致,但做产业,你需要把10个指标全都做到很好,且还要考虑成本和商业化,得到客户的认可,这是一个煎熬的过程,但同时也是一个进步的过程。
左为耀途资本执行董事于光
第二个问题我们来讨论一下AI 和大模型的新趋势。从你们观察,目前客户对算力芯片的需求有什么变化?你们又是如何快速赶上大模型需求呢?
李新荣:工程师的思维往往是开门见山的,关键落脚点还是在产品上。跟客户的对接,我认为比较重要的,首先了解你的客户需求,以及自己的产品能否满足他们的需求,这必须是一个互赢的结果。
第二针对不同的存量市场和增量市场,采取不同的打法。面对既有市场“统治者”的存量市场,我们的打法更多是TCO(总体拥有成本),你必须要(在产品上)交付更好的效率, 交付更好的PPA(Performance性能、Power功耗、Area尺寸),才能打动客户转换供应商。
我们当然是希望能够开拓更多的增量市场,特别是随着国产化加速,相当于打开了一扇新的门,我们要能够提供这扇门中的最佳产品。最佳产品的定义包括,最好的性能、最好的适配性、可用易用性等。
张磊:我们现在商业市场上基本还是与英伟达的产品竞争,客户会综合考虑性能、可用性、迁移成本、整体的TCO。虽然目前有“国产替代”的说法,但并不是说我们客户会做出非理性的商业决策。我们现在获得的不少大客户订单,是因为我们找到了客户痛点,产品又在某些方面有较大的优势并产生了价值,他们才会买单。
萧启阳:业界共识是以后云计算最终有三大芯片,CPU、 GPU/GPGPU、DPU,云豹智能做的就是DPU。
从商业角度来说, DPU是云计算网络、数据存储跟虚拟化中最关键的环节,帮助云服务实现利润最大化,把算力的资源效率提升到最高。
DPU的概念最早由全球最大的云服务商亚马逊云在8年前提出,在还没有完整概念时,他们就收购了一家以色列公司Annapurna Labs,用了3.5亿美元自研芯片,推出 Nitro 系统,也成为了AWS 云服务的技术基石。
目前我们没有看到有做到我们这样高度和全面的同类国内厂商,大厂也很难有这样的决心和规划做DPU,基本都用FPGA。有些人可能误解DPU 是一个非常碎片化的市场,我们DPU 角色可以归类到CPU、GPU算力类,而由于通用性、可编程性、多租户等特性,DPU 承担着资源调度、虚拟化、网络、安全等工作,能够极大提升算力利用效率,所以大模型也让 DPU 的价值更加凸显。
英伟达创始人说,我们在一个新的加速算力的新时代。这种“加速算力”是分布式算力,其实我们也在一个新的加速网络的时代。
目前我们的客户主流都是用英伟达GPU,所以大家能做的更多是优化网络,网络优化了才能提升 GPU 算力资源的效率。我们的DPU芯片能提供更高的灵活性、通用性,可以支持各家不同的算法、不同的协议,来优化网络,提升GPU效率。
李丹:数据中心AI算力的不断提升,带来了数据中心架构的转变。以前是以CPU为中心的架构,未来是计算的算力资源池化和存储资源池化为主的池化架构。基于池化架构下,低延时、高带宽的互联传输技术和芯片变得至关重要。
我们电科星拓就是以适配未来新一代数据中心架构来进行产品规划。数据中心架构互联包含电互联、光互联等,电互联主要用于数据中心机柜内,包括服务器间、GPU 间、CPU 和GPU之间 、CPU 和硬盘间,我们有支持PCIe高速传输的芯片。数据中心机柜间需要光模块来互联,我们也有相关的芯片布局。
甘甫烷:新形势下,光互联也有新需求,至少有三个痛点,算上价格是四个。
第一是延时。GPU 之间互联的最大问题是延迟,一个光模块中单一 DSP 的延迟大约 100 纳秒,而AI高性能计算对此很敏感。所以现在有个新解决方案,LPO(Linear-drive Pluggable Optics),也就是去掉光模块中的DSP,优点可以减少100纳秒延时;节省一半的功耗和成本。LPO在今年 3 月出现后就特别火爆,很多客户问我们要样,但是目前行业标准还没有设立好。
第二是带宽,现在有个新趋势是CPO(Co-packaged Optics),相当于把 GPU 和硅光子芯片封装在一个机板上,大规模增加现有带宽密度。云计算巨头、网络设备和芯片龙头都在布局CPO。
今年8月英特尔推出了一个用硅光子互联几百个核的芯片demo,这是他们想做了20年的事,从原来机柜间的互联,深入到芯片间的互联及芯片内部核与核的互联,目前已经初具雏形。这是一个非常重要,且需要GPU、DPU、交换机、互联芯片公司联合一起才能做成的事。国外巨头博通、英特尔、英伟达都在内部推动,我们这次圆桌讨论的五家公司正好在一条链上,非常有必要一起把中国产业链做起来。
第三是产能。AI起来太快,产业链还没有做好准备,目前激光器等各种器件都全面缺货,像英伟达基本上包了从现在开始三年的VCSEL激光器产能,而未来三年硅光子可能进入一个大规模增长的时间节点。

于光:在座其实都是产业链上非常强相关的5家公司,希望未来能有深入合作机会。最后一个问题想请教各位,产品落地到数据中心服务器场景的要求非常高,各公司今年都有比较大的落地突破。能不能分享一下目前你们主要产品在客户端的进展情况?
李丹:最近两年,我们的客户还处于消化库存阶段,我们预计到年底库存水位会到一个比较低的水平;预计明年初,客户的需求将逐步恢复。我们的产品已获得多家大型设备制造商的认可,包括国内数据中心厂商和ODM厂商等,因此,我们预计明年在数据中心领域的客户收入将迅速增长。
张磊:我们产品在一些头部互联网和运营商都商业落地,并承载重要业务,目前在爬量过程中,在某些场景有较大的优势,我们期待与客户继续把量做上去。
李新荣:人工智能的应用场景是很宽泛的,但是我认为一个刚起步的国内厂商,专注比泛化更重要,所以我们一开始的策略就是抓住几个战略合作伙伴,专注服务于最适配的市场,包括运营商、金融、人工智能等产业。同时我们也在配合几个策略联盟的厂商,尤其是系统集成策略联盟厂商推广应用。目前我们已经有多个项目落地交付,预计今年底能交出一份不错的成绩单。
萧启阳:云豹智能应该是在座成立时间最短的,天使轮融资是在 2021 年三四月份才签约,刚才忘记感谢耀途的杨总和白总,在疫情最严峻的2021年参与了两轮融资,而我们都没有线下见过面,都是线上视频,那一年我们总共融了 2 亿多美元。我觉得很幸运,有这么多投资者信任我和团队。
DPU是一个非常大非常难做的芯片,做这个芯片到量产阶段至少需要3亿美金,据客户反馈,目前我们应该是国内唯一一家,我们融资金额和团队应该是国内的翘楚。我们核心团队有20多年研发和产品经验,来自Intel、Broadcom、Arm、海思、阿里巴巴等公司。腾讯是我们一个大股东,也很认可我们,腾讯之前将我们芯片给业界测试过,有四倍性能提升,现在应该有 8 倍。
目前芯片就已经流片,未来半年到一年将会陆续公开合作信息,我可以说整个国内业界应该都非常期待我们400G 的 DPU 芯片。
甘甫烷:目前我们肯定已经踏上新的AI风口,但是能够飞得多高还是要看核心竞争力。
目前我们进展较快的400G 和 800G 这两款芯片,已经通过光系统和光模块公司进入美国主流数据中心客户,美国主要是采用800G芯片产品,400G产品为辅,中国市场预计稍微滞后一两年,更多会用400G产品。
我们产品的系统测试已经完全通过,正式转产产品。我们的产品技术和性能达标,后续的关键就是量产。
所以相较于竞争对手,我们在芯片技术、产业链合作方面都已经走在前列了,开发了光学芯片、单片集成、片上激光线、封装配合等各方面,别人可能还只做到光器件,还未涉及跟电、封装、 GPU 的配合。同时很多产业链核心伙伴跟我们合作很紧密,特别是供应链、代工厂。

于光:非常感谢 5 位嘉宾的分享,最后请 5 位用一句话来展望一下未来。
甘甫烷:风口来了,我们有机会能走得很远,希望我们能一起把中国产业做起来。
李丹:中国算力基础设施领域存在着机遇与挑战并存的情况,电科星拓将锚定目标,笃行实干,为智能世界注入互联“芯”动力。
萧启阳:我们产品面向数据中心跟云计算,非常注重生态,希望我们中国产业链多多合作做大产业,我相信必定可以。
张磊:我们是希望更多的互联网和运营商客户使用我们的产品,然后我们作为一个终端用户自己也可以每天体验到瀚博的产品。
李新荣:一句话,这是个长赛道,我觉得不要心存侥幸,坚持战略,并完美执行,最终让自己的产品说话。

