大数跨境

ChatGPT横空出世,AI“翻译官”要突破英伟达CUDA生态,让AI芯片更聪明

ChatGPT横空出世,AI“翻译官”要突破英伟达CUDA生态,让AI芯片更聪明 问芯
2023-04-11
1
导读:ChatGPT全球爆红,再掀新一波AI革命。无论产业终极赢家是微软、Google、Amazon或是其他新创公
ChatGPT全球爆红,再掀新一波AI革命。无论产业终极赢家是微软、GoogleAmazon或是其他新创公司,可以预见的是眼前赢家绝对是英伟达。为什么多数的AI公司和ChatGPT都离不开英伟达的GPUAI训练?
英伟达创办人黄仁勋曾说过,Nvidia本质是一家软件公司。这句话透露了英伟达在AI领域打遍天下无敌手的秘诀是强大的AI编译器CUDA生态系统。
试想,很多AI新创公司可能会花数十亿元的资源去打造一颗7nm5nm工艺的AI芯片,做出比英伟达性能更强大、功耗更低的产品,但最后却因为找不到可以适配的商用化软件,AI应用程式上不了芯片,导致芯片根本卖不出去。
由此可知,很多AI新创公司面临的真正挑战除了硬件本身,还有软件环境。 CUDA生态系统就是英伟达花了15时间,投入超过100亿美元所筑起的摩天高墙,难以被竞争对手超越。
AI领域还有另一个不被理解的寂寞。相较于摩尔定律每18个月晶体管增加一倍,AI对硬件算力的需求却是每100天就会成长一倍。英伟达曾在2020年提出GPU将推动AI性能实现逐年翻倍的理论,称为黄氏定律(Huang’s Law)。
这样的说法是一点也不夸张。 ChatGPT才推出100天时,Amazon就宣布开发出的新AI模型准确度已经大幅高过ChatGPT,且模型尺寸只有ChatGPT的十分之一。
每百日,AI世界就出现新的样貌,但开发一颗芯片从初期设计到生产最少也要18个月,等同在AI世界过了五个世代,这就是AI世界疯狂的地方。
早期计算机的发展从单核到多核,进入海量运算时代后,连多核都无法解决AI的难题,因此需要更多的GPU和加速器。硬件端一眼望穿的瓶颈,导致了整个AI世界由生态和应用在驱动,当ChatGPT横空出世,一下子就把硬件运算资源给吃光。因此,我们需要更厉害的硬件来突破AI的瓶颈。
其实AI芯片很多瓶颈都不在硬件本身上,AI芯片耗费很多性能在编译与传输,并非真的在做计算,这也导致产品落地时间拉长。这让AI编译器的角色变得很关键,从英伟达的CUDA即可看出AI编译器软件所筑起的高墙之重要性。
《问芯Voice》专访AI编译器Skymizer董事长赖俊豪、CEO唐文力,谈谈AI编译器产业,以及ChatGPT出现后,对AI编译器带来哪些需求。 AI编译器如何扮演称职的翻译官角色,帮助AI芯片公司加速产品落地。再者,赖俊豪过去曾担任台积电旗下IC设计服务公司创意的CEO,他眼中的AI芯片如何加速前进促进产业发展。
简述何谓编译器?工程师写程式语言,CPU写机器语言,这中间需要翻译官来把程式语言翻译成为机器语言,AI编译器就是这个翻译官。
AI编译器这类软件技术的门槛在人,因为懂compiler(编译)这门科学的人才极微稀缺,这类程式语言算是很基础,但十分古老的学问,已经很少人会去专门学习这一门技术。
过去学compiler的人主要是处理CPU指令集,以及CPU如何与周边元件协同。随着CPUx86ArmMIPS三大阵营确立,哪一种程式的编译器需要对应哪一类CPU也都固定,自然对编译器人才的需求减少,compiler渐渐变成很冷门的专业。
随着AI时代开始,AI模型一直在演变,每一家IC设计公司推出的硬件都不同,对编译器的需求自然大幅提升。 AI模型是各种不同指令组合的程式,再翻译成ASIC读懂0101架构,中间就需要AI编译器协助,来翻译不同的AI模组到不同的ASIC硬件上。
对比PCAI运作,以前PC作业系统可以看成是现在的AI编译器,CPU变成NPUProgram角色被AI模型取代,AI世界里这三者之间的互动成为全新的科学知识。
英伟达GPU在跑AI的时候,就像跑传统PCGPU也是0101架构,而CUDA最厉害的地方是第一个把这类AI模型顺畅且完美的翻译,英伟达更将相关软件都私有化。
可以参考以前比特币挖矿机刚出来的时候,初期也是用CPU,再来用英伟达的GPU,最后演变成用客制化的ASIC来挖矿。未来AI硬件也会循同样逻辑,会有很多泛用GPU需求,但也会有很多专用需求像是根据数据中心、行动装置、边缘计算等不同需求都会转用ASIC
GPU生态相较,AI可以发展的更健康,因为GPU必须完全相容于CUDA生态,但AI不用,在机器学习框架领域非常竞争,且生态系统分散,有比CUDA更高层级的GoogleTensorFlowMetaPyTorch,前几年TensorFlow处于领先地位,现在PyTorch的声势非常强。另外也还有Meta 、微软结盟推出的ONNXOpen Neural Network Exchange),有助于不同框架工具彼此整合编译执行,Skymizer在此耕耘多年,并基于此建立了ONNC编译器(Open Nerual Network Compiler),将所有的 AI 晶片与 ONNX 连结起来。
会有这样的发展是由于虽然英伟达在硬件领域有强势地位,但Google并不乐见英伟达CUDA把持一切,因此也做了自己的训练和框架工具,甚至是做了自己的硬件TPU,长出属于Google自己的生态系统,让机器学习模型的预设软件堆叠不再封闭于 CUDA生态,确实获得了成功。
这让AI生态有一个好处,并非一定要跟着英伟达。 Skymizer也是一边盯着CUDAGoogle,同时也和微软、MetaAmazon几家非Google的联盟做其他软件生态 。例如Skymizer另一个主力技术MLIR的多层次编译架构,目前主要的框架语意如PyTorchTensorFlowONNX以及TVM,在ONNC都可完善支援。
AI的世界没有永远的王者,ChatGPT横空出世说明了一切。搞不好英伟达会开始紧张,因为看到有些人会用非CUDA的加速器,导致CUDA一部分的市场因为ChatGPT的崛起而跑到别的工具上,而这也是Skymizer的机会。
随着ChatGPT出现,新杀手级应用需要新的AI领域微软作业系统的角色出现,Skymizer就是市场上极为少数可以提供AI系统软件的企业,其提供的软件服务,不仅可以协助芯片客户快速落地,更可以做到自动化、软硬件优化,更好地提升芯片性能。
Skymizer给自己的定位与英伟达不同,像是当年的台积电与英特尔,前者是专攻特定领域,后者是垂直整合的商业模式,Skymizer会专注把软件做好,英伟达则是从软吃到硬。
谈到竞争对手,Skymizer表示,市面上提供类似技术服务的公司甚为稀少。稀少的原因在于大公司会内建团队,而新创公司却因人才有限而必须寻求委外合作,这给Skymizer带来机会。事实上,Skymizer是其中协助客户商务落地最为成功的公司,目前客户已涵盖从云到端的一线芯片公司,手机、监控、指纹、数据中心、电商推荐系统、物联网等,各类大小型应用,都已成功落地导入产品化。
AI芯片其实是一种软件定义的芯片,芯片中所有的硬件应该是软件定义,但这个概念和做法并不普及。整个IC产业仍是遵循古法,先订完硬件的规格后,再根据规格把芯片刻出来。但问题是,AI产业每100天就变一个样貌,传统的做法会跟不上AI发展的脚步。
因此,AI芯片产业非常需要一个非常棒的翻译官,同时懂AI,又很了解芯片,清楚地告诉硬件未来AI会出现什么样的变化,可以提早做准备,逐渐实践软件定义芯片的真正意涵,Skymizer就是这个翻译官最好的代表企业。

【声明】内容源于网络
0
0
问芯
AI、机器人和未来。
内容 628
粉丝 0
问芯 AI、机器人和未来。
总阅读45
粉丝0
内容628