搜索
首页
大数快讯
大数活动
服务超市
文章专题
出海平台
流量密码
出海蓝图
产业赛道
物流仓储
跨境支付
选品策略
实操手册
报告
跨企查
产业带
导航
知识体系
工具箱
产业园
更多
百科
找货源
跨境招聘
DeepSeek
首页
>
ChatGPT横空出世,AI“翻译官”要突破英伟达CUDA生态,让AI芯片更聪明
>
ChatGPT横空出世,AI“翻译官”要突破英伟达CUDA生态,让AI芯片更聪明
问芯
2023-04-11
1
导读:ChatGPT全球爆红,再掀新一波AI革命。无论产业终极赢家是微软、Google、Amazon或是其他新创公
ChatGPT
全球爆红,再掀新一波
AI
革命。无论产业终极赢家是微软、
Google
、
Amazon
或是其他新创公司,可以预见的是眼前赢家绝对是英伟达。为什么多数的
AI
公司和
ChatGPT
都离不开英伟达的
GPU
做
AI
训练?
英伟达创办人黄仁勋曾说过,
Nvidia
本质是一家软件公司。这句话透露了英伟达在
AI
领域打遍天下无
敌手的秘诀是强大的
AI
编译器
CUDA
生态系统。
试想,很多
AI
新创公司可能会花数十亿元的资源去打造一颗
7nm
或
5nm
工艺的
AI
芯片,做出比
英伟达
性能更强大、功耗更低的产品,但最后却因为找不到可以适配的商用化软件,
AI
应用程式上不了芯片,导致芯片根本卖不出去。
由此可知,很多
AI
新创公司面临的真正挑战除了硬件本身,还有软件环境。
CUDA
生态系统就是英伟达花了
15
年
时间
,投入超过
100
亿美元所筑起的摩天高墙,难以被竞争对手超越。
AI
领域还有另一个不被理解的寂寞。相较于摩尔定律每
18
个月晶体管增加一倍,
AI
对硬件算力的需求却是每
100
天就会成长一倍。英伟达曾在
2020
年提出
GPU
将推动
AI
性能实现逐年翻倍的理论,称为黄氏定律(
Huang’s Law
)。
这样的说法是一点也不夸张。
ChatGPT
才推出
100
天时,
Amazon
就宣布开发出的新
AI
模型准确度已经大幅高过
ChatGPT
,且模型尺寸只有
ChatGPT
的十分之一。
每百日,
AI
世界就出现新的样貌,但开发一颗芯片从初期设计到生产最少也要
18
个月,等同在
AI
世界过了五个世代,这就是
AI
世界疯狂的地方。
早期计算机的发展从单核到多核,进入海量运算时代后,连多核都无法解决
AI
的难题,因此需要更多的
GPU
和加速器。硬件端一眼望穿的瓶颈,导致了整个
AI
世界由生态和应用在驱动,当
ChatGPT
横空出世,一下子就把硬件运算资源给吃光。因此,我们需要更厉害的硬件来突破
AI
的瓶颈。
其实
AI
芯片很多瓶颈都不在硬件本身上,
AI
芯片耗费很多性能在编译与传输,并非真的在做计算,这也导致产品落地时间拉长。这让
AI
编译器的角色变得很关键,从英伟达的
CUDA
即可看出
AI
编译器软件所筑起的高墙之重要性。
《问芯
Voice
》专访
AI
编译器
Skymizer
董事长赖俊豪、CEO唐文力,谈谈
AI
编译器产业,以及
ChatGPT
出现后,对
AI
编译器带来哪些需求。
AI
编译器如何扮演称职的
“
翻译官
”
角色,帮助
AI
芯片公司加速产品落地。再者,赖俊豪过去曾担任台积电旗下
IC
设计
服务
公司创意的
CEO
,他眼中的
AI
芯片如何加速前进促进产业发展。
简述何谓编译器?工程师写程式语言,
CPU
写机器语言,这中间需要翻译官来把程式语言翻译成为机器语言,
AI
编译器就是这个翻译官。
AI
编译器这类软件技术的门槛在人,因为懂
compiler(
编译
)
这门科学的人才极微稀缺,这类程式语言算是很基础,但十分古老的学问,已经很少人会去专门学习这一门技术。
过去学
compiler
的人主要是处理
CPU
指令集,以及
CPU
如何与周边元件协同。随着
CPU
由
x86
、
Arm
、
MIPS
三大阵营确立,哪一种程式的编译器需要对应哪一类
CPU
也都固定,自然对编译器人才的需求减少,
compiler
渐渐变成很冷门的专业。
随着
AI
时代开始,
AI
模型一直在演变,每一家
IC
设计公司推出的硬件都不同,对编译器的需求自然大幅提升。
AI
模型是各种不同指令组合的程式,再翻译成
ASIC
读懂
0101
架构,中间就需要
AI
编译器协助,来翻译不同的
AI
模组到不同的
ASIC
硬件上。
对比
PC
和
AI
运作,以前
PC
作业系统可以看成是现在的
AI
编译器,
CPU
变成
NPU
,
Program
角色被
AI
模型取代,
AI
世界里这三者之间的互动成为全新的科学知识。
英伟达
GPU
在跑
AI
的时候,就像跑传统
PC
,
GPU
也是
0101
架构,而
CUDA
最厉害的地方是第一个把这类
AI
模型顺畅且完美的翻译,英伟达更将相关软件都私有化。
可以参考以前比特币挖矿机刚出来的时候,初期也是用
CPU
,再来用英伟达的
GPU
,最后演变成用客制化的
ASIC
来挖矿。未来
AI
硬件也会循同样逻辑,会有很多泛用
GPU
需求,但也会有很多专用需求像是根据数据中心、行动装置、边缘计算等不同需求都会转用
ASIC
。
与
GPU
生态相较,
AI
可以发展的更健康,因为
GPU
必须完全相容于
CUDA
生态,但
AI
不用,在机器学习框架领域非常竞争,且生态系统分散,有比
CUDA
更高层级的
Google
的
TensorFlow
和
Meta
的
PyTorch
,前几年
TensorFlow
处于领先地位,现在
PyTorch
的声势非常强。另外也还有
Meta
、微软结盟推出的
ONNX
(
Open Neural Network Exchange
),有助于不同框架
工具
彼此整合编译执行,
Skymizer
在此耕耘多年,并基于此建立了
ONNC
编译器
(Open Nerual Network Compiler)
,将所有的
AI
晶片与
ONNX
连结起来。
会有这样的发展是由于虽然英伟达在硬件领域有强势地位,但
Google
并不乐见英伟达
CUDA
把持一切,因此也做了自己的训练和框架工具,甚至是做了自己的硬件
TPU
,长出属于
Google
自己的生态系统,让机器学习模型的预设软件堆叠不再封闭于
CUDA
生态,确实获得了成功。
这让
AI
生态有一个好处,并非一定要跟着英伟达。
Skymizer
也是一边盯着
CUDA
和
Google
,同时也和微软、
Meta
、
Amazon
几家非
Google
的联盟做其他软件生态
。例如
Skymizer
另一个主力技术
MLIR
的多层次编译架构,目前主要的框架语意如
PyTorch
、
TensorFlow
、
ONNX
以及
TVM
,在
ONNC
都可完善支援。
在
AI
的世界没有永
远的王者,
ChatGPT
横空出世说明了一切。
搞不好英伟达会开始紧张,因为看到有些人会用非
CUDA
的加速器,导致
CUDA
一部分的市场因为
ChatGPT
的崛起而跑到别的工具上,而这也是
Skymizer
的机会。
随着
ChatGPT
出现,新
杀手级应用需要新的
AI
领域微软作业系统的角色出现,
Skymizer
就是市场上极为少数可以提供
AI
系统软件的企业,其提供的软件服务,不仅可以协助芯片客户快速落地,更可以做到自动化、软硬件优化,更好地提升芯片性能。
Skymizer
给自己的定位与英伟达不同,像是当年的台积电与英特尔,前者是专攻特定领域,后者是垂直整合的商业模式,
Skymizer
会专注把软件做好,英伟达则是从软吃到硬。
谈到竞争对手,
Skymizer
表示,市面上提供类似技术服务的公司甚为稀少。稀少的原因在于大公司会内建团队,而新创公司却因人才有限而必须寻求委外合作,这给
Skymizer
带来机会。事实上,
Skymizer
是其中协助客户商务落地最为成功的公司,目前客户已涵盖从云到端的一线芯片公司,手机、监控、指纹、数据中心、电商推荐系统、物联网等,各类大小型应用,都已成功落地导入产品化。
AI
芯片其实是一种软件定义的芯片,芯片中所有的硬件应该是软件定义,但这个概念和做法并不普及。整个
IC
产业仍是遵循古法,先订完硬件的规格后,再根据规格把芯片刻出来。但问题是,
AI
产业每
100
天就变一个样貌,传统的做法会跟不上
AI
发展的脚步。
因此,
AI
芯片产业非常需要一个非常棒的
“
翻译官
”
,同时懂
AI
,又很了解芯片,清楚地告诉硬件未来
AI
会出现什么样的变化,可以提早做准备,逐渐实践软件定义芯片的真正意涵,
Skymizer
就是这个
“
翻译官
”
最好的代表企业。
【声明】内容源于网络
0
0
问芯
AI、机器人和未来。
内容
628
粉丝
0
关注
在线咨询
问芯
AI、机器人和未来。
总阅读
45
粉丝
0
内容
628