大数跨境
0
0

GPU超能力分析!为何它的算力如此之牛

GPU超能力分析!为何它的算力如此之牛 极云Cloud
2024-05-16
2
导读:它只擅长做相对简单的计算,尤其是大规模的并行计算。

点击蓝字

关注我们

显卡的原理看似复杂,

其实一点也不简单。



显卡里面最重要的就是这块GPU



GPU跟CPU类似,

都是通过成百上千个针脚连接到PCB电路板的。

但是就是这么一块小芯片,

里面却集成了超过100亿个晶体管。

如果将芯片放大到纳米级别,

可以看到里面是一座座的高科技迷宫。



与CPU只有少数几个核心不同的是,

GPU的核心能达到几千甚至上万个。



虽然GPU核心众多,

但是它只擅长做相对简单的计算,

尤其是大规模的并行计算


那么,

什么是并行计算呢?

这是一张图片,

图片由很多像素组成。

GPU在渲染图片时,

像素并不是一个接一个按顺序计算的。

因为顺序计算会导致

其它的核心不工作

都跑一边喝茶聊天去了,

计算效率大大降低。

所以GPU策略是谁抢到资源谁计算,

计算之间相互独立,

最终只要将图片组合在一起

显示出来就可以了。


GPU是如何展现

超强的计算实例的?

假如这里有100个任务需要GPU进行处理,

每个任务被称为一个线程。

最理想的方法是这100个任务

分配给100个核心一次处理。


问题是GPU处理的任务太庞大了。

如果需要处理100万个线程,

就要使用100万个核心,

这是不现实的。

那么我们就以线程为中心进行处理。

这里有100万个线程任务,

对应一个拥有1000个核心的GPU。



处理时,

我们需要将100万个线程

分别发送到核心的某个地方,

分配过程异常复杂。


为了方便,

现在我们将1000核心分成10个处理单元,

每个单元里面100个核心,

然后再进行任务分配。

这样虽然简单了一些,

但是依旧还是很复杂。


可以这样,

我们将100万个线程任务也进行分组,

每1000个任务一组,

一共1000组,


再进行分配的话就简单多了。

但是有个问题,

这里的每组任务里面有1000个,

而每个处理单元里面只有100个核心,

还是不能一次处理掉每组任务,

那怎么办呢?

很简单,将1000组任务再进行分组,

每100个任务打包在一起分成十个包,


一个包对应一个处理单元里面的100个核心,

从而一对一进行处理。


GPU就是以“包”为单位来处理任务的。

目前市面上比较先进的显卡,

核心数量超过1万个

这些核心每128个分为一组,

核心组的任务也是每128个任务打包在一起,

所以一个包可以分配给一组核心来执行。


那么问题来了,

当核心执行任务时需要从内存中读取数据,

这会产生一定的延迟。

那GPU是如何解决延迟问题呢?


CPU解决延迟问题是

通过增加高速缓存来解决的:

当核心组在执行一个任务包时,

如果出延延迟,它并不会等待,

而是立即执行下一个任务包。

如果继续出现延迟,

它又会立即跳到下一个。



也就是说GPU的核心会不停的进行运算。

只要有活干,任劳任怨。



GPU一开始主要是为了

加速图形渲染而设计的,

但是它大规模处理问题的能力

刚好与如今高速发展的人工智能不谋而合。


人工智能一个重要技术就是深度学习,

学习过程需要输入大量的数据,

然后对其进行并行运算得出预期结果值,

而这正是GPU所擅长的,

所以GPU常用来训练AI模型。



互联网基础服务

当然选极云!


扫码即可为您提供

定制化解决方案!


关于我们


极云科技是国内知名的云计算及IDC基础服务提供商,四川省高新技术企业,拥有工信部颁发的跨地区增值电信业务(ISP)许可证、华为云经销商资质并取得多项软著证书。


业务涵盖公有云、IDC租用托管、成都服务器托管、成都机柜租用、等保安全、私有云建设等企业级互联网基础服务。

【声明】内容源于网络
0
0
极云Cloud
极云科技是以新一代智能算力为核心竞争力的AIDC服务商,聚焦智算中心托管与智算云两大核心业务,致力于构建覆盖AI算力基础设施、分布式云平台、行业解决方案的全栈服务体系。咨询电话:400-028-0032
内容 678
粉丝 0
极云Cloud 极云科技是以新一代智能算力为核心竞争力的AIDC服务商,聚焦智算中心托管与智算云两大核心业务,致力于构建覆盖AI算力基础设施、分布式云平台、行业解决方案的全栈服务体系。咨询电话:400-028-0032
总阅读944
粉丝0
内容678