前言
华为昇腾芯片是华为发布的两款人工智能处理器,包含昇腾310用于推理和910用于训练业务,均采用自家的达芬奇架构。
昇腾310,主要应用于边缘计算产品和移动端设备等低功耗的领域。昇腾910整数精度(INT8)算力可达640TOPS,在业界其算力处于领先水平,性能水平接近于英伟达A100。
昇腾数据中心解决方案Atlas硬件系列
基于达芬奇架构的两颗“芯”。
1)昇腾310处理器:本质上是人工智能片上系统,主要应用于边缘计算产品和移动端设备等低功耗的领域。
2)昇腾910处理器:该芯片计算密度大,领先全球,相比于同时代的英伟达Tesla V100 GPU还要高出一倍,其主要应用于云端,可以为深度学习的训练算法提供强大算力。
数值类型
半精度(FP16):浮点数使用16位表示,相对于FP32提供了较低的精度,但可以减少存储空间和计算开销。按照理论来说可以跑机器学习这些任务,但是FP16会出现精度溢出和舍入误差,所以很多应用都是使用混合精度计算的也就是FP16+FP32模式,简单来说FP16其实在图像处理有更大优势点。
单精度(Fp32):浮点数使用32位表示,具有较高的精度和动态范围,适用于大多数科学计算和通用计算任务。通常我们训练神经网络模型的时候默认使用的数据类型为单精度FP32。
双精度(Fp64):浮点数使用64位表示,提供更高的精度和动态范围。通常在需要更高精度计算的科学和工程应用中使用,相对于单精度,需要更多的存储空间和计算资源。
固定点数(INT8):固定点数使用固定的小数点位置来表示数值,可以使用定点数算法进行计算。INT8与FP16、FP32的优势在于计算的数据量相对小,计算速度可以更快,并且能通过减少计算和内存带宽需求来提高能耗。
算力单位
TOPS:每秒执行1万亿次运算次数。
TFLOPS:每秒执行1万亿次浮点运算次数,与“TOPS”区别FL,即float浮点。
PFLOPS:(PetaFLOPS),每秒一千万亿(=10^15)次的浮点运算。
Atlas 300I Pro 推理卡
AI算力: 整数精度(INT8): 140 TOPS
半精度(FP16): 70 TFLOPS
处理器核:内置8个Arm Core(最大主频1.9GHz)
内存:容量24GB;支持ECC
功耗:72 W
Atlas 300V Pro 视频解析卡
AI算力: 整数精度(INT8): 140 TOPS
半精度(FP16): 70 TFLOPS
处理器核:内置8个Arm Core(最大主频1.9GHz)
内存:容量48G;支持ECC
编解码能力:内置DVPP预处理单元 视频128路 1080P 30FPS(硬件解码能力)
功耗:72 W
Atlas 300I Duo 推理卡
AI算力:整数精度(INT8): 280 TOPS
半精度(FP16): 140 TFLOPS
处理器核:内置16个Arm Core(最大主频1.9GHz)
内存:LPDDRX 96GB,总带宽528 GB/s ;支持ECC
编解码能力:内置DVPP预处理单元 视频256路 1080P 30FPS (硬件解码能力)
功耗:150 W
Atlas 300T Pro训练卡
AI算力:提供最大280TFLOPS FP16性能,算力达到业界标卡巅峰
处理器核:芯片集成32个华为达芬奇AI Core+ 16个TaiShan核
内存:32GB HBM内存+16GB DDR4内存
网口:芯片直出 1*100G RoCE网口,无需外置网卡;支持PCIe4.0和1*100G RoCE高速接口,出口总带宽56.5Gb/s,较业界1.8倍,训练数据和梯度同步效率提升10%-70%。
昇腾处理器是全球首个覆盖全场景的AI芯片。昇腾AI芯片基于统一的达芬奇架构,具备从几十毫瓦IP到几百瓦芯片的平滑扩展,拥有端边云全场景部署的能力,也是构建昇腾计算产品、使能上层软件和应用的底座,有高算力、高能效、灵活可裁剪等特性。
公司:北京鼎信泰德科技有限公司
联系电话:400-819-0180
地址:北京市海淀区彩和坊路8号天创科技大厦606室
公司宗旨:全心全意为客户服务。
合作十年、正规授权、原厂正品、现货供应、海量库存!
华为政企业务全行业全产品线金牌代理商
超聚变服务器金牌代理商
华为商用终端兵器集团电子采购平台授权供应商
华为终端产品核心经销商
华为政企业务中央政府采购授权供应商
华为政企业务CSP三钻服务商
华为云核心级解决方案提供商
奇安信授权行业钻石代理商
英伟达/浪潮/华三/京东/授权代理及合作伙伴
服务器、存储、桌面云、交换机、路由器、防火墙、虚拟化!
华为笔记本、台式机、打印机、智慧屏、平板、手表、手环、耳机!
如需购买欢迎致电!

