大数跨境

超算架构算力成为大模型兵家必争之“力”

超算架构算力成为大模型兵家必争之“力” 未来科技范儿
2023-08-30
0
导读:展览总面积达4.5万平方米,吸引了160家国内外机器人企业携近600件展品参展,60款全球首发新品将在博览会现场集中发布,数量居历届之最。本届大会论坛由6场主论坛、近30场专题论坛及配套活动组成。32

今年以来,大模型成为当之无愧的风口,据不完全统计,国内已发布的各类大模型数量超过 100 个, 呈现出“百模大战”的态势。资本也闻风赶来,天眼查 APP 显示,今年上半年与大模型直接相关的融资事件超20起。

大模型愈演愈烈,随之催生了海量的 AI 算力需求。截至 2022 年底,我国算力总规模达 180EFLOPS ,目前居全球第二位,并保持 30%的年增长率。据测算 ,2023年我国算力核心产业规模有望突破 2 万亿元。

虽然算力行业总体蓬勃发展,但面对大模型浪潮之下激增的算力需求,目前英伟达的产能有 限,加之受限于台积电的产能以及内存供应商等限制, GPU 的产能不会暴涨,旺盛的需求和GPU 的短缺,造成了行业存在巨大 AI 算力缺口,“抢卡”现象仍在持续。

如何破解大模型“算力荒”成为摆在算力服务商面前的共同命题。


“看不见”的超算,“看得见”的好用

众所周知,大模型是“烧钱”的业务,而“烧钱”的原因最主要是当前每次大模型训练所需要的 算力非常之高。

ChatGPT 为例,根据 OpenAI 公开数据推测,如果每秒1000 万亿次的计算,每次模型训练也需要 3640 天的计算能力。

仅单次训练任务都需要数百张甚至数千张 GPU 卡做计算加速,例如A100、A800、H800 等,同时还需要长周期、稳定可靠的计算环境来保障计算任务不中断,尽管开发者会加入很多的 checkpoint,但发生故障后在时间、精力和成本方面的代价都不小。

这样的大模型训练场景对算力提出了架构互通、高速互联的需求,考验规模性算力资源在短时 间内的计算“爆发力”。

而过去的云计算架构主要是分布式架构,主流的云计算服务器之间的网络带宽在 200Gbps,但大模型的一些训练需求服务器之间的互联网带宽一般要求达到 3200Gbps,两者相差十几倍。

过去的超算架构又主要以CPU为主,传统基础设施架构下的算力已经无法满足大模型时代的需求,只有建设大规模 GPU超算集群才可以满足大模型的算力需求。

大规模 GPU 超算集群,顾名思义,将大量 GPU 资源组成算力集群来应对极高的密集性计算,其浮点运算速度能够达到千万亿次每秒,同时具备高速互联计算网络、高性能文件存储和强劲的GPU算力。

可以说,大规模 GPU 超算集群更加贴合大模型训练场景,并行科技董事长陈健也曾公开表示:“大模型的训练本质上就是一个超大的训练任务,比如在 1000 张 GPU 卡上跑两三个月,就是一个典型的超算应用场景。”


超万 P 超算架构大模型算力“及时雨”解决“算力荒”

OpenAI 测算,全球 AI 训练所用的计算量呈现指数级增长,平均每 3.43 个月便会增长一 倍,过去几年计算需求量已扩大 30万倍,远超算力增长速度。

GPU 卡资源也始终紧张,大模型竞赛已经推高了市场对 GPU 的需求。尽管有一些公司即使 暂时还不需要 GPU,但由于担心未来,也会开始提前储备。相当于“对供应短缺的预期加重 了供应短缺”。

有相关人士预测至少到 2023 年底,对于要部署数百或数千的 H100/H800 的企业都会面临短缺问题,目前看来,GPU 的短缺可能会持续到 2024 年。

为缓解 GPU 卡资源紧张问题,作为超算架构大模型算力网络先行者的并行科技计划将在 2023 年底前,以“算力网络”为依托,上线超万 P 超算架构大模型算力,为大模型行业带来 GPU 资源“及时雨”。



【未来科技范】往期文章

雅迪Q1电动车:动力强劲 娇小不娇弱

游戏笔记本:宏碁掠夺者HELIOS 300白金版

拖地机器人:云鲸居然还会洗抹布

投影仪:坚果G9图文+短视频

手机:三星Galaxy A50s评测
游戏手机:腾讯黑鲨手机3 短视频
VRPico Neo 2 一体机评测 

AI音箱:小鸟Zipp 2

小米米家喷墨打印机


【未来科技范已入驻】

今日头条| 搜狐网| 懂车帝| 知乎| 
百度百家| 企鹅| 新浪财经| 车家号|
什么值得买| 凤凰| 搜狐| UC大鱼|
东方财富| 同花顺| 网易| 未来科技范|
雪球| 哔哩哔哩| 抖音| AF| 新浪微博|

2018 烽巢网年度优质内容媒体人
2019微博知名数码视频自媒体
2019烽巢网年度贡献奖:最佳魅力奖
金鸥奖中国:2019年度最具创新力科技媒体


未来科技范
商务合作、投稿
联系微信:technewszy
END
我知道你在看🌟

【声明】内容源于网络
0
0
未来科技范儿
聚焦未来科技产业,致力于一站集成产业报道、企业观察等绝对干货。
内容 381
粉丝 0
未来科技范儿 聚焦未来科技产业,致力于一站集成产业报道、企业观察等绝对干货。
总阅读155
粉丝0
内容381