大数跨境

大模型百家争鸣时代,国产AI芯片如何担当底座力量?

大模型百家争鸣时代,国产AI芯片如何担当底座力量? 问芯
2023-07-24
1
导读:近日,中国工程院院士李国杰先生在AI计算研讨会上,剖析了国内当下大模型发展火热现状,认为抓住AIGC机遇,可
当前国内大模型发展火热诸多专家认为抓住AIGC机遇,可能逆转中国在AI领域的竞争态势。进一步比较、分析国内外人工智能三要素:国内算法水平与国外差距不大;数据方面,中国拥有很大的基数优势;算力发展则成了国内外竞争的关键。
一方面,国内算力快速发展。据工信部数据,中国算力总体规模据世界第二,其中AI算力占比超50%。同时,呈现出高性能计算与AI计算融合发展趋势,科技部专门下发文件支持高性能计算中心与智算中心异构融合发展。
衡量算力发展水平,除了算力规模,还要关注数据精度,不同的计算场景需要不同数据精度支持。因此,李院士认为国内AI应用需要发展多精度混合计算,因此全精度、通用的GPU成为迫切需求。
另一方面,外国持续管控先进AI芯片进口,近期更是传闻英伟达A800/H800也将被纳入限制清单——这些芯片是英伟达为满足去年9月出口要求,专门设计、定制版本。在可预见的未来,国产人工智能应用的发展面临先进AI芯片被卡脖子的困境。在此阴影之下,国内AI芯片厂商以不同技术路线进行突破,迎来了新一轮发展机遇。虽然性能存在差距,但也能满足部分AI应用的算力需求。

AI算力发展,需要全精度GPGPU支持
国产AI芯片技术路线主要分为GPGPUAI ASIC(或NPU),相较而言,GPGPU路线更加符合AI算力发展需求,更具潜力。GPGPU也叫做通用GPU,优势在于具备大规模并行计算的能力,可快速开发高能效的应用程序,在产品性能、通用性、易用性等方面优势明显,全球9成以上商用AI系统的选择GPGPU架构芯片,在训练负载方面更是如此。而且,当前AI应用基本全都建立在GPGPU架构的软件开发平台上,生态体系更加完善,好用,易用。AI技术发展日新月异,AI软件开发者通过在GPGPU平台开发,能够更好的提高生产力。
ASIC架构,优势在于根据产品的需求,进行特定设计和制造的集成电路,因此计算速度快,能耗更低。它的出现存在一个理论前提,即算法发展相对成熟,已发现最优算法,通过将软件固化到硬件执行,以实现最优效率。由于当前AI算法、模型快速迭代发展,ASIC架构需要投入大量的资金,以及经历较长的研发和工程周期,容易出现量产即落后的局面。另外,国际上还有基于FPGA架构开发AI芯片,虽然可根据自身需求进行重复编程,但缺点在于频率较低,单元计算能力有限,价格昂贵。而且,基于FPGAAI应用开发,需要软件工程师同时具备软件、硬件能力,开发难度较大;并且目前FPGA被国外巨头垄断,因此很少有FPGA架构的国产AI芯片。
相对于ASICFPGA而言,国内对GPGPU芯片其实需求更为迫切。大模型预训练面临着计算资源需求、数据集规模、训练时间和效率、参数调优和模型调整、以及泛化能力和适应性等多个难题。应对这些难题需要综合考虑硬件资源、数据管理、算法设计等多方面因素。因此,算力领先、软件完善的 GPGPU成为先进大模型的首选算力来源。而且,随着AI应用向多模态进一步发展,通用性更优的GPGPU可以更好的支持这类应用发展。
另外,国内对GPGPU芯片的需求不止于芯片可提供多少算力,是否能满足应用场景所需的计算精度也同样重要。原因在于,AI应用视场景不同,需要算力精度不同。例如AICG领域对图像和语音的处理,用32位、16位计算精度即可;而部分科学计算,则需要用到FP64双精度浮点运算,才可保证模型训练和预测结果的准确性。总而言之,AI算力的全面发展,需要全精度、通用性强的GPGPU芯片支撑。

国产AI芯片,性能近乎NVIDIA主流产品

据数据统计,2022年中国人工智能芯片市场规模为850 亿元,2023年中国人工智能芯片市场规模将达到1039 亿元,2025 年中国人工智能芯片市场规模将达到1780亿元。当前,国内AI芯片厂商数量约在6000+家,其中主流厂商数量约60余家,主要分为三个梯队,第一梯队包括海光、华为、寒武纪等。划分原因在于,第一梯队厂商有成熟产品,且已有商业化量产规模的应用。
海光:DCU产品深算系列,兼容通用的 CUDA”环境以及国际主流商业计算软件和人工智能软件,对标主流 NVIDIA A100 产品,海光 DCU 单芯片产品基本能达到与其相近的性能水平。并且,海光DCU深算一号,国内唯一能支持全部数据精度,可以满足需要更高精度的数学计算的需要。GPGPU架构,让其通用性更强,海光DCU产品在AI计算、大数据处理、商业计算等领域发挥着重要作用。
华为昇腾:产品包括昇腾310910,自研达芬奇架构实现较低功耗和较好散热,可在华为庞大的AI软件工程师支持下,通过运行华为的全栈软硬件平台,并且深度适配、迁移和优化,可以应用于云边端全场景覆盖,目前已形成较为完善的生态。
寒武纪:产品主要由云端芯片与边缘芯片等组成,产品体系丰富,适配AI应用及各类算法,产品的能效较好,并掌握了智能芯片架构、编译器、工具链等核心技术。但因为ASIC架构芯片的天然劣势,使得寒武纪产品在实际应用中需要大量资金、人才投入,落地部署困难重重,实际应用限制多多。
第二梯队包括,燧原、昆仑芯、天数、壁仞、沐曦等近几年成立的初创企业。这几家厂商虽然发布了产品,但由于AI芯片产品化、复杂度等原因,在实际应用中进展有限,或开始在某些领域局部试水,或者还在努力建设软件生态,集群部署方案等。
第三梯队包括龙芯、景嘉微等,这两家厂商有意向进军AI计算领域,但尚无AI芯片量产。龙芯作为国产CPU领域的主流厂商,5月份宣布集成龙芯自研GPGPU的第一款AI计算芯片,预计将于 2024 年一季度流片。而景嘉微作为国内最早投入GPU研发的厂商之一,近期也宣布募资42亿元投入高性能GPGPU芯片研发及产业化项目。这两家厂商作为国内计算芯片代表厂商,如今在布局AI计算芯片研发,终于迈出了第一步。
国内大模型百家争鸣,AI芯片发展为其提供了算力底座。据IDC数据,2026年中国AI投资规模将有望达到267亿美元,其中AI底层硬件市场占比将超过AI总投资规模的半数。随着市场与技术不断成熟,中国的芯片产业还有着巨大的发展潜力,国产芯片将在AI领域发挥自主可靠的引擎作用。

【声明】内容源于网络
0
0
问芯
AI、机器人和未来。
内容 628
粉丝 0
问芯 AI、机器人和未来。
总阅读45
粉丝0
内容628