大模型百家争鸣时代，国产AI芯片如何担当底座力量？- 大数跨境

首页

大模型百家争鸣时代，国产AI芯片如何担当底座力量？

问芯

2023-07-24

导读：近日，中国工程院院士李国杰先生在AI计算研讨会上，剖析了国内当下大模型发展火热现状，认为抓住AIGC机遇，可

当前国内大模型发展火热，诸多专家认为抓住AIGC机遇，可能逆转中国在AI领域的竞争态势。进一步比较、分析国内外人工智能三要素：国内算法水平与国外差距不大；数据方面，中国拥有很大的基数优势；算力发展则成了国内外竞争的关键。

一方面，国内算力快速发展。据工信部数据，中国算力总体规模据世界第二，其中AI算力占比超50%。同时，呈现出高性能计算与AI计算融合发展趋势，科技部专门下发文件支持高性能计算中心与智算中心异构融合发展。

衡量算力发展水平，除了算力规模，还要关注数据精度，不同的计算场景需要不同数据精度支持。因此，李院士认为国内AI应用需要发展多精度混合计算，因此全精度、通用的GPU成为迫切需求。

另一方面，外国持续管控先进AI芯片进口，近期更是传闻英伟达A800/H800也将被纳入限制清单——这些芯片是英伟达为满足去年9月出口要求，专门设计、定制版本。在可预见的未来，国产人工智能应用的发展面临先进AI芯片被卡脖子的困境。在此阴影之下，国内AI芯片厂商以不同技术路线进行突破，迎来了新一轮发展机遇。虽然性能存在差距，但也能满足部分AI应用的算力需求。

AI算力发展，需要全精度GPGPU支持

国产AI芯片技术路线主要分为GPGPU和AI ASIC（或NPU），相较而言，GPGPU路线更加符合AI算力发展需求，更具潜力。GPGPU也叫做通用GPU，优势在于具备大规模并行计算的能力，可快速开发高能效的应用程序，在产品性能、通用性、易用性等方面优势明显，全球9成以上商用AI系统的选择GPGPU架构芯片，在训练负载方面更是如此。而且，当前AI应用基本全都建立在GPGPU架构的软件开发平台上，生态体系更加完善，好用，易用。AI技术发展日新月异，AI软件开发者通过在GPGPU平台开发，能够更好的提高生产力。

ASIC架构，优势在于根据产品的需求，进行特定设计和制造的集成电路，因此计算速度快，能耗更低。它的出现存在一个理论前提，即算法发展相对成熟，已发现最优算法，通过将软件固化到硬件执行，以实现最优效率。由于当前AI算法、模型快速迭代发展，ASIC架构需要投入大量的资金，以及经历较长的研发和工程周期，容易出现量产即落后的局面。另外，国际上还有基于FPGA架构开发AI芯片，虽然可根据自身需求进行重复编程，但缺点在于频率较低，单元计算能力有限，价格昂贵。而且，基于FPGA的AI应用开发，需要软件工程师同时具备软件、硬件能力，开发难度较大；并且目前FPGA被国外巨头垄断，因此很少有FPGA架构的国产AI芯片。

相对于ASIC与FPGA而言，国内对GPGPU芯片其实需求更为迫切。大模型预训练面临着计算资源需求、数据集规模、训练时间和效率、参数调优和模型调整、以及泛化能力和适应性等多个难题。应对这些难题需要综合考虑硬件资源、数据管理、算法设计等多方面因素。因此，算力领先、软件完善的 GPGPU成为先进大模型的首选算力来源。而且，随着AI应用向多模态进一步发展，通用性更优的GPGPU可以更好的支持这类应用发展。

另外，国内对GPGPU芯片的需求不止于芯片可提供多少算力，是否能满足应用场景所需的计算精度也同样重要。原因在于，AI应用视场景不同，需要算力精度不同。例如AICG领域对图像和语音的处理，用32位、16位计算精度即可；而部分科学计算，则需要用到FP64双精度浮点运算，才可保证模型训练和预测结果的准确性。总而言之，AI算力的全面发展，需要全精度、通用性强的GPGPU芯片支撑。

国产AI芯片，性能近乎NVIDIA主流产品

据数据统计，2022年中国人工智能芯片市场规模为850 亿元，2023年中国人工智能芯片市场规模将达到1039 亿元，2025 年中国人工智能芯片市场规模将达到1780亿元。当前，国内AI芯片厂商数量约在6000+家，其中主流厂商数量约60余家，主要分为三个梯队，第一梯队包括海光、华为、寒武纪等。划分原因在于，第一梯队厂商有成熟产品，且已有商业化量产规模的应用。

•海光：DCU产品深算系列，兼容通用的“类 CUDA”环境以及国际主流商业计算软件和人工智能软件，对标主流 NVIDIA A100 产品，海光 DCU 单芯片产品基本能达到与其相近的性能水平。并且，海光DCU深算一号，国内唯一能支持全部数据精度，可以满足需要更高精度的数学计算的需要。GPGPU架构，让其通用性更强，海光DCU产品在AI计算、大数据处理、商业计算等领域发挥着重要作用。

•华为昇腾：产品包括昇腾310、910，自研达芬奇架构实现较低功耗和较好散热，可在华为庞大的AI软件工程师支持下，通过运行华为的全栈软硬件平台，并且深度适配、迁移和优化，可以应用于云边端全场景覆盖，目前已形成较为完善的生态。

•寒武纪：产品主要由云端芯片与边缘芯片等组成，产品体系丰富，适配AI应用及各类算法,产品的能效较好，并掌握了智能芯片架构、编译器、工具链等核心技术。但因为ASIC架构芯片的天然劣势，使得寒武纪产品在实际应用中需要大量资金、人才投入，落地部署困难重重，实际应用限制多多。

第二梯队包括，燧原、昆仑芯、天数、壁仞、沐曦等近几年成立的初创企业。这几家厂商虽然发布了产品，但由于AI芯片产品化、复杂度等原因，在实际应用中进展有限，或开始在某些领域局部试水，或者还在努力建设软件生态，集群部署方案等。

第三梯队包括龙芯、景嘉微等，这两家厂商有意向进军AI计算领域，但尚无AI芯片量产。龙芯作为国产CPU领域的主流厂商，5月份宣布集成龙芯自研GPGPU的第一款AI计算芯片，预计将于 2024 年一季度流片。而景嘉微作为国内最早投入GPU研发的厂商之一，近期也宣布募资42亿元投入高性能GPGPU芯片研发及产业化项目。这两家厂商作为国内计算芯片代表厂商，如今在布局AI计算芯片研发，终于迈出了第一步。

国内大模型百家争鸣，AI芯片发展为其提供了算力底座。据IDC数据，2026年中国AI投资规模将有望达到267亿美元，其中AI底层硬件市场占比将超过AI总投资规模的半数。随着市场与技术不断成熟，中国的芯片产业还有着巨大的发展潜力，国产芯片将在AI领域发挥自主可靠的引擎作用。

【声明】内容源于网络

问芯

AI、机器人和未来。

内容 628

粉丝 0

问芯 AI、机器人和未来。

总阅读45

粉丝0

内容628