ChatGPT 是由美国 OpenAI 于2022年11月开发推出的一个 AI 对话模型。因出色的文本生成和对话交互能力在全球范围内迅速走红,5天活跃用户过百万,2个月活跃用户过亿,可谓风光无限。
ChatGPT 的本质上是一个有着大量复杂计算需求的 AI 模型,其通过连接大量真实语料库来进行深层次、多阶段的训练和学习得以具备智慧能力,它仍属于 AIGC(利用 AI 技术自动生成内容的生产方式)的应用范畴。有专家指出:ChatGPT 的持续火爆,为 AIGC 带来全新变革,它所引发的深刻影响和变革是以算力为基石,并且对 AI 模型训练所需要的算力支持提出了更高要求。
ChatGPT 需要大量 GPU 的高性能算力,用于深度神经网络训练。它支持单机环境和多机环境,可充分利用多 GPU 训练,以提高算力。ChatGPT 还需要良好的网络环境,以便进行大规模数据分发,同时占用了大量存储空间,以存储训练数据和模型参数。此外,ChatGPT 还需要先进的 IT 基础设施,以便支持训练过程的管理、可视化和优化。

国内向 ChatGPT 以及 AIGC 领域发展的公司已经非常多。有报道称,百度的文心一言将直接接入搜索;京东则计划结合 ChatGPT 的方法和技术点融入到产品服务中来;阿里内测中的达摩院版 ChatGPT 则在钉钉进行人机对话;腾讯持续投入此前在 AI 大模型、机器学习算法以及 NLP 等领域的技术储备;字节跳动的人工智能实验室( AI Lab)有开展类似 ChatGPT 和 AIGC 的相关研发,未来或为 PICO 提供技术支持。
目前,国内公司正在向虚拟人、AIGC 等概念靠拢,但还存在着一些技术发展瓶颈。原因在于五点:
1)国内缺少原创模型,没有模型迭代积累。ChatGPT 依赖于 InstructGPT,InstructGPT 依赖于 GPT-3.5、GPT-3。
2)国内真实数据体量。除百度有天然用户搜索问答训练样本外,对于其他公司可能较为缺少。
3)国内缺少技术积累。ChatGPT 发展过程中对于数据处理、清洗、标注、模型训练、推理加速等方面均具有技术难点,且对结果均影响较大。且包括国内大厂在内,强化学习框架仍未出现大规模使用场景。
4)国内创新性土壤还需发展。整体商业环境较为急躁,但投入与产出需要花费一些时间。
5)众所周知,目前,我们的算力平台已经有明显落后的趋势:
• 硬件平台算力被限制
• 模型的成熟程度及可扩展性、鲁棒性
• 集群管理难、调试难,研发成果难转换成生产应用
• 数据并行、模型并行等多机多卡带来的管理难题
• 对IT基础设施建设、IDC 管理、可视化、运维等众口难调
在高算力的需求下,对于超算基础设施的计算和传输能力都提出了更多的要求,扩容迫在眉睫。企业上云的趋势确定加速,将会在云端沉淀越来越多的数据,这些数据构成了 AIGC 爆发的基础,由此而带动相关长周期受益。在应用层面,更多的公司会将 ChatGPT 等 AIGC 产品与各自的垂类行业深度结合,产生更大的效用,长期来看会给产业链带来更多机会。
>>>> 基础层:算力及云计算芯片+预训练模型
• 数据中心芯片:海量数据的存储与计算,NVIDIA+AMD+MRVL ......
• 移动计算:高通、MediaTek(移动 XR、车载等)......
• 预训练模型:微软、谷歌、Meta、NVIDIA ......
>>>> 工具层:垂直化、场景化、个性化模型与工具
• 建模工具:Adobe、Autodesk、Unity ......
• AI 工具:C3AI、微软、NVIDIA、谷歌 ......
• 海量数据处理:Rapids、snowflake、cflt ......
• 自动化与流程再造:Uipath(RPA 与 AI 深度融合)......
>>>> 应用层:AI+行业应用
• 拥有大量数据入口的 C 端与 B 端龙头
• 自动驾驶:NVIDIA、高通......
• 大数据:Plantir、AYX ......
• 金融领域:Lemonade、Upstart ......
• ITSM 与网安:erviceNow 、crowdstrike、FTNT、Dynatrace、Splunk ......
紫光数码根植 ICT 领域 20 余年,面向数字经济和智能时代的发展需求,推出系列 AI算力产品。该系列产品涵盖 NVIDIA 全系企业级产品,包括 DC GPU、DGX 超级 AI服务器、专业图形 GPU 、高速网络产品、集群管理及调度、资源监控软件。同时提供如 NVIDIA AI Enterprise 等 AI 解决方案、AI 一栈式软件。紫光数码具备强大的项目管理和实施能力,拥有多个大型 AI 项目的实施和运维经验,将把系列 AI 算力产品赋能各行各业 AI 场景和应用,并为新技术发展提供澎湃的算力支撑。
文中部分内容来源:网络综合整理

