大数跨境

破局算力困局:百度如何以系统级思维重构 AI 应用生态

破局算力困局:百度如何以系统级思维重构 AI 应用生态 元龙数字智能科技
2025-04-30
2

破局算力困局

百度如何以系统级思维重构 AI 应用生态


在AI技术飞速发展的当下,模型层出不穷,但百度创始人李彦宏在Create 2025大会上强调,应用才是AI产业的核心。面对开发者对应用价值持续性的疑虑,以及全球白热化的AI算力竞赛,找对场景、善用模型工具的应用将超越模型本身。目前,科技巨头们在算力领域投入巨大,预示着更强模型和应用突破即将到来,但中国AI发展面临高端芯片供应与制造的瓶颈,无法单纯复制海外“堆算力”模式,通过系统性优化和工程创新来最大化效率、降低成本成为关键。

在此背景下,百度宣布文心大模型降价、点亮基于自研昆仑芯P800的3万卡智算集群,回应开发者焦虑,降低AI应用门槛。百度智能云事业群总裁沈抖提出“应用即系统”,强调将硬件、软件、平台、网络等作为有机整体进行深度协同优化,才能最大化整体效能。百度智能云百舸AI异构计算平台也在大会上展示变化,旨在打通从“模型引领”到“应用为王”的链路。

当人们将目光聚焦在各类AI应用时,支撑它们的基础设施正面临巨大压力。大模型驱动的AI浪潮,不仅是算法和数据的胜利,更是对计算、存储、网络等底层能力的极限挑战。过去简单堆砌硬件、各环节独立优化的方式,已无法满足动辄千亿、万亿参数模型和实时响应应用的需求。训练领先大模型需要成千上万块GPU或NPU进行长时间计算,不同计算任务还需不同类型处理器协同工作,高效管理和调度这些海量且多样化的算力资源是复杂难题。万卡级分布式训练中,任何一个环节的微小失误都可能导致训练中断,造成巨大损失。模型训练完成后,推理部署环节要快速响应用户请求、服务大量并发用户并控制成本,而MoE等复杂模型结构对资源调度和优化提出了更高要求。此外,AI技术发展迅速,企业需要快速试验新模型、调整策略、集成开源成果,僵化封闭的基础设施会阻碍创新。这些难题相互交织,只有从“系统”视角出发,对算力、存储、网络等进行通盘考虑和协同优化,才能应对AI时代的复杂性,这也印证了“应用即系统”的观点。

构建系统级基础设施,需要从模型开发、应用编排到算力底座的全栈协同。在百度智能云体系中,千帆平台承担模型与应用层面的关键角色,而百舸AI异构计算平台则是驱动一切高效运行的核心。百舸平台从设计之初就带有“系统工程”色彩,旨在解决单点优化无法克服的全局性问题。它具备大规模、稳定、极速、高效等核心能力,能支持构建和管理十万卡级别超大规模计算集群,通过软硬件协同优化实现高达99.5%的有效训练时长和分钟级故障恢复能力,推理响应速度达到5us量级,还能通过精细化资源调度等技术确保计算资源物尽其用。百舸并非这些能力的简单叠加,而是将它们深度融合,提供高度协同、开箱即用的整体解决方案,让开发者和企业能专注于上层创新和应用落地。

在Create 2025大会上,百度围绕提升AI基础设施的效率与密度,展示了硬件创新与平台优化。硬件层面的“昆仑芯超节点”将64张百度自研的P800 AI加速卡塞进一个机柜,解决了传统多机柜方案通信效率低、成本高的问题,使卡之间的互联带宽提升8倍,单卡训练性能提高10倍,推理性能提高13倍,还节省了空间。百舸平台内部的大规模分布式PD分离推理系统,将推理过程拆分并匹配合适计算资源,进行精细调度管理,能把推理成本降低95%,同时处理请求数量增加20倍,为企业节省大量开支。

技术的价值最终体现在实际应用中,百舸平台已在多个行业合作中展现出强大实力。中国钢研与百度智能云合作,基于昆仑芯和百舸搭建专属智算平台,结合自身数据训练行业专用模型,开发出自动检测并生成报告的应用,实现产线提效超50%,质检人力节省超40%,关键指标准确率达95%以上。民生银行利用千帆平台和百舸算力进行大模型管理和应用开发,提升了研发效率,预估全面推广能年省两成以上人力成本。北京人形机器人创新中心研发“天工”机器人及其背后的具身智能平台,其复杂的模型训练和推理就依赖百度百舸提供的稳定算力。此外,百度智能云千帆平台利用百舸的PD分离推理优化,降低了DeepSeek等模型的服务成本,提升了吞吐和速度;招商银行与百度智能云合作,部署基于昆仑芯P800的大规模国产芯片集群,验证了其在金融场景下的稳定性和性能;好未来通过百舸的资源调度能力,提升了集群资源利用率超过10%。这些案例覆盖不同行业和规模的企业,表明百舸平台及其系统级能力能切实帮助用户解决AI落地中的实际问题,具有广泛的适用性。

AI竞赛已从单纯的模型比拼,转向应用落地和价值创造的深水区。在这场转变中,底层基础设施的角色从提供算力,演变为支撑复杂AI系统高效运行的“智能底座”。未来,一个AI-Ready的基础设施,关键在于整体的系统效率、成本效益以及支撑应用快速迭代和创新的能力。具备软硬协同、全栈优化能力的平台将更具竞争力,最终的竞争焦点在于谁能更好地帮助开发者跨越技术鸿沟,在千行百业中用AI创造出实实在在的价值,这才是通往“应用的天下”的真正路径。就像温斯顿·丘吉尔所说,今日构建AI基础设施的尝试,不仅将承载未来的应用,更将深刻塑造未来AI应用的面貌和可能性的边界。 

END

【声明】内容源于网络
0
0
元龙数字智能科技
永做第一 使命第一 向善第一
内容 901
粉丝 0
元龙数字智能科技 永做第一 使命第一 向善第一
总阅读2.5k
粉丝0
内容901