


AI服务器功率密度高,对于高效的液冷散热是刚需,目前浸没式液冷还有一些技术瓶颈,冷板式液更为成熟,基于现有基础设施,冷板式液冷+风冷将会是主要的方案,占据90%以上的市场份额。
目前国内市场主要玩家中,整体方案商维谛和英维克为主,佳力图、申菱等各家占10%不到份额,做零部件的高澜股份处于产业链上游可以对所有客户供货。

Q:选择液冷方案的优势?
A:客户选择制冷方案的核心还是在于解决散热问题,特别是在面对高热密度的AI训练场景时,这些因素变得尤为重要。尽管常有误解认为液冷技术的主要优势是PUE,实际上其真正价值在于解决高热密度散热问题,PUE只是带来的其他好处之一。
训练场景是AI服务器最核心的应用,特点是高热密度,尤其是在大规模应用的万卡集群中,热密度可达120KW,这导致散热成为一个刚性需求。有效的冷却技术,特别是液体冷却系统,因其优异的散热性能而成为首选。液体冷却技术的核心价值在于其高效的散热能力,这对于处理集中在单个机柜内的高密度热量尤为关键。
Q:AI服务器散热方案?
A:国外AI服务器主流的方案采用“冷板式液冷+背板式风冷”的模式,未来一段时间内冷板式方案会占多数。
Q:英伟达最新代服务器液冷方案?
A:英伟达最新的B200是单模组14.2KW,基本4台一个服务器是极限,合计56KW。英伟达的GH200是一个CPU+两个GPU作为一个单元,整柜方案NVL72,一个柜子的热密度大概120KW,采用混合式制冷,CPU、GPU+Switch全部用液冷方案,其他零部件采用主动式背板空调方案。整个数据中心搭配大概4+4个机柜,合计576张卡,会用2台CDU作为液冷环网,外部配备一个冷塔。
Q:未来AI服务器液冷方案?
A:未来英伟达会做混合式液冷的新方案,广域液冷是英伟达的下一代芯片可能会采用的方式,芯片采用相变式冷板,整个服务器做密封,注入浸没液,用浸没液做其他组件散热,可以做到完全无风扇的形式,热密度可以做到200KW。
Q:未来液冷方案市场?
Q:国内AI数据中心现状?
A:全球万卡集群都在美国本土,推理服务器在亚太相对多。国内在高算力芯片和组网技术上都有很大的瓶颈。
Q:华为昇腾芯片性能?
A:华为的升腾系列如910B和910C,在单卡算力上可以与H800相比较,但组网能力较弱,这对于执行大型训练任务仍有压力,其组网能力比H20更弱,因此尽管H20性能受限,仍是国内最优的推理型应用解决方案,H20通过组网后的算力水平甚至高过H100,接近H200。
Q:国内H20散热方案?
Q:字节散热方案?
A:字节在国内的机柜都是40KW左右的单柜,80%液冷+20%风冷。字节在华东的托管机柜大概300兆瓦,25年还会增加200兆瓦;芜湖基地规划500兆瓦,还在交付中,基本都是40KW的单机柜密度。
Q:华为昇腾服务器散热方案?
A:华为昇腾910系列服务器每个机柜在46KW左右,基本都采用整机柜的液冷方案。
Q:推理散热?
Q:国内算力集群?
Q:数据中心投资液冷的趋势
A:目前四大云厂还在做核心训练,主要做万卡集群,但在前端数据中心已经在布局一些推理的资源,需要兼顾现有基础设施的条件,一些基础设施做不了液冷,能做液冷的部分都会采用。
其中新建的部分一定会上液冷,首先液冷对基础设施的投资额会减少,可以省去机械制冷的硬件成本;其次液冷使得服务器可靠性会增加,减少风扇和震动后,服务器稳定性有所提高。而对于现有的基础设施,也会涉及到对基础设施的改造,目前处于逐步改造成液冷的过程中。
Q:浸没式液冷和冷板式液冷趋势?
A:全液冷和混合式液冷相比,主要看产业成熟度,由于目前浸没式还有一些瓶颈,规模化还不现实,相应的采用冷板式方式会成熟很多,但冷板式液冷最多做到85%的散热是极限,还有15%~20%的热需要依靠风冷,因此只能使用混合方案。对于现有基础设施,采用半改造风液混合的方式更加容易。
Q:选择液冷方案的优势
A:客户选择制冷方案的核心还是在于解决散热问题,特别是在面对高热密度的AI训练场景时,这些因素变得尤为重要。尽管常有误解认为液冷技术的主要优势是PUE,实际上其真正价值在于解决高热密度散热问题,PUE只是带来的其他好处之一。
训练场景是AI服务器最核心的应用,特点是高热密度,尤其是在大规模应用的万卡集群中,热密度可达120KW,这导致散热成为一个刚性需求。有效的冷却技术,特别是液体冷却系统,因其优异的散热性能而成为首选。液体冷却技术的核心价值在于其高效的散热能力,这对于处理集中在单个机柜内的高密度热量尤为关键。
成本方面,由于高热密度的处理是一个不可避免的趋势,特别是在AI系统中,因此选择有效的冷却技术成为必然。随着AI服务器硬件设备成本的大幅增加,冷却系统在整体成本中所占比例将大幅下降,使得客户更加关注性能保障和热稳定性,而非冷却设备的成本。
Q:浸没式在数据中心的应用前景
A:国内浸没式液冷目前落地最多的是超算行业,以CPU为核心,需要密集布置CPU,使用相变式浸没较多,单柜可达200KW以上,因此只有在超算行业浸没式才有优势;但面向数据中心的智算中,浸没式短期内都不会是主流。
但由于目前冷板还是有缺点,还需要补一部分风冷,因此不是全液冷方案,未来如果浸没式把腐蚀问题、结构问题、成本、维护代价等问题都解决,技术才能成熟替代冷板。目前英特尔重点推广浸没式方案,其应用较多。
Q:不同机柜对散热方案的选择
A:散热的核心单元是机柜,机柜的热密度决定了其散热方式,业内共识是40KW是切换点,对于40千瓦以下的热密度,风冷近端送风可以满足需求;超过40千瓦时,从成本和实际效果来看,风冷都不理想,使用冷板式液冷更优。
但热密度也有交叉,在20多KW的热密度时就可以开始考虑冷板式液冷,同时也可以使用风冷,但热密度超过40KW后,就不在推荐使用风冷,成本会比液冷更高。
但单机柜热密度可以调整,采用何种散热方案也取决于数据中心客户的方案如何设计。
Q:不同制冷方案的价值量测算
A:以国内为例,目前纯风冷型的平均1KW造价大约在2000元以内,大规模建设价格很便宜,系统有简化。
而冷板式液冷(包含混合风冷)型的单位造价大约在4000元左右,管路等零部件大概2000元,CDU+柜内部分1500元左右,室外部分冷塔等大概500元。
浸没式液冷的造价大约在8000到10000元,主要由于浸没液的高成本。
Q:散热行业格局
A:目前国内市场主要玩家中,以整体方案商维谛和英维克为主,佳力图、申菱等各家占10%不到份额,广东海悟主要做一些运营商的集采和改造项目。
Q:曙光数创?
A:曙光数创专门做制冷解决方案,也属于系统厂商,其核心优势是做浸没式方案,冷板式不是强项。但是其受制于曙光的背景,对于非曙光的客户没有竞争力,同时其不懂做空调,没法提供同源方案,这一点比英维克要弱,其强项在于对服务器改造很厉害,例如风冷改成液冷,但做液冷和风冷的混合方案就没有优势。但是很多宁畅中的标配套都给曙光数创。
Q:申菱环境?
A:申菱自己做制造,偏供应链,成本比较低,相当于散热市场中的代工厂,类似于富士康的角色。
Q:高澜股份?
A:高澜股份 英维克他们是零组件供应商,虽然其没有解决方案,竞争力相对弱,但其优势体现在制造能力上,是最源头的供应商,无论做什么样的系统,都需要找高澜买零部件,只要按照客户规格生产即可,即使是维谛、英维克等,也会向上游去采购零组件。
Q:液冷行业壁垒
A:系统厂商:如维谛、英维克,其优势主要是整体系统的knowhow,作为传统空调厂商,空调系统可做到能效更高,系统控制更好;其次是工艺和产品丰富度,整体的部署方案也很关键。空调不是标准品,精密空调的非标率在50%左右,因此散热是一个垂直的、定制化很高的赛道,对于做标准品的厂商来说,做服务器散热就没有优势。
但对于系统厂商,需要在技术上牵制客户,如果客户把所有技术都搞定,只要采购零组件来组装即可,系统厂就不再有优势;系统厂商必须具备一些不可替代的创新点,客户无法自己设计,才可以此和客户形成长期合作关系,销售自己的成套解决方案。
零部件厂商:基本不存在壁垒,过去做风冷的压缩机等还有一些头部厂商具有一定壁垒,但液冷中除了快接头算比较高精密的结构件,整个液冷市场壁垒并不高。
制冷剂:目前主要是纯水或乙二醇,都是很常见的工业品;浸没式的液体虽然很贵,主要一些综合性大厂在做,不存在一家独大。
Q:不同服务器散热的采购模式
A:英伟达的卡还是以服务器厂商主导,例如浪潮、新华三、超聚变、曙光、宁畅等。各家方案都差不多,拿到英伟达的模组后基本设计空间有限,因此做出来的服务器都类似。
国内算力卡配套的服务器也越来越多由服务器代工厂来主导散热的设计,液冷厂商例如英维克、维谛技术是液冷的整体方案提供商,但目前很多液冷由服务器厂商直接配套,浪潮、曙光都能够自己做液冷方案,就会影响到液冷方案商的订单,传统散热厂商只能提供一些风冷模块。因此对于维谛、英维克在这部分能够供应的空间会进一步萎缩。
但对于上游做结构接为主的厂商例如高澜,不太懂IP等knowhow,但客户的项目标准化以后,可为客户提供标准化的交付,很多终端大厂做熟悉以后,就会倾向于标准化,所有机柜、服务器规格都相同,就不需要服务器代工厂来做,会绕过服务器厂商直接和零部件厂商下单。
Q:不同客户类型对散热的采购模式
A:国内目前超算、运营商、垂直行业客户各占三分之一。
互联网大厂是直接和液冷厂商谈,要符合要求且价格便宜,最大的受益者是服务器大厂,连着液冷一起提供,专门做液冷的厂商英维克等机会不大,而外部的管道、冷塔等只要找专门的零部件供应商做即可。
维谛、英维克等企业在这当中只能做风冷部分,这部分专业性强,服务器厂商做不了,但占比只有20%~50%份额,液冷分配完后剩下部分才有机会。
运营商中,采用的液冷整机柜,是整体设计,其入围的厂商也只有四五家,例如维谛、英维克等,由中国移动牵头,三大运营商规格都一样,今年会试用几千台左右的液冷,预计25年后开始上量。
这部分各家规格必须统一,各家散热厂商都必须按照统一的规格做,基本在集采名录里面的厂商都能够有订单,但基本每家份额都很平均,不会有谁占优势。这部分服务器厂商就没有优势,因为运营商会更希望专业的人做专业的事,不会交给服务器厂商来做。
垂直行业客户部分,例如高校、教育、金融行业等,这些客户都不太懂行,同时现场条件可能也不适用于液冷,就面临改造,改造的过程就比较复杂,就需要由专业的液冷厂商来完成,需要综合能力,就又回到了维谛和英维克的市场。
但这部分市场的问题在于,每个市场都很小,需要渗透到大量的细分领域,就需要依靠销售团队来推广,不同厂商在不同地区就会有一些地域性优势,例如佳力图在华东、英维克在华南等。



