自2025年1月NVIDIA RTX5090发布以来,大家就一直都很关注这个显卡,我们之前建了个5090的群,一直到现在每天都是挺热闹。但在过去的几个月时间里,RTX5090也出现了一系列的问题,这篇文章我们从售价、租金、算力、功耗、性能、发热和组网七个方面,结合实际案例与数据,深入探讨RTX5090目前的市场行情,本文的数据参考自“小易AI袁亮”。
售价从高位回落
RTX5090发布时,市场对其寄予厚望,预期售价高达4万元以上。然而,仅4个月后,价格已跌至2万元出头,部分电商平台(如京东)上的同德品牌RTX5090甚至低至2.3万元。价格快速下滑的原因主要有以下几点:
首先,市场传言RTX5090存在芯片过热问题,影响了消费者信心。其次,早期关于多卡组网可能出现“锁卡”或性能瓶颈的传闻,降低了企业采购意愿。此外,显卡厂商在发布初期大幅抬价,导致市场需求不及预期。最后,上一代旗舰RTX4090改装的48GB版本在性价比上更具吸引力,成为5090的直接竞争对手。综合这些因素,RTX5090的市场需求远低于预期,价格回落反映了市场对其性能和稳定性的观望态度。
租金
由于RTX5090发布初期售价高昂(3万元以上),机房普遍不愿大规模采购,导致租赁市场发展缓慢。直到5月份价格回落,部分机房才开始上架RTX5090相关机型。目前市场租赁价格为:
-
单卡租赁价格:约1万元/年。 -
整机配置价格:一台配备8张RTX5090的整机约为30万元。
以一台8卡整机为例,扣除机柜租赁费和电费后,投资回本周期大约为4年。对于AI企业来说,这一周期较长,尤其是在算力需求快速变化的背景下,租赁模式的吸引力仍需进一步验证。
算力
RTX5090在算力方面表现突出,尤其是在AI训练和推理场景中。FP16精度算力:单卡419 TFLOPS。8卡整机算力:约3.4 PFLOPS。集群规模:300张RTX5090可组成千亿次浮点运算(PFLOPS级)的算力集群。这一算力水平使其在大型语言模型(LLM)训练、推理以及高性能计算(HPC)任务中具备显著优势。然而,实际应用中,算力的发挥还需依赖软件优化和组网效率。
功耗
RTX5090的功耗是其应用中的一大痛点。额定功耗:575W,峰值功耗:瞬间可高达900W,8卡整机功耗:约6kW。
以每千瓦时电费0.6元计算,一台8卡整机每月电费约为3600元。高功耗不仅增加了运营成本,还对机房的散热和供电系统提出了更高要求,企业在部署时需充分考虑电力成本和基础设施支持。
性能:FP8/FP4推理与游戏表现
在AI推理场景中,RTX5090支持低精度运算(如FP8和FP4),显著提升效率。知名科技博主“极客湾”曾使用Ollama框架,部署一个23亿参数的通用模型(1500-2.5模型)进行推理测试,RTX5090D与5090性能相当,两者在推理任务中表现几乎一致。相比上一代旗舰RTX4090,5090的推理速度快约50%。
在游戏场景中,RTX5090在4K分辨率下的平均帧率也显著优于4090,展现了其在图形渲染方面的强大能力。然而,性能优势的发挥需要针对性的优化,尤其是在低精度推理场景中。
发热
RTX5090的发热问题主要集中在芯片和电源连接器两方面,尤其是与12V-2x6电源连接器相关的过热和熔化现象。虽然此类问题发生概率较低,但仍需关注。以下是几种缓解发热问题的方法:
-
通过驱动或BIOS设置限制瞬间功率,降低峰值功耗。 -
采用液冷或涡轮风扇增强散热能力。 -
使用原厂电源连接线,避免第三方线材的兼容性问题。
通过以上措施,RTX5090的发热问题基本可控,但企业在部署时仍需重视散热系统的设计和维护。
组网
早期市场传言RTX5090在多卡组网时可能出现“锁卡”或性能瓶颈,导致部分企业对其组网能力持怀疑态度。然而,小易AI的实际自测中,在多卡组网环境中未发现锁卡问题,而且多家使用RTX5090的企业均未报告类似问题,咨询海外开发者后,锁卡问题也未被广泛提及。
综合来看,锁卡问题可能源于早期驱动的不成熟,随着驱动更新的推进,该问题已基本解决。RTX5090在NVLink和PCIe组网中的表现稳定,适合构建高性能AI集群。
投稿、商务合作请微信dolphinjetta
是说芯语,欢迎关注分享

