NVIDIA 软件可选服务支持数据中心集群管理- 大数跨境

紫光数码企业解决方案

2025-12-11

导读：这是 NVIDIA 持续支持开放、透明软件的一部分，旨在帮助客户最大限度的发挥其 GPU 系统的性能。

这项可选服务将帮助数据中心运营商监测整个 AI GPU 集群运行状况，从而最大限度地延长正常运行时间。

随着 AI 基础设施的规模和复杂性不断增加，数据中心运营商需要持续了解性能、温度和功耗等因素。这些洞察使数据中心运营商能够主动监测和调整大规模分布式系统中的数据中心配置，从而确保这些系统以最高效率和可靠性运行。

NVIDIA 正在开发用于可视化和监测 NVIDIA GPU 集群的软件解决方案，为云合作伙伴和企业提供洞察仪表板，帮助他们提高整个计算基础设施的 GPU 正常运行时间。

该服务由客户选择、自行安装和控制，用于监测 GPU 使用情况、配置和错误。它将包含一个开源客户端软件智能体，这是 NVIDIA 持续支持开放、透明软件的一部分，旨在帮助客户最大限度的发挥其 GPU 系统的性能。

通过这项服务，数据中心运营商将能够：

这些功能可以帮助企业和云提供商可视化其 GPU 集群、解决系统瓶颈并优化生产力，从而提高投资回报。

此可选服务提供实时监测，让每个 GPU 系统与外部云服务通信和共享 GPU 指标。NVIDIA GPU 没有硬件跟踪技术、终止开关和后门。

以上为摘要内容，点击“阅读原文”或扫描下方二维码阅读完整内容：

【声明】内容源于网络

紫光数码企业解决方案

第一时间获取紫光数码企业级解决方案、成功案例介绍，报名市场活动。

内容 283

粉丝 0

紫光数码企业解决方案第一时间获取紫光数码企业级解决方案、成功案例介绍，报名市场活动。

总阅读137

粉丝0

内容283