大数跨境
0
0

开发者新闻 | NVIDIA DGX Spark 的性能如何支持密集型 AI 任务

开发者新闻 | NVIDIA DGX Spark 的性能如何支持密集型 AI 任务 NVIDIA企业开发者社区
2025-11-17
8

NVIDIA DGX Spark 的性能如何支持密集型 AI 任务


当今,要求严苛的 AI 开发者工作负载通常需要比台式电脑所能提供的内存更多,也往往需要访问笔记本电脑或 PC 所不具备的软件,这使得工作不得不转向云端或数据中心。

NVIDIA DGX Spark 可作为云实例和数据中心队列的替代方案。这款基于Blackwell 架构的紧凑型超级计算机,具备每秒 1 千万亿次的 FP4 AI 计算性能、128 GB 的一致性统一系统内存,以及每秒 273 GB 的内存带宽,并预装了NVIDIA AI 软件堆栈。借助 DGX Spark,您无需依赖云端或排队使用数据中心资源,即可在本地高效处理大规模计算密集型任务。

我们将为您介绍 DGX Spark 在计算性能、大容量内存以及预装 AI 软件方面的优势,如何有效加速微调、图像生成、数据科学和推理等工作负载。请继续阅读,了解部分基准测试结果。




全文链接:

https://developer.nvidia.com/blog/how-nvidia-dgx-sparks-performance-enables-intensive-ai-tasks/

NVIDIA cuOpt 中使用 GPU 加速的屏障方法求解线性程序



NFL 如何在安排所有常规赛季比赛的同时,避免比赛场地与 Beyoncé 音乐会的时间发生冲突?

医生如何利用单个捐赠的肾脏启动一系列移植,并构建尽可能长的移植链,以挽救更多患者?

航空公司如何在满足乘务员休息要求和机组人员调配的前提下,优化航班乘务员排班,同时有效控制酒店费用与运营成本?

这类问题可通过优化方法求解,优化作为应用数学的一个分支,常采用线性规划 (LP) 和混合整数规划 (MIP) 来寻找理想解决方案。然而,求解过程并不容易,因为这些问题通常包含数百万个变量和约束条件,可能导致计算速度显著下降。虽然有时能够快速获得近似解,但要获得高精度的解往往需要更长的计算时间。

NVIDIA cuOpt 是一个开源的 GPU 加速库,用于求解优化问题。新版cuOpt 引入了一个基于屏障法的全新线性规划求解器,进一步丰富了现有的cuOpt LP 求解器功能,使工程师、研究人员和开发者能够更快速、更精确地处理大规模线性规划问题。

内部基准测试显示,与主流开源 CPU 求解器相比,cuOpt 屏障在平均性能上可实现超过 8 倍的加速;在大型线性规划问题的公共测试集上,相较于广泛使用的商用 CPU 求解器,平均性能提升超过 2 倍(图 1)。

在并发模式下,当 cuOpt barrier 与 cuOpt PDLP 结合使用时,其性能在开源求解器中位居首位,并在包含 11 个求解器的公开基准测试中位列第二(检索于2025年10月20日)。 

本文将介绍线性规划的基础知识,阐述 cuOpt 新的 GPU 加速求解方法,并深入分析相关的性能基准测试数据。




全文链接:

https://developer.nvidia.com/blog/solve-linear-programs-using-the-gpu-accelerated-barrier-method-in-nvidia-cuopt/


点击“阅读原文”查看更多开发者新闻


【声明】内容源于网络
0
0
NVIDIA企业开发者社区
NVIDIA 开发者社区是 NVIDIA 企业级 GPU 开发者交流平台,通过此平台可第一时间获取 NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。
内容 964
粉丝 0
NVIDIA企业开发者社区 NVIDIA 开发者社区是 NVIDIA 企业级 GPU 开发者交流平台,通过此平台可第一时间获取 NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。
总阅读146
粉丝0
内容964