9大关键词玩转GTC大会！英伟达新GPU炸圈！Blackwell 推理性能飙升30倍！



9大关键词玩转GTC大会！英伟达新GPU炸圈！Blackwell 推理性能飙升30倍！

软积木

2024-03-19

导读：GTC大会于美国时间 3 月 18 日在圣何塞 SAP 中心开幕，软积木参会并从现场发来完整的干货报道。

GTC大会于美国时间 3 月 18 日在圣何塞 SAP 中心开幕，软积木参会并从现场发来完整的干货报道。

现场摄

Nvidia GTC 2024

英伟达首席执行官黄仁勋（Jensen Huang）上台发表了长达两个小时的主题演讲。在这次演讲中，他重点介绍了Blackwell B200 GPU，这款芯片在AI训练方面的性能达到了其前代产品的4倍，而在推理性能上更是飙升30倍。

在演讲的后半部分，黄仁勋进一步概述了英伟达在网络、高速AI互连、数据中心CPU、GPU、集群、边缘AI、机器人以及医疗保健等多个领域的新产品组合。这些新产品的推出为未来计算和应用领域的发展带来了无限可能。

Blackwell GPU

NVIDIA Grace Blackwell 在主题演讲中亮相。这种新的“AI超级芯片”包含2080亿个晶体管。然而，黄仁勋强调的不是处理器本身，而是新架构的可扩展性。黄仁勋展示了变体包括两个B200和一个Grace CPU。

通过Blackwell，NVIDIA带来了新的机密计算功能，包括业界首款支持可信执行环境（TEE）I/O的GPU，将TEE从CPU扩展到GPU。这确保了对私有数据的安全和快速处理，对于训练生成式人工智能至关重要。这一进步不仅保护了大型 AI 模型，还实现了机密的 AI 训练从而保护了 AI 中的知识产权。

除了规格本身之外，Nvidia还引入了许多新功能。例如，新芯片可以尽可能地在飞行中简化某些 AI 计算，使 AI 训练速度明显比以前快得多。这是重要的一步，因为训练过程LLMs可能需要数周时间，从而限制了人工智能的创新。所谓的“RAS引擎”充当安全检查，充当AI计算的“板载测试器”。此外，安全选项还提供了在静态、传输中和计算过程中加密数据的能力。

目前AWS，谷歌云，Microsoft Azure和甲骨文云等企业已经与Blackwell签约。

Nvidia Inference Microservice

为了更好地接收和操作软件，英伟达推出了一项新服务——NIM。Nvidia Inference Microservice（简称 NIM），提供数十种企业级生成式 AI 微服务。

这些服务允许企业在其平台上创建和部署自定义应用程序，优化对流行 AI 模型的推理，并使用 NVIDIA CUDA-X 微服务为各种应用程序增强开发。黄仁勋强调了这些微服务在将各行各业的企业转变为人工智能驱动的实体方面的潜力。

NIM可以通过新的 Nvidia.ai.com 中心下载和在任何地方使用，“这就是我们未来编写软件的方式，”——通过组装一堆人工智能。

量子模拟云

NVIDIA 还推出了量子模拟云服务，使研究人员能够探索各个科学领域的量子计算。该服务基于开源 CUDA-Q 平台，为构建和测试量子算法和应用程序提供了强大的工具和集成。与多伦多大学以及 Classiq 和 QC Ware 等公司的合作，展示了 NVIDIA 在加速量子计算创新方面所做的努力。

NVIDIA Blackwell HGX

采用Blackwell架构，NVIDIA更新了其HGX服务器和基板系列。与以前的模型相比，这种重大变化显著降低了总拥有成本，同时提高了性能。这种比较是惊人的——当 FP8 与 FP4 进行对比时，性能得到了4.5 倍提升。即使将 FP8 与其前身相匹配，性能也几乎翻了一番。这不仅关乎原始速度，这是内存效率的一次飞跃，展示了聚合内存带宽激增 8 倍。

第五代 NVLink 和 NVLink 交换机

第五代 NVLink 标志着高性能计算和 AI 领域的一个重要里程碑。该技术增强了 GPU 之间的连接和通信能力，这是 AI 基础模型快速发展需求的关键方面。第五代 NVLink 将其 GPU 连接容量提高到 576 个 GPU，比之前的 256 个 GPU 限制大幅增加。与前代产品相比，这种扩展与带宽翻了一番相结合，这对于日益复杂的基础 AI 模型的性能来说是一个关键的增强。

黄仁勋在GTC主题演讲中使用的一个重要术语是加速计算。通用计算已经过时了，“加速计算”是未来。它表明特定的工作负载需要的不仅仅是强大的 CPU，拥有数万个内核的 GPU 可以以闪电般的速度处理 AI 计算；这就是为什么英伟达，而不是英特尔、AMD或任何其他主要供应商，能够从GenAI的突然崛起的原因。

那么生成式人工智能还能为我们做些什么呢？后半场黄仁勋阐述了这些技术在产品中的使用。

Earth-2

首先是天气预报。极端天气给世界各国造成了数十亿美元的损失，英伟达今天推出了 Earth-2，Earth-2 云 API 将在 Nvidia DGX Cloud 上运行，向各种用户开放以创建高分辨率模拟。

他们使用一种名为 CorrDiff 的新型 Nvidia 生成式 AI 模型，该模型能够生成比当前数值模型高 12.5 倍的分辨率图像，速度快 1,000 倍，能源效率提高 3,000 倍，并纠正以前模型的不准确之处，汇集多个信息源以创建更准确和更有针对性的预测。

医疗保健

黄仁勋强调英伟达已经完成的大量工作，从成像到基因组学和药物发现。

如今，英伟达更进一步，为世界各地的研究人员构建模型，承担了大量背景工作，并使药物发现比以往任何时候都更快。

Omniverse

Omniverse被称为 Nvidia 的“灵魂”。黄仁勋说，机器人技术的“聊天GPT”时刻可能指日可待，英伟达希望跟上速度，并准备好在它到来时推出。“我们需要一个模拟引擎，以数字方式代表机器人的世界”这就是 Omniverse。

黄仁勋指出，我们今天将要看到的一切都是由英伟达自己的系统生成和模拟的。黄仁勋介绍了一个虚拟仓库的演示，该虚拟仓库将机器人和“人类”系统融合在一起，展示了该技术如何提高生产力和效率。

另外，NVIDIA 还展示了 Apple Vision Pro 在 Omniverse 中的工作，这将为苹果打开一个巨大的市场。

NVIDIA Drive Thor

在汽车行业，全球最大的自动驾驶汽车公司比亚迪未来电动汽车将搭载英伟达采用Blackwell架构新一代自动驾驶汽车（AV）处理器DRIVE Thor。Drive Thor预计最早将于明年开始量产，性能高达1000TFLOPS。

NVIDIA Jetson Thor 还用于更新机器人技术。NVIDIA正在做下一代能够控制人形机器人，也在为此构建一个软件堆栈。

另外针对机械臂，有一个新的SDK，Isaac Perceptor为这些项目提供更多的洞察力和智能。

黄仁勋与该公司提供动力的人形机器人一起登上舞台，其中包括来自迪士尼的小型机器人，这些机器人在 NVIDIA Isaac SIM 中学会了行走。

后续NVIDIA通过视频展示了这些人形机器人在现实世界中的运行。

END

ChatU.AI可免费申请试用，支持企业私有部署，多引擎AIGC操作系统安全稳定，点击下方公众号一键试用！

【声明】内容源于网络

软积木

🤖专注AI前沿干货分享 🌎AI原生应用触手可及·开启企业无限智能 💻官网：https://www.CubixAI.com 📮商务合作：BD@cubixai.com

内容 157

粉丝 0

软积木 🤖专注AI前沿干货分享 🌎AI原生应用触手可及·开启企业无限智能 💻官网：https://www.CubixAI.com 📮商务合作：BD@cubixai.com

总阅读92

粉丝0

内容157