《使用 NVIDIA NIM 大规模部署 RAG 工作流》
新课发布
配有实战练习环境的在线自主培训
在现代企业商业智能化的发展中,检索增强生成(RAG)在大语言模型应用中的地位日益凸显。不仅能够显著提升企业内容创作与交互的智能化水平,还能在多个业务场景中实现精准信息抽取与高效内容生成。企业级的 RAG 应用需要应对巨大流量和大规模文档,从模型搭建到生产级部署具有很高的复杂度和参数量。
本课程探讨 RAG 工作流生产级部署的最佳实践。您将学习部署、监控、自动扩展、线上热更新的全工作流。为您在搭建部署过程中,降低试错成本,加速大模型应用落地。
课程时长:4 学时(课后 6 个月内可以继续访问课件,实验资源用量有限额)
课程语言:中文
工具、库、框架:NVIDIA NIMs、Kubernetes、Helm、Grafana、Prometheus
学习目标:
使用 Helm 和 NVIDIA RAG Operator 将 RAG 应用部署到 Kubernetes 集群上。
利用 NVIDIA NIM 实现可扩展的容器化 LLM 和嵌入模型。
连接、更新、添加和自动扩展应用组件。
使用 Prometheus 和 Grafana 监控应用性能。
课程大纲:
课程设置概述:熟悉课程的交互式环境、Kubernetes 设置,并了解课程所需的 Kubernetes 概念和命令。
基于 Kubernetes 的 RAG 应用部署:如何使用 Kubernetes 和 Helm 部署 RAG 工作流,以及如何在工作流中使用单个 NIM 服务。
监控:如何使用 DCGM 监控应用程序,以及如何配置和查看 Grafana 和 Prometheus。
自动扩展:基于自定义指标使用 HPA 自动扩展应用程序,并对应用程序进行负载测试。
自定义 RAG 工作流组件:替换应用组件,例如 LLM。
开始学习
-
扫描如下二维码或点击文末“阅读原文”,选择课程并点击 “开始学习”。
-
课程内容丰富,电脑端学习体验更佳。

如果您希望系统全面地精进 AI 开发技能和提升效率,请关注并报名定期举办的 NVIDIA AI 培训班
现在购买 5 个席位,立享 8 折优惠,立即报名锁定席位。
NVIDIA AI 培训班
7 - 11 月课程表
-
7 月 25 日:构建基于大语言模型(LLM)的应用
-
8 月 08 日:高效定制大语言模型(LLM)
-
8 月 22 日:构建基于扩散模型的生成式 AI 应用
-
9 月 05 日:深度学习基础 —— 理论与实践入门(升级版)
-
9 月 19 日:构建基于大语言模型(LLM)的应用
-
10 月 10 日:高效定制大语言模型(LLM)
-
10 月 24 日:构建大语言模型 RAG 智能体
-
11 月 07 日:构建基于扩散模型的生成式 AI 应用
新课持续发布,敬请关注!
报名 AI 培训班
-
扫描如下二维码,选择课程并点击“立即报名”
咨询企业专属培训,请微信联系 DLI 小助手 (微信号:NVIDIALearn)
NVIDIA 培训精选合辑
NVIDIA 培训 | 《构建大语言模型 RAG 智能体》前沿技能开课在即,立即报名
NVIDIA 培训 | 生成式 AI 与大语言模型(LLM)选课指南
NVIDIA 培训 | RAG 免费中文新课上线,快速领取学起来!
NVIDIA 培训 | 3 门免费课程开启生成式 AI 与大语言模型之旅
NVIDIA 培训 | DOCA 免费中文新课首发,获取数据中心开发加速技能
NVIDIA 培训 | 11 门 Omniverse 课程免费学,入门工业数字化应用开发
扫描下方海报二维码,查看 NVIDIA 培训 21 门免费基础入门课程列表,领取课程并开始学习。

