大数跨境
0
0

NVIDIA 2026 校园招聘 | 加入我们,成为构建未来计算架构的新生代力量

NVIDIA 2026 校园招聘 | 加入我们,成为构建未来计算架构的新生代力量 NVIDIA企业开发者社区
2025-11-17
1
导读:NVIDIA 历代架构以科学家名字命名NVIDIA 专注于每一代产品的架构设计,构思软硬件协同解决方案,分析

NVIDIA 历代架构以科学家名字命名


NVIDIA 专注于每一代产品的架构设计,构思软硬件协同解决方案,分析前沿 AI 模型性能,探索下一代产品的无限可能。


想象一下,您正站在科技的前沿,参与构建改变世界的架构。从计算架构到 TPC 架构,我们的团队像一支技术先锋队,致力于将复杂的计算变得简单而高效。每一次的架构创新,都是一次探索未知的冒险。现在,我们邀请你加入这个充满激情与创造力的团队,一起探索未来的无限可能!


NVIDIA 中国计算架构团队众多校招职位正在热招中,我们诚邀优秀的应届毕业生加入我们,成为构建未来计算架构的新生代力量,与 NVIDIA 一起共同推动科技的边界!


团队介绍



Deep Learning And Compute Arch(计算架构团队)历经 CUDA 并行编程模型从起步至今的所有阶段,参与了几乎所有的通用 GPU 计算架构的研发工作,集成了无数计算架构团队伙伴们的智慧。


我们不同的分支团队专注于各自领域,携手创造出令人惊叹的技术成果。每个团队都在推动前沿技术的发展,致力于解决复杂的计算挑战。


想知道他们在具体从事哪些工作,以及你的背景和技能是否与之匹配吗?我们将为你揭秘,帮助你更好地了解每个团队的独特使命和机遇。


TensorRT


TensorRT 团队主要负责设计和开发可扩展到多个平台的强大推理软件,并对重要模型进行性能分析和优化。


团队紧跟 AI 领域的学术进展和业界 AI 推理服务与应用部署中的实际需求,设计,开发和更新 TensorRT 的功能。


成功密码:C++ 编程、深度学习框架、LLM、生成模型、推荐模型


TensoRT LLM


TensoRT LLM 团队是基于软硬协同以及模型联合优化的设计理念,推进 LLM 推理性能的技术边界。


团队工作支撑公司内外重点核心场景,包括但不限于 MLPerf, SemiAnalysis InferenceMax, ArtificialAnalysis, CSP 以及 AI start-up 客户;同时推进当代主流硬件上的大模型推理性能全栈优化,以及深度参与未来架构的演进探索。


成功密码:大模型场景的推理优化、模型系统联合优化


DL Complier


DL Complier 团队基于 MLIR 技术栈,开发 NVIDIA GPU 上面向不同层级应用场景的深度学习编译系统,包括代码生成系统、运行时、领域编程语言、算子调优等。


团队的工作作为基础编译系统支撑公司内外重点核心 AI 场景的算子开发任务;推进从上层编程模型到底层编译系统的全链路优化设计,深度参与未来软硬系统架构的演进探索。


成功密码:深度学习编译器、AI 工作负载


LLM Post-Train


LLM Post-Train 团队负责持续迭代 NeMo RL 的特性,性能优化以及 bug 修复;跟进 LLM RLHF 的算法,在 NeMo RL 中实现;支持新的 GPU 硬件架构以及在 RLHF 框架中优化相关性能;支持新的应用场景,例如 Agentic RL, VLM 等。


LLM Post-Train 团队基于 NVIDIA 自研高性能与 scalable 的 RLHF 框架、跟随前沿 RL 算法、实现算法与系统高度结合。


成功密码: LLM 推理框架与优化技巧与原理,FSDP 或 Megatron LM 强化学习算法,分布式计算


cuDNN


cuDNN 团队的工作核心在于开发和优化 NVIDIA 的 cuDNN 深度学习加速库,重点是 GPU 架构下的高性能计算与深度神经网络支持。团队中的工程师们将参与大模型推理性能优化、API 与架构设计、GPU 内核开发,并在跨团队协作中支持多种 AI 应用场景。


团队位于 NVIDIA AI 软件栈核心,是支撑 LLM、自动驾驶、计算机视觉等关键应用的基础设施团队。加入该团队能直接影响全球最前沿的 AI 技术落地,并有机会与顶尖 GPU 架构师和深度学习专家密切合作。


成功密码:GPU 编程与优化,性能分析与调优,机器学习或深度学习,编译器开发


DL Compute


DL Compute 团队(Performance Modelling, Analysis, Projection Optimization)主要负责构建并开发推理算子原型,建立算子硬件架构性能模型,预测 NVIDIA 下一代产品的性能分析,优化算子在现有产品和最终大模型上应用的性能并且探索下一代架构特性。


在 DL Compute 团队工作能深度参与所有 NVIDIA 的 GPU 和 SOC 芯片架构设计,从 Volta, Ampere, Hopper, Blackwell, Rubin 等 GPU 架构,到 Orin, Thor 等 SOC 芯片,并延伸至推理引擎库(TRT、TRT-LLM、cuDNN 等)的全链路追踪,最终探索下一代架构的未来特性。


成功密码:软硬件性能分析、编程模型、CUDA、AI 编译技术、主流 LLM 框架


无论你对以上哪个领域感兴趣,我们的团队都能为你提供广阔的发展空间与挑战。


期待你的加入,与我们一起开创计算架构的未来!


 面向人群 


电子工程、计算机工程等相关专业 

2026 届本科、硕士、博士应届毕业生(校招岗位)

2027 届本科、硕士、博士全日制在读学生(实习岗位)


 工作地点 


上海、北京


 计算架构组申请方式 


2026 届校园招聘岗位 | 扫码立即投递

2026 春季实习生岗 | 扫码立即投递


学长分享:

从计算架构到世界第八高峰马纳斯鲁



2025 年 9 月 23 日,NVIDIA 上海计算架构团队的 Xiaolei Shi 将印有“Speed of Light”的绿色条幅带上马纳斯鲁峰(8163米)顶峰。这位从清华 GPU 编程爱好者成长为架构工程师的攀登者,用 12 个月“目标分解法”训练计划征服 8000 米级雪山。Xiaolei 指出,攀登高峰与 NVIDIA 文化高度契合 —— 目标的升级迭代、第一性原理聚焦瓶颈、团队协作信任贯穿始终。


更多校招、实习生岗位持续热招中,扫描以下二维码或点击“阅读原文”投递吧!



加入 NVIDIA,你将收获



  • 与行业领袖并肩工作的机会

  • 参与改变世界的项目

  • 持续的职业发展和海量学习资源

  • 有竞争力的薪酬和福利

  • 全方位的健康保障项目

  • ESPP 员工购股计划


NVIDIA 致力于创建具有多元化与包容性的工作场所,我们欢迎多元背景的人才加入!

【声明】内容源于网络
0
0
NVIDIA企业开发者社区
NVIDIA 开发者社区是 NVIDIA 企业级 GPU 开发者交流平台,通过此平台可第一时间获取 NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。
内容 964
粉丝 0
NVIDIA企业开发者社区 NVIDIA 开发者社区是 NVIDIA 企业级 GPU 开发者交流平台,通过此平台可第一时间获取 NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。
总阅读146
粉丝0
内容964