本次活动聚焦大模型训练、推理优化、智能体框架与异构计算等前沿议题,吸引了百余名来自全国各地的 AI 研究者、工程师与技术爱好者,共同探索PyTorch全链路性能极限,为现场及线上开发者带来了一场深度技术盛宴。
# Opening:连接全球技术生态
PyTorch Ambassador 宗泽升在开场中介绍了PyTorch全球大使项目的蓬勃发展。目前37位大使遍布19个国家,共同推动PyTorch在学术与工业界的应用。他还预告了即将到来的PyTorch Conference 2025及培训认证计划,为开发者勾勒出PyTorch生态的全球图景与成长路径。
# DeepSpeed :大模型训练的工程基石
英特尔(中国)有限公司高级软件工程师同时也是DeepSpeed TSC Committer的马国凯率先开讲。他的议题DeepSpeed -- Scalable, Memory Efficient and High Throughput Distributed Large Foundation Model Training Engine系统性地介绍了 DeepSpeed 的核心技术架构的最新进展。从ZeRO内存优化到AutoTP自动张量并行,DeepSpeed正在通过抽象加速器接口构建跨硬件统一生态,让大模型训练变得更加高效和普惠。
# ROLL框架:智能体训练的系统级创新
# 昇腾推理优化:性能极致的工程实践
# torch_npu + aclGraph:软硬协同新范式
# FlagGems:通用算子的高性能解决方案
# 规模化加速人工智能:多元生态的加速实践

本次 Meetup 在热烈的技术交流氛围中圆满结束。六场演讲全面覆盖了从训练、推理、强化学习到底层算子、硬件适配的关键技术链条,展现了PyTorch 社区在推动 AI 工程创新方面的强大活力。
未来,PyTorch 社区将继续举办更多技术交流活动,携手开发者共建开放、合作、前沿的 AI 开源生态。
📌资料获取:演讲材料将在讲师授权后对外开放,敬请关注。
https://github.com/PyTorch-China/pytorch-meetup
▶️直播回放:
黄大年茶思屋
https://www.chaspark.com/#/live/1180963125778124800
PyTorch社区-B站
https://space.bilibili.com/439250344
📣 特别致谢:感谢所有讲师、组织者与参会者的支持!期待下期再会!

