不卷算力卷效率|HAMi Meetup 将以上海为系列活动的开源协作始发站,响应行业对高效算力调度解决方案的需求,搭建技术实践与经验共享的交流平台。本次活动将在模速空间举办,由 HAMi 社区和密瓜智能主办,CNCF(云原生计算基金会)特别支持。
活动现场,CNCF、密瓜智能、沐曦股份、蔚来、DaoCloud 道客、星环科技将齐聚现场进行主题分享,共同探索异构算力调度的高效解法,在思维碰撞中破解算力资源浪费难题,实现不卷算力卷效率!
欢迎 AI 技术开发者、运维工程师、企业 IT 架构师、云厂商、硬件厂商技术负责人及产品专家、金融、智驾、物流、生物科技等行业数字化转型负责人、开源技术爱好者及相关领域研究者等报名参与!
活动信息
活动时间:2025 年 11 月 30 日 13:30-18:00
活动地点:上海・徐汇区龙台路 180 号 F2 栋 2 层 模速空间科创金融综合服务平台
活动报名:扫描下方图片二维码即可免费报名参与,席位有限,先到先得
立即扫码报名
HAMi 简介
活动亮点速览
现场惊喜满满:面对面探讨异构算力调度最优解,解锁不卷算力卷效率的核心密码!现场还设置抽奖环节,欢迎参与互动赢取惊喜周边!
嘉宾阵容,实战干货抢先看
重磅开场嘉宾:
Keith Chan:Vice President, The Linux Foundation APAC China Director, CNCF
核心议题分享
《HAMi 2.7.0 版本解读与 2.8.0 版本 Roadmap:异构芯片全适配与调度能力跨越式升级》
密瓜智能 李孟轩
密瓜智能联合创始人 & HAMi maintainer。清华大学计算机系硕士,专注于云原生以及异构算力领域,擅长云原生架构,GPU 虚拟化和异构算力管理,发表过 4 篇与云原生算力相关的专利,与信通院合作撰写《云原生 AI 技术架构白皮书》。
这次将为我们讲解 HAMi 聚焦异构算力管理痛点,介绍 HAMi 2.7.0版本关键升级,涵盖多厂商芯片全流程支持、调度器优化及 WebUI 可视化实践;以及 2.8.0 版本roadmap 披露,展现 HAMi 版本对资源利用率与调度效率的提升价值。
《MetaX sGPU on HAMi》
沐曦股份 郭磊
MetaX sGPU 核心贡献者。专注于面向 AI 场景的 Kubernetes 调度器研发工作,在 scheduling framework、Volcano、HAMi 等调度框架上有丰富的实践经验。
随着AI算力需求激增,GPU 资源利用率不足和碎片化成为关键挑战。本次分享将介绍 MetaX sGPU 如何借助 HAMi 异构调度框架实现 GPU 共享调度,并详细解析sGPU 的核心架构与强大的功能特性,包括细粒度共享、Qos 策略、在离线混部,以及整卡场景的拓扑感知调度。
《基于 vGPU 的 mlperf》
蔚来 李鹏
李鹏,蔚来云端工程部训练加速负责人,深耕异构算力集群管理与 AI 训练性能优化,拥有大规模 GPU 集群落地经验。主导蔚来云端 vGPU 方案设计落地,聚焦 AI 训练效率与成本优化,在 GPU 虚拟化、性能诊断等领域成果丰硕,方案已应用于自动驾驶核心业务,解决资源利用率低、性能瓶颈难定位问题。
本次分享聚焦 “基于 vGPU 的 AI 训练性能优化框架”,结合 HAMi 技术底座,拆解蔚来大规模 AI 训练场景的性能诊断与效率提升实践。框架依托 HAMi vGPU 的无侵入特性,拦截 GPU 全链路行为调用生成函数日志,无需修改代码即可实时分析 AI 任务。技术上,基于日志构建多维度分析体系,量化算力与显存效率、还原执行时间线、挖掘调度瓶颈,还能捕获异常 API 调用;产品层面实现 “底层瓶颈定位 + 上层代码溯源” 闭环诊断。目前已适配蔚来自动驾驶训练,针对多模态模型等场景提供优化建议,助力提升任务效率、降低集群资源浪费,适配工业级 AI 训练需求。
《HAMi:让开源 GPU调度赋能 d.run 的 AI 开发者》
DaoCloud 道客 卢传佳
「DaoCloud 」道客产品负责人,资深的云原生及 AI 平台产品架构师与布道师,拥有 10+ 年云计算与 AI 实战经验。
这次将为我们深入介绍 HAMi——一款开源的异构设备虚拟化调度中间件——如何成为 d.run 平台背后的关键能力支撑。HAMi 通过标准化 GPU 资源的虚拟化、配额管理与调度接口,使得异构资源(GPU、NPU 等)能在 Kubernetes 环境中以更高的粒度灵活编排。
《星环 x 国产算力生态:适配实践》
星环科技 侯雨希
星环科技人工智能产品部 AI - 工具平台研发,负责为星环 LLMOps 平台提供底层 GPU 算力管理、服务调度、配额管理等能力。
本分享将介绍星环 LLMOps 在国产算力生态中的适配实践,包括扩展 HAMi 调度器以支持寒武纪多型号混合部署,深度修复开源海光 dcu-vgpu-device-plugin 与 Exporter。同时简要解析国产算力场景下 DRA 的资源抽象与调度挑战,展示星环构建统一异构算力调度体系的技术路径。
Meetup议程全公开

