上周六,KCD 北京如约举办,活动现场汇聚了上百位开发者加入这场技术盛宴。
CloudPilot AI 的 Tech Lead 姜伟在 AI 专场以「高效 AI 基础设施:业务灵活弹性+云端 GPU 瞬时供应」为题进行分享,深入解析如何在公有云中结合 KServe 和 Karpenter,打造高性价比的企业级 AI 推理工作负载。
姜伟在 KCD Beijing 演讲现场
演讲内容
本次分享中,主要探讨了:
-
• AI 推理基础架构的典型场景和挑战 -
• 如何结合 KServe 和 Karpenter 解决复杂性及成本难题 -
• 如何利用 Karpenter 按需供应 GPU,以满足不同工作负载的需求
以下为本次演讲 PPT:
在近期即将在伦敦举办的 KubeCon 2025 上,也有 Karpenter 相关的演讲,将介绍如何通过 Karpenter 自动化 Kubernetes 集群更新,欢迎到现场交流!
推荐阅读
Karpenter + Spot 加持,助力 AKS 成本降低 80%
AWS 用户必看:网安独角兽如何用 Karpenter 削减 60% K8s 成本
项目介绍
Karpenter 于2021年11月推出并开源,是一款开源的Kubernetes集群自动扩缩容工具,专为优化 Kubernetes 集群的工作负载设计,旨在以灵活、高性能和简洁的方式实现节点的弹性扩展。今年9月已发布1.0版本。目前,Karpenter 已为全球超500家知名企业在生产环境中提供服务,包括阿迪达斯、Anthropic、Slack、Figma等。
Karpenter项目地址:
https://github.com/kubernetes-sigs/karpenter

