点击上方卡片,关注「CloudPilot AI」
5分钟,降低50%云成本
本周六,CloudPilot AI 受邀在 「KCD 北京站」以及「数据与AI新技术论坛」上分享大模型推理的降本提效策略。以下是活动信息:
KCD 北京站
KCD(Kubernetes Community Day)是由 CNCF 发起的系列线下技术沙龙。本期 KCD 重点关注 AI 和云原生两大主题,CloudPilot AI 的 Tech Lead 姜伟将与阿里巴巴云计算团队的主任工程师莫源一起,在 AI 专场以「高效 AI 基础设施:业务灵活弹性+云端 GPU 瞬时供应」为题进行分享。
以下是活动及演讲信息:
📅 活动日期:2025年3月15日(本周六)9:00 — 18:15
📍 活动地点:北京市海淀区魏公村路6号院丽金智地中心
ℹ️ 报名方式:扫描下方二维码即可完成活动报名
📃 活动议程:点击此处查看完整议程
演讲介绍
演讲主题:
高效 AI 基础设施:业务灵活弹性+云端 GPU 瞬时供应
演讲时间:
AI 专题会场 17:05—17:35
演讲摘要:
人工智能正加速改变全球格局,越来越多的企业纷纷入局,借助创新的 AI 解决方案优化甚至重塑社会运作方式。许多企业选择在公有云 Kubernetes 环境中运行 AI 推理工作负载,但如何高效调配不同类型的 GPU 资源,并根据需求动态扩展工作负载,仍然是一项复杂的挑战。
为了打造一套无需繁琐管理的 AI 推理基础架构,实现工作负载的自动扩展、成本优化、高效运行和资源最大化利用,我们在公有云中结合了 KServe 和 Karpenter。通过这一方案,我们探索出了管理企业级 AI 推理工作负载的最佳实践,实现无缝扩展和智能节点调度,让企业无需操心底层资源的复杂性,就能获得理想的计算性能。
在本次分享中,我们将探讨:
AI 推理基础架构的典型场景和挑战
如何结合 KServe 和 Karpenter 解决复杂性及成本难题
如何利用 Karpenter 按需供应 GPU,以满足不同工作负载的需求
现场福利
如果你在 KCD 现场,欢迎来 Karpenter 展桌打卡,我们准备了贴纸、冰箱贴以及弹性伸缩工具选型指南手册等小礼物。仅需参与展台互动,即可获取!
另外,如果您想了解更多有关优化 K8s 成本、提升资源利用效率,也欢迎到展桌来,与技术专家面对面交流,解锁最佳实践!
数据与AI新技术论坛
「数据与AI新技术论坛」是由上海开源信息技术协会发起的系列技术活动,聚焦三大维度:技术底层架构解析(如分布式训练框架、AI编译器优化)、前沿应用场景实践(智能决策系统、生成式AI工程化)、开发效能提升方案(MLOps全流程、低代码AI工具链)。
CloudPilot AI 高级工程师周仁天以「高效运行大模型:弹性扩缩容助力生产环境降本增效」为题进行分享。
以下是活动信息:
📅 活动日期:2025年3月15日(本周六)13:30—16:00
📍 活动地点:模速空间 1F 路演厅,上海市徐汇区龙台路 180 号 F2 幢 1 层
ℹ️ 报名方式:扫描下方二维码即可完成活动报名
📃 活动议程:点击此处查看完整议程
演讲介绍
演讲主题:
高效运行大模型:弹性扩缩容助力生产环境降本增效
演讲时间:
13:55 - 14:15
演讲摘要:
本次分享将以近期爆火的大模型 DeepSeek 为例,深入解析如何在云端实现私有化部署,确保数据安全的同时提升推理性能。
我们将结合实际操作,演示如何利用开源 K8s 节点自动弹性伸缩器 Karpenter,实现计算资源的丝滑扩缩容,智能匹配工作负载需求,从而大幅降低大模型的部署成本。
通过这一方案,企业和开发者最高可节省 85% 的云计算成本,让高效、低成本的大模型推理成为可能。
🌸 趁春光尚好,这周六来线下见面吧!
推荐阅读
CA 不够用了?Azure 推 Karpenter + Spot,让 AKS 便宜 80%!
逐层优化!网安独角兽如何在 AWS 上削减 60% 的 K8s 成本
公司介绍
CloudPilot AI 是一家全球领先的 Karpenter 托管云服务提供商,致力于通过智能化、自动化的云资源调度和编排技术,帮助企业最大化云资源利用率。我们秉持“让客户在云中花费的每一分钱都物超所值”的使命,为客户提升10倍的资源效率,同时将云成本降低50%以上。
目前,开源K8s弹性伸缩器 Karpenter 已为全球超500家知名企业在生产环境中提供服务,包括阿迪达斯、Anthropic、Slack、Figma等。CloudPilot AI 已为数十家全球顶尖科技公司提供服务,累计为客户节省超过30万美金,平均节省67%。 选择CloudPilot AI,让每一笔支出都更智慧。
免费试用,2步5分钟,降低50%云成本:
cloudpilot.ai

