大数跨境

本周六京沪双城,与CloudPilot AI共探大模型推理的降本之道

本周六京沪双城,与CloudPilot AI共探大模型推理的降本之道 云妙算
2025-03-11
0
导读:CloudPilot AI 受邀在 「KCD 北京站」以及「数据与AI新技术论坛」上分享大模型推理的降本提效策略。

点击上方卡片,关注「CloudPilot AI」

5分钟,降低50%云成本


本周六,CloudPilot AI 受邀在 「KCD 北京站」以及「数据与AI新技术论坛」上分享大模型推理的降本提效策略。以下是活动信息:


KCD 北京站


KCD(Kubernetes Community Day)是由 CNCF 发起的系列线下技术沙龙。本期 KCD 重点关注 AI 和云原生两大主题,CloudPilot AI 的 Tech Lead 姜伟将与阿里巴巴云计算团队的主任工程师莫源一起,在 AI 专场以「高效 AI 基础设施:业务灵活弹性+云端 GPU 瞬时供应」为题进行分享。


以下是活动及演讲信息:


📅 活动日期:2025年3月15日(本周六)9:00 — 18:15

📍 活动地点:北京市海淀区魏公村路6号院丽金智地中心

ℹ️ 报名方式:扫描下方二维码即可完成活动报名

📃 活动议程:点击此处查看完整议程

演讲介绍

演讲主题:

高效 AI 基础设施:业务灵活弹性+云端 GPU 瞬时供应


演讲时间:

AI 专题会场 17:05—17:35


演讲摘要:

人工智能正加速改变全球格局,越来越多的企业纷纷入局,借助创新的 AI 解决方案优化甚至重塑社会运作方式。许多企业选择在公有云 Kubernetes 环境中运行 AI 推理工作负载,但如何高效调配不同类型的 GPU 资源,并根据需求动态扩展工作负载,仍然是一项复杂的挑战。


为了打造一套无需繁琐管理的 AI 推理基础架构,实现工作负载的自动扩展、成本优化、高效运行和资源最大化利用,我们在公有云中结合了 KServe 和 Karpenter。通过这一方案,我们探索出了管理企业级 AI 推理工作负载的最佳实践,实现无缝扩展和智能节点调度,让企业无需操心底层资源的复杂性,就能获得理想的计算性能。


在本次分享中,我们将探讨:

  • AI 推理基础架构的典型场景和挑战

  • 如何结合 KServe 和 Karpenter 解决复杂性及成本难题

  • 如何利用 Karpenter 按需供应 GPU,以满足不同工作负载的需求


现场福利

如果你在 KCD 现场,欢迎来 Karpenter 展桌打卡,我们准备了贴纸、冰箱贴以及弹性伸缩工具选型指南手册等小礼物。仅需参与展台互动,即可获取!


另外,如果您想了解更多有关优化 K8s 成本、提升资源利用效率,也欢迎到展桌来,与技术专家面对面交流,解锁最佳实践!


数据与AI新技术论坛


「数据与AI新技术论坛」是由上海开源信息技术协会发起的系列技术活动,聚焦三大维度:技术底层架构解析(如分布式训练框架、AI编译器优化)、前沿应用场景实践(智能决策系统、生成式AI工程化)、开发效能提升方案(MLOps全流程、低代码AI工具链)。


CloudPilot AI 高级工程师周仁天以「高效运行大模型:弹性扩缩容助力生产环境降本增效」为题进行分享。


以下是活动信息:


📅 活动日期:2025年3月15日(本周六)13:30—16:00

📍 活动地点:模速空间 1F 路演厅,上海市徐汇区龙台路 180 号 F2 幢 1 层

ℹ️ 报名方式:扫描下方二维码即可完成活动报名

📃 活动议程:点击此处查看完整议程

演讲介绍

演讲主题:

高效运行大模型:弹性扩缩容助力生产环境降本增效


演讲时间:

13:55 - 14:15


演讲摘要:

本次分享将以近期爆火的大模型 DeepSeek 为例,深入解析如何在云端实现私有化部署,确保数据安全的同时提升推理性能。


我们将结合实际操作,演示如何利用开源 K8s 节点自动弹性伸缩器 Karpenter,实现计算资源的丝滑扩缩容,智能匹配工作负载需求,从而大幅降低大模型的部署成本。


通过这一方案,企业和开发者最高可节省 85% 的云计算成本,让高效、低成本的大模型推理成为可能。


🌸 趁春光尚好,这周六来线下见面吧!


推荐阅读

CA 不够用了?Azure 推 Karpenter + Spot,让 AKS 便宜 80%!

逐层优化!网安独角兽如何在 AWS 上削减 60% 的 K8s 成本

一文消除大数据处理的资源浪费,实现 90% 成本降低

公司介绍

CloudPilot AI 是一家全球领先的 Karpenter 托管云服务提供商,致力于通过智能化、自动化的云资源调度和编排技术,帮助企业最大化云资源利用率。我们秉持“让客户在云中花费的每一分钱都物超所值”的使命,为客户提升10倍的资源效率,同时将云成本降低50%以上。


目前,开源K8s弹性伸缩器 Karpenter 已为全球超500家知名企业在生产环境中提供服务,包括阿迪达斯、Anthropic、Slack、Figma等。CloudPilot AI 已为数十家全球顶尖科技公司提供服务,累计为客户节省超过30万美金,平均节省67%。 选择CloudPilot AI,让每一笔支出都更智慧。


免费试用,2步5分钟,降低50%云成本:

cloudpilot.ai

【声明】内容源于网络
0
0
云妙算
让您在云中花费的每一分钱都物超所值
内容 104
粉丝 0
云妙算 让您在云中花费的每一分钱都物超所值
总阅读112
粉丝0
内容104