点击上方卡片,关注「CloudPilot AI」
回复关键词【案例】
查看多邻国、Canva等名企的云端降本实践
2026 年 6 月 15 日 — CloudPilot AI——为要求最严苛的团队打造的 Kubernetes 弹性伸缩平台——今日宣布正式支持 Google Cloud。运行 Google Kubernetes Engine(GKE)的团队现在可以将集群接入 CloudPilot AI,以消除云资源浪费、增强工作负载韧性、降低 Google Cloud 账单——接入用的是只读 Agent,几分钟即可完成,不触碰任何敏感数据,也不改动集群配置。
此次发布把 CloudPilot AI 已在 AWS 上获得众多企业信任的优化能力延伸到了 Google Cloud,让 GKE 用户也能用上平台标志性的即时节点供给、工作负载 rightsizing 与预测式 Spot 处理。Azure 将在第三季度支持。
01/
你的集群每分钟都在损失数百万
You see the waste. You know JVMs need tuning. You'd run Spot if you trusted it. 这是三个你的团队叫得出名字、却始终顾不过来的问题:
- 浪费——看得见,却很难持续保持利用率。
75% 的集群 CPU 处于闲置。但要把它收回来,需要持续不断的调优,而没人有时间做。 - 调优——每一次配置失误都会变成一次事故。
Heap 给小了就 OOM,Limits 卡太紧就 throttling。两者都是可知的,但在规模化场景下都没人去修。 - Spot——没人愿意为这份风险负责。
省 70% 是真的,但没人能预测它什么时候被回收。
CloudPilot AI 正是为自动闭合这三道缺口而生:把你看得见的浪费真正收回来、把你知道该做的调优真正落地、把你想要的 Spot 折扣拿到手,却无需任何人去背这份风险。
02/
由 Karpenter 的维护者亲手打造
在这件事上,CloudPilot AI 有着独一无二的位置:团队本身就是 karpenter-provider-gcp 的构建者和维护者——正是这个开源项目,把 Karpenter「即时、无节点组」的节点供给模型带到了 Google Cloud。同一批工程师,也是 CNCF 生态里 Karpenter 本身的联合创始人与维护者。
换句话说,为 GCP 打造 CloudPilot AI 的人,就是写出它所依赖的那层开源地基的人。论对 Karpenter on Google Cloud 的理解,没有人比我们更深。
「我们不是『拿来』了 Karpenter for GCP——我们在开源社区里亲手构建并维护它。这让我们对节点供给在 Google Cloud 上的真实行为,有着别人不具备的洞察。CloudPilot AI 把我们维护开源版积累的全部经验,沉淀成了一层智能弹性伸缩能力,让生产级 GKE 集群既跑得稳、又跑得省。」
—— Jingkang Jiang,CloudPilot AI 联合创始人兼 CEO
03/
相比开源版多了什么
karpenter-provider-gcp 为 GKE 用户提供了强大、灵活的弹性伸缩地基。CloudPilot AI 在它之上,叠加了一层具备上下文感知能力的自动化能力——把开源版单独使用时仍然甩给你自己处理的那些生产难题接管下来:
- 韧性
CloudPilot AI 会等到替换节点 Ready、Pod 确认 Running 之后才终止旧节点(优雅交接);默认就为多副本负载强制 anti-affinity、至少分散到 2 台节点;并把负载分散到多个机型族( e2、n2、n2d、c2d、t2d)和多个可用区——让任何单一 Spot 容量池或可用区都不会成为单点故障。 - Workload Autoscaler, 把 Java 当作一等公民。
持续分析真实用量,实时调整 CPU/内存 requests,在 consolidation 时既消除过度预留、又规避 OOM 风险。针对 Java,CloudPilot AI 超越了常规的资源调优:它会把 JVM Heap 行为与垃圾回收纳入考量——这正是 VPA 类方案力不从心之处——并对 Heap 做 rightsizing(支持 HeapDrift 处理与 JVM 参数 mutation),让 Java 服务既跑得精简,又不会 OOM 或出现 GC 退化。 - 更快的扩缩容:镜像 lazy loading + P2P。
CloudPilot AI 用两种方式加速镜像拉取,让扩缩容与节点替换更快: lazy loading 让容器在所需镜像层可用时就能启动(无需等待完整镜像下载完成); P2P 分发 让新节点优先从集群内附近节点获取镜像层,而不是每次都从远端镜像仓库拉取。两者结合,节点上线显著更快——扩缩容能跟上流量变化,节点交接也更平滑。 - 完整可观测性。
节点级事件历史(创建 / 删除 / 替换,每条都附状态与原因),外加实时看板呈现开销、事件与成本趋势——而不是散落各处的命令行日志。
04/
几分钟接入你的 GKE 集群
接入一个 GKE 集群只需一条脚本。CloudPilot AI 的 Agent 是只读的——它无法访问你的敏感数据,也绝不改动集群配置。在控制台里选择 GKE,在 Cloud Shell 或终端里运行给出的命令,CloudPilot AI 就会立即开始优化。
访问 cloudpilot.ai 接入你的第一个 GKE 集群。
推荐阅读
全球抢 GPU,Kubernetes 却闲置?看 DRA 如何让算力按需飞
别了,EC2 Auto Scaling!AWS 2025 变革信号背后的行业真相
公司 GPU 还在 “摸鱼” 吗?这项Kubernetes 技术或许能帮你节省百万算力成本
公司介绍
CloudPilot AI 是一家总部位于旧金山硅谷的科技公司。致力于彻底变革云基础设施的管理方式
我们秉持“为全世界最严苛的团队自动扩展Kubernetes集群”的使命,已为数百家全球顶尖科技公司提供服务,累计为客户节省超过5亿美金,平均节省67%。
免费试用,2步5分钟,降低50%云成本:
cloudpilot.ai

