大数跨境

AWS 成本优化实战:一次配置改动,立省 8000 元

AWS 成本优化实战:一次配置改动,立省 8000 元 云妙算
2025-09-11
2

点击上方卡片,关注「CloudPilot AI」

回复关键词【案例】

查看多邻国、Canva等名企的云上优化实践


你的 AWS 账单大部分是按使用量计费的,这本身没问题:用得多,付得多。使用量增加 50%,账单也会增加 50%。但最近我发现,情况出现了异常。


在这篇文章里,我分享了自己因为 AWS Config 导致账单持续增长的经历,以及一个降低 AWS Config 成本的小技巧。


在过去一年多的时间里,我每个月都会收到我们 AWS 账号的超出设置预算的告警。下图展示了2025年7月的告警:



很长一段时间以来,我都默认自己花的钱超过了多年前制定的预算。这个月开始,我调查了账单增长的原因,发现了一个有趣的现象。


01/

检查我的 AWS 账单


我使用 AWS Cost Explorer 来理解我的 AWS 开销。以下图表展示了过去一年的 AWS 成本:



正如我所说,AWS账单在一定程度上反映了工作负载的使用模式。作为近似值,我使用告警数量来核对服务使用情况与AWS账单之间的对应关系。



过去12个月内,警报数量增长了33%,从12万增至16万。AWS账单从350美元增至419美元,增幅达20%。乍看之下,这似乎是个好消息。


02/

调查成本飙升背后的真相


但仔细观察会发现,其中一项服务成本显著上升:AWS Config。



AWS Config 费用从6美元涨至90美元,涨幅达1400%。


03/

根本原因分析


幸运的是,AWS Cost Explorer 允许我按使用类型对 AWS Config 成本进行细分,很快就发现大部分费用都来自ConfigurationItemRecorded 这一使用类型。


我有两个问题需要了解:

1. 为什么记录的配置变更会这么多?

2. 如何才能减少被记录的配置变更?


我们把 AWS 的配置数据集中存储到一个 S3 Bucket 里,所以我用 AWS 提供的一些 Athena 查询跑了一遍,结果发现大部分变更都是由 AWS Fargate 引起的:


每次启动一个任务时,都会创建一个 ENI,这会记录 4 个变更(ENI、VPC、子网和安全组)。4 条 AWS Config 变更的费用是 0.012 美元,而运行一个 Fargate 任务 1 分钟(1 vCPU 和 2 GB 内存)只要 0.0008 美元。


换句话说,我在 AWS Config 上花的钱比跑 Fargate 还多(简直离谱 !)。


你可能会问,为什么非得用 AWS Config?答案很简单:我们的 ISO 27001 审计依赖 AWS Security Hub,而 AWS Security Hub 又依赖 AWS Config。


04/

AWS Config 成本优化


最后的问题是:怎么在不影响 Security Hub 的前提下,减少 AWS Config 记录的变更数量? 答案其实很简单:把记录频率从“实时”改成“每日一次”。


下面这段 CloudFormation 配置就能改记录频率:


ConfigurationRecorder:   Type'AWS::Config::ConfigurationRecorder'   Properties:     [...]     RecordingMode:       RecordingFrequency: DAILY


正如你所见,自 7 月 23 日调整配置后,我的 AWS Config 成本几乎降到了零。这项优化每月可节省约 90 美元,一年累计约 1080 美元,可谓是一次既有趣又值得投入时间的尝试。


05/

总 结


AWS Config 持续增加其记录的资源类型,因此账单金额也往往会随之增长。


此外,波动较大的工作负载会频繁创建和删除资源,而这些操作都会被 AWS Config 记录。例如,用 Auto Scaling Group 管理一组 Spot EC2 实例,或是前文提到的 Fargate 任务。


本文介绍的“将记录频率改为每日”方案,可以帮助你在资源变动频繁的 AWS 环境中有效降低 Config 成本。但需要注意以下几点:


  • 并非所有变更都能在每日记录模式下被捕捉到。幸运的是,我同时启用了 AWS CloudTrail,可完整记录所有 API 活动。

  • 每日模式下单条变更记录费用更高,每条 0.012 美元,相较实时模式的 0.003 美元贵了 300%。如果你的环境变动不大,反而可能增加成本。


其他降低成本小技巧,比如,如何通过脚本实现0成本的GitOps中K8s资源自动调优、如何以一半的成本部署大模型。欢迎点击下方卡片回复【技巧】获取。


推荐阅读

业务增长200%!CloudPilot AI 招销售,邀你共创高光时刻!

真实事故复盘:HPA配置失误如何让集群一夜损失400万元

实操Demo:数分钟降低 80% K8s 集群成本

公司介绍

CloudPilot AI,Your SRE Agent。致力于通过智能化、自动化的云资源调度和编排技术,数分钟即可降低 80% Kubernetes 成本。实现云基础设施的预测性优化与稳定性保障,帮助企业最大程度减少资源浪费。


我们秉持“让客户在云中花费的每一分钱都物超所值”的使命,已为数百家全球顶尖科技公司提供服务,累计为客户节省超过千万美金,平均节省67%。


目前,开源K8s弹性伸缩器 Karpenter 已为全球超500家知名企业在生产环境中提供服务,包括阿迪达斯、Anthropic、Slack、Figma等。选择CloudPilot AI,让每一笔支出都更智慧。


免费试用,2步5分钟,降低50%云成本:

cloudpilot.ai

【声明】内容源于网络
0
0
云妙算
让您在云中花费的每一分钱都物超所值
内容 0
粉丝 0
云妙算 让您在云中花费的每一分钱都物超所值
总阅读0
粉丝0
内容0