两个平台,两张条形图。其中一个显然更便宜。
有人自豪地说:
这是供应商在幻灯片上以粗体显示的唯一成本。
但这也是90%错误决策的开始。
我的一位从事零售业的同事曾经告诉我,“我们正在迁移到平台 X——它的运行成本比我们目前的平台便宜 40%。”
理论上他们“节省”了 40%,但在计划外的计算上却多付出了 80% 的代价。
一家消费品公司在其平台上构建了数据湖,但该平台本身并不支持增量更新。
每天晚上,他们都要重新处理数 TB 的数据,只是为了更新几条记录。
当我们询问原因时,一位工程师回答道:
一家全球零售商将其整个仓库都建在专有格式上。
当他们的AI团队想要在Databricks中进行实验时,发现无法直接读取这些数据。
因此,他们将PB级数据复制到Parquet等开放格式中。
当被问及原因时,数据架构师叹了口气说:
封闭的系统就像粘人的前任,不愿放手你的数据。
一位金融客户自豪地展示了他们的“自动化”数据提取框架。
当我问到它失败的频率时,首席工程师回答道:
今天看似完美的东西,明天就可能成为瓶颈。
而是“以后进化会有多痛苦?”
一家电信公司将其所有分析功能都构建在 GCP 原生服务上,因为这些服务是免费的。
两年后,他们想在 AWS 上运行工作负载以服务新市场——结果却发现他们的整个堆栈都绑定在一个云平台上。
当 GDPR 和 CCPA 合规成为强制性要求时,采用去中心化、硬编码数据管道的公司需要花费数月时间构建手动退出和删除流程。而采用集中式治理和元数据目录的团队则在数周内完成了这项工作。
第二个团队则将治疗环节融入到他们的架构中。
正因如此,高TCO系统不仅会损害预算,还会损害增长。
一家零售商希望实现现代化的个性化服务,这需要可靠的实时消费者数据。
如果底层数据模型碎片化或速度缓慢,无论人工智能水平如何,都无法挽救它。
当你优化总体拥有成本时,你优化的是公司的整体稳健性。
在比较数据平台时,问题不应该是“谁更便宜?”,而应该问“谁更可持续、更可互操作、更赋能?”
第二个是生活。

