-
数据驱动:我们仍然会凭直觉做决定,只不过现在我们会拿着图表一起做决定。 -
数据驱动:我们认真考虑了数据……真的。然后我们按照老板的要求做了。 -
数据战略:一份设计精美却略显浮夸的 60 页幻灯片演示文稿,它大胆地宣称数据的重要性,用 40 页的篇幅进行抽象的阐述,最后给出的路线图却完全无人遵循。 -
数字化转型:我们花费了数百万元将我们各自独立的混乱架构迁移到云端,并撰写了一篇精彩的帖子,几乎让我们相信我们成功了。 -
企业数据战略:一份非常严肃、令人印象深刻的文件,但无人问津,却能永存。 -
创新驱动:我们买了一个昂贵的工具,我们既不了解它,也不会使用它,而且也从来不需要它,但我们把它融入了我们的愿景中,并称之为“战略赋能”。 -
AI优先:我们在考虑数据之前就制作了PPT,在检查可行性之前就抛出了花哨的流行语,在忘记伦理道德之前就大肆宣传,这一切都是因为我们害怕落后。 -
自助式分析:我们构建了 200 个无人能懂的仪表盘,我们向所有人开放了访问权限,并告诉他们我们正在用数据赋能于他们,而现在,为了弥补我们的烂摊子,我们却指责用户“数据素养不足”。 -
单一数据源:我们宣布一个数据仓库凌驾于所有其他数据仓库之上,忽略了所有与之相矛盾的数据仓库,现在每个人都假装他们在查看相同的数据。 -
实时报告:它每 15 分钟更新一次,每小时都会崩溃一次,而且绝对没有人会用它来做决定,但是“实时”听起来对领导层来说很了不起。 -
数据湖:原始数据最终会在这里退役、腐烂,偶尔会在年终报告之前恐慌性地重新出现。 -
洞察力速度:产生洞察力的速度要快到人们无法忽略它们。 -
MVP(最小可行产品):它几乎无法运行,经常崩溃,但它“技术上可行”,所以我们称之为创新。 -
仪表盘:漂亮的图表,不可靠的数据,以及 20 个无人问津的筛选器,基本上就是一个陈旧指标的圣殿,我们每月打开一次来给领导留下深刻印象,然后就立刻忘记了。 -
人工智能伦理:我们曾就公平性和偏见问题达成过一项严肃的协议……但最终我们还是发布了该模型,因为它获得了不错的 F1 分数。 -
敏捷开发:我们将项目分解成多个迭代周期,这样我们就可以以更小、更频繁的方式错过截止日期。 -
北极星指标:一个神奇的数字,我们都假装它会指引我们,直到有人质疑它,然后我们悄悄地把它换成更闪亮的东西。 -
数据素养:一项旨在帮助所有人“理解数据”的崇高计划,却因资金不足、仓促完成且草率,最终以一份186页的学习管理系统(LMS)形式推出。然后,我们却指责员工在周一的董事会会议前没有完成学习。 -
云原生:一种委婉的说法,意思是“我们放弃了理解我们的基础设施,现在我们从 Azure 或 AWS 租用混乱”,同时还要支付一笔足以养活一个小国的月租费。 -
登月思维:完全无视预算、可行性和常识,带领一支几乎不懂 Excel 的团队,瞄准星辰大海。 -
高管仪表盘:精心挑选的一系列指标,让领导层以为一切正常,直到他们不小心点击了某个筛选器。 -
可操作的见解:我们把任何听起来足够聪明以至于可以忽略,但又足够模糊以至于可以转发的观察结果称为可操作的见解。 -
大数据:和普通数据完全一样,但现在它无处不在,增长迅速,破坏了我们的工具,而且如果没有上下文,它仍然大多无用,但听起来仍然很重要。 -
商业智能 (BI):这个术语曾经的意思是“帮助你了解你的业务的洞察”,现在主要指的是在做出决定几周后才出现的仪表盘。 -
数据科学:一半是统计学,一半是巫术,但大部分只是我们从 ChatGPT 逐字复制的脚本,同时假装理解模型刚刚做了什么。 -
数据工程:一群默默无闻的英雄,凌晨两点还在用胶带把管道粘在一起,而其他人早上都在吹嘘人工智能。 -
客户 360 度视图:我们从 12 个互不相连的系统中拼凑出不完整的数据,猜测其余部分,然后画个圈圈圈起来,就称之为“完整”。 -
接下来最佳行动:一种巧妙的艺术,即自信地猜测用户永远不会需要的产品,仅仅因为他们在中年危机期间点击过预算功能。 -
目标运营模式:一份 68 页的演示文稿,内容是“假设我们有无限的预算、完美的协调一致,并且没有人为干预,事情应该这样运作”。 -
负责任的人工智能:我们关心公平、道德和透明度……只要它速度快、有利可图,并且不会让我们被起诉,或者更糟的是,受到监管机构的制裁。
-
数据治理:一个非常崇高的梦想,即妥善管理数据,如今却被埋没在 139 份未读的政策文件和一个无人打开的 SharePoint 文件夹之下。 -
元数据管理:一种高尚的艺术,它能给我们几乎不理解的事物贴上标签,以便我们能够更精确地忽略它们。 -
数据沿袭:我们顺着数据轨迹追踪,发现了问题所在,最终发现这是一个上次更新于 2003 年的遗留系统。 -
基于角色的访问权限:要么您意外获得了完整的管理员权限,要么您根本无法打开任何一个控制面板。 -
访问控制:我们把所有东西都锁上了,忘了谁有钥匙,我们只是说“请向三位经理申请访问权限后再试”,而这三位经理从不查看电子邮件,而且自疫情爆发以来,他们的 MS Teams 状态一直显示为“不可用” 。 -
数据质量:我们在多个数据库中发现了缺失值、重复记录以及“Nigerai”的五种拼写方式, 因此我们认为数据质量足以用于报告,现在我们只能在情感上接受它了。 -
数据治理框架:本质上是一个设计精美但用心良苦的流程图,却被埋没在一个只有只读权限的 SharePoint 文件夹中。
-
Databricks:我们说我们使用Databricks。但我们真正的意思是,“我们即将花费九个月的时间假装我们了解集群,并编写‘中级’PySpark代码。” -
Power BI:我们创建了 200 个仪表板,其中 199 个相互矛盾,唯一不矛盾的那个仪表板也坏了,但它的切片器很漂亮,这就足够了。 -
Kubernetes:因为 Docker 还不够让人紧张。 -
Snowflake:我们迁移到 Snowflake 是为了获得更好的性能、更大的扩展性和云原生优势,现在却每天都在向财务部门解释账单。 -
Airflow:你的DAG会失败。你的重试也会失败。但至少图形视图看起来像现代艺术品,所以我们继续假装它运行正常。 -
Terraform:我们之前使用 Terraform 以代码形式配置基础设施。现在我们不敢再修改任何东西,因为一行错误的代码就可能删除生产环境。 -
dbt:将 SQL 的优雅与 Jinja 和 YAML 的混乱以及 19 种不同的文件夹结构结合起来,现在你的 SELECT 语句会让你焦虑不已。 -
大型语言模型:它无所不知,却又一无所知,并且会自信地解释如何用 JSON 烧开水。
-
可扩展架构:我们构建了一个可以处理数百万用户的系统。然后,为了应对从未出现的流量高峰,我们又添加了 19 层抽象层……因为我们实际的用户数量从未超过 28 个,而这些用户实际上只是我们自己在进行测试。 -
混合云:我们有云端,也有本地部署。现在我们有一些本地数据不想放到云端,而一些云端数据我们也有本地数据,但没人真正知道哪些数据存在哪里。 -
无服务器架构:他们说“只为使用的资源付费”,现在我们收到账单时却惊慌失措。 -
弹性计算:当你忘记设置限制时,它会自动扩展;只有当你的借记卡开始透支时,它才会缩减。 -
编排:听起来像亨德尔的歌,但实际上主要是 Airflow 和 Kubernetes 在 YAML 中互相吼叫,而所有东西都在凌晨 1 点悄无声息地崩溃。
往期推荐

