什么是 Delta Lake 表结构？——Microsoft Fabric 背后的“聪明仓库”

Power Bi World

2025-09-22

导读：Delta Lake 是 Microsoft Fabric 中用来存储 Lakehouse 表数据的“聪明结构”，它不仅能存数据，还能记住你做过的所有操作，支持时间回溯、数据更新、版本控制，简直就是数

🧠 一句话先说清楚：

Delta Lake 是 Microsoft Fabric 中用来存储 Lakehouse 表数据的“聪明结构”，它不仅能存数据，还能记住你做过的所有操作，支持时间回溯、数据更新、版本控制，简直就是数据仓库里的“黑匣子”。

📦 Delta Lake 是什么？和 Parquet 有啥关系？

很多人一听就懵：“Lakehouse、Data Lake、Delta Table、Parquet……到底啥是啥？”

来，咱们捋一捋：

你可以理解为：

🧱 Parquet 是砖头， 🏠 Delta Lake 是房子，房子里不仅有砖头，还有门窗、电路、结构图。

🔍 Delta Lake 有哪些“聪明功能”？

FactInternetSales/├── _delta_log/│   ├── 00000.json│   ├── 00001.json├── part-00000.parquet├── part-00001.parquet

每次你更新数据，系统会：

以下是 OneLake 中表格数据的样子。

FactInternetSales 是 Lakehouse 中的一个表。它的所有数据都存储在一个同名文件夹中，该文件夹中包含 parquet 文件以及 _delta_log 文件夹。_delta_log 文件夹的内容如下所示：

您还可以使用 Lakehouse Explorer 和查看文件选项来查看 Lakehouse 表的 Delta Lake 结构。

有两种方式：

系统自动用 Delta Lake 结构，不用你操心。

df = spark.read.csv("路径")df.write.mode("overwrite").format("delta").save("Tables/Sales")

这样就能把 CSV 数据转成 Delta 表。

比如你想查 2024 年 4 月 28 日的数据快照：

df_old = spark.read.format("delta").option("timestampAsOf", "2024-04-28").load("Tables/FactInternetSales")

这就像穿越回过去，看看那时候的数据长啥样。

Fabric 会自动帮你做这些事：

你也可以手动触发这些命令。

Delta Lake 是 Microsoft Fabric Lakehouse 表背后的“聪明仓库”，它结合了 Parquet 的高效存储和数据库的事务能力，支持时间旅行、审计日志、数据更新等功能，是做数据分析、建模和数据治理的强力工具。

【声明】内容源于网络

Power Bi World

探索Power Bi知识以及Power Platform Form 的其他知识分享！

内容 130

粉丝 0

Power Bi World 探索Power Bi知识以及Power Platform Form 的其他知识分享！

总阅读90

粉丝0

内容130