本篇 Cloudberry 孵化报告总结了我们在 2025 年 5 月到 7 月的主要进展。本文改编自 2025 年 8 月的英文版《Apache Cloudberry 孵化器报告》(https://cwiki.apache.org/confluence/display/INCUBATOR/August2025),译文较原文有所删改以适合博文展示。
关于 Apache Cloudberry
Cloudberry 是一款先进且成熟的开源大规模并行处理(MPP)数据库,源自 Pivotal Greenplum Database®️的开源版本,但基于更现代的 PostgreSQL 内核构建,使 Cloudberry 非常适合数据仓库、大规模分析和 AI/ML 工作负载。
Cloudberry 自 2024-10-11 起开始孵化。
在毕业前需要解决的三个最重要未完成问题:
-
按照 ASF 发布流程发布第一个 Apache 版本。 -
扩大贡献者和社区规模,以确保长期可持续性。
自上次报告以来,社区发展情况如何?
-
邮件列表活动:自上次报告以来,开发邮件列表(Dev)新增 221 封邮件,涉及技术和 Apache 相关讨论。 -
Slack 活动: general 频道新增 15 个新主题,自上次报告以来新增 5 名成员。 -
GitHub 讨论:自上次报告以来新增 16 个新主题。 -
新入选 Committer: -
2025 年 5 月 21 日 - Wenchao Zhang(zhangwenchao-123) -
2025 年 7 月 9 日 - Xun Gong(gongxun0928) -
活动: -
《Community Over Code Asia 2025》:本次会议有六场关于 Cloudberry 的演讲,涵盖 AI、数据仓库、OLAP 和孵化器主题,现场设有一个 Cloudberry 展位。 -
《HOW2025:PostgreSQL & IvorySQL 生态会议》:PPMC 成员 Dianjin Wang 和 Max Yang 参加了此次会议,并向观众布道介绍 Apache Cloudberry。 -
PPMC 成员 Tushar Pednekar 进行了关于 Apache Cloudberry 的 10 分钟 T3D 主题演讲,主持人是 Joshua Drake:https://youtu.be/0mPCoEXG0XU -
PPMC 成员 Tushar Pednekar 在新加坡《Flink Forward Asia 2025》大会上进行了关于 Cloudberry + Flink 技术结合的演讲:https://www.youtube.com/watch?v=K9d572vOvNY -
由贡献者 @Leonid Borchuk 和 PPMC 成员 @Kirill Reshke 在 sql-ninja 会议的演讲回顾视频发布:https://www.youtube.com/watch?v=lMYqOoE4p5A
自上次报告以来,项目发展情况如何?
-
ASF 开源合规治理: -
将 greenplum_path 重命名为 cloudberry-env.sh 以更好地符合 ASF 规则,目前已在主分支生效,并将在 2.1 版本中正式推出。 -
更新 Apache RAT 的匹配规则,适配最新的源码文件变更情况。 -
将 PAX 的 cpp-stub 从子模块更改为子目录以避免引入二进制文件。 -
将 configure 参数 --with-pythonsrc-ext 启用时所需要的 Python 模块,从直接搭载源码包改为在构建过程中通过 curl 命令下载的方式进行。 -
正在准备 Apache Cloudberry (Incubating) 2.0.0 版本: -
已经完成了 RC1 和 RC2 阶段,并解决了一些许可证问题,将进行 RC3 阶段用于 Dev 邮件列表投票和 Apache 孵化器邮件列表投票。 -
PostgreSQL 内核升级:社区开发者已启动从 PG 14.4 到 PG 16.9 的内核升级工作,可参见 https://lists.apache.org/thread/1b5sr96315txsvs1zg65vsd1n01kf0ql。 -
自上次报告以来,主分支新增了 130 次提交,主要集中在性能改进、错误修复和新功能上。 -
生态与周边: -
Apache SeaTunnel 在其最新 2.3.11 版本中为 Apache Cloudberry 添加了官方连接器支持(参见 https://s.apache.org/baj30) -
Flink JDBC 连接器 v3.3.0+ 开始支持 Cloudberry -
主仓库 GitHub 已获得 1k+ GitHub Star!
最后一位 Committer 或 PPMC 成员的选举时间?
-
2025 年 5 月 21 日 - Wenchao Zhang(zhangwenchao-123,Committer) -
2025 年 7 月 9 日 - Xun Gong(gongxun0928,Committer)
附:Apache Cloudberry 孵化报告(202503-202504)
在毕业前需要解决的三个最重要未完成问题:
-
完成源代码清理以确保符合 ASF 规范。 -
按照 ASF 发布流程发布第一个 Apache 版本。 -
扩大贡献者和社区规模,以确保长期可持续性。
自上次报告以来,社区发展情况如何?
-
邮件列表活动:2025 年 3 月和 4 月,开发邮件列表上分别有 59 条和 92 条消息,内容涵盖技术和与 Apache 相关的话题。 -
Slack 活动: general 频道新增 16 个话题,自上次报告以来新增 27 名成员。 -
GitHub 讨论:3 月新增 4 个话题,4 月新增 7 个话题。 -
新 Committer:欢迎自加入孵化器以来的第一位 Committer。 -
2025 年 3 月 19 日 - Xiong Tong -
活动: -
加入开源之夏 OSPP 2025,吸引大学生参与开源开发。 -
由 HashData 在杭州举办的 Cloudberry Meetup 吸引了 30~ 名参会者。 -
贡献者@Leonid Borchuk 和 PPMC 成员@Kirill Reshke 于 2025 年 3 月 22 日在莫斯科的 sql-ninja 会议上发表了关于 Cloudberry 的演讲。 -
PPMC 成员 Shine Zhang 于 2025 年 3 月 20 日在美国奥兰多举行的《Postgres Conference 2025 》上发表了题为《从 Greenplum 到 Apache Cloudberry》的演讲。 -
6+ 个 Cloudberry 演讲提案已提交至 Community Over Code Asia 2025 大会(仍在审核中,等待最终批准)。 -
创建网站新页面,指导如何邀请新贡献者。
自上次报告以来,项目发展情况如何?
-
在 GitHub 创建 Wiki 空间,整理来自社区实践的知识,包括发布流程。 -
安全: -
CICD: -
正在为 Cloudberry 添加 Ubuntu 构建和测试环境支持。 -
代码库更新: -
通过 GitHub 项目进行 Pull Request 管理:https://github.com/orgs/apache/projects/490 -
根据路线图演进 Cloudberry 代码:将行列混合存储引擎-PAX 贡献回 Cloudberry 代码库; -
完成了从开源 Greenplum 项目 cherry-pick 部分 commit 到 Cloudberry 的第一阶段(总完成度为 80%以上)。 -
为首个 Apache Cloudberry(Incubating)2.0.0 版本发布启动准备工作 -
许可证相关更新: -
更新 NOTICE 和 LICENSE 文件。 -
在 licenses 目录下列出第三方许可证。 -
用与许可证兼容的 ruff 替换 Pylint。 -
将 Cloudberry 社区新创建文件的许可证文件头更新为 Apache 许可证文件头。 -
添加 RAT 许可证审计配置和合规元数据。 -
品牌更新:在主代码库和网站源代码中,将旧名称 Cloudberry Database 全部升级为最新的 Apache Cloudberry 品牌。 -
清理源代码中遗弃和不再使用的文件,确保代码库更加清爽,并满足 ASF 的要求(移除concourse/* 、 hd-ci/* 、 deploy/* 等)。
最后一位提交者或 PPMC 成员的选举时间?
-
2025 年 3 月 19 日 - Xiong Tong (committer) 👇🏻️扫码加入 Apache Cloudberry交流群👇🏻️


