大数跨境
0
0

Apache Cloudberry 孵化报告(202505-202507)

Apache Cloudberry 孵化报告(202505-202507) ApacheCloudberry
2025-08-20
4
导读:本篇 Cloudberry 孵化报告总结了我们在 2025 年 5 月到 7 月的主要进展。

本篇 Cloudberry 孵化报告总结了我们在 2025 年 5 月到 7 月的主要进展。本文改编自 2025 年 8 月的英文版《Apache Cloudberry 孵化器报告》(https://cwiki.apache.org/confluence/display/INCUBATOR/August2025),译文较原文有所删改以适合博文展示。

关于 Apache Cloudberry

Cloudberry 是一款先进且成熟的开源大规模并行处理(MPP)数据库,源自 Pivotal Greenplum Database®️的开源版本,但基于更现代的 PostgreSQL 内核构建,使 Cloudberry 非常适合数据仓库、大规模分析和 AI/ML 工作负载。

Cloudberry 自 2024-10-11 起开始孵化。

在毕业前需要解决的三个最重要未完成问题:

  1. 按照 ASF 发布流程发布第一个 Apache 版本。
  2. 扩大贡献者和社区规模,以确保长期可持续性。

自上次报告以来,社区发展情况如何?

  • 邮件列表活动:自上次报告以来,开发邮件列表(Dev)新增 221 封邮件,涉及技术和 Apache 相关讨论。
  • Slack 活动: general 频道新增 15 个新主题,自上次报告以来新增 5 名成员。
  • GitHub 讨论:自上次报告以来新增 16 个新主题。
  • 新入选 Committer:
    • 2025 年 5 月 21 日 - Wenchao Zhang(zhangwenchao-123)
    • 2025 年 7 月 9 日 - Xun Gong(gongxun0928)
  • 活动:
    • 《Community Over Code Asia 2025》:本次会议有六场关于 Cloudberry 的演讲,涵盖 AI、数据仓库、OLAP 和孵化器主题,现场设有一个 Cloudberry 展位。
    • 《HOW2025:PostgreSQL & IvorySQL 生态会议》:PPMC 成员 Dianjin Wang 和 Max Yang 参加了此次会议,并向观众布道介绍 Apache Cloudberry。
    • PPMC 成员 Tushar Pednekar 进行了关于 Apache Cloudberry 的 10 分钟 T3D 主题演讲,主持人是 Joshua Drake:https://youtu.be/0mPCoEXG0XU
    • PPMC 成员 Tushar Pednekar 在新加坡《Flink Forward Asia 2025》大会上进行了关于 Cloudberry + Flink 技术结合的演讲:https://www.youtube.com/watch?v=K9d572vOvNY
    • 由贡献者 @Leonid Borchuk 和 PPMC 成员 @Kirill Reshke 在 sql-ninja 会议的演讲回顾视频发布:https://www.youtube.com/watch?v=lMYqOoE4p5A

自上次报告以来,项目发展情况如何?

  • ASF 开源合规治理:
    • 将 greenplum_path 重命名为 cloudberry-env.sh 以更好地符合 ASF 规则,目前已在主分支生效,并将在 2.1 版本中正式推出。
    • 更新 Apache RAT 的匹配规则,适配最新的源码文件变更情况。
    • 将 PAX 的 cpp-stub 从子模块更改为子目录以避免引入二进制文件。
    • 将 configure 参数 --with-pythonsrc-ext 启用时所需要的 Python 模块,从直接搭载源码包改为在构建过程中通过 curl 命令下载的方式进行。
  • 正在准备 Apache Cloudberry (Incubating) 2.0.0 版本:
    • 已经完成了 RC1 和 RC2 阶段,并解决了一些许可证问题,将进行 RC3 阶段用于 Dev 邮件列表投票和 Apache 孵化器邮件列表投票。
  • PostgreSQL 内核升级:社区开发者已启动从 PG 14.4 到 PG 16.9 的内核升级工作,可参见 https://lists.apache.org/thread/1b5sr96315txsvs1zg65vsd1n01kf0ql。
  • 自上次报告以来,主分支新增了 130 次提交,主要集中在性能改进、错误修复和新功能上。
  • 生态与周边:
    • Apache SeaTunnel 在其最新 2.3.11 版本中为 Apache Cloudberry 添加了官方连接器支持(参见 https://s.apache.org/baj30)
    • Flink JDBC 连接器 v3.3.0+ 开始支持 Cloudberry
  • 主仓库 GitHub 已获得 1k+ GitHub Star!

最后一位 Committer 或 PPMC 成员的选举时间

  • 2025 年 5 月 21 日 - Wenchao Zhang(zhangwenchao-123,Committer)
  • 2025 年 7 月 9 日 - Xun Gong(gongxun0928,Committer)

附:Apache Cloudberry 孵化报告(202503-202504)

在毕业前需要解决的三个最重要未完成问题:

  1. 完成源代码清理以确保符合 ASF 规范。
  2. 按照 ASF 发布流程发布第一个 Apache 版本。
  3. 扩大贡献者和社区规模,以确保长期可持续性。

自上次报告以来,社区发展情况如何?

  • 邮件列表活动:2025 年 3 月和 4 月,开发邮件列表上分别有 59 条和 92 条消息,内容涵盖技术和与 Apache 相关的话题。
  • Slack 活动: general 频道新增 16 个话题,自上次报告以来新增 27 名成员。
  • GitHub 讨论:3 月新增 4 个话题,4 月新增 7 个话题
  • 新 Committer:欢迎自加入孵化器以来的第一位 Committer。
    • 2025 年 3 月 19 日 - Xiong Tong
  • 活动:
    • 加入开源之夏 OSPP 2025,吸引大学生参与开源开发。
    • 由 HashData 在杭州举办的 Cloudberry Meetup 吸引了 30~ 名参会者。
    • 贡献者@Leonid Borchuk 和 PPMC 成员@Kirill Reshke 于 2025 年 3 月 22 日在莫斯科的 sql-ninja 会议上发表了关于 Cloudberry 的演讲。
    • PPMC 成员 Shine Zhang 于 2025 年 3 月 20 日在美国奥兰多举行的《Postgres Conference 2025 》上发表了题为《从 Greenplum 到 Apache Cloudberry》的演讲。
    • 6+ 个 Cloudberry 演讲提案已提交至 Community Over Code Asia 2025 大会(仍在审核中,等待最终批准)。
    • 创建网站新页面,指导如何邀请新贡献者。

自上次报告以来,项目发展情况如何?

  • 在 GitHub 创建 Wiki 空间,整理来自社区实践的知识,包括发布流程。
  • 安全:
    • 集成两个代码分析工具以提升代码质量并识别开发过程中的潜在问题:Coverity Scan 和 SonarQube Scan。
    • 修复 PostgreSQL 安全问题 CVE-2025-1094。
  • CICD:
    • 正在为 Cloudberry 添加 Ubuntu 构建和测试环境支持。
  • 代码库更新:
    • 通过 GitHub 项目进行 Pull Request 管理:https://github.com/orgs/apache/projects/490
    • 根据路线图演进 Cloudberry 代码:将行列混合存储引擎-PAX 贡献回 Cloudberry 代码库;
    • 完成了从开源 Greenplum 项目 cherry-pick 部分 commit 到 Cloudberry 的第一阶段(总完成度为 80%以上)。
    • 为首个 Apache Cloudberry(Incubating)2.0.0 版本发布启动准备工作
  • 许可证相关更新:
    • 更新 NOTICE 和 LICENSE 文件。
    • 在 licenses 目录下列出第三方许可证。
    • 用与许可证兼容的 ruff 替换 Pylint。
    • 将 Cloudberry 社区新创建文件的许可证文件头更新为 Apache 许可证文件头。
    • 添加 RAT 许可证审计配置和合规元数据。
  • 品牌更新:在主代码库和网站源代码中,将旧名称 Cloudberry Database 全部升级为最新的 Apache Cloudberry 品牌。
  • 清理源代码中遗弃和不再使用的文件,确保代码库更加清爽,并满足 ASF 的要求(移除concourse/* 、 hd-ci/* 、 deploy/* 等)。

最后一位提交者或 PPMC 成员的选举时间?

  • 2025 年 3 月 19 日 - Xiong Tong (committer)

    👇🏻️扫码加入 Apache Cloudberry交流群👇🏻️

【声明】内容源于网络
0
0
ApacheCloudberry
ASF 孵化项目,领先的开源 MPP 数据库,可用作数据仓库,并适用于大规模分析和 AI/ML 工作负载,本账号由 PPMC 成员维护
内容 24
粉丝 0
ApacheCloudberry ASF 孵化项目,领先的开源 MPP 数据库,可用作数据仓库,并适用于大规模分析和 AI/ML 工作负载,本账号由 PPMC 成员维护
总阅读28
粉丝0
内容24