点亮 ⭐️ Star · 照亮开源之路
精彩回顾
近期,国民乳业巨头伊利集团在社区线上 Meetup 上带来了《伊利集团基于 DolphinScheduler 的探索与实践》。
伊利集团数字化中心统筹推进全集团的数字化转型工作,姜涛及其团队在数字化中心负责大数据技术能力的建设以及相关的业务支持工作。在数据驱动转型的过程中,会存在海量的数据集成任务,整体集成架构的合理性、调度的稳定性会严重影响数据流转的效率,也会制约数据的价值挖掘,伊利基于 Apache DolphinScheduler 构建了统一的调度服务与数据集成体系,加速数据流转,助力企业数字化转型。
姜涛
伊利集团 数字化中心 数据技术经理
-
背景与应用情况介绍 -
实践&探索 -
未来的规划 -
关于开源的思考
1
背景与应用情况介绍
01
伊利介绍
02
应用背景介绍
-
应用的多云分布现状,使跨云的数据搬迁与多云统一调度成为刚需
-
统一技术架构来对抗熵增,降本增效
-
同类工具产品重复建设:因为缺少统一规划,导致同类功能产品存在重复建设。 -
技术选型杂:AirFlow、Azkaban、Oozie、 自研调度等。 -
建设及衍生成本高:多技术栈的人员资源储备、运维、使用培训等成本。 -
扩展性问题:本地化个性需求的扩展性支持。
03
伊利大数据调度服务平台定位&应用现状
-
伊利大数据调度服务平台系统总览
2
实践&探索
01
面向场景的数据集成
-
多种数据集成组件或技术让用户难以选择 -
技术架构不统一导致维护成本增加 -
数据集成任务配置繁琐 -
二次开发扩展性较差
-
只给用户一个最好的选择:多种选择往往无法选择,那干脆只提供一个最好的 -
基于 DataX 统一数据集成架构,优化资源问题,降低运维成本 -
面向业务应用时,通过模板生成器生成任务模板 ,简化操作 -
合理的代码设计
02
轻量化的资产管理
03
多云任务调度
04
监控看板优化
05
体验升级优化
3
未来规划
01
长期规划
-
多云统一:可以与去中心化的新型数据架构完美契合,这是一个非常重要的方向; -
低代码:从用户角度来说,可以支持全链路一站式可视化建模、开发、分析体验; -
智能化的管理:现在的数据架构基于降低数据管理复杂度为出发点,基于元数据驱动治理,实现数据质量管理智能化,也会是一个很大的命题。
02
短中期规划
-
云原生的结合:DolphinScheduler 社区已提供基于 k8S 部署服务,所以我们的 master、worker 等服将务基于容器化进行改造; -
引入测试、上线流程:在项目内添加开发者、审核者等角色,同时对上线动作进行管控,上线后元数据自动同步; -
质量模块:DolphinScheduler 3.0 已经加入了数据质量模块,我们将整合这一部分,并进行本地化拓展,包括对数据质量预定义、稽核,引入数据血缘等
4
开源的思考
参与贡献
随着国内开源的迅猛崛起,Apache DolphinScheduler 社区迎来蓬勃发展,为了做更好用、易用的调度,真诚欢迎热爱开源的伙伴加入到开源社区中来,为中国开源崛起献上一份自己的力量,让本土开源走向全球。
参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:
贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。
社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689
非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22
如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html
加入 Slack:https://join.slack.com/t/asf-dolphinscheduler/shared_invite/zt-1cmrxsio1-nJHxRJa44jfkrNL_Nsy9Qg
来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。
参与开源可以近距离与各路高手切磋,迅速提升自己的技能,如果您想参与贡献,我们有个贡献者种子孵化群,可以添加社区小助手微信(Leonard-ds) ,手把手教会您( 贡献者不分水平高低,有问必答,关键是有一颗愿意贡献的心 )。
添加小助手微信时请说明想参与贡献。
来吧,开源社区非常期待您的参与。
< 🐬🐬 >
更多精彩推荐
☞Apache DolphinScheduler PMC:我在社区里如何玩转开源?
☞ApacheCon Asia 2022 精彩回顾 | DolphinScheduler 在联想作为统一调度中心的落地实践
☞示例讲解 | Apache DolphinScheduler 简单任务定义及复杂的跨节点传参
我知道你在看哟!

