点击蓝字 关注我们
通知!
开源之夏 2023 学生报名已经正式开启!Apache DolphinScheduler 今年继续参与开源之夏的活动,2023 年 4 月 29 日-6 月 3 日 15:00 UTC+8,同学们可以在开源之夏官网 https://summer-ospp.ac.cn/ 找到 Apache DolphinScheduler 下的项目,挑选自己感兴趣的课题,通过项目相对应导师联系方式与导师沟通并准备申请资料,提交申请。
开源之夏 2023 介绍
奖金设置
活动流程
Apache DolphinScheduler社区介绍
-
高可靠性:去中心化的多Master和多Worker服务对等架构, 避免单Master压力过大,并采用任务缓冲队列来避免过载; -
简单易用:DAG监控界面让所有流程定义可视化,通过拖拽任务完成定制DAG,通过API方式与第三方系统集成, 一键部署; -
丰富的使用场景:支持多租户,支持暂停恢复操作. 紧密贴合大数据生态,提供Spark, Hive, M/R, Python, Sub_process, Shell等近20种任务类型; -
高扩展性:支持自定义任务类型,调度器使用分布式调度,调度能力随集群线性增长,Master和Worker支持动态上下线。
DolphinScheduler项目课题介绍
01
重构依赖任务模式
计划改造:
2、前端在依赖的地方增加个单选框,选择依赖任务或者工作流,如果选择依赖任务,任务的选择框显示出来,如果现在依赖工作流,任务的选择框隐藏
3、对于后端,All对于的任务code还是0,依赖工作流时,对应的任务code可使用-1或其他表示。
02
Dolphinscheduler master/worker
恢复容错优化
-
在容错恢复过程中,Shell节点能够正常获取其先前的运行状态。 -
在容错恢复过程中,Yarn 相关的任务能够正常获取其先前的运行状态。
-
熟悉 Linux 进程管理 -
理解 Hadoop Yarn 组件并且能根据官方文档快速学习使用相应API -
熟悉 Java 语言
03
pydolphinscheduler任务增加
minix机制
class Shell(Task):_task_custom_attr = {"raw_script",}ext: set = {".sh", ".zsh"}ext_attr: str = "_raw_script"def __init__(self, name: str, command: str, *args, **kwargs):self._raw_script = commandsuper().__init__(name, TaskType.SHELL, *args, **kwargs)
-
通过 minix 解决这个类似的问题 -
保证单元测试及覆盖率
-
了解 python 基础,对 OOP 有一定认识 -
了解 pytest 相关
04
数据源中心扩展成源中心
-
将 Datasource Center 的名称更改为 Connection Center。 -
重构部分AWS EMR、Zeppelin、K8S、Sagemaker任务插件,方便用户在连接中心管理外部连接。 -
去掉安全中心的Cluster Management和K8S Namespace Manage,因为管理K8S集群不是大数据编排工具的工作。用户可以在连接中心为 K8S 任务插件配置 K8S 连接。
-
[后端] 熟悉Java编程。 -
[后端] 对 Spring Boot Framework 有一定的了解。 -
[前端] 对VUE有所了解
05
增加跨工作流的参数传递功能
-
实现以上两个场景的需求,并将代码提交到开发分支上 -
详细的设计文档以及使用文档 -
详尽的UT测试类
-
熟悉 Java 语言 -
熟悉 spring boot -
可以实现简单的前端效果
06
DolphinScheduler Listener机制
-
完成Listener机制设计和开发、并将代码提交到开发分支上 -
详细的设计文档和使用文档 -
详尽的UT测试类
-
熟悉Java语言 -
熟悉SpringBoot
参与贡献
随着国内开源的迅猛崛起,Apache DolphinScheduler 社区迎来蓬勃发展,为了做更好用、易用的调度,真诚欢迎热爱开源的伙伴加入到开源社区中来,为中国开源崛起献上一份自己的力量,让本土开源走向全球。
参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:
贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。
社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689
非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22
如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html
来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。
参与开源可以近距离与各路高手切磋,迅速提升自己的技能,如果您想参与贡献,我们有个贡献者种子孵化群,可以添加社区小助手微信(Leonard-ds) ,手把手教会您( 贡献者不分水平高低,有问必答,关键是有一颗愿意贡献的心 )。

添加社区小助手微信(Leonard-ds)
添加小助手微信时请说明想参与贡献。
来吧,开源社区非常期待您的参与。
汽车行业走在了数字化革命浪潮的前列。大数据和 AI 技术的日益成熟,让汽车行业面对着动辄上百万的日活数据,二调度系统助力汽车数字化平台数据调度重塑着未来汽车的面貌,其重要作用不言而喻。
Apache DolphinScheduler 作为国内外多家知名车企数据平台的核心调度系统,它是如何帮助车企迎接数字化时代新挑战的?如何辅助重塑未来汽车的新面貌?欢迎大家关注即将到来的 Apache DolphinScheduler 汽车行业最佳应用实践专场直播!
直播时间:2023 年 5 月 23 日 19:00-21:00
预约方式:点击预约,视频号直播不见不散!

