大数跨境

Apache DolphinScheduler 工作流卡死,怎么解决?

Apache DolphinScheduler 工作流卡死,怎么解决? 海豚调度
2025-12-08
2
导读:根据以往处理经验,只有一种可能。



点击蓝字 关注我们





Apache DolphinScheduler 有时候可能会出现工作流卡死问题:


  • 工作流显示运行状态(小齿轮一直转),但进入工作流查看各任务实例却是没有运行的状态。工作流执行时间超时严重,有的甚至达到几天都执行不完。

  • 工作流显示运行状态,进入工作流,各子工作流也显示运行状态,但再进入子工作流,各任务实例其实已经运行完了,此时子工作流卡节点死不动一直运行状态,下一个节点也不调起。持续很久都不结束。


解决

思路


发生这种情况,根据以往处理经验,只有一种可能:那就是 Apache DolphinScheduler 操作 MySQL 数据库超时了,MySQL 出现了死锁、事务超时、查询时间长等,导致 Apache DolphinScheduler 状态与数据库不同步了。工作流也无法继续下去。


解决

方案


一般 Apache DolphinScheduler 数据库操作超时,就会卡住,有的会卡在调数据库前,有的是会卡在调数据库后,对数据库基本是写操作。卡住咱们也没法,只能保证数据库能用了,然后再重试之前的操作。


我们一般采用如下方案:


  1. 查看 Apache DolphinScheduler MySQL 数据库的工作流定义、任务定义、工作流实例、任务实例等表进行简单的更新操作是否存在超时/锁表等问题。

  2. 如果 MySQL 没问题

    1. 可以查看前后端状态是否一致,不一致可以人工修改库强制改成一致的,让流程继续下去。

    2. 如果状态一致,可以杀死工作流,手工删除工作流实例,然后重启补数调度。

  3. 如果 MySQL 有问题

    1. 是否查询慢更新慢,查看 MySQL 机器是否资源不够了。

    2. 是否无法查询或更新,发生了锁表,通过show processlist,看哪些数据库连接连接时长很长,尤其是那些sleep的,将该连接kill掉“kill processid”。processid是show processlist执行后列表的第一列。


通过上面的解决方案,大体能解决绝大部分问题。有问题评论区大家可以一起沟通。


原文链接:https://blog.csdn.net/f4vinny/article/details/155012377





用户案例



天翼云Zoom网易邮箱 
每日互动 惠生工程  作业帮 
博世智驾 蔚来汽车 长城汽车
集度长安汽车思科网讯
食行生鲜联通医疗联想
新网银行唯品富邦消费金融 
自如有赞伊利当贝大数据
珍岛集团传智教育Bigo
YY直播  拈花云科太美医疗
Cisco Webex兴业证券




迁移实战



Azkaban   Ooize(当贝迁移案例)
Airflow (有赞迁移案例)
Air2phin(迁移工具)
Airflow迁移实践



发版消息




Apache DolphinScheduler 3.2.2版本正式发布!
Apache DolphinScheduler 3.2.1 版本发布:增强功能与安全性的全面升级
Apache DolphinScheduler 3.3.0 Alpha发布,功能增强与性能优化大升级!




加入社区



关注社区的方式有很多:

  • GitHub: https://github.com/apache/dolphinscheduler
  • 官网:https://dolphinscheduler.apache.org/en-us
  • 订阅开发者邮件:dev@dolphinscheduler@apache.org(向邮箱发送任意内容,收到邮件后回复同意订阅即可)
  • X.com:@DolphinSchedule
  • YouTube:https://www.youtube.com/@apachedolphinscheduler
  • Slack:https://join.slack.com/t/asf-dolphinscheduler/shared_invite/zt-1cmrxsio1-nJHxRJa44jfkrNL_Nsy9Qg

同样地,参与Apache DolphinScheduler 有非常多的参与贡献的方式,主要分为代码方式和非代码方式两种。

📂非代码方式包括:

完善文档、翻译文档;翻译技术性、实践性文章;投稿实践性、原理性文章;成为布道师;社区管理、答疑;会议分享;测试反馈;用户反馈等。

👩‍💻代码方式包括:

查找Bug;编写修复代码;开发新功能;提交代码贡献;参与代码审查等。

贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。

社区汇总了以下适合新手的问题列表https://github.com/apache/dolphinscheduler/pulls?q=is%3Apr+is%3Aopen+label%3A%22first+time+contributor%22

优先级问题列表https://github.com/apache/dolphinscheduler/pulls?q=is%3Apr+is%3Aopen+label%3Apriority%3Ahigh

如何参与贡献链接https://dolphinscheduler.apache.org/zh-cn/docs/3.2.2/%E8%B4%A1%E7%8C%AE%E6%8C%87%E5%8D%97_menu/%E5%A6%82%E4%BD%95%E5%8F%82%E4%B8%8E_menu

如果你❤️小海豚,就来为我点亮Star吧!

https://github.com/apache/dolphinscheduler


你的好友秀秀子拍了拍你

并请你帮她点一下“分享”

【声明】内容源于网络
0
0
海豚调度
Apache DolphinScheduler是一个分布式、去中心化、易扩展的可视化DAG工作流任务调度系统,其致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。
内容 0
粉丝 0
海豚调度 Apache DolphinScheduler是一个分布式、去中心化、易扩展的可视化DAG工作流任务调度系统,其致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。
总阅读0
粉丝0
内容0