大数跨境

精通Quartz:Java中的时间管理与任务调度专家

精通Quartz:Java中的时间管理与任务调度专家 海豚调度
2023-12-20
1
导读:Quartz,一个在Java应用中无可替代的时间管理与任务调度库,以其独特的功能和灵活性广受开发者青睐。

|阮文俊

编辑整理 曾辉

Quartz,一个在Java应用中无可替代的时间管理与任务调度库,以其独特的功能和灵活性广受开发者青睐。

得名于“石英”,Quartz不仅象征着时间的精确性,也体现了其在任务调度领域的核心地位。本文将深入剖析Quartz的内部工作原理和最佳实践,帮助开发者更好地理解和运用这一强大的库。

Quartz的核心特性

作为库的身份

不同于独立部署的应用程序,Quartz以库(library)的形式存在,方便地嵌入到任何Java应用中。

专为Java设计

作为一个纯Java编写的库,Quartz专门服务于Java生态系统,与Java应用的集成无缝且高效。

灵活的部署能力

从单机应用到大型分布式系统,Quartz均能提供稳定的任务调度支持。

低依赖性

Quartz的设计注重独立性,几乎不依赖外部的框架或库,确保了其高度的自给自足。

Quartz的实现机制

关键组件

  • Job: 表示任务本身,包括任务名称、组别及其具体执行逻辑。
  • Trigger: 定义任务触发规则,例如执行的频率和条件。
  • Scheduler: 调度器,负责安排和执行Job。

使用流程

  1. 创建Scheduler: 通过工厂方法初始化Scheduler实例。
  2. 配置任务: 将Job与相应的Trigger配置到Scheduler中。
  3. 启动调度: 激活Scheduler以开始任务的执行。

特别提示

尽管未启动的Scheduler不执行任务,但其内部线程仍会持续轮询,这是其设计上的一种谨慎考虑。

与SpringBoot的集成

在SpringBoot环境下,Quartz展现了更高的灵活性和便利性:

  • 参数传递方式: 在Spring环境中,Quartz的Job不仅可以通过Map接收参数,还可以直接注入Spring容器管理的对象。
  • 任务调度灵活性: 支持多种Trigger配置,可实现从简单到复杂的各类调度需求。

总体而言,Quartz为Java应用带来了强大而灵活的任务调度能力,无论是简单的单次任务还是复杂的分布式定时任务,都能轻松应对。

高级特性

Corn Trigger

Quartz广泛应用的Corn Trigger允许通过Cron表达式定义复杂的调度规则,实现精细化的任务调度。这种灵活性使Quartz成为处理定时任务的首选工具

日历触发器

除了Corn Trigger,Quartz还支持基于日历的触发器,提供更多样化的调度选项,满足特定时间安排的需求。

触发器与作业依赖关系

在Quartz中,触发器(Trigger)与作业(Job)的关系是核心设计。一种常见的设计模式是一对一关系,其中一个Trigger对应一个Job。这种设计简化了调度逻辑,并提高了容错能力。

集群支持

Quartz通过集群支持提升执行效率,尤其在大规模的应用场景中表现突出。集群模式允许多个应用实例共同参与任务调度,优化资源利用。

Quartz架构

部署模型

Quartz设计为嵌入式库,可以轻松集成到Java应用中。其核心依赖于作业存储(Job Store),并支持多实例部署。

核心模块

Quartz的代码结构简洁,主要由核心模块和少量扩展模块组成。核心模块不仅代码量适中,而且由专人维护,保证了代码质量和一致性。

监听器

Quartz提供两种类型的监听器:作业监听器和调度器监听器。这些监听器可以回调状态变化,如作业执行情况和调度器状态,为外部监控和日志记录提供便利。

架构组件

Quartz的架构可分为以下几个主要部分:

  • 监听器(Listeners): 用于监控作业和调度器的状态变化。
  • 调度器(Scheduler): 调度器是Quartz的心脏,负责任务调度和执行。
  • 触发器(Triggers): 定义任务的触发规则。
  • 作业(Jobs): 表示具体的任务实现。
  • 作业存储(Job Stores): 存储作业和触发器的信息。

通过这些组件,Quartz能够提供灵活而强大的任务调度解决方案,适应从简单到复杂的各种业务场景。

核心类:QuartzSchedulerThread

QuartzSchedulerThread是Quartz的心脏,负责轮询数据库,查找当前可执行的Trigger。由于数据库本身不会主动推送数据,Quartz采用拉取方法,即定期查询数据库以确定任务执行的时机。

SimpleThreadPool

SimpleThreadPool是Quartz的线程池实现,用于执行Job。与常见的线程池不同,它没有等待队列。线程池的大小直接决定了可以并行执行的任务数量。若所有线程都在忙,新的Trigger必须等待直到有空闲线程。

触发器与作业关系

Quartz中,Trigger与Job的关系是一对一的。一个Trigger只能对应一个Job,而一个Job可以有多个Trigger。这种设计简化了调度过程,确保了系统的容错性。

集群模式

Quartz的集群模式旨在提高任务执行效率。通过数据库锁,保证同一时刻只有一个实例可以访问特定Trigger。这种机制在系统规模庞大时显示其优势,通过集群部署,不同实例可以并行处理任务。

触发器状态处理

Trigger状态的处理是Quartz调度过程中的关键环节。一旦Trigger被触发,它会被标记为“已获取(Acquired)”,并生成一个Trigger实例表示任务正在执行。任务完成后,该实例会被删除,从而无法追踪历史执行记录。

调度流程

步骤1:触发器检索

首先,Quartz会查询数据库,确定当前可执行的Trigger列表。这一步涉及到复杂的SQL查询,考虑到执行时间和状态。

步骤2:触发器处理

处理步骤包括设置Trigger状态为“已获取”,并在数据库中创建相应的Trigger实例。

步骤3:任务执行

将Trigger关联的Job提交到线程池进行执行。

步骤4:触发器实例清理

任务执行完成后,对应的Trigger实例将被删除,这意味着无法从数据库中追溯任务的历史执行。

总结

Quartz的核心类和工作机制共同构成了一个高效且灵活的任务调度系统。尽管Quartz在设计上注重简洁和性能,但它的确切实现细节和架构选择显示出其在处理复杂任务调度场景中的强大能力。

总的来说,Quartz作为Java中的时间管理与任务调度专家,提供了一套全面且高效的解决方案,以应对各种复杂的调度需求。其灵活的配置选项、与SpringBoot的无缝集成以及强大的集群支持,使其在Java应用中的任务调度领域独树一帜。

对于希望提高应用效率、优化资源分配和扩展应用功能的Java开发者而言,掌握Quartz的使用无疑是提升开发能力的关键步骤。


用户实践案例


奇富科技  蜀海供应链 联通数科 拈花云科

蔚来汽车 长城汽车 集度 长安汽车

思科网讯 生鲜电商 联通医疗 联想

新网银行 消费金融  腾讯音乐 自如

有赞 伊利 当贝大数据

联想 传智教育 Bigo

通信行业




迁移实践


Azkaban   Ooize   

Airflow (有赞案例) Air2phin(迁移工具)


Airflow迁移实践

参与Apache DolphinScheduler 社区有非常多的参与贡献的方式,包括:


贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。

社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689

非新手问题列表:https://github.com/apache/dolphinscheduler/issues?
q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22

如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html

来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。

【声明】内容源于网络
0
0
海豚调度
Apache DolphinScheduler是一个分布式、去中心化、易扩展的可视化DAG工作流任务调度系统,其致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。
内容 667
粉丝 0
海豚调度 Apache DolphinScheduler是一个分布式、去中心化、易扩展的可视化DAG工作流任务调度系统,其致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。
总阅读167
粉丝0
内容667