file

近期,Apache DolphinScheduler进行了版本更新,发布了3.3.0 alpha版本。Apache DolphinScheduler 3.3.0 alpha版本在任务管理、容错能力、扩展性等方面实现跨越式升级,为大规模工作流调度提供更稳定、灵活的解决方案。但需要提醒的是,此版本为alpha版本,请谨慎更新使用。

立即体验:

此次更新涵盖了大量DSIP(优化提案)、Feature(功能更新)和Improvement(优化),下面是对本次发版重点的简要梳理。

DSIP(优化提案)

以下为DolphinScheduler 3.3.0 alpha版本的结构性优化提案,对DolphinScheduler核心功能、架构、性能做出的系统性变更:

连接中心(Connection Center)支持增强

  • DSIP-19 系列:支持 Zeppelin、SageMaker、K8s 等连接(@xdu-chenrj)
  • DSIP-27:Java 任务插件改进(@ailiujiarui)

🧾 审计日志与远程日志优化

  • DSIP-24 / 25 / 26 / 57:远程日志与审计日志架构升级与回滚(@pegasas, @qingwli, @SbloodyS)

🔨 Master/Task 执行逻辑优化

  • DSIP-44 / 54 / 56 / 61 / 67 / 65 / 73 / 87:从线程池调度、任务执行抽象、调度命令机制等多角度优化(@ruanwenjun)

💡 用户体验优化

  • DSIP-50 / 51 / 59 / 60 / 62 / 68 / 72 / 78:清理冗余插件、模块、UI 结构统一化(@SbloodyS)

🧰 其他

  • DSIP-75:自动添加 license header(@ruanwenjun)
  • DSIP-70:移除 1.x/2.x 升级代码(@SbloodyS)
  • DSIP-38:插件上传/下载 + 依赖优化(@SbloodyS)

Feature(新增功能)

🎧 监听与告警

  • 增加Listener 机制(#14981)
  • 支持 Prometheus AlertManager、Aliyun Voice、HTTP 测试发送(#15079, #15248, #15163)

🧪 新插件与集成

  • 支持 OceanBase DataX 任务(#16281)
  • 支持 EMR Serverless Spark(#16126)
  • 支持 Dinky 任务 Prepare Params 传参(#15947)

🧱 资源与权限管理

  • UI 显示资源路径、Worker Group 权限管理(#16590, #15600)

🗂 存储扩展

  • 增加腾讯云 COS 存储插件(#16565)

📄 文档增强

  • 安全模型文档、安全命名统一(#16609, #16587)

Improvement(改进优化)

⚙ 核心模块与性能

  • Master/Worker 线程池、注册中心 zk 超时优化、RPC 重试机制、依赖任务处理优化等(多个 @ruanwenjun PR)

🧪 测试覆盖率提升

  • 提升 UT、E2E 覆盖率,填补空白测试用例(大量 @abzymeinsjtu PR)

🧹 清理与重构

  • 移除冗余代码、日志优化、变量命名统一等(多个 @SbloodyS、@caicancai、@Gallardot PR)

📦 部署/文档优化

  • 文档 typo 修复、Helm 配置补充、Docker Hub 优化、安装流程优化(多个 @SbloodyS、@Gallardot PR)

Bug Fix(缺陷修复)

本周期修复的问题主要集中在以下几个模块:

  • 调度核心模块
    修复了子工作流在状态为 PAUSE 时仍能继续运行的问题(#16564)、依赖任务状态解析异常(#16599)、全局参数未正确传递(#16376)、条件依赖任务状态为 WAITING_DEPEND 时调度异常(#16232)等问题,增强了调度的稳定性与正确性。
  • 插件相关问题
    修复了 Elasticsearch 插件在使用过程中出现空指针异常的问题(#16107),以及文件插件在多线程下载文件过程中可能出现失败的情况(#16063),提升了插件的健壮性和兼容性。
  • 数据源配置问题
    解决了数据源参数未正确识别与解析的问题(#15874),并修复了 MySQL 数据源在部分 JDBC 驱动版本中连接失败的问题(#16376),增强了数据源连接的适配能力。
  • 前端展示问题
    修复了权限模块 DATASOURCE_CATALOG 的命名错误导致 UI 显示异常(#16590),以及任务状态展示与后端不一致的问题(#16594),提升了前端使用体验。
  • 测试用例修复
    修复了因依赖插件异常引发的 E2E 测试失败(#15892),并解决了部分单元测试在特定环境下不稳定的问题(#16120),提升了测试系统的稳定性。

Document(文档改进)

本周期文档更新覆盖了部署指南、贡献者说明和配置文档等多个方面:

  • 安装与部署文档
    更新了 Helm 安装说明,明确了部署步骤、Chart 参数配置,方便用户快速部署(#16604)。
  • 贡献者文档
    完善了贡献流程说明,新增了 PR 标题规范、提交流程图,帮助新贡献者更清晰地参与项目开发(#16294、#16125)。
  • 配置与使用文档
    补充了任务依赖、数据源配置、告警策略等模块的文档细节(#15972、#16097、#16407),提升了文档的可读性和准确性。

Chore(杂项优化)

Chore 类别的优化集中在 CI 流程、无效模块清理与部分重构方面:

  • CI/CD 流程优化
    引入 Mock Server 模拟调度执行过程,加快了 E2E 测试速度并提升稳定性(#16030);为多任务并发场景下的调度失败添加了兼容处理(#16139);优化了 CI 执行逻辑并简化了 E2E 执行命令(#16643)。
  • 模块清理与结构重构
    移除了部分未使用的旧模块、插件和无效测试代码,简化了代码结构,提升了整体代码清晰度和维护效率(#15973、#16588)。

贡献者名单

本次版本由社区开发者共同推动完成,特别感谢以下核心贡献者(部分名单):

  • 阮文俊(PMC成员):主导架构设计与核心功能开发。
  • 感谢Gallardot, weideguo等共计71位贡献者对本次版本发布的支持(GitHub ID):

@Blue-Fox、@ZarakiKenpachi、@zhangyongqin、@ironnight、@liuchuo、@yehfan、@CaIShunfeng、@yuxiaoyang-cn、@kongchongming、@MasahiroZhang、@wuxuqiang、@gaoqiang173、@ckeeper97、@twocolds、@hvhye、@liujx0429、@lingkong-jiankong、@jiangm2019、@izukayy、@derryyy、@serpywa、@2rinn、@ilyaszq、@weidaokun、@codenavie、@peijie-liu、@mario27547、@yassirlr、@mingxiaojun、@lixunxd、@wmm2019、@Shawn1997、@nobida、@Chen-lina、@hzytong、@jiangang-huawei、@zhangchaofan、@dongchunlin、@HXT-DAO、@zhaozhichao、@YucongZhu、@onakobayashi、@sdh2110、@laitinglin、@wumomo-npm、@tang-xi、@Maxwell-nz、@bigfrog828、@flarv、@buqiong、@peicongl、@xiayuheng、@kokaokami、@ztust-hsy、@ChengYu-Cloud、@sxt5699、@0d7000、@suxianglong、@one-man-team、@zhouyi0410、@tianxuyuan、@heguanghu、@LotharHuber、@chongxiao-qw、@mcz1988、@windzhe、@linhong-ua、@sunkiming、@nothedream、@kenbliu、@klovejun、@ywq1024、@jianghaitao

参与社区,共建开源生态

欢迎通过以下方式加入社区:

本文由 白鲸开源科技 提供发布支持!

海豚调度
89 声望22 粉丝

Apache DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度平台。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。