SeaTunnel 部署(Zeat)单机 vs DataX性能

2024-07-18
阅读 14 分钟
962
1、SeaTunnel部署1.1、下载包 {代码...} 1.2、下载插件注意 : 修改 bin/install-plugin.sh,让它从阿里云仓库下载,快一点。前提自己的mvn是能走阿里云的 {代码...} sh bin/install-plugin.sh 2.3.5开始下载插件,会放入到connectors下例如 : {代码...} 1.3、放入mysql驱动/home/seatunnel/lib 下放入 {代码...} /home/s...

DataX源码编译及示例

2024-07-17
阅读 11 分钟
794
1、系统要求 {代码...} 2、源码编译 {代码...} 结果如下 : {代码...} 打包成功后的DataX包位于 {DataX_source_code_home}/target/datax/datax/ ,结构如下: {代码...} 3、示例(MySQL → MySQL)3.1、准备(MySQL目标表) {代码...} 3.2、json准备DataX 完整 JSON 配置文件示例 : {代码...} mysql2mysql.json 如下 : {代码.....

Dolphinscheduler YARN Task 状态跟踪

2024-07-13
阅读 14 分钟
736
Dolphinscheduler针对YARN任务,比如说MR、Spark、Flink,甚至是Shell任务,最初都是会判断如果有YARN任务,解析到applicationId。就会不单单判断客户端进程为单一判断依据,还要根据YARN状态进行最终的Dolphinscheduler任务状态判断。后期社区也是疯狂的重构(确实是好的向往,都是现在就成了半成品)。所以现在的问题就...

Dolphinscheduler JavaTask解决资源文件找不到和变量替换BUG修复

2024-07-13
阅读 13 分钟
706
dolphinscheduler-task-plugin/dolphinscheduler-task-java/src/main/java/org/apache/dolphinscheduler/plugin/task/java/JavaTask.java

Dolphinscheduler 启动 -> 补数 -> 手动输入不能输入空格BUG修复

2024-07-11
阅读 1 分钟
311
dolphinscheduler-ui/src/views/projects/workflow/definition/components/start-modal.tsx

Dolphinscheduler JavaTask 支持OUT参数下游传输

2024-07-11
阅读 8 分钟
658
0、修改一行源码org.apache.dolphinscheduler.plugin.task.java.JavaTask1、针对JAVA类1.1、流程定义图1.1、javaTaskForClass设置1.2、taskA设置1.3、taskA输出 {代码...} 2、针对JAR2.1、jar包封装示例2.1.1、pom.xml {代码...} 2.1.2、demo.Demo类具体内容 {代码...} 2.1.3、上传jar到资源中心mvn clean package,将编...

Dolphinscheduler JavaTask类名称支持非数字、下划线开头BUG修复

2024-07-11
阅读 3 分钟
367
1、复现1.1、配置1.2、流程实例状态1.3、看执行日志 {代码...} 其实就是解析类名称是DemoTest,真正的类名称是DemoTest1232、解决修改正则表达式 :org.apache.dolphinscheduler.plugin.task.java.JavaConstants {代码...} 如感兴趣,点赞加关注,谢谢!!!

Dolphinscheduler 最新系统架构图

2024-07-10
阅读 1 分钟
485
如感兴趣,点赞加关注,谢谢!!!

Java 8 总结

2024-07-09
阅读 7 分钟
653
Lambda 表达式是 Java 8 引入的一种新特性,允许你以更加简洁的方式编写匿名函数,从而使代码更简洁和易读。Lambda 表达式的语法格式如下:

Dolphinscheduler 输出变量解说

2024-07-05
阅读 9 分钟
904
在 Shell 脚本中,单引号 (')、双引号 (") 和反引号 (`) 各自有不同的作用和用法。理解它们的区别和用法对于编写和调试 Shell 脚本非常重要

HDFS NameNode HA固定一个NN为Active

2024-07-03
阅读 2 分钟
549
有时候为了简单,尝尝在连接dolphinscheduler的时候,我们会使用单NameNode来进行资源中心地址的配置。当然dolphinscheduler是支持HA的

Spring ThreadPoolTaskExecutor解说

2024-07-01
阅读 6 分钟
1.1k
异步执行方法:被 @Async 注解标记的方法会在一个独立的线程中执行,而不是在调用者的线程中。这意味着调用方法时,调用者线程会立即返回,并且方法的实际执行会在后台进行

Dolphinscheduler Master模块源码剖析

2024-06-26
阅读 6 分钟
1.2k
核心代码逻辑org.apache.dolphinscheduler.server.master.registry.MasterSlotManager.SlotChangeListener#notify

Dolphinscheduler Worker向Master汇报优化

2024-06-24
阅读 3 分钟
645
注意 : RUNNING_INFO更新有问题,因为根本就不会更新PID,因为都没有传递过去PID,所以这个有什么用呢?PID还是最后FINISH进行更新的,这不合理,如果任务执行时间比较长,我恰好要看PID,是不是看不到,等到任务结束才能看到

Dolphinscheduler 中的参数及子流程变量池传递失效BUG

2024-06-21
阅读 10 分钟
1k
1、Dolphinscheduler中的参数command_param 中的启动参数本地参数变量池全局参数项目参数内置参数(业务时间参数、系统内置参数、衍生内置参数),衍生内置参数是在Worker端进行处理的1.1、Master参数设置org.apache.dolphinscheduler.server.master.runner.TaskExecutionContextFactory#createTaskExecutionContext {代码...

Dolphinscheduler Master 逻辑任务架构图

2024-06-21
阅读 1 分钟
561
1、逻辑任务总体架构2、逻辑任务实例操作函数架构总共有四种函数 :LogicITaskInstanceDispatchOperationFunction逻辑任务实例分发操作函数LogicITaskInstanceKillOperationFunction逻辑任务实例kill操作函数LogicITaskInstancePauseOperationFunction逻辑任务实例暂停操作函数TaskInstanceWakeupOperationFunction逻辑任...

Dolphinscheduler 子工作流不能继承父工作流租户BUG修复

2024-06-20
阅读 2 分钟
682
1、现象创建两个工作流如下 :父工作流只有一个Task,引用的是子工作流 :使用hdfs租户跑父工作流 :查看子工作流中的任务日志 : {代码...} 发现租户是 default,说明租户信息没有透传到子工作流中2、解决其实很简单,问题在于子工作流在创建Command的时候没有传入租户code赶快给社区提交PR吧,嘻嘻如感兴趣,点赞加关注,...

Dolphinscheduler IDEA本地调试

2024-06-19
阅读 4 分钟
10k
1、基础组件准备 {代码...} 2、初始化2.1、初始化数据库 {代码...} 2.2、配置common.properties重点配置 {代码...} 2.3、配置各个服务的application.yaml注意 : 主要配置 zookeeper连接地址和mysql地址即可,不赘述2.4、配置各个服务的logback-spring.xml设置 <appender-ref ref="STDOUT"/> 控制台输出3...

Dolphinscheduler ShellTask CPU和Memory 使用及BUG修复

2024-06-19
阅读 5 分钟
1k
ShellTask默认情况下设置CPU配额和最大内存是不起作用的1、系统支持Ubuntu 或 Debian 系统: {代码...} CentOS 或 RHEL 系统:sudo yum install systemdFedora 系统 :sudo dnf install systemd1、开启common.properties {代码...} 2、原理如果是flase的话,其实下面的逻辑是不会走的,所以要设置为true才能玩耍org.apach...

Java SPI & google auto-service

2024-06-18
阅读 3 分钟
762
1、原生Java SPI定义SomeService接口 : {代码...} 定义SomeService接口实现类(服务提供者) : {代码...} META-INF/services/com.cestc.bigdata.spi.SomeService注意 : com.cestc.bigdata.spi.SomeServiceProvider2不存在 {代码...} Main方法 {代码...} 注意 : 不能使用for来迭代,如果使用for来迭代,发现一个SPI没有实现...

Maven assembly打包

2024-06-18
阅读 11 分钟
821
能够通过替换包名避免依赖冲突,如果一个项目中同时依赖了某个库的两个版本,比如spark程序中,自己的代码依赖okhttp3, spark本身的代码依赖okhttp2,此时除了重写自己的代码,更改依赖外,还可以通过shade解决依赖冲突。巧用maven-shade-plugin解决依赖冲突

Dolphinscheduler Slf4j MDC Task日志打印

2024-06-17
阅读 8 分钟
654
1、Slf4j MDC线程安全测试类似ThreadLocal使用 {代码...} 输出结果 : {代码...} 可以当做ThreadLocal来使用,是线程安全的2、模拟 dolphinscheduler Task日志打印2.1、pom.xml依赖 {代码...} 2.2、TaskLogFilter {代码...} 2.3、TaskLogDiscriminator {代码...} 2.4、logback.xml {代码...} 2.5、示例 {代码...} 2.6、结...

Git开发模式及代码提交规范

2024-06-17
阅读 11 分钟
990
在使用 Git 开发时,有 4 种常用的工作流,也叫开发模式,按演进顺序分为集中式工作流、功能分支工作流、Git Flow 工作流和 Forking 工作流。接下来,我会按演进顺序分别介绍这 4 种工作流

Dolphinscheduler Worker模块源码剖析

2024-06-16
阅读 59 分钟
1.4k
Worker服务的Netty提供和Master JDK 动态代理接口调用,请参考 Dolphinscheduler 告警模块解说,不再重复的说

Dolphinscheduler 中ProcessBuilder的使用

2024-06-15
阅读 10 分钟
641
org.apache.dolphinscheduler.plugin.task.api.shell.ShellInterceptorBuilderFactory

Dolphinscheduler AOP 获取 yarn applicationId 优雅吗?

2024-06-15
阅读 9 分钟
639
明确个人观点,NO,不优雅。本来好好的日志解析,弄个spring aop拦截器就NB了?而且还跑不通,Dolphinscheduler 3.2.1 版本测试了,不能使用。这是要干鸡毛啊?

Java反射综合小示例

2024-06-14
阅读 4 分钟
550
1、接口及实现类定义UserService 接口 : {代码...} UserServiceImpl 实现类 : {代码...} Result 结果返回类 : {代码...} 2、反射 {代码...} 结果 : {代码...} 如感兴趣,点赞加关注,谢谢!!!

Dolphinscheduler Shell类型的任务怎么设置环境变量?

2024-06-11
阅读 8 分钟
1.3k
SHELL、JAVA、PYTHON、FLINK、MR、FLINK_STREAM、HIVECLI、SPARK、SEATUNNEL、DATAX、SQOOP、DATA_QUALICY、JUPYTER、MLFLOW、OPENMLDB、DVC、PYTORCH、KUBEFLOW、CHUNJUN、LINKIS

Dolpinscheduler创建流程定义时不指定setTaskExecuteType,任务会跑成死循环

2024-06-07
阅读 6 分钟
709
看代码 org.apache.dolphinscheduler.server.master.utils.WorkflowInstanceUtils#logTaskInstanceInDetail