访问控制策略之Ladon入门

12 月 21 日
阅读 3 分钟
87
Ladon 是一个 Go 语言库,用于实现访问控制策略(Access Control Policies),并提供灵活的权限验证功能。它通常用于基于角色(RBAC)、基于属性(ABAC)等方式的权限管理。Ladon 提供了一种方法来定义策略,并根据主体(subject)、资源(resource)和操作(action)对访问进行验证

Supersonic入门调研

12 月 13 日
阅读 4 分钟
98
SuperSonic是融合Headless BI和Chat BI的新一代数据分析平台,致力于通过自然语言对话来分析数据,与传统交互的分析产品组合,推动数据民主化。SuperSonic提供两套开箱即用的产品界面:

Flink CDC一库多表数据同步

12 月 13 日
阅读 20 分钟
74
注意 : 虽然程序中设置的checkpoint的路径是 hdfs://xx.xx.xx.xx:8020/flink-cdc/ck,但是需要指定的全路径是hdfs://xx.xx.xx.xx:8020/flink-cdc/ck/96f0dc3d9b2717ae3c0a27799560d862/chk-62,下面有多个checkpoint,指定最新的即可

研发模式

12 月 9 日
阅读 5 分钟
67
瀑布模式按照预先规划好的研发阶段来推进研发进度。比如,按照需求阶段、设计阶段、开发阶段、测试阶段、发布阶段、运营阶段的顺序串行执行开发任务。每个阶段完美完成之后,才会进入到下一阶段,阶段之间通过文档进行交付。整个过程如下图所示 :

CentOS 下使用 systemd 守护自定义的进程

12 月 6 日
阅读 2 分钟
83
1、阐述systemd 是一个 系统和服务管理器,用于初始化系统、管理用户空间服务、处理服务依赖关系,并提供强大的日志管理功能核心特点:并行启动:支持多服务的并行启动,提高启动速度依赖关系管理:自动处理服务之间的依赖关系单一二进制文件:通过 systemctl 管理所有服务、目标、设备等日志系统:通过 journald 提供统...

JWT入门

12 月 3 日
阅读 7 分钟
96
JWT (JSON Web Token) 是一种基于 JSON 格式的开放标准(RFC 7519),用于在不同系统间作为一种安全的、紧凑的令牌实现信息的传递。它通常用于身份验证、授权以及信息安全传递

Docker desktop报错解决

11 月 26 日
阅读 2 分钟
132
1、背景 {代码...} 2、不用梯子配置 {代码...} 也可加自己的阿里云镜像3、安装clickhouse {代码...}

Dolphinscheduler之quartz

11 月 13 日
阅读 6 分钟
184
1、QRTZ_JOB_DETAILS 和 QRTZ_TRIGGERS 是中心表,定义了任务与触发器之间的关系2、QRTZ_TRIGGERS 表通过外键关联了多个触发器类型表,如 QRTZ_SIMPLE_TRIGGERS 和 QRTZ_CRON_TRIGGERS,用于实现不同类型的触发方式3、QRTZ_FIRED_TRIGGERS 用于记录每次任务执行的历史,与任务和触发器表都有关联4、QRTZ_CALENDARS 用于...

模拟AsyncDispatcher

11 月 7 日
阅读 3 分钟
141
1、示意图2、代码 {代码...} 3、输出结果事件类型 : DISPATCH分发任务...事件类型 : KILLkill任务...

中序、后序遍历还原二叉树

11 月 7 日
阅读 2 分钟
116
具体步骤1、从后序遍历序列的最后一个节点取出根节点2、在中序遍历序列中找到根节点的位置,这个位置的左边部分是左子树,右边部分是右子树3、递归构建左子树和右子树,重复以上步骤

YARN中Service组合模式

10 月 30 日
阅读 4 分钟
185
两个方向来说,就是说组件是一个普通的服务组件,还是组合服务组件。如果是普通的服务组件,比如说AsyncDispatcher就是一个普通的服务组件,它继承了AbstractService,那其实就是直接重新自己的serviceInit和serviceStart方法即可,然后调用它的init和start方法就可以完成初始化和启动当时针对ResourceManager这种组件,...

YARN & MapReduce

10 月 29 日
阅读 90 分钟
289
原 MapReduce 框架也称MRv1,它是一个主从式架构。主节点JobTracker负责集群的资源管理和处理Client请求,从节点TaskTracker负责管理资源和执行任务。不仅仅存在JobTracker的SPOF问题,而且JobTracker的负载非常高,集群的资源管理也非常粗暴不合理1、单点故障,可靠性低 : JobTracker采用了Master/Slave架构,是集群事...

Dolphinscheduler 之 MR任务

10 月 22 日
阅读 11 分钟
230
args呢?如果要使用args,以上这种 fs、jt、D、libjars、files、archives、tokenCacheFile 是需要自己解析的

Apache Commons CLI (命令行解析参数)

10 月 19 日
阅读 3 分钟
288
Apache Commons CLI 是一个用于解析命令行参数的库,可以轻松处理应用程序中的命令行选项。它支持短选项(如 -h)和长选项(如 --help),并提供丰富的功能,如必填参数、参数类型、帮助信息等

DataX源码分析

10 月 18 日
阅读 1 分钟
151
切分多个Task之后,DataX Job会调用Schedule模块,根据配置的并发数据量,将上一步拆分成的Task重新组合,组装成TaskGroup(任务组),每一个TaskGroup负责以一定并发运行完毕分配好的所有Task,默认单个任务组的并发数量为5;

DataEase入门

10 月 16 日
阅读 9 分钟
259
1、源码编译前提 安装 JDK 21、apache-maven-3.9.6(我用3.9.3也是可以的) {代码...} 1.1、编译步骤 {代码...} 1.2、问题解决 {代码...} 解决 settings.xml 进行如下配置: {代码...} 1.3、创建database {代码...} 1.4、创建运行目录 {代码...} 注意 : dataease2.0 这个目录是必须的,源码中写死的1.5、启动访问 {代码...}...

Flink在全局并行度为1,keyBy之后不同的key,Watermark的推进

10 月 2 日
阅读 4 分钟
418
事件时间针对迟到数据1、设置乱序程度 forBoundedOutOfOrderness2、设置迟到,窗口关闭时间 allowedLateness3、设置侧输出流 sideOutputLateData

说说Java 的 -javaagent

9 月 9 日
阅读 6 分钟
184
-javaagent 是 Java 虚拟机(JVM)的启动参数,用于在 Java 应用程序启动时加载一个 Java 代理(Agent)。Java 代理允许你在不修改应用程序代码的情况下动态地拦截和修改字节码,常用于性能监控、调试、日志记录、性能分析以及应用程序的动态修改等场景

CentOS 8 上安装并启动 PostgreSQL 10.15

9 月 7 日
阅读 2 分钟
480
在 CentOS 8 中,可以通过官方的 PostgreSQL 模块进行安装。默认情况下,CentOS 8 中 PostgreSQL 存储库已经被包含。你可以使用 dnf 包管理器来安装

Dolphinscheduler Master线程模型是不是有点懵,一张图说清楚

9 月 3 日
阅读 1 分钟
247
如感兴趣,点赞加关注,谢谢!!!

dolpinscheduler 嵌入 arthas 监控接口调用

8 月 27 日
阅读 6 分钟
326
1、手动安装 {代码...} 2、报错解决2.1、报错1 {代码...} 解决 : {代码...} 2.2、报错2 {代码...} 解决 {代码...} 3、watchwatch 用于监控方法的具体执行细节,如参数、返回值等 {代码...} {代码...} 4、tracetrace 用于监控方法调用的深度,包括调用了哪些方法以及每个方法的执行时间 {代码...} 5、dumpheapdump arthas...

说说 HDFS fsck

8 月 3 日
阅读 3 分钟
468
hdfs fsck 是 Hadoop 分布式文件系统 (HDFS) 的一个命令行工具,用于检查文件系统的一致性。它可以帮助管理员检查文件系统的健康状况,并提供有关丢失块、损坏文件等信息

Zookeeper 原生API VS Apache Curator 监听

8 月 3 日
阅读 7 分钟
323
在 ZooKeeper 中,Watcher 是一次性的,不会自动重新注册。因此,如果你希望在特定事件(如节点数据变化)发生后继续监听其他事件(如节点删除),你需要在每次事件触发时重新注册 Watcher

NameNode haadmin -failover 和 haadmin -transitionToActive 的区别

8 月 2 日
阅读 2 分钟
341
hdfs haadmin -failover 和 hdfs haadmin -transitionToActive 是 HDFS 高可用性(HA)管理中的两个重要命令,它们用于管理 NameNode 的角色切换和状态转换

说说HDFS NameNode HA

8 月 2 日
阅读 5 分钟
317
1、NameNode竞争在ZooKeeper上进行注册,即创建一个临时节点目录ActiveStandbyElectorLock,写入NN的host、port、nameserviceId、namenodeI等信息,那个写入成功,那个就是Active状态2、注册成功后,同时会创建一个ActiveBreadCrumb永久节点(用来进行切换的时候,如果不是该当前Active NameNode,需要进行fence隔离)通过...

Dolphinscheduler DAG核心源码剖析

7 月 30 日
阅读 6 分钟
599
注意 : 在 Dolphinscheduler 中,离线任务是有完整的声明周期的,比如说停止、暂停、暂停恢复、重跑等等,都是以DAG(有向无环图的形式进行任务组织)T+1离线任务的

批量修改pom.xml中的groupId

7 月 29 日
阅读 1 分钟
293
使用 shell 脚本批量修改 pom.xml 文件中的 groupId 可以通过 sed 命令来实现。下面是一个示例 shell 脚本,它会递归地查找当前目录及其子目录中的所有 pom.xml 文件,并将 groupId 从 org.apache.dolphinscheduler 修改为 com.datashark

Dolphinscheduler集成chunjun

7 月 22 日
阅读 4 分钟
338
/dolphinscheduler/dolphinscheduler-api/src/main/resources/task-type-config.yaml

Dolphinscheduler之容错

7 月 21 日
阅读 3 分钟
462
那问题来了1、Master掉了怎么办?它是负责流程实例的管理的。这样Worker就没有办法给它汇报任务状态,当然它也不能做状态处理了?2、Worker掉了又怎么办?要知道Worker是真正任务执行的载体,它如果掉了。Master要怎么处理?

SeaTunnel 部署(Zeat)单机 vs DataX性能

7 月 18 日
阅读 14 分钟
740
1、SeaTunnel部署1.1、下载包 {代码...} 1.2、下载插件注意 : 修改 bin/install-plugin.sh,让它从阿里云仓库下载,快一点。前提自己的mvn是能走阿里云的 {代码...} sh bin/install-plugin.sh 2.3.5开始下载插件,会放入到connectors下例如 : {代码...} 1.3、放入mysql驱动/home/seatunnel/lib 下放入 {代码...} /home/s...