flink keyby 在 subtask 中分配不均的研究

2020-10-13
阅读 1 分钟
5.2k
最近在做大数据量的实时数据迁移, 频繁使用到了keyby hash去均衡数据, 但是却发现subtask执行的数据量不是很均衡, 导致checkpoint频繁超时, 于是开始寻找解决方法.

flink 多窗口分析

2020-05-21
阅读 4 分钟
3.8k
由于数据存在倾斜, 需要实现两阶段聚合, 这个时候萌生了连续使用eventtime window进行聚合的想法, 于是开始了以下的源码分析.