不可以保证一定所有输入到来。 可以的方法是加两层时间窗: 第一层时间窗比如30s,对于你想要处理的数据,满三十秒之后无论时间窗里面有多少先处理掉, 第二层时间窗可以设置为半小时或者一小时,主要是处理因为延迟而进到多个时间窗里面的数据,处理后面时间窗里数据的时候将他与前面时间窗的数据merge掉 导致延迟的场景很多:比如上游流量突然增加导致传输或者上游逻辑处理能力不足等等
不可以保证一定所有输入到来。
可以的方法是加两层时间窗:
第一层时间窗比如30s,对于你想要处理的数据,满三十秒之后无论时间窗里面有多少先处理掉,
第二层时间窗可以设置为半小时或者一小时,主要是处理因为延迟而进到多个时间窗里面的数据,处理后面时间窗里数据的时候将他与前面时间窗的数据merge掉
导致延迟的场景很多:比如上游流量突然增加导致传输或者上游逻辑处理能力不足等等