热点数据筛选优化策略？

柚子kik

26212

发布于
2024-03-13 四川

捏造的信仰

2.8k2520

更新于
2024-03-14

热点数据怎么筛选？

如题，存在这样一个场景，上游系统和我们系统之间存在通知+定时轮询的机制去同步某个账户的流水。其中定时轮询的批量高频率执行，因为里面大部分账户做同步的时候都是没有任何数据的，上游系统就骂人了，由此打算从中抽取一些热点数据做同步。

现在的想法是在得到通知的时候维持一个redis缓存，定时轮询时看缓存中是否存在数据，存在才同步否则不同步，然后再做一个慢一点的全量同步定时。具体实现是在redis中维持一个没有过期时间的zset或者set，同时往这个set添加带过期时间的账户，将redis的内存淘汰策略设置为带ttl的lru。

现在的问题是，由于账户数量较大，单纯设置一个set肯定会存在bigkey问题，而且不清楚内存淘汰策略会达到怎么样的一个效果，如果缓存的账户数量很多，那么和全查区别不大。

所以请教一下，请各位不吝赐教

redis

java

阅读 974

2 个回答

得票最新

捏造的信仰

2.8k2520

发布于
2024-03-14 湖南

你作为下游，其实要关注的是：

自从上次同步后，哪些账户出现了变动？

因此只要上游提供一个接口，提供指定时间点之后的变动账户列表，说白了就是根据 update_time 查询，然后返回满足条件的账户 ID 列表给你。你就只需要按照列表中的账户同步即可，这样就避免了无效查询。

阿凡提

263

发布于
2024-03-21 安徽

在您描述的场景中，热点数据筛选的目标是减少不必要的数据同步，提高系统效率。您提出的使用Redis缓存和定时全量同步的策略是一个很好的方向。针对您提到的问题，这里提供一些建议和优化方案：

1. 热点数据识别

首先，需要有一个机制来识别哪些账户是“热点”的。这可以通过分析历史数据同步记录来实现，例如：

统计每个账户在一定时间窗口内的同步频率。
识别出同步频率高于某个阈值的账户作为热点账户。
定期更新这些统计数据，以便动态调整热点账户的集合。

2. 缓存策略优化

对于Redis缓存，可以考虑以下优化策略：

使用Hash结构：代替Set结构，使用Hash结构存储账户ID和其最后一次同步时间戳。这样可以避免BigKey问题，并且方便进行账户级别的操作。
分片缓存：如果账户数量非常大，可以将热点账户分散到多个Redis实例或不同的Hash中，以减轻单个Redis实例的压力。
动态过期时间：为每个账户设置动态过期时间，根据账户的热点程度调整。热点账户可以设置较长的过期时间，非热点账户可以设置较短的过期时间。

3. 内存淘汰策略

LRU算法：确保Redis的LRU算法能够有效地淘汰最久未使用的数据。
定期清理：可以定期（比如每天凌晨）进行一次全量同步，这样可以保证数据的一致性，并且清理掉可能因为LRU算法未能及时淘汰的旧数据。

4. 定时全量同步

低峰期同步：将全量同步安排在系统负载较低的时段执行，以减少对上游系统的压力。
增量同步：在全量同步时，只同步自上次全量同步以来发生变化的数据，这样可以减少数据传输量。

5. 监控和调优

监控Redis性能：监控Redis的内存使用情况、响应时间等指标，确保系统稳定运行。
调优同步频率：根据实际情况调整通知和定时轮询的频率，以达到最佳的性能和资源利用率。

6. 其他考虑

上游系统优化：与上游系统沟通，看是否有可能优化数据同步接口，减少无效请求。
异常处理：在同步过程中加入异常处理机制，确保在数据同步失败时能够及时重试或记录日志，以便后续分析问题。

通过上述策略的实施，可以在保证数据同步效率的同时，减少对上游系统的不必要请求，提高整体系统的稳定性和性能。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

热点数据筛选优化策略？

1. 热点数据识别

2. 缓存策略优化

3. 内存淘汰策略

4. 定时全量同步

5. 监控和调优

6. 其他考虑

你尚未登录，登录后可以

小网站有必要将图片放到阿里云OSS存储吗？

Spring中的两个疑惑?

求java/php大佬帮帮忙？

Java实例变量默认值赋值时机是什么时候？

java连redis-sentinel连不上,接下来如何排查?

请问，低代码中，DSL和DSL2CODE是否有公共语言的实现呢？

java里怎么解析mybatis返回的单条map类型集合？