头图

前言

Easysearch / Elasticsearch / Opensearch 管理系统中,对于不同集群不同指标数据进行采集是一个常规任务。但是采集过程中不仅会对采集系统 CPU 和访问性能造成不少压力,也会对 Easysearch / Elasticsearch / Opensearch 集群造成资源消耗,从而影响集群本身的健康运行。因此,优化设计采集指标任务系统设计尤为重要。

原架构分析

先前基于对 Console 自身性能影响的考量,我们将所有纳管集群的指标采集任务都放到单一线程中去顺序执行,如下图:

在原有架构中,所有集群指标的采集任务操作均依赖于一个线程执行,每个集群的采集任务包括 “集群健康”,“集群统计”,“节点统计” 等采集任务。该模型实现简单,但也带来以下问题:

  1. 单线程实现增加应用总时间而导致超时风险。
  2. 不同集群间采集指标任务相互干扰,导致指标采集相当不稳定。
  3. 不同的集群指标采集时间间隔可能不一样,无法精确控制。

新架构优化

新设计中,我们将每个集群中不同采集项分布到独立线程去执行:

  1. 每个集群的“集群健康”,“节点统计”,和“指数统计”采用独线程执行。
  2. 不同的指标采集任务可以独立设置采集时间间隔。
  3. 将所有采集任务放到一个线程池中去执行,集中控制资源使用和任务调度。

优化效果

通过拆分并发执行,新设计获得了如下收益:

  1. 解决了相互干扰并导致性能不稳定的问题
  2. 提升输出和数据分析完整性。
  3. 解决了不同指标采集任务设置不同采集间隔的问题

总结

通过拆分并发采集集群指标,使得 INFINI Console 的指标采集功能更加流畅,指标输出更加完整,给用户带来更好的使用体验。最近 INFINI Console 宣布开源了,如果您想了解更多的细节, 可以去 https://github.com/infinilabs/console 查看源码。

关于 INFINI Console

INFINI Console 是一款非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管,企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。INFINI Console 还可以对集群内的索引及数据进行操作管理,可以配置灵活的告警规则,可以指定统一的安全策略,可以查看各个维度的日志和审计信息,真正实现企业级的搜索服务平台化建设和运营。

官方文档:https://infinilabs.cn/products/console


极限实验室
1 声望2 粉丝

极限科技,全称极限数据(北京)科技有限公司,是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室(INFINI Labs)致力于打造极致易用的数据探索与分析体验。


引用和评论

0 条评论