活动介绍

B 站原监控架构面临稳定性差、用户查询体验差和云上监控数据质量差等痛点,为此设计了采集存储分离、存算分离的架构,并选用 VictoriaMetrics 作为时序数据库。新架构在数据来源、采集、存储和查询等方面进行了优化。目前新架构:P90 查询耗时降低 10 倍以上,支持 170w+ 采集对象,实现 1-5-10 中的 1 分钟发现,指标告警异常降低 90% 以上,写入吞吐 44M/s,查询吞吐 48k/s,P90 查询耗时降低到 ms 级,成效卓著。
9 月 4 日晚 19:30,鲍森乐老师将会在线和大家一起探讨建设监控系统时,遇到的核心痛点及详细的解决策略与方法。
 
直播预告:
分享人:
鲍森乐 资深研发工程师2021 年加入 B 站,一直负责监控系统架构演进,指标平台迭代,VM 集群稳定性,push 链路等相关工作。完成监控 2.0 架构全面落地,新一代云&边缘监控架构统一,指标 P90 查询耗时降低 10 倍以上。
  
分享内容概要:
1、面对亿级指标量,B 站如何设计采集存储分离、存算分离架构以解决 Prometheus 频发 00M 问题,并实现资源弹性伸缩?
2、面对稳定性差及查询体验不佳等痛点,B 站如何优化监控架构?
3、在多云和边缘网络环境日益复杂的背景下,B 站怎样实现云上数据的统一管理与整合?  

观看方式:扫描下方二维码即可预约直播
图片
 
 合作媒体:
图片
 

发布于 2024-08-30
0 条评论
组织者
主办方
TakinTalks 稳定性社区