前言
我曾经在我的OpenTelemetry
系列文章中介绍了使用OpenTelemetry
社区提供的一系列工具和来实现可观测性的能力。但是从实际的使用角度来说,每一个环节都不是简单的配置就能够放心在生产环境使用的。包括数据的大量产生后的并发处理,collector
的多实例部署,数据的存储问题等等。这些都没法直接在OpenTelemetry
社区找到现成的解决方案。对于使用的人来说需要的是一个完整的解决方案,而不是一个一个的开源项目。今天就在这里介绍一个开源的性能监控平台SigNoz
。
SigNoz介绍
SigNoz
是一个开源的性能监控工具,可以用来监控应用程序。SigNoz
使用分布式跟踪获得可见性。
SigNoz
在很多地方是基于OpenTelemetry
体系的,他的collector
是基于OpenTelemetry Collector
的,他的客户端采样方式也是基于OpenTelemetry
。
从架构图我们可以看到SigNoz
基于OpenTelemetry Collector
研发了自己的collector
,这个collector
可以接收app的数据上报,也能接收OpenTelemetry Collector
的二次分发。SigNoz
的存储使用的ClickHouse
,后端API和告警服务使用的Golang
开发,前端则使用的是React
。
SigNoz使用
为了体验SigNoz
提供的能力,我们就先来本地进行一下安装。
本地安装
本地安装有多种方式,但是在此处建议使用docker
来进行安装。安装前需要确保3301 4317 4318
三个端口是可用的。
首先,执行:
git clone -b main https://github.com/SigNoz/signoz.git && cd signoz/deploy/
将signoz
项目clone下来并进入deploy
目录。
然后执行:
docker-compose -f docker/clickhouse-setup/docker-compose.yaml up -d
安装完成后可以看到如下的一系列镜像:
访问http://localhost:3301/
就能够看到页面,之后发起注册
完成登陆:
使用
SigNoz
体系已经搭建完成,现在我们就能够开始进行使用了。首先我们需要接入OpenTelemetry
的SDK,这个在我的OpenTelemetry
系列文章中有提到过,这里就不赘述了。大家可以选用自己的语言匹配的SDK。在此处我使用的是OpenTelemetry Java Instrumentation
即Java Agent模式。
我在此使用了两个基于SpringBoot
的测试应用:spring-provider
和spring-receiver
。这两个应用仅仅包含了普通的请求和OpenFeign
请求。
在Trace
看板中,我们自定义筛选条件,自定义图标的选项来查看不同维度的Trace
数据,在下方的列表页中选择一行点进去会跳转到Trace
的详情页,在详情页中可以看到链路的具体调用信息,Span等维度的数据。
从Service
中找到一个具体的服务进入其详情页就能看到一些Metrics
的数据:
在metrics的图表中会有99线,95线等维度。
在Logs
中可以查看服务的日志信息,目前Logging
维度在OpenTelemetry
中还未完全的GA,配套的collector
等都还在快速迭代中,因此SigNoz
的这部分也还是在Beta
中。
在ServiceMap
中可以看到服务的调用图谱
SigNoz
也提供了告警的能力,在Alert
面板中可以配置不同类型的告警
在这里配置一个Trace的告警需要有如下的三个步骤:
- 使用数据库查询语句定义度量指标
- 定义告警条件
- 其他告警配置
配置完毕后保存就能够看到配置的告警了。
总结
总的来说相比自己搭建OpenTelemetry
的整个采集体系,然后分别用jaeger
来查看trace,用prometheus
来查询metrics,SigNoz
整合了Trace
,Metrics
,Logging
等的一些列的聚合,展示与管理。他是一个可观测体系平台的集合,有着丰富的能力。在本片中介绍到的仅仅是他的能力的一部分,有兴趣的朋友可以自己去本地装一下体验一下。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。