[wgcloud-agent] WgcloudAgent.go:287: 防篡改校验错误次数大于10次

WGCLOUD监控平台在运行中,发现主机下线了,查看agent日志,发现以下错误日志:

[wgcloud-agent]2022/07/01 00:12:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:13:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:14:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:15:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:16:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:17:20 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:17:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:17:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36
[wgcloud-agent]2022/07/01 00:18:46 WgcloudAgent.go:287: 防篡改校验错误次数大于10次,不再上报数据: 36

这个问题注意几点:

(1) server和agent的主机系统时间差不能大于15个小时,若时间差不超过15小时打印【防篡改校验错误】类似信息,忽略即可

(2) v3.3.5之前版本,server主机的9997端口(这是守护进程wgcloud-daemon-release的默认端口)要开放给agent主机,保证agent主机可以telnet通server的9997端口

v3.3.5或以后版本9997端口已经不需要开放给agent访问

(3) 若是v3.3.5或之后版本,查看server本机是否能正常访问http://localhost:9997获得返回值,如:2faa233a1400201bedc199fe1d8ab393,若server主机的localhost不能使用,可以在配置文件server/config/application.yml,将配置项daemonUrl: http://localhost:9997 中的localhost改成server主机ip

(4) wgcloud-server-release.jar不要编辑修改,若编辑过,还原回去原始安装包里的wgcloud-server-release.jar即可

(5) server和agent要保持同一个版本号

(6) server端的守护进程(wgcloud-daemon-release)不要关闭,特别是Windows注意不要关闭守护进程窗口。若是Linux,查看此进程是否存活(ps -ef | grep wgcloud)

还有一种可能是server部署在Windows,不小心左键点击守护进程的窗口,进入编辑模式了,右击恢复就好了

如果因为此原因的话,重启server(守护进程会随着server启动)后,1小时内所有agent会陆续恢复上线,也可以手动重启agent(立即上线)

(7) server如果运行在arm、龙芯等系统,需要将守护进程wgcloud-agent-release替换为对应的版本,点击下载

(8) 如果server长时间没有运行,那么当server重新启动后,agent会在1小时内陆续自动恢复上线,不用重启agent。也可以手动重启agent,会立刻恢复上线

517 声望
2 粉丝
0 条评论
推荐阅读
WGCLOUD的配置使用 - 导入sql文件
我一般用MySQL数据库,所以就导入wgcloud-MySQL.sql文件,导入有多种方式,一般用数据库客户端工具导入就行,如果是mysql命令导入的话,如下

一往情深1阅读 428

prometheus remote-write解析(二) -- 源码解读
整体流程remoteConfigs支持配置多个remoteStorage,每个remoteStorage使用1个QueueManager;watcher将sample发送给QueueManager;1个QueueManager中管理多个shard,每个shard的容量为capactiy;每个shard会定时(ba...

a朋2阅读 2.8k评论 1

Prometheus的使用
在Prometheus的架构设计中,Prometheus Server 并不直接服务监控特定的目标,其主要任务负责数据的收集,存储并且对外提供数据查询支持。因此为了能够能够监控到某些东西,如主机的CPU使用率,我们需要使用到Expo...

代码的路2阅读 397

自定义数据采集export到prometheus使用 Flask实现
如图 想要取到 url get请求的值,使用prometheus blackbox 无法获取,所以考虑使用flask自定义exporter 获取

台湾省委书记阅读 980

封面图
国产 ETL工具 ETL产品 数据交换系统 ETL工具选型 需要考虑哪些因素
多数软件又为什么逐渐国产化? 长期以来,国内数据技术都由海外厂商主导。然而随着国际竞争环境日益激烈,争端所引发的技术卡脖子事件频发,面对特殊的大环境,全球化带来的科技创新共同体背后,国家IT产业实现自...

weigeonlyyou阅读 916

封面图
prometheus pushgateway使用及源码分析
一.Pushgateway是什么pushgatway是prometheus社区推出的一个推送指标的组件,主要应用在:短生命周期(short-lived)或者批任务(batch jobs)的资源/作业的指标;prometheus无法拉取到(网络原因)的target的指标;作...

a朋阅读 797

开源signoz实现可观测性的分析
Signoz是一个开源的APM(Application Performance Management),它是应用可观测性的一个实践,使用OpenTelemetry协议,将traces/metrics/log融合在一起。

a朋阅读 780

517 声望
2 粉丝
宣传栏