CPU与核心
linux负载(平均数),衡量系统繁忙程度指标。数值接近于系统核心总数70%
平均负载
平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均进程数,也就是平均活跃进程数
- 如果cpu有两个核心,平均负载为2.73,6.90.12.98
- 过去1分钟内,有2.73/2 = 136%的超载
当平均负载高于cpu负载总数量70%的时候,应该分析排查
CPU密集型进程
使用大量CPU会导致平均负载升高,此时两者是一致的
IO密集型进程
等待I/O也会导致平均负载身高,但cpu使用率不一定很高
大量等待CPU的进程调度也会导致平均负载升高,此时的CPU使用率也会比较高
可运行状态:S R 占用cpu
不可中断状态:D 占用IO
stress
压力测试工具
模拟I/O压力,即不停地的执行sync()
stress --cpu 5 --timeout 100s #
stress --hdd &--hdd-bytes 1g #hd harkdisk创造进程读写
stress -io 1 --timeout 600s #--io 利用sync()测试600s
watch uptime #每两秒运行一次uptime命令
mpstat
CPU测试工具
查看cpu统计信息
-P ALL 1 #查看所有cpu使用率,一秒刷新一次
mpstat 1 10 #一秒更新一次,更新10次
pidstat
查看pid统计信息
-u 5 1 每5秒更新一组数据
iostat
查看io设备统计信息
日志故障排查流程(含日志)
- w/uptime 查看负载、
- ps aux/top查看cpu百分比
- top检查具体是哪个进程,找出可以进程
- 追踪这个进程使用情况
- 查看对应日志
- 系统日志:/var/log/messages(系统通用日志)
- /var/log/secure(用户登录情况)
- 服务软件的日志
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。