CPU与核心

linux负载(平均数),衡量系统繁忙程度指标。数值接近于系统核心总数70%

平均负载

平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均进程数,也就是平均活跃进程数

  • 如果cpu有两个核心,平均负载为2.73,6.90.12.98
  • 过去1分钟内,有2.73/2 = 136%的超载
  • 当平均负载高于cpu负载总数量70%的时候,应该分析排查

    CPU密集型进程

    使用大量CPU会导致平均负载升高,此时两者是一致的

    IO密集型进程

    等待I/O也会导致平均负载身高,但cpu使用率不一定很高

大量等待CPU的进程调度也会导致平均负载升高,此时的CPU使用率也会比较高

可运行状态:S R 占用cpu
不可中断状态:D 占用IO

stress

压力测试工具
模拟I/O压力,即不停地的执行sync()
stress --cpu 5 --timeout 100s #
stress --hdd &--hdd-bytes 1g #hd harkdisk创造进程读写
stress -io 1 --timeout 600s #--io 利用sync()测试600s
watch uptime #每两秒运行一次uptime命令

mpstat

CPU测试工具
查看cpu统计信息
-P ALL 1 #查看所有cpu使用率,一秒刷新一次
mpstat 1 10 #一秒更新一次,更新10次

pidstat

查看pid统计信息
-u 5 1 每5秒更新一组数据

iostat

查看io设备统计信息

日志故障排查流程(含日志)

  • w/uptime 查看负载、
  • ps aux/top查看cpu百分比
  • top检查具体是哪个进程,找出可以进程
  • 追踪这个进程使用情况
  • 查看对应日志
  • 系统日志:/var/log/messages(系统通用日志)
  • /var/log/secure(用户登录情况)
  • 服务软件的日志

xfxfxf
11 声望1 粉丝