Linux中的Kdump服务

我们知道在Linux中系统分为内核态和用户态，一般用户行为都发生在用户态，内核自我管理。但如果内核出现错误崩溃了，可以使用Kdump来分析错误原因。

Kdump服务提供了内核的崩溃转储机制，可以在内核崩溃时保存系统内存信息。Kdump使用kexec系统调用在崩溃时进入第二kernel抓取保存崩溃内核的内存信息，the second kernel以服务的形式占用一部分系统内存。也就是说Kdump服务利用系统内存提供了一个临时备用的内核得以保存内核日志信息。

安装Kdump

Kdump服务由kexec-tools包提供，安装命令为

$ rpm -q kexec-tools
$ yum install kexec-tools

注意，内核崩溃转储机制需要内核命令行参数设置崩溃转储，必须在引导“第一内核”期间为捕获内核保留 crashkernel 的内存。需要在/etc/default/grub配置中设置crashkernel=256M。

当内核崩溃时，崩溃日志core dump可以保存在文件，远程设备，或者网络设备中，如果不设置一般保存在/var/crash/目录中，如果要修改保存位置，可以修改/etc/kdump.conf配置文件中 patch 参数的地址。

Kdump服务管理

Kdump是以服务形式管理的

启用kdump

$ systemctl enable kdump.service

启动kdump

$ systemctl start kdump.service

停止kdump

$ systemctl enable kdump.service

禁用kdump

$ systemctl disable kdump.service

强制内核崩溃

可以通过人工方式手动使内核崩溃

$ systemctl is-active kdump
$ echo 1 > /proc/sys/kernel/sysrq
$ echo c > /proc/sysrq-trigger
$ reboot

重启后可以在/var/crash/目录下看到vmcore日志文件

crash工具

如果Kdump正常工作成功获取了内核的崩溃日志，那么下一步就是分析崩溃日志，我们可以使用crash工具来查看vmcore日志文件

crash工具一个类似GDB的分析core dump的工具

安装crash

$ yum install crash
$ yum install kernel-debuginfo

使用crash分析日志

$ crash /usr/lib/debug/lib/modules/4.18.0-5.el8.x86_64/vmlinux /var/crash/127.0.0.120190-03-01-11:06:33/vmcore

我们可以看到crash命令第一个参数是当前系统的debug-info，第二个参数时vmcore文件

执行crash命令后会进入crash工具的CLI
可以输入更多命令操作

#  display messages buffer
$ crash> log

# display kernel backtrace
$ crash> bt

# display process status
$ crash> ps

# display virtual memory
$ crash> vm

# display open files
$ crash> files

Linux中的Kdump服务

安装Kdump

Kdump服务管理

强制内核崩溃

crash工具

hhhan

引用和评论

git 同步上下游代码

rocky linux 使用记录

linux替换原有java

快捷键打开某个窗口(如网页chatGPT)

麒麟系统中theia终端崩溃问题排查小记

但是，I/O多路复用中是如何判断文件“可读”/“可写”的？

【笔记】CentOS 7 中配置 YUM