一、Supervisor 简介

Supervisor 是一款基于 Python 开发的进程管理工具,能够将普通命令行进程转换为后台守护进程,并提供以下核心能力:

  • 进程监控:实时监控子进程运行状态
  • 自动重启:进程异常退出时自动恢复
  • 集中管理:通过命令行或 Web 界面统一管理多进程
  • 日志聚合:自动捕获进程的标准输出和错误日志

其工作原理是通过 fork/exec 机制启动被管理进程,使其成为 Supervisor 的子进程。当子进程异常终止时,父进程能及时感知并触发重启策略。


二、核心应用场景

  1. 消息队列消费

    • 管理多进程消费队列任务,避免单点故障导致的业务中断
    • 示例:RabbitMQ、Kafka 消费者进程守护
  2. 定时任务调度

    • 确保 Cron 任务稳定执行,失败后自动重试
    • 示例:数据同步、报表生成等定时作业
  3. 关键服务守护

    • 维持 Web 服务、API 接口等长时运行进程的可用性
    • 示例:Flask/Gunicorn、Node.js 应用守护
  4. 批处理任务管理

    • 监控数据处理、文件解析等批处理任务的执行状态

三、安装部署(CentOS 环境)

# 通过 yum 快速安装
yum install -y supervisor

# 验证安装
supervisord --version

四、配置文件详解

  1. 主配置文件路径

    vim /etc/supervisord.conf
  2. 启用 Web 控制台
    取消以下配置段的注释,并按需修改:

    [unix_http_server]
    file=/var/run/supervisor/supervisor.sock   ; Socket 文件路径
    chmod=0700                                 ; 文件权限(默认 0700)
    
    [inet_http_server]
    port=127.0.0.1:9001                        ; 监听地址和端口(生产环境建议绑定内网 IP)
    username=user                              ; 登录用户名
    password=123                               ; 登录密码

    安全建议

    • 若需外网访问,可将 port 改为 0.0.0.0:9001,但需配合防火墙限制 IP 访问
    • 使用强密码并定期更换
  3. 服务管理命令

    # 启动/停止/重启
    systemctl start|stop|restart supervisord
    
    # 查看状态
    systemctl status supervisord

五、子进程配置实战(以 ThinkPHP6 队列为例)

  1. 创建子进程配置文件

    cd /etc/supervisord.d
    touch test_queue.ini
  2. 编写进程配置

    [program:test_queue]                        ; 程序名称(需与文件名一致)
    command=php /www/wwwroot/tp6/think queue:listen --queue test_queue  ; 启动命令(绝对路径更可靠)
    directory=/www/wwwroot/tp6                  ; 可选:指定命令执行的工作目录
    autostart=true                              ; Supervisor 启动时自动拉起该进程
    autorestart=true                            ; 进程异常退出时自动重启
    startretries=3                              ; 启动失败重试次数(默认 3)
    user=root                                   ; 运行用户(建议使用非 root 用户)
    stdout_logfile=/var/log/test_queue.out.log  ; 标准输出日志(自动切割需额外配置)
    stderr_logfile=/var/log/test_queue.err.log  ; 错误日志
    environment=LANG="en_US.UTF-8"              ; 可选:设置环境变量
  3. 生效配置

    # 语法检查(重要!)
    supervisord -c /etc/supervisord.conf --check
    
    # 重新加载配置
    supervisorctl reread    # 读取新配置
    supervisorctl update    # 应用变更并重启相关进程
    
    # 或直接重启服务(影响所有进程)
    systemctl restart supervisord

六、进程管理技巧

# 查看所有进程状态
supervisorctl status

# 管理单个进程
supervisorctl start|stop|restart test_queue

# 查看进程日志
tail -f /var/log/test_queue.out.log

# 进入交互式控制台
supervisorctl

七、Web 控制台使用指南

  1. 访问方式

    • port=127.0.0.1:9001:通过 SSH 端口转发访问

      ssh -L 9001:localhost:9001 your_server_ip

      浏览器访问 http://localhost:9001

    • port=0.0.0.0:9001:直接访问 http://your_server_ip:9001
  2. 控制台功能

    • 实时查看进程状态(运行中、停止、重启次数)
    • 一键启停进程
    • 查看实时日志输出
    • 修改配置后在线重载

    Web 控制台示例


八、最佳实践

  1. 日志管理

    • 使用 logrotate 实现日志自动切割和归档
    • 避免日志文件无限增长导致磁盘占满
  2. 权限控制

    • 使用非 root 用户运行进程(通过 user=www-data 配置)
    • 限制 Web 控制台的访问 IP
  3. 高可用方案

    • 对 Supervisor 本身配置监控,防止单点故障
    • 结合 Keepalived 实现双机热备
  4. 异常排查

    • 通过 supervisorctl tail test_queue stderr 快速查看错误
    • 检查系统资源(内存、CPU、句柄数)是否不足

附录:常用配置参数说明

参数说明
numprocs启动进程数(实现多进程负载均衡)
priority启动优先级(数字越小越早启动)
stopwaitsecs强制终止前的等待时间(默认 10 秒)
redirect_stderr将标准错误重定向到标准输出(简化日志管理)

通过合理配置 Supervisor,可显著提升服务的可靠性和运维效率。


白穹雨
31 声望1 粉丝

热爱技术,热爱生活。学过Java,现在从事PHP。