如何通过 PrometheusRule 资源创建 Loki 警报

发布于 2025-07-22

主要观点：

关键信息：

PrometheusRule 是 Prometheus 生态系统中管理警报规则的事实上的标准，但最初未设计用于处理基于 Loki 日志的警报。
社区曾尝试引入自定义资源如 LokiRule 等，但未被 Grafana 团队支持。
Loki Operator 的 AlertingRule 和 RecordingRule 资源仅在 Loki 通过该操作符部署时有效。
Grafana Alloy 的 loki.rules.kubernetes 配置块可用于定义 Loki 警报规则，但需额外配置，如配置 Prometheus Admission Webhook 跳过 Loki 规则验证等。

重要细节：

配置 loki.rules.kubernetes 时，需指定地址、租户 ID 等，且规则选择器要使用正确标签。
配置 Prometheus Admission Webhook 时，要通过 matchConditions 规则跳过对带有 loki 标签的规则的验证。
配置 Loki Ruler 时，要启用持久化、使用 S3 存储等。
可通过创建 PrometheusRule 资源定义基于日志的警报规则，如触发条件等。
可创建测试用的 Kubernetes Pod 生成日志，通过定义的规则进行警报验证，在 Grafana UI 中可查看警报状态。

最终，通过这些配置可实现动态提供警报、集中管理警报等，将 DevOps 和可观测性结合起来。

阅读 100