--- title: "Prometheus" type: entity tags: [Monitoring, Observability, DevOps] sources: [engineering-devops-automator] last_updated: 2026-05-01 --- # Prometheus ## 基本信息 - **类型**:开源监控系统 - **开发商**:CNCF(云原生计算基金会) - **官网**:https://prometheus.io ## 定义 Prometheus 是一个开源的系统监控和告警工具包,通过定期抓取(pull)指标数据,提供强大的数据模型、查询语言(PromQL)和告警管理能力。 ## 核心特性 - **多维数据模型**:指标名称 + 标签集(key-value pairs) - **PromQL**:强大的指标查询和聚合语言 - **主动抓取**:通过 HTTP 定期拉取指标,而非被动接收 - **告警管理**:与 AlertManager 集成,支持分组、抑制和静默 - **服务发现**:自动发现监控目标,支持 Kubernetes、DNS 等 ## 在 DevOps Automator 中的角色 - 监控告警体系的核心组件 - 通过告警规则(如 HighErrorRate、HighResponseTime)实现主动问题发现 - 与 Grafana 集成提供可视化仪表板 ## 关键告警示例 ```yaml alert: HighErrorRate expr: rate(http_requests_total{status=~"5.."}[5m]) > 0.1 for: 5m labels: severity: critical annotations: summary: "High error rate detected" ``` ## 相关概念 - [[Observability]] - [[Grafana]] ## 相关工具 - AlertManager(告警处理和路由) - Grafana(指标可视化) - node-exporter(主机指标) - cAdvisor(容器指标) ## Aliases - Prometheus - Prometheus Monitor - Prometheus Monitoring