56 lines
1.5 KiB
Markdown
56 lines
1.5 KiB
Markdown
---
|
||
title: "Prometheus"
|
||
type: entity
|
||
tags: [Monitoring, Observability, DevOps]
|
||
sources: [engineering-devops-automator]
|
||
last_updated: 2026-05-01
|
||
---
|
||
|
||
# Prometheus
|
||
|
||
## 基本信息
|
||
- **类型**:开源监控系统
|
||
- **开发商**:CNCF(云原生计算基金会)
|
||
- **官网**:https://prometheus.io
|
||
|
||
## 定义
|
||
Prometheus 是一个开源的系统监控和告警工具包,通过定期抓取(pull)指标数据,提供强大的数据模型、查询语言(PromQL)和告警管理能力。
|
||
|
||
## 核心特性
|
||
- **多维数据模型**:指标名称 + 标签集(key-value pairs)
|
||
- **PromQL**:强大的指标查询和聚合语言
|
||
- **主动抓取**:通过 HTTP 定期拉取指标,而非被动接收
|
||
- **告警管理**:与 AlertManager 集成,支持分组、抑制和静默
|
||
- **服务发现**:自动发现监控目标,支持 Kubernetes、DNS 等
|
||
|
||
## 在 DevOps Automator 中的角色
|
||
- 监控告警体系的核心组件
|
||
- 通过告警规则(如 HighErrorRate、HighResponseTime)实现主动问题发现
|
||
- 与 Grafana 集成提供可视化仪表板
|
||
|
||
## 关键告警示例
|
||
```yaml
|
||
alert: HighErrorRate
|
||
expr: rate(http_requests_total{status=~"5.."}[5m]) > 0.1
|
||
for: 5m
|
||
labels:
|
||
severity: critical
|
||
annotations:
|
||
summary: "High error rate detected"
|
||
```
|
||
|
||
## 相关概念
|
||
- [[Observability]]
|
||
- [[Grafana]]
|
||
|
||
## 相关工具
|
||
- AlertManager(告警处理和路由)
|
||
- Grafana(指标可视化)
|
||
- node-exporter(主机指标)
|
||
- cAdvisor(容器指标)
|
||
|
||
## Aliases
|
||
- Prometheus
|
||
- Prometheus Monitor
|
||
- Prometheus Monitoring
|