Files
nexus/wiki/entities/Prometheus.md
2026-05-03 05:42:12 +08:00

1.5 KiB
Raw Blame History

title, type, tags, sources, last_updated
title type tags sources last_updated
Prometheus entity
Monitoring
Observability
DevOps
engineering-devops-automator
2026-05-01

Prometheus

基本信息

  • 类型:开源监控系统
  • 开发商CNCF云原生计算基金会
  • 官网https://prometheus.io

定义

Prometheus 是一个开源的系统监控和告警工具包通过定期抓取pull指标数据提供强大的数据模型、查询语言PromQL和告警管理能力。

核心特性

  • 多维数据模型:指标名称 + 标签集key-value pairs
  • PromQL:强大的指标查询和聚合语言
  • 主动抓取:通过 HTTP 定期拉取指标,而非被动接收
  • 告警管理:与 AlertManager 集成,支持分组、抑制和静默
  • 服务发现:自动发现监控目标,支持 Kubernetes、DNS 等

在 DevOps Automator 中的角色

  • 监控告警体系的核心组件
  • 通过告警规则(如 HighErrorRate、HighResponseTime实现主动问题发现
  • 与 Grafana 集成提供可视化仪表板

关键告警示例

alert: HighErrorRate
expr: rate(http_requests_total{status=~"5.."}[5m]) > 0.1
for: 5m
labels:
  severity: critical
annotations:
  summary: "High error rate detected"

相关概念

相关工具

  • AlertManager告警处理和路由
  • Grafana指标可视化
  • node-exporter主机指标
  • cAdvisor容器指标

Aliases

  • Prometheus
  • Prometheus Monitor
  • Prometheus Monitoring