1.8 KiB
1.8 KiB
title, type, tags, last_updated
| title | type | tags | last_updated | ||||
|---|---|---|---|---|---|---|---|
| Observability | concept |
|
2026-04-26 |
Observability(可观测性)
中文名称: 可观测性
类型: 技术方法论 / SRE 核心支柱
别名:
- 可观测性
- 云原生可观测性
- Observability Stack
Definition
可观测性(Observability)是指通过系统外部输出来推断其内部状态的能力。在 IT 运维领域,通常由三大支柱构成:
- 指标(Metrics): 系统运行时数值数据的时序聚合——如 CPU 使用率、内存占用、请求 QPS。代表工具:Prometheus、InfluxDB、VictoriaMetrics。
- 日志(Logs): 系统运行事件的离散记录——如错误日志、访问日志、业务事件。代表工具:ELK(Elasticsearch + Logstash + Kibana)、Loki、Graylog。
- 链路(Traces): 分布式请求在多个服务间的调用路径追踪——如 HTTP 请求从 API → DB → Cache 的完整耗时。代表工具:Jaeger、Zipkin、OpenTelemetry。
第三支柱趋势: OpenTelemetry(OTel)作为 CNCF 项目,正在成为可观测数据的统一采集标准,将 Traces、Metrics、Logs 三者以统一规范融合。
家庭监控场景下的应用
在家庭服务器/NAS 监控中,可观测性通过以下组件实现:
- 指标: Prometheus + node_exporter + cAdvisor + blackbox_exporter
- 可视化: Grafana 仪表盘
- 告警: Alertmanager + 邮件/Slack 通知
- 日志(可选): Loki + Promtail