48 lines
1.8 KiB
Markdown
48 lines
1.8 KiB
Markdown
---
|
||
title: "Observability"
|
||
type: concept
|
||
tags: [devops, monitoring, sre, infrastructure]
|
||
last_updated: 2026-04-26
|
||
---
|
||
|
||
## Observability(可观测性)
|
||
|
||
**中文名称:** 可观测性
|
||
|
||
**类型:** 技术方法论 / SRE 核心支柱
|
||
|
||
**别名:**
|
||
- 可观测性
|
||
- 云原生可观测性
|
||
- Observability Stack
|
||
|
||
---
|
||
|
||
## Definition
|
||
|
||
可观测性(Observability)是指通过系统外部输出来推断其内部状态的能力。在 IT 运维领域,通常由三大支柱构成:
|
||
|
||
1. **指标(Metrics):** 系统运行时数值数据的时序聚合——如 CPU 使用率、内存占用、请求 QPS。代表工具:Prometheus、InfluxDB、VictoriaMetrics。
|
||
2. **日志(Logs):** 系统运行事件的离散记录——如错误日志、访问日志、业务事件。代表工具:ELK(Elasticsearch + Logstash + Kibana)、Loki、Graylog。
|
||
3. **链路(Traces):** 分布式请求在多个服务间的调用路径追踪——如 HTTP 请求从 API → DB → Cache 的完整耗时。代表工具:Jaeger、Zipkin、OpenTelemetry。
|
||
|
||
**第三支柱趋势:** OpenTelemetry(OTel)作为 CNCF 项目,正在成为可观测数据的统一采集标准,将 Traces、Metrics、Logs 三者以统一规范融合。
|
||
|
||
---
|
||
|
||
## 家庭监控场景下的应用
|
||
|
||
在家庭服务器/NAS 监控中,可观测性通过以下组件实现:
|
||
- **指标:** Prometheus + node_exporter + cAdvisor + blackbox_exporter
|
||
- **可视化:** Grafana 仪表盘
|
||
- **告警:** Alertmanager + 邮件/Slack 通知
|
||
- **日志(可选):** Loki + Promtail
|
||
|
||
---
|
||
|
||
## Related Sources
|
||
- [[家庭监控方案-prometheus-grafana-node-exporter-cadvisor-blackbox]]
|
||
- [[public-cloud-learning-sessions-observability-with-opentelemetry]]
|
||
- [[ctp-topic-67-cloud-native-observability-using-opentelemetry]]
|
||
- [[ctp-topic-8-implementation-of-cloud-monitoring-using-micro-focus-operations-brid]]
|