title, type, tags, date
| title |
type |
tags |
date |
| Cloud Monitoring |
concept |
| AWS |
| CloudOps |
| Observability |
| CTP |
| Monitoring |
|
2026-04-14 |
Definition
Cloud Monitoring(云监控)是指在公有云环境(AWS/Azure/GCP)中,对基础设施、服务器、应用程序、硬件和网络等数据源进行持续监控和事件采集的系统性实践。云监控的核心挑战在于云环境的动态性——资源生命周期短、数量庞大、跨多账户多区域分布,传统基于静态服务器的监控工具难以有效覆盖。
Core Properties
- 动态发现:云环境中资源随时创建/销毁,监控必须支持自动发现而非静态配置
- 多账户覆盖:AWS Organizations 多账户架构下,需要集中化监控能力
- 无代理采集:云环境下倾向于通过 API(如 CloudWatch)而非在被监控目标上安装 Agent
- 跨平台支持:现代监控解决方案需支持 AWS/Azure/GCP 等多云环境
- 策略驱动:通过 Policy/Management Pack 定义监控规则,实现规模化管理
Key Mechanisms
- CloudWatch API:AWS 的指标和日志服务,是 AWS 云监控的统一数据源
- IAM Role 跨账户访问:通过角色信任关系实现监控账户安全读取被监控账户数据,无需共享 Access Key
- Management Pack:监控平台(如 OBM)的策略包,定义采集间隔、指标、阈值和数据源
- Global/Regional 分层架构:区域级 OBM 采集数据 → 全球级 OBM 汇聚 → 工单系统触发事件处理
Comparison with Traditional Monitoring
| 维度 |
传统监控 |
云监控 |
| 目标发现 |
手动添加 |
自动发现 |
| 部署模式 |
被监控目标安装 Agent |
API 拉取(无代理) |
| 账户覆盖 |
单点监控 |
多账户集中采集 |
| 伸缩性 |
固定容量 |
按需弹性 |
| 密钥管理 |
共享 Access Key |
IAM Role 信任关系 |
Related Concepts
References