Files
nexus/wiki/concepts/Cloud-Monitoring.md

2.4 KiB
Raw Blame History

title, type, tags, date
title type tags date
Cloud Monitoring concept
AWS
CloudOps
Observability
CTP
Monitoring
2026-04-14

Definition

Cloud Monitoring云监控是指在公有云环境AWS/Azure/GCP对基础设施、服务器、应用程序、硬件和网络等数据源进行持续监控和事件采集的系统性实践。云监控的核心挑战在于云环境的动态性——资源生命周期短、数量庞大、跨多账户多区域分布传统基于静态服务器的监控工具难以有效覆盖。

Core Properties

  • 动态发现:云环境中资源随时创建/销毁,监控必须支持自动发现而非静态配置
  • 多账户覆盖AWS Organizations 多账户架构下,需要集中化监控能力
  • 无代理采集:云环境下倾向于通过 API如 CloudWatch而非在被监控目标上安装 Agent
  • 跨平台支持:现代监控解决方案需支持 AWS/Azure/GCP 等多云环境
  • 策略驱动:通过 Policy/Management Pack 定义监控规则,实现规模化管理

Key Mechanisms

  • CloudWatch APIAWS 的指标和日志服务,是 AWS 云监控的统一数据源
  • IAM Role 跨账户访问:通过角色信任关系实现监控账户安全读取被监控账户数据,无需共享 Access Key
  • Management Pack:监控平台(如 OBM的策略包定义采集间隔、指标、阈值和数据源
  • Global/Regional 分层架构:区域级 OBM 采集数据 → 全球级 OBM 汇聚 → 工单系统触发事件处理

Comparison with Traditional Monitoring

维度 传统监控 云监控
目标发现 手动添加 自动发现
部署模式 被监控目标安装 Agent API 拉取(无代理)
账户覆盖 单点监控 多账户集中采集
伸缩性 固定容量 按需弹性
密钥管理 共享 Access Key IAM Role 信任关系

References