--- title: "SRE Team" type: entity tags: [SRE, DevOps, Automation, AWS, Tools] last_updated: 2026-04-14 --- ## Overview SRE Team(Site Reliability Engineering 团队)是该组织中负责 AWS Landing Zone 运维自动化和工具开发的团队。在 CTP Topic 28 中,SRE 团队展示了其开发的 AWS Tag Validation Tool,展示了 SRE 实践中的自动化工具开发能力。 ## Responsibilities | 职责 | 说明 | |------|------| | 运维自动化 | 开发自动化工具减少人工重复操作,通过 IaC + CI/CD 实现 Standard Change | | 工具开发 | 构建内部平台工具(如 Tag Validation Tool) | | 可靠性保障 | 确保 AWS 基础设施的高可用性和可观测性,定义 SLO/SLR 体系 | | 内部平台 | 维护 SRE Tools Repository 内部代码仓库 | | SRE 三阶段支持 | Build(构建)/Early Live Support(早期上线支持)/BAU(日常运维)三个阶段与产品团队协作 | ## SRE Tools Repository SRE 团队维护的内部代码仓库([[SRE-Tools-Repository]]),集中存放所有 SRE 自动化脚本和工具: - **Tag Validation Tool**:Python/Boto3 AWS 标签验证工具 - 环境管理:Poetry - 配置管理:variables.yaml(每个账户独立配置) ## Related Concepts - [[Tag-Validation-Tool]]:SRE 团队开发的标签验证工具 - [[Variables-YAML]]:Tag Validation Tool 的配置文件 - [[Boto3]]:SRE 工具使用的 AWS Python SDK - [[Poetry]]:SRE 工具的 Python 环境管理工具 - [[AWS-Landing-Zone]]:SRE 团队服务的核心基础设施平台 ## Sources - [[ctp-topic-28-aws-tag-validation-tool]] - [[ctp-topic-30-managing-change]]