1.8 KiB
1.8 KiB
title, type, tags, last_updated
| title | type | tags | last_updated | |||||
|---|---|---|---|---|---|---|---|---|
| SRE Team | entity |
|
2026-04-28 |
Overview
SRE Team(Site Reliability Engineering 团队)是该组织中负责 AWS Landing Zone 运维自动化和工具开发的团队。在 CTP Topic 28 中,SRE 团队展示了其开发的 AWS Tag Validation Tool,展示了 SRE 实践中的自动化工具开发能力。
Responsibilities
| 职责 | 说明 |
|---|---|
| 运维自动化 | 开发自动化工具减少人工重复操作,通过 IaC + CI/CD 实现 Standard Change |
| 工具开发 | 构建内部平台工具(如 Tag Validation Tool) |
| 可靠性保障 | 确保 AWS 基础设施的高可用性和可观测性,定义 SLO/SLR 体系 |
| 内部平台 | 维护 SRE Tools Repository 内部代码仓库 |
| SRE 三阶段支持 | Build(构建)/Early Live Support(早期上线支持)/BAU(日常运维)三个阶段与产品团队协作 |
SRE Tools Repository
SRE 团队维护的内部代码仓库(SRE-Tools-Repository),集中存放所有 SRE 自动化脚本和工具:
- Tag Validation Tool:Python/Boto3 AWS 标签验证工具
- 环境管理:Poetry
- 配置管理:variables.yaml(每个账户独立配置)
Related Concepts
- Tag-Validation-Tool:SRE 团队开发的标签验证工具
- Variables-YAML:Tag Validation Tool 的配置文件
- Boto3:SRE 工具使用的 AWS Python SDK
- Poetry:SRE 工具的 Python 环境管理工具
- AWS-Landing-Zone:SRE 团队服务的核心基础设施平台