42 lines
1.7 KiB
Markdown
42 lines
1.7 KiB
Markdown
---
|
||
title: "SRE Team"
|
||
type: entity
|
||
tags: [SRE, DevOps, Automation, AWS, Tools]
|
||
last_updated: 2026-04-28
|
||
---
|
||
|
||
## Overview
|
||
|
||
SRE Team(Site Reliability Engineering 团队)是该组织中负责 AWS Landing Zone 运维自动化和工具开发的团队。在 CTP Topic 28 中,SRE 团队展示了其开发的 AWS Tag Validation Tool,展示了 SRE 实践中的自动化工具开发能力。
|
||
|
||
## Responsibilities
|
||
|
||
| 职责 | 说明 |
|
||
|------|------|
|
||
| 运维自动化 | 开发自动化工具减少人工重复操作,通过 IaC + CI/CD 实现 Standard Change |
|
||
| 工具开发 | 构建内部平台工具(如 Tag Validation Tool) |
|
||
| 可靠性保障 | 确保 AWS 基础设施的高可用性和可观测性,定义 SLO/SLR 体系 |
|
||
| 内部平台 | 维护 SRE Tools Repository 内部代码仓库 |
|
||
| SRE 三阶段支持 | Build(构建)/Early Live Support(早期上线支持)/BAU(日常运维)三个阶段与产品团队协作 |
|
||
|
||
## SRE Tools Repository
|
||
|
||
SRE 团队维护的内部代码仓库([[SRE-Tools-Repository]]),集中存放所有 SRE 自动化脚本和工具:
|
||
|
||
- **Tag Validation Tool**:Python/Boto3 AWS 标签验证工具
|
||
- 环境管理:Poetry
|
||
- 配置管理:variables.yaml(每个账户独立配置)
|
||
|
||
## Related Concepts
|
||
|
||
- [[Tag-Validation-Tool]]:SRE 团队开发的标签验证工具
|
||
- [[Variables-YAML]]:Tag Validation Tool 的配置文件
|
||
- [[Boto3]]:SRE 工具使用的 AWS Python SDK
|
||
- [[Poetry]]:SRE 工具的 Python 环境管理工具
|
||
- [[AWS-Landing-Zone]]:SRE 团队服务的核心基础设施平台
|
||
|
||
## Sources
|
||
- [[ctp-topic-28-aws-tag-validation-tool]]
|
||
- [[ctp-topic-30-managing-change]]
|
||
- [[ctp-topic-72-implementing-an-enterprise-dr-strategy-using-aws-backup.md]]
|