Files
nexus/wiki/entities/SRE-Team.md
2026-04-24 04:02:45 +08:00

42 lines
1.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "SRE Team"
type: entity
tags: [SRE, DevOps, Automation, AWS, Tools]
last_updated: 2026-04-14
---
## Overview
SRE TeamSite Reliability Engineering 团队)是该组织中负责 AWS Landing Zone 运维自动化和工具开发的团队。在 CTP Topic 28 中SRE 团队展示了其开发的 AWS Tag Validation Tool展示了 SRE 实践中的自动化工具开发能力。
## Responsibilities
| 职责 | 说明 |
|------|------|
| 运维自动化 | 开发自动化工具减少人工重复操作,通过 IaC + CI/CD 实现 Standard Change |
| 工具开发 | 构建内部平台工具(如 Tag Validation Tool |
| 可靠性保障 | 确保 AWS 基础设施的高可用性和可观测性,定义 SLO/SLR 体系 |
| 内部平台 | 维护 SRE Tools Repository 内部代码仓库 |
| SRE 三阶段支持 | Build构建/Early Live Support早期上线支持/BAU日常运维三个阶段与产品团队协作 |
## SRE Tools Repository
SRE 团队维护的内部代码仓库([[SRE-Tools-Repository]]),集中存放所有 SRE 自动化脚本和工具:
- **Tag Validation Tool**Python/Boto3 AWS 标签验证工具
- 环境管理Poetry
- 配置管理variables.yaml每个账户独立配置
## Related Concepts
- [[Tag-Validation-Tool]]SRE 团队开发的标签验证工具
- [[Variables-YAML]]Tag Validation Tool 的配置文件
- [[Boto3]]SRE 工具使用的 AWS Python SDK
- [[Poetry]]SRE 工具的 Python 环境管理工具
- [[AWS-Landing-Zone]]SRE 团队服务的核心基础设施平台
## Sources
- [[ctp-topic-28-aws-tag-validation-tool]]
- [[ctp-topic-30-managing-change]]