Files
nexus/wiki/entities/SRE-Team.md
2026-04-24 04:02:45 +08:00

1.6 KiB
Raw Blame History

title, type, tags, last_updated
title type tags last_updated
SRE Team entity
SRE
DevOps
Automation
AWS
Tools
2026-04-14

Overview

SRE TeamSite Reliability Engineering 团队)是该组织中负责 AWS Landing Zone 运维自动化和工具开发的团队。在 CTP Topic 28 中SRE 团队展示了其开发的 AWS Tag Validation Tool展示了 SRE 实践中的自动化工具开发能力。

Responsibilities

职责 说明
运维自动化 开发自动化工具减少人工重复操作,通过 IaC + CI/CD 实现 Standard Change
工具开发 构建内部平台工具(如 Tag Validation Tool
可靠性保障 确保 AWS 基础设施的高可用性和可观测性,定义 SLO/SLR 体系
内部平台 维护 SRE Tools Repository 内部代码仓库
SRE 三阶段支持 Build构建/Early Live Support早期上线支持/BAU日常运维三个阶段与产品团队协作

SRE Tools Repository

SRE 团队维护的内部代码仓库(SRE-Tools-Repository),集中存放所有 SRE 自动化脚本和工具:

  • Tag Validation ToolPython/Boto3 AWS 标签验证工具
  • 环境管理Poetry
  • 配置管理variables.yaml每个账户独立配置

Sources