Auto-sync: 2026-04-26 16:02

2026-04-26 16:02:45 +08:00
parent 1abf0d56f5
commit d2ae5b3948
20 changed files with 1656 additions and 1731 deletions
--- a/wiki/overview.md
+++ b/wiki/overview.md
@@ -180,6 +180,20 @@ Git 是云转型计划中 DevOps 与 CI/CD 流水线的基础技能。**[[ctp-to

 **[[ctp-topic-9-ci-cd-with-gruntwork]]**（CTP Topic 9）聚焦 CI/CD 与 Gruntwork 在 AWS Landing Zone 中的实践，基于 Gruntwork 参考架构通过 Terraform/Terragrunt 实现基础设施自动化交付（⚠️ 视频待 Whisper 转录后补充详细内容）。

+**[[devops-culture-and-transformation-fostering-collaboration-agile-practices-and-innovation-linkedin]]**（DevOps Culture and Transformation）：深入阐述 DevOps 文化转型的完整框架——四大文化支柱（跨职能协作/自动化/持续改进/客户导向）、Agile 与 DevOps 的共生关系（Scrum/Kanban 提供方法论框架，CI/CD 提供工程加速能力）、以及战略转型 playbook（领导层支持 → 团队赋能 → 小步试点 → 克服阻力）。核心洞察：DevOps 本质是文化与思维转变而非工具引入；自动化应覆盖 CI/CD、IaC、可观测性三个层面；无责事后分析（blameless post-mortems）是持续改进的关键机制。未来趋势：AI/ML 赋能智能自动化、GitOps、Serverless DevOps、边缘计算 DevOps、DevSecOps 深化。与 [[ctp-topic-4-using-agile-to-run-the-cloud-transformation-program]]（敏捷落地）和 [[ctp-topic-33-an-introduction-to-gitops]]（GitOps）共同构成完整的 DevOps 知识体系。
+
+**[[cloud-devop-maturity-guideline]]**（Cloud DevOp Maturity - Guideline）：企业级 SaaS 公司的云 DevOps 成熟度评估框架与提升路径——基于 DORA 四项核心指标（部署频率、变更前置时间、变更失败率、MTTR）和 CMMI 成熟度模型，从自动化、协作文化、监控可观测性、安全集成（DevSecOps）四大支柱进行系统评估。核心工具链覆盖 CI/CD（持续集成/持续交付流水线）、IaC（Terraform/Ansible 基础设施即代码）、容器化（Kubernetes/Docker）、监控（Prometheus/Grafana）。成熟度提升路线：进行成熟度评估 → 建立 DevOps 卓越中心 → 分阶段实施改进（从 CI/CD 和自动化入手）→ 持续迭代。与 [[devops-culture-and-transformation-fostering-collaboration-agile-practices-and-innovation-linkedin]]（DevOps 文化转型）共享四大支柱框架但侧重不同——前者聚焦文化转型方法论，后者聚焦量化评估与成熟度路径；与 [[devops-maturity-model-from-traditional-it-to-advanced-devops]] 在 DevOps 成熟度模型层面关联。
+
+**[[what-i-know-about-cloud-service-delivery-1]]**（What I Know About Cloud Service Delivery 1）：云服务交付（Cloud Service Delivery）完整生命周期管理框架——核心定义：云服务交付是连接云技术能力（IaaS/PaaS/SaaS）与最终用户实际需求之间的桥梁，由多角色团队（Cloud Infrastructure Engineer / DevOps SRE / Security / FinOps / Support）协作驱动。12 大管理领域：①服务供给与部署（自动化 + 资源配置）；②基础设施管理（监控 + 补丁 + HA/DR）；③平台管理 PaaS（中间件/数据库/开发工具）；④应用运营管理（性能监控 + 持续部署 + 密钥管理）；⑤安全与合规（防火墙/IDS/IPS/IAM + GDPR/HIPAA/PCI）；⑥性能与可用性监控（SLA 99.9% vs 99.99%、SLO、Grafana 告警）；⑦事件与问题管理（Incident/Problem 双层机制）；⑧变更与配置管理（IaC + Planned/Emergency Change 区分）；⑨成本管理与优化（FinOps、Savings Plans、Right-sizing）；⑩客户接入与支持（Onboarding + 服务台）；⑪服务治理与生命周期（Service Catalog + CCOE）；⑫备份恢复与灾难管理（Backup 策略 + DR 演练）。最佳实践工具：AWS CloudWatch + Grafana（监控）、New Relic/APM（应用性能）、WAF + IP Whitelist（安全）、Terraform IaC（配置管理）。属 [[Cloud-DevOps-Maturity-Model]] 在运营管理维度的具体化，与 [[cloud-devop-maturity-guideline]]（成熟度评估）和 [[devops-culture-and-transformation-fostering-collaboration-agile-practices-and-innovation-linkedin]]（DevOps 文化）共同构成完整的云运营知识体系。
+
+**[[cloud-maturity-model-a-detailed-guide-for-cloud-adoption]]**（Cloud Maturity Model - A Detailed Guide For Cloud Adoption）：系统性介绍 **Cloud Maturity Model (CMM)** 云成熟度模型的完整指南——5级成熟度阶段（Level 0 Legacy → Level 5 Optimized）覆盖企业云转型完整路径；关键组成要素覆盖业务维度（财务/战略/组织/文化/治理/合规/采购）和技术维度（架构/应用/DevOps/安全/IaaS/PaaS/SaaS/AI/IoT）；三维评估框架（People/Processes/Technology）；7大收益（战略规划增强、团队协作提升、应用性能提升、安全性增强、上市时间缩短、行业对标、成本节约）；最佳实践（设定云采用目标、识别当前成熟度级别、选择合适的成熟度模型、遵循治理与合规、安全与风险管理）。核心理念：CMM 是云转型的全面导航仪，帮助企业找到适合自身需求的平衡点，Level 5 是目标但往往更具理想性，建议选择性采纳带来明确业务价值的要素。与 [[cloud-devop-maturity-guideline]] 在成熟度模型层面互补——前者聚焦 DevOps 交付能力成熟度，本 Source 聚焦云采用全维度成熟度；与 [[devops-maturity-model-from-traditional-it-to-advanced-devops]] 共同构成完整成熟度知识体系。
+
+**[[the-myths-and-misconceptions-about-cloud-computing-linkedin]]**（The Myths and Misconceptions About Cloud Computing | LinkedIn）：云计算领域7大常见误解及真相——澄清云安全不如本地、云计算成本高、迁移复杂、性能不可靠等认知误区。核心观点：主流云服务商通过加密、MFA、合规认证（ISO 27001/HIPAA/GDPR）提供比本地更强的安全保障；按需付费模型配合预留实例和自动扩展可显著降低成本；分阶段迁移策略和混合云方案可有效降低迁移风险；SLA 保证可用性通常超过 99.99%。属 [[Cloud-Computing]] 认知纠正的基础入门，与 [[ctp-topic-53-why-bother-with-cloud]]（云转型商业价值）共同构成云采用决策的知识基础。
+
+**[[how-can-a-multi-cloud-strategy-transform-your-business-roi]]**（How Can a Multi Cloud Strategy Transform Your Business ROI?）：多云策略（Multi-Cloud Strategy）的商业价值与实施框架——核心数据：78% 企业使用 3+ 公有云、86% 企业计划 2024 年底采用多云、优化后实现 30% 运营成本降低（Forrester）。8 大商业价值：①避免供应商锁定（保留谈判筹码）、②增强弹性与可用性（跨云冗余 99.99%）、③提升安全态势（各云最佳安全功能）、④无限弹性扩展（应对流量高峰）、⑤成本优化（跨提供商比价）、⑥加速创新（访问最新云服务）、⑦满足合规（数据主权控制）、⑧性能优化（选择最近/最快的云区域）。行业案例：电商高峰期跨云扩展、医疗机构 HIPAA 合规、金融机构多云安全。实施路径：评估需求→选择提供商（对齐服务与需求）→集成管理（Kubernetes/Terraform）→监控优化（CloudHealth/Datadog）。属 [[Multi-Cloud-Strategy]] 概念的核心来源，与 [[cloud-operating-model-key-strategies-and-best-practices]] 中的"统一治理"形成互补——多云是选择层，Cloud Operating Model 是治理层；与 [[Vendor-Lock-In]] 共同构成云供应商风险管理知识体系。
+
+**[[how-to-simplify-multi-account-deployments-monitoring-centralized-logs-for-aws-cloudformation-stacksets]]**（How to Simplify Multi-Account Deployments Monitoring: Centralized Logs for AWS CloudFormation StackSets）：AWS 官方博客（2025-10-24）详解多账户 StackSets 部署的集中日志监控方案——解决当跨 50 个账户部署关键安全基线突然失败时，团队需逐个登录账户查看日志的运营痛点。核心架构：①管理账户部署（log-setup-management.yaml）创建 Central Event Bridge Bus + CloudWatch Log Group（central-cloudformation-logs）+ KMS 加密；②通过同一 StackSet 自动向所有成员账户推送 EventBridge Rules；③StackSet 部署模板（common-resources-stackset.yaml）在目标账户创建 S3 等通用资源并触发 CloudFormation 事件。事件流：目标账户 CloudFormation 事件 → EventBridge Rules（按模式捕获）→ 跨账户 Event Bus → CloudWatch Log Group → CloudWatch Logs Insights 自定义查询。单一部署三重价值：创建中心日志基础设施 + 自动向所有成员账户推送 EventBridge 规则 + 设置跨账户 IAM 角色。成本组件：EventBridge 跨账户事件费 + CloudWatch Logs 存储与查询费 + KMS 密钥费。与 [[ctp-topic-16-cross-account-terraform-modules]]（跨账号 Terraform 模块）共享跨账户 IAM Assume Role 机制但聚焦维度不同——前者解决部署工具的跨账户访问，后者解决 StackSets 部署本身的可见性问题；与 [[what-i-know-about-cloud-service-delivery-1]] 中"性能与可用性监控"和[[ctp-topic-67-cloud-native-observability-using-opentelemetry]]（OpenTelemetry 日志链路）共同构成企业级可观测性知识体系。
+
 Cloud Transformation Programme (CTP) materials cover AWS landing zones, EKS, Terraform, GitOps, FinOps, observability, security, and enterprise architecture. Key themes: 3 Lines of Defence framework, ITSM, container hardening, backup & DR strategies. DevOps culture focuses on four pillars: Collaboration, Automation (CI/CD, IaC), Continuous Improvement (Kaizen), and Customer-Centricity. Agile practices (Scrum, Kanban) are symbiotic with DevOps. Emerging trends: DevSecOps, GitOps, Serverless DevOps, AI/ML-driven automation, and Edge Computing DevOps.

 **[[ctp-topic-32-using-atlantis-cicd-for-infrastructure-deployments]]**（CTP Topic 32）：Atlantis 替代 Jenkins 用于 Terraform IaC 部署——针对当前 Jenkins 流水线初始化慢（多次代码克隆/顺序测试/ECS 预配置）和架构复杂（持续叠加功能导致脆弱）的双重痛点，Atlantis 提供 PR 评论式协作模型，开发者直接在 GitHub PR 上评论 `atlantis plan`/`apply` 即可触发变更，无需独立账号；每个 Landing Zone 共享账户部署单台 EC2 实例，通过 GitHub Enterprise Webhook 接收通知，服务账号负责评论/合并/关闭 PR；跨账户访问通过在各账户部署的 IAM 角色实现；并行构建支持多模块并发 plan/apply；锁定机制防止多 PR 同时操作同一模块产生冲突。Atlantis 在 merge 前即应用变更，确保代码与基础设施始终同步。属 [[GitOps]] 工具实践层，与 [[ctp-topic-33-an-introduction-to-gitops]]（GitOps 概念）和 [[ctp-topic-9-ci-cd-with-gruntwork]]（Gruntwork CI/CD）共同构成完整链路。注意：[[ctp-topic-39-implementing-eks-in-the-aws-lab-landing-zone]] 提到 Atlantis 当前不支持 EKS 部署，两者存在实践约束差异。
@@ -350,6 +364,8 @@ Key concepts: [[Process]], [[Value]], [[Value-Stream]], [[Value-Adding]], [[Wast

 **[[ctp-topic-72-enterprise-dr-strategy-aws-backup]]**（CTP Topic 72）：AWS 解决方案架构师 Sabith 深入讲解企业级灾难恢复策略与 AWS Backup 架构设计——核心内容：HA（高可用）关注系统运行时间和 MTBF，DR（灾难恢复）专注于防止数据丢失和系统恢复，两者互补；RPO（恢复点目标）定义可接受的最大数据丢失量，RTO（恢复时间目标）定义可接受的最大停机时间；AWS Backup 完全托管、基于策略，通过 Backup Plans 定义何时备份什么，Backup Vaults 存储恢复点，支持跨账户跨区域复制；四级 DR 架构模式（Backup and Restore → Pilot Light → Warm Standby → Active-Active）提供从低成本到高弹性的递进选择；增量备份仅捕获变更，节省成本；Vault Lock 合规模式防止任何人（包括根用户）提前删除恢复点，有效防勒索软件；建议使用独立的 Vault/Bunker Account 存储备份副本，取证账户（Forensic Account）定期测试恢复点并扫描恶意软件。属 [[AWS-Landing-Zone]] DR 与数据保护层的理论基础补充，与 [[ctp-topic-44-aws-backup-in-micro-focus]]（聚焦 Micro Focus 内部评估）和 [[ctp-topic-73-aws-backup-implementation]]（聚焦 CTP 迁移实施）构成完整的 AWS Backup 知识体系。

+**[[rto-vs-rpo-key-differences-for-modern-disaster-recovery]]**（RTO vs RPO: Key Differences for Modern Disaster Recovery）：RTO（Recovery Time Objective）和 RPO（Recovery Point Objective）在现代灾难恢复与持续交付中的关键区别与实践应用——核心区分：RTO 衡量系统停机时长容忍度（从故障时刻开始计时），RPO 衡量数据丢失容忍度（从上一备份时刻向前测量）；现代部署环境下软件故障（Bug/错误迁移/AI 模型异常）比硬件灾难更频繁，每日常规发布即潜在 RTO/RPO 场景。Feature Flag 驱动的新范式：通过部署与发布解耦（Deploy whenever you want, release when you're ready）、渐进式灰度发布（1%→5%→25%→100%）和 Kill Switch（即时禁用故障功能），将 RTO 从"小时级紧急回滚部署"缩短至"秒级配置开关切换"，RPO 通过 Feature Flag 保护数据完整性避免回滚时数据损坏。应用分层恢复策略：Tier 1 Critical（支付/认证，RTO<5min/RPO<1min）→ Tier 2 Important（管理后台/报表，RTO<1h/RPO<15min）→ Tier 3 Nice-to-have（内部工具，RTO<4h/RPO<1h）。成本效益原则：若停机1小时损失 $10K，不要每年花 $100K 基础设施预防——Feature Flag 方案比传统热备基础设施成本更低、效果更好（HP/Christian Dior 案例）。属 [[ctp-topic-72-enterprise-dr-strategy-aws-backup]]（AWS 基础设施层 DR）在软件交付层的互补——前者聚焦备份基础设施，后者聚焦代码层快速恢复，共同构成完整 DR 知识体系；与 [[what-i-know-about-cloud-service-delivery-1]]（"备份恢复与灾难管理"第12领域）形成引用关系；与 [[cloud-devop-maturity-guideline]] 的 DORA MTTR 指标关联（MTTR 直接量化 RTO）。
+
 **[[Install WSL]]**（[[install-wsl]]）：微软官方 WSL 完整安装指南——`wsl --install` 一键安装（Windows 10/11 Build 19041+），支持 Ubuntu/Debian/SUSE/Kali 等多发行版并行安装，`wsl.exe --set-default-version` 切换 WSL1/WSL2；离线场景通过 MSI + DISM 命令手动启用 Virtual Machine Platform；运行入口推荐 Windows Terminal（含多标签、自定义快捷键）。[[Install WSL]] 与 [[WSL2 启动与网络配置指南]] 互补——前者解决安装问题，后者解决网络配置问题。

 **[[WSL2]]** 是 Windows 内置的 Linux 运行环境，WSL2 默认使用 NAT 网络模式导致 Windows 代理无法被 WSL2 内部访问。通过 `.wslconfig` 启用 `networkingMode=mirrored` + `dnsTunneling=true` 可实现 WSL2 与 Windows 共享网络堆栈；国内环境下可使用 `ghproxy.com` 反向代理加速 GitHub 下载。[[WSL2]] 与 [[Ubuntu Server]] 同属 Linux 环境，[[WSL2]] 侧重 Windows 桌面开发场景，[[Ubuntu Server]] 侧重无头服务器场景。