Auto-sync: 2026-04-26 16:02
This commit is contained in:
@@ -180,6 +180,20 @@ Git 是云转型计划中 DevOps 与 CI/CD 流水线的基础技能。**[[ctp-to
|
||||
|
||||
**[[ctp-topic-9-ci-cd-with-gruntwork]]**(CTP Topic 9)聚焦 CI/CD 与 Gruntwork 在 AWS Landing Zone 中的实践,基于 Gruntwork 参考架构通过 Terraform/Terragrunt 实现基础设施自动化交付(⚠️ 视频待 Whisper 转录后补充详细内容)。
|
||||
|
||||
**[[devops-culture-and-transformation-fostering-collaboration-agile-practices-and-innovation-linkedin]]**(DevOps Culture and Transformation):深入阐述 DevOps 文化转型的完整框架——四大文化支柱(跨职能协作/自动化/持续改进/客户导向)、Agile 与 DevOps 的共生关系(Scrum/Kanban 提供方法论框架,CI/CD 提供工程加速能力)、以及战略转型 playbook(领导层支持 → 团队赋能 → 小步试点 → 克服阻力)。核心洞察:DevOps 本质是文化与思维转变而非工具引入;自动化应覆盖 CI/CD、IaC、可观测性三个层面;无责事后分析(blameless post-mortems)是持续改进的关键机制。未来趋势:AI/ML 赋能智能自动化、GitOps、Serverless DevOps、边缘计算 DevOps、DevSecOps 深化。与 [[ctp-topic-4-using-agile-to-run-the-cloud-transformation-program]](敏捷落地)和 [[ctp-topic-33-an-introduction-to-gitops]](GitOps)共同构成完整的 DevOps 知识体系。
|
||||
|
||||
**[[cloud-devop-maturity-guideline]]**(Cloud DevOp Maturity - Guideline):企业级 SaaS 公司的云 DevOps 成熟度评估框架与提升路径——基于 DORA 四项核心指标(部署频率、变更前置时间、变更失败率、MTTR)和 CMMI 成熟度模型,从自动化、协作文化、监控可观测性、安全集成(DevSecOps)四大支柱进行系统评估。核心工具链覆盖 CI/CD(持续集成/持续交付流水线)、IaC(Terraform/Ansible 基础设施即代码)、容器化(Kubernetes/Docker)、监控(Prometheus/Grafana)。成熟度提升路线:进行成熟度评估 → 建立 DevOps 卓越中心 → 分阶段实施改进(从 CI/CD 和自动化入手)→ 持续迭代。与 [[devops-culture-and-transformation-fostering-collaboration-agile-practices-and-innovation-linkedin]](DevOps 文化转型)共享四大支柱框架但侧重不同——前者聚焦文化转型方法论,后者聚焦量化评估与成熟度路径;与 [[devops-maturity-model-from-traditional-it-to-advanced-devops]] 在 DevOps 成熟度模型层面关联。
|
||||
|
||||
**[[what-i-know-about-cloud-service-delivery-1]]**(What I Know About Cloud Service Delivery 1):云服务交付(Cloud Service Delivery)完整生命周期管理框架——核心定义:云服务交付是连接云技术能力(IaaS/PaaS/SaaS)与最终用户实际需求之间的桥梁,由多角色团队(Cloud Infrastructure Engineer / DevOps SRE / Security / FinOps / Support)协作驱动。12 大管理领域:①服务供给与部署(自动化 + 资源配置);②基础设施管理(监控 + 补丁 + HA/DR);③平台管理 PaaS(中间件/数据库/开发工具);④应用运营管理(性能监控 + 持续部署 + 密钥管理);⑤安全与合规(防火墙/IDS/IPS/IAM + GDPR/HIPAA/PCI);⑥性能与可用性监控(SLA 99.9% vs 99.99%、SLO、Grafana 告警);⑦事件与问题管理(Incident/Problem 双层机制);⑧变更与配置管理(IaC + Planned/Emergency Change 区分);⑨成本管理与优化(FinOps、Savings Plans、Right-sizing);⑩客户接入与支持(Onboarding + 服务台);⑪服务治理与生命周期(Service Catalog + CCOE);⑫备份恢复与灾难管理(Backup 策略 + DR 演练)。最佳实践工具:AWS CloudWatch + Grafana(监控)、New Relic/APM(应用性能)、WAF + IP Whitelist(安全)、Terraform IaC(配置管理)。属 [[Cloud-DevOps-Maturity-Model]] 在运营管理维度的具体化,与 [[cloud-devop-maturity-guideline]](成熟度评估)和 [[devops-culture-and-transformation-fostering-collaboration-agile-practices-and-innovation-linkedin]](DevOps 文化)共同构成完整的云运营知识体系。
|
||||
|
||||
**[[cloud-maturity-model-a-detailed-guide-for-cloud-adoption]]**(Cloud Maturity Model - A Detailed Guide For Cloud Adoption):系统性介绍 **Cloud Maturity Model (CMM)** 云成熟度模型的完整指南——5级成熟度阶段(Level 0 Legacy → Level 5 Optimized)覆盖企业云转型完整路径;关键组成要素覆盖业务维度(财务/战略/组织/文化/治理/合规/采购)和技术维度(架构/应用/DevOps/安全/IaaS/PaaS/SaaS/AI/IoT);三维评估框架(People/Processes/Technology);7大收益(战略规划增强、团队协作提升、应用性能提升、安全性增强、上市时间缩短、行业对标、成本节约);最佳实践(设定云采用目标、识别当前成熟度级别、选择合适的成熟度模型、遵循治理与合规、安全与风险管理)。核心理念:CMM 是云转型的全面导航仪,帮助企业找到适合自身需求的平衡点,Level 5 是目标但往往更具理想性,建议选择性采纳带来明确业务价值的要素。与 [[cloud-devop-maturity-guideline]] 在成熟度模型层面互补——前者聚焦 DevOps 交付能力成熟度,本 Source 聚焦云采用全维度成熟度;与 [[devops-maturity-model-from-traditional-it-to-advanced-devops]] 共同构成完整成熟度知识体系。
|
||||
|
||||
**[[the-myths-and-misconceptions-about-cloud-computing-linkedin]]**(The Myths and Misconceptions About Cloud Computing | LinkedIn):云计算领域7大常见误解及真相——澄清云安全不如本地、云计算成本高、迁移复杂、性能不可靠等认知误区。核心观点:主流云服务商通过加密、MFA、合规认证(ISO 27001/HIPAA/GDPR)提供比本地更强的安全保障;按需付费模型配合预留实例和自动扩展可显著降低成本;分阶段迁移策略和混合云方案可有效降低迁移风险;SLA 保证可用性通常超过 99.99%。属 [[Cloud-Computing]] 认知纠正的基础入门,与 [[ctp-topic-53-why-bother-with-cloud]](云转型商业价值)共同构成云采用决策的知识基础。
|
||||
|
||||
**[[how-can-a-multi-cloud-strategy-transform-your-business-roi]]**(How Can a Multi Cloud Strategy Transform Your Business ROI?):多云策略(Multi-Cloud Strategy)的商业价值与实施框架——核心数据:78% 企业使用 3+ 公有云、86% 企业计划 2024 年底采用多云、优化后实现 30% 运营成本降低(Forrester)。8 大商业价值:①避免供应商锁定(保留谈判筹码)、②增强弹性与可用性(跨云冗余 99.99%)、③提升安全态势(各云最佳安全功能)、④无限弹性扩展(应对流量高峰)、⑤成本优化(跨提供商比价)、⑥加速创新(访问最新云服务)、⑦满足合规(数据主权控制)、⑧性能优化(选择最近/最快的云区域)。行业案例:电商高峰期跨云扩展、医疗机构 HIPAA 合规、金融机构多云安全。实施路径:评估需求→选择提供商(对齐服务与需求)→集成管理(Kubernetes/Terraform)→监控优化(CloudHealth/Datadog)。属 [[Multi-Cloud-Strategy]] 概念的核心来源,与 [[cloud-operating-model-key-strategies-and-best-practices]] 中的"统一治理"形成互补——多云是选择层,Cloud Operating Model 是治理层;与 [[Vendor-Lock-In]] 共同构成云供应商风险管理知识体系。
|
||||
|
||||
**[[how-to-simplify-multi-account-deployments-monitoring-centralized-logs-for-aws-cloudformation-stacksets]]**(How to Simplify Multi-Account Deployments Monitoring: Centralized Logs for AWS CloudFormation StackSets):AWS 官方博客(2025-10-24)详解多账户 StackSets 部署的集中日志监控方案——解决当跨 50 个账户部署关键安全基线突然失败时,团队需逐个登录账户查看日志的运营痛点。核心架构:①管理账户部署(log-setup-management.yaml)创建 Central Event Bridge Bus + CloudWatch Log Group(central-cloudformation-logs)+ KMS 加密;②通过同一 StackSet 自动向所有成员账户推送 EventBridge Rules;③StackSet 部署模板(common-resources-stackset.yaml)在目标账户创建 S3 等通用资源并触发 CloudFormation 事件。事件流:目标账户 CloudFormation 事件 → EventBridge Rules(按模式捕获)→ 跨账户 Event Bus → CloudWatch Log Group → CloudWatch Logs Insights 自定义查询。单一部署三重价值:创建中心日志基础设施 + 自动向所有成员账户推送 EventBridge 规则 + 设置跨账户 IAM 角色。成本组件:EventBridge 跨账户事件费 + CloudWatch Logs 存储与查询费 + KMS 密钥费。与 [[ctp-topic-16-cross-account-terraform-modules]](跨账号 Terraform 模块)共享跨账户 IAM Assume Role 机制但聚焦维度不同——前者解决部署工具的跨账户访问,后者解决 StackSets 部署本身的可见性问题;与 [[what-i-know-about-cloud-service-delivery-1]] 中"性能与可用性监控"和[[ctp-topic-67-cloud-native-observability-using-opentelemetry]](OpenTelemetry 日志链路)共同构成企业级可观测性知识体系。
|
||||
|
||||
Cloud Transformation Programme (CTP) materials cover AWS landing zones, EKS, Terraform, GitOps, FinOps, observability, security, and enterprise architecture. Key themes: 3 Lines of Defence framework, ITSM, container hardening, backup & DR strategies. DevOps culture focuses on four pillars: Collaboration, Automation (CI/CD, IaC), Continuous Improvement (Kaizen), and Customer-Centricity. Agile practices (Scrum, Kanban) are symbiotic with DevOps. Emerging trends: DevSecOps, GitOps, Serverless DevOps, AI/ML-driven automation, and Edge Computing DevOps.
|
||||
|
||||
**[[ctp-topic-32-using-atlantis-cicd-for-infrastructure-deployments]]**(CTP Topic 32):Atlantis 替代 Jenkins 用于 Terraform IaC 部署——针对当前 Jenkins 流水线初始化慢(多次代码克隆/顺序测试/ECS 预配置)和架构复杂(持续叠加功能导致脆弱)的双重痛点,Atlantis 提供 PR 评论式协作模型,开发者直接在 GitHub PR 上评论 `atlantis plan`/`apply` 即可触发变更,无需独立账号;每个 Landing Zone 共享账户部署单台 EC2 实例,通过 GitHub Enterprise Webhook 接收通知,服务账号负责评论/合并/关闭 PR;跨账户访问通过在各账户部署的 IAM 角色实现;并行构建支持多模块并发 plan/apply;锁定机制防止多 PR 同时操作同一模块产生冲突。Atlantis 在 merge 前即应用变更,确保代码与基础设施始终同步。属 [[GitOps]] 工具实践层,与 [[ctp-topic-33-an-introduction-to-gitops]](GitOps 概念)和 [[ctp-topic-9-ci-cd-with-gruntwork]](Gruntwork CI/CD)共同构成完整链路。注意:[[ctp-topic-39-implementing-eks-in-the-aws-lab-landing-zone]] 提到 Atlantis 当前不支持 EKS 部署,两者存在实践约束差异。
|
||||
@@ -350,6 +364,8 @@ Key concepts: [[Process]], [[Value]], [[Value-Stream]], [[Value-Adding]], [[Wast
|
||||
|
||||
**[[ctp-topic-72-enterprise-dr-strategy-aws-backup]]**(CTP Topic 72):AWS 解决方案架构师 Sabith 深入讲解企业级灾难恢复策略与 AWS Backup 架构设计——核心内容:HA(高可用)关注系统运行时间和 MTBF,DR(灾难恢复)专注于防止数据丢失和系统恢复,两者互补;RPO(恢复点目标)定义可接受的最大数据丢失量,RTO(恢复时间目标)定义可接受的最大停机时间;AWS Backup 完全托管、基于策略,通过 Backup Plans 定义何时备份什么,Backup Vaults 存储恢复点,支持跨账户跨区域复制;四级 DR 架构模式(Backup and Restore → Pilot Light → Warm Standby → Active-Active)提供从低成本到高弹性的递进选择;增量备份仅捕获变更,节省成本;Vault Lock 合规模式防止任何人(包括根用户)提前删除恢复点,有效防勒索软件;建议使用独立的 Vault/Bunker Account 存储备份副本,取证账户(Forensic Account)定期测试恢复点并扫描恶意软件。属 [[AWS-Landing-Zone]] DR 与数据保护层的理论基础补充,与 [[ctp-topic-44-aws-backup-in-micro-focus]](聚焦 Micro Focus 内部评估)和 [[ctp-topic-73-aws-backup-implementation]](聚焦 CTP 迁移实施)构成完整的 AWS Backup 知识体系。
|
||||
|
||||
**[[rto-vs-rpo-key-differences-for-modern-disaster-recovery]]**(RTO vs RPO: Key Differences for Modern Disaster Recovery):RTO(Recovery Time Objective)和 RPO(Recovery Point Objective)在现代灾难恢复与持续交付中的关键区别与实践应用——核心区分:RTO 衡量系统停机时长容忍度(从故障时刻开始计时),RPO 衡量数据丢失容忍度(从上一备份时刻向前测量);现代部署环境下软件故障(Bug/错误迁移/AI 模型异常)比硬件灾难更频繁,每日常规发布即潜在 RTO/RPO 场景。Feature Flag 驱动的新范式:通过部署与发布解耦(Deploy whenever you want, release when you're ready)、渐进式灰度发布(1%→5%→25%→100%)和 Kill Switch(即时禁用故障功能),将 RTO 从"小时级紧急回滚部署"缩短至"秒级配置开关切换",RPO 通过 Feature Flag 保护数据完整性避免回滚时数据损坏。应用分层恢复策略:Tier 1 Critical(支付/认证,RTO<5min/RPO<1min)→ Tier 2 Important(管理后台/报表,RTO<1h/RPO<15min)→ Tier 3 Nice-to-have(内部工具,RTO<4h/RPO<1h)。成本效益原则:若停机1小时损失 $10K,不要每年花 $100K 基础设施预防——Feature Flag 方案比传统热备基础设施成本更低、效果更好(HP/Christian Dior 案例)。属 [[ctp-topic-72-enterprise-dr-strategy-aws-backup]](AWS 基础设施层 DR)在软件交付层的互补——前者聚焦备份基础设施,后者聚焦代码层快速恢复,共同构成完整 DR 知识体系;与 [[what-i-know-about-cloud-service-delivery-1]]("备份恢复与灾难管理"第12领域)形成引用关系;与 [[cloud-devop-maturity-guideline]] 的 DORA MTTR 指标关联(MTTR 直接量化 RTO)。
|
||||
|
||||
**[[Install WSL]]**([[install-wsl]]):微软官方 WSL 完整安装指南——`wsl --install` 一键安装(Windows 10/11 Build 19041+),支持 Ubuntu/Debian/SUSE/Kali 等多发行版并行安装,`wsl.exe --set-default-version` 切换 WSL1/WSL2;离线场景通过 MSI + DISM 命令手动启用 Virtual Machine Platform;运行入口推荐 Windows Terminal(含多标签、自定义快捷键)。[[Install WSL]] 与 [[WSL2 启动与网络配置指南]] 互补——前者解决安装问题,后者解决网络配置问题。
|
||||
|
||||
**[[WSL2]]** 是 Windows 内置的 Linux 运行环境,WSL2 默认使用 NAT 网络模式导致 Windows 代理无法被 WSL2 内部访问。通过 `.wslconfig` 启用 `networkingMode=mirrored` + `dnsTunneling=true` 可实现 WSL2 与 Windows 共享网络堆栈;国内环境下可使用 `ghproxy.com` 反向代理加速 GitHub 下载。[[WSL2]] 与 [[Ubuntu Server]] 同属 Linux 环境,[[WSL2]] 侧重 Windows 桌面开发场景,[[Ubuntu Server]] 侧重无头服务器场景。
|
||||
|
||||
Reference in New Issue
Block a user