Auto-sync: 2026-04-26 16:02

This commit is contained in:
2026-04-26 16:02:45 +08:00
parent 1abf0d56f5
commit d2ae5b3948
20 changed files with 1656 additions and 1731 deletions

View File

@@ -180,6 +180,20 @@ Git 是云转型计划中 DevOps 与 CI/CD 流水线的基础技能。**[[ctp-to
**[[ctp-topic-9-ci-cd-with-gruntwork]]**CTP Topic 9聚焦 CI/CD 与 Gruntwork 在 AWS Landing Zone 中的实践,基于 Gruntwork 参考架构通过 Terraform/Terragrunt 实现基础设施自动化交付(⚠️ 视频待 Whisper 转录后补充详细内容)。
**[[devops-culture-and-transformation-fostering-collaboration-agile-practices-and-innovation-linkedin]]**DevOps Culture and Transformation深入阐述 DevOps 文化转型的完整框架——四大文化支柱(跨职能协作/自动化/持续改进/客户导向、Agile 与 DevOps 的共生关系Scrum/Kanban 提供方法论框架CI/CD 提供工程加速能力)、以及战略转型 playbook领导层支持 → 团队赋能 → 小步试点 → 克服阻力。核心洞察DevOps 本质是文化与思维转变而非工具引入;自动化应覆盖 CI/CD、IaC、可观测性三个层面无责事后分析blameless post-mortems是持续改进的关键机制。未来趋势AI/ML 赋能智能自动化、GitOps、Serverless DevOps、边缘计算 DevOps、DevSecOps 深化。与 [[ctp-topic-4-using-agile-to-run-the-cloud-transformation-program]](敏捷落地)和 [[ctp-topic-33-an-introduction-to-gitops]]GitOps共同构成完整的 DevOps 知识体系。
**[[cloud-devop-maturity-guideline]]**Cloud DevOp Maturity - Guideline企业级 SaaS 公司的云 DevOps 成熟度评估框架与提升路径——基于 DORA 四项核心指标部署频率、变更前置时间、变更失败率、MTTR和 CMMI 成熟度模型从自动化、协作文化、监控可观测性、安全集成DevSecOps四大支柱进行系统评估。核心工具链覆盖 CI/CD持续集成/持续交付流水线、IaCTerraform/Ansible 基础设施即代码、容器化Kubernetes/Docker、监控Prometheus/Grafana。成熟度提升路线进行成熟度评估 → 建立 DevOps 卓越中心 → 分阶段实施改进(从 CI/CD 和自动化入手)→ 持续迭代。与 [[devops-culture-and-transformation-fostering-collaboration-agile-practices-and-innovation-linkedin]]DevOps 文化转型)共享四大支柱框架但侧重不同——前者聚焦文化转型方法论,后者聚焦量化评估与成熟度路径;与 [[devops-maturity-model-from-traditional-it-to-advanced-devops]] 在 DevOps 成熟度模型层面关联。
**[[what-i-know-about-cloud-service-delivery-1]]**What I Know About Cloud Service Delivery 1云服务交付Cloud Service Delivery完整生命周期管理框架——核心定义云服务交付是连接云技术能力IaaS/PaaS/SaaS与最终用户实际需求之间的桥梁由多角色团队Cloud Infrastructure Engineer / DevOps SRE / Security / FinOps / Support协作驱动。12 大管理领域:①服务供给与部署(自动化 + 资源配置);②基础设施管理(监控 + 补丁 + HA/DR③平台管理 PaaS中间件/数据库/开发工具);④应用运营管理(性能监控 + 持续部署 + 密钥管理);⑤安全与合规(防火墙/IDS/IPS/IAM + GDPR/HIPAA/PCI⑥性能与可用性监控SLA 99.9% vs 99.99%、SLO、Grafana 告警⑦事件与问题管理Incident/Problem 双层机制⑧变更与配置管理IaC + Planned/Emergency Change 区分⑨成本管理与优化FinOps、Savings Plans、Right-sizing⑩客户接入与支持Onboarding + 服务台⑪服务治理与生命周期Service Catalog + CCOE⑫备份恢复与灾难管理Backup 策略 + DR 演练。最佳实践工具AWS CloudWatch + Grafana监控、New Relic/APM应用性能、WAF + IP Whitelist安全、Terraform IaC配置管理。属 [[Cloud-DevOps-Maturity-Model]] 在运营管理维度的具体化,与 [[cloud-devop-maturity-guideline]](成熟度评估)和 [[devops-culture-and-transformation-fostering-collaboration-agile-practices-and-innovation-linkedin]]DevOps 文化)共同构成完整的云运营知识体系。
**[[cloud-maturity-model-a-detailed-guide-for-cloud-adoption]]**Cloud Maturity Model - A Detailed Guide For Cloud Adoption系统性介绍 **Cloud Maturity Model (CMM)** 云成熟度模型的完整指南——5级成熟度阶段Level 0 Legacy → Level 5 Optimized覆盖企业云转型完整路径关键组成要素覆盖业务维度财务/战略/组织/文化/治理/合规/采购)和技术维度(架构/应用/DevOps/安全/IaaS/PaaS/SaaS/AI/IoT三维评估框架People/Processes/Technology7大收益战略规划增强、团队协作提升、应用性能提升、安全性增强、上市时间缩短、行业对标、成本节约最佳实践设定云采用目标、识别当前成熟度级别、选择合适的成熟度模型、遵循治理与合规、安全与风险管理。核心理念CMM 是云转型的全面导航仪帮助企业找到适合自身需求的平衡点Level 5 是目标但往往更具理想性,建议选择性采纳带来明确业务价值的要素。与 [[cloud-devop-maturity-guideline]] 在成熟度模型层面互补——前者聚焦 DevOps 交付能力成熟度,本 Source 聚焦云采用全维度成熟度;与 [[devops-maturity-model-from-traditional-it-to-advanced-devops]] 共同构成完整成熟度知识体系。
**[[the-myths-and-misconceptions-about-cloud-computing-linkedin]]**The Myths and Misconceptions About Cloud Computing | LinkedIn云计算领域7大常见误解及真相——澄清云安全不如本地、云计算成本高、迁移复杂、性能不可靠等认知误区。核心观点主流云服务商通过加密、MFA、合规认证ISO 27001/HIPAA/GDPR提供比本地更强的安全保障按需付费模型配合预留实例和自动扩展可显著降低成本分阶段迁移策略和混合云方案可有效降低迁移风险SLA 保证可用性通常超过 99.99%。属 [[Cloud-Computing]] 认知纠正的基础入门,与 [[ctp-topic-53-why-bother-with-cloud]](云转型商业价值)共同构成云采用决策的知识基础。
**[[how-can-a-multi-cloud-strategy-transform-your-business-roi]]**How Can a Multi Cloud Strategy Transform Your Business ROI?多云策略Multi-Cloud Strategy的商业价值与实施框架——核心数据78% 企业使用 3+ 公有云、86% 企业计划 2024 年底采用多云、优化后实现 30% 运营成本降低Forrester。8 大商业价值:①避免供应商锁定(保留谈判筹码)、②增强弹性与可用性(跨云冗余 99.99%)、③提升安全态势(各云最佳安全功能)、④无限弹性扩展(应对流量高峰)、⑤成本优化(跨提供商比价)、⑥加速创新(访问最新云服务)、⑦满足合规(数据主权控制)、⑧性能优化(选择最近/最快的云区域)。行业案例:电商高峰期跨云扩展、医疗机构 HIPAA 合规、金融机构多云安全。实施路径评估需求→选择提供商对齐服务与需求→集成管理Kubernetes/Terraform→监控优化CloudHealth/Datadog。属 [[Multi-Cloud-Strategy]] 概念的核心来源,与 [[cloud-operating-model-key-strategies-and-best-practices]] 中的"统一治理"形成互补——多云是选择层Cloud Operating Model 是治理层;与 [[Vendor-Lock-In]] 共同构成云供应商风险管理知识体系。
**[[how-to-simplify-multi-account-deployments-monitoring-centralized-logs-for-aws-cloudformation-stacksets]]**How to Simplify Multi-Account Deployments Monitoring: Centralized Logs for AWS CloudFormation StackSetsAWS 官方博客2025-10-24详解多账户 StackSets 部署的集中日志监控方案——解决当跨 50 个账户部署关键安全基线突然失败时团队需逐个登录账户查看日志的运营痛点。核心架构①管理账户部署log-setup-management.yaml创建 Central Event Bridge Bus + CloudWatch Log Groupcentral-cloudformation-logs+ KMS 加密;②通过同一 StackSet 自动向所有成员账户推送 EventBridge Rules③StackSet 部署模板common-resources-stackset.yaml在目标账户创建 S3 等通用资源并触发 CloudFormation 事件。事件流:目标账户 CloudFormation 事件 → EventBridge Rules按模式捕获→ 跨账户 Event Bus → CloudWatch Log Group → CloudWatch Logs Insights 自定义查询。单一部署三重价值:创建中心日志基础设施 + 自动向所有成员账户推送 EventBridge 规则 + 设置跨账户 IAM 角色。成本组件EventBridge 跨账户事件费 + CloudWatch Logs 存储与查询费 + KMS 密钥费。与 [[ctp-topic-16-cross-account-terraform-modules]](跨账号 Terraform 模块)共享跨账户 IAM Assume Role 机制但聚焦维度不同——前者解决部署工具的跨账户访问,后者解决 StackSets 部署本身的可见性问题;与 [[what-i-know-about-cloud-service-delivery-1]] 中"性能与可用性监控"和[[ctp-topic-67-cloud-native-observability-using-opentelemetry]]OpenTelemetry 日志链路)共同构成企业级可观测性知识体系。
Cloud Transformation Programme (CTP) materials cover AWS landing zones, EKS, Terraform, GitOps, FinOps, observability, security, and enterprise architecture. Key themes: 3 Lines of Defence framework, ITSM, container hardening, backup & DR strategies. DevOps culture focuses on four pillars: Collaboration, Automation (CI/CD, IaC), Continuous Improvement (Kaizen), and Customer-Centricity. Agile practices (Scrum, Kanban) are symbiotic with DevOps. Emerging trends: DevSecOps, GitOps, Serverless DevOps, AI/ML-driven automation, and Edge Computing DevOps.
**[[ctp-topic-32-using-atlantis-cicd-for-infrastructure-deployments]]**CTP Topic 32Atlantis 替代 Jenkins 用于 Terraform IaC 部署——针对当前 Jenkins 流水线初始化慢(多次代码克隆/顺序测试/ECS 预配置和架构复杂持续叠加功能导致脆弱的双重痛点Atlantis 提供 PR 评论式协作模型,开发者直接在 GitHub PR 上评论 `atlantis plan`/`apply` 即可触发变更,无需独立账号;每个 Landing Zone 共享账户部署单台 EC2 实例,通过 GitHub Enterprise Webhook 接收通知,服务账号负责评论/合并/关闭 PR跨账户访问通过在各账户部署的 IAM 角色实现;并行构建支持多模块并发 plan/apply锁定机制防止多 PR 同时操作同一模块产生冲突。Atlantis 在 merge 前即应用变更,确保代码与基础设施始终同步。属 [[GitOps]] 工具实践层,与 [[ctp-topic-33-an-introduction-to-gitops]]GitOps 概念)和 [[ctp-topic-9-ci-cd-with-gruntwork]]Gruntwork CI/CD共同构成完整链路。注意[[ctp-topic-39-implementing-eks-in-the-aws-lab-landing-zone]] 提到 Atlantis 当前不支持 EKS 部署,两者存在实践约束差异。
@@ -350,6 +364,8 @@ Key concepts: [[Process]], [[Value]], [[Value-Stream]], [[Value-Adding]], [[Wast
**[[ctp-topic-72-enterprise-dr-strategy-aws-backup]]**CTP Topic 72AWS 解决方案架构师 Sabith 深入讲解企业级灾难恢复策略与 AWS Backup 架构设计——核心内容HA高可用关注系统运行时间和 MTBFDR灾难恢复专注于防止数据丢失和系统恢复两者互补RPO恢复点目标定义可接受的最大数据丢失量RTO恢复时间目标定义可接受的最大停机时间AWS Backup 完全托管、基于策略,通过 Backup Plans 定义何时备份什么Backup Vaults 存储恢复点,支持跨账户跨区域复制;四级 DR 架构模式Backup and Restore → Pilot Light → Warm Standby → Active-Active提供从低成本到高弹性的递进选择增量备份仅捕获变更节省成本Vault Lock 合规模式防止任何人(包括根用户)提前删除恢复点,有效防勒索软件;建议使用独立的 Vault/Bunker Account 存储备份副本取证账户Forensic Account定期测试恢复点并扫描恶意软件。属 [[AWS-Landing-Zone]] DR 与数据保护层的理论基础补充,与 [[ctp-topic-44-aws-backup-in-micro-focus]](聚焦 Micro Focus 内部评估)和 [[ctp-topic-73-aws-backup-implementation]](聚焦 CTP 迁移实施)构成完整的 AWS Backup 知识体系。
**[[rto-vs-rpo-key-differences-for-modern-disaster-recovery]]**RTO vs RPO: Key Differences for Modern Disaster RecoveryRTORecovery Time Objective和 RPORecovery Point Objective在现代灾难恢复与持续交付中的关键区别与实践应用——核心区分RTO 衡量系统停机时长容忍度从故障时刻开始计时RPO 衡量数据丢失容忍度从上一备份时刻向前测量现代部署环境下软件故障Bug/错误迁移/AI 模型异常)比硬件灾难更频繁,每日常规发布即潜在 RTO/RPO 场景。Feature Flag 驱动的新范式通过部署与发布解耦Deploy whenever you want, release when you're ready、渐进式灰度发布1%→5%→25%→100%)和 Kill Switch即时禁用故障功能将 RTO 从"小时级紧急回滚部署"缩短至"秒级配置开关切换"RPO 通过 Feature Flag 保护数据完整性避免回滚时数据损坏。应用分层恢复策略Tier 1 Critical支付/认证RTO<5min/RPO<1min→ Tier 2 Important管理后台/报表RTO<1h/RPO<15min→ Tier 3 Nice-to-have内部工具RTO<4h/RPO<1h。成本效益原则若停机1小时损失 $10K不要每年花 $100K 基础设施预防——Feature Flag 方案比传统热备基础设施成本更低、效果更好HP/Christian Dior 案例)。属 [[ctp-topic-72-enterprise-dr-strategy-aws-backup]]AWS 基础设施层 DR在软件交付层的互补——前者聚焦备份基础设施后者聚焦代码层快速恢复共同构成完整 DR 知识体系;与 [[what-i-know-about-cloud-service-delivery-1]]"备份恢复与灾难管理"第12领域形成引用关系与 [[cloud-devop-maturity-guideline]] 的 DORA MTTR 指标关联MTTR 直接量化 RTO
**[[Install WSL]]**[[install-wsl]]):微软官方 WSL 完整安装指南——`wsl --install` 一键安装Windows 10/11 Build 19041+),支持 Ubuntu/Debian/SUSE/Kali 等多发行版并行安装,`wsl.exe --set-default-version` 切换 WSL1/WSL2离线场景通过 MSI + DISM 命令手动启用 Virtual Machine Platform运行入口推荐 Windows Terminal含多标签、自定义快捷键。[[Install WSL]] 与 [[WSL2 启动与网络配置指南]] 互补——前者解决安装问题,后者解决网络配置问题。
**[[WSL2]]** 是 Windows 内置的 Linux 运行环境WSL2 默认使用 NAT 网络模式导致 Windows 代理无法被 WSL2 内部访问。通过 `.wslconfig` 启用 `networkingMode=mirrored` + `dnsTunneling=true` 可实现 WSL2 与 Windows 共享网络堆栈;国内环境下可使用 `ghproxy.com` 反向代理加速 GitHub 下载。[[WSL2]] 与 [[Ubuntu Server]] 同属 Linux 环境,[[WSL2]] 侧重 Windows 桌面开发场景,[[Ubuntu Server]] 侧重无头服务器场景。