Sync: add cloud learning and model updates

This commit is contained in:
2026-04-24 17:48:36 +08:00
parent 3148216d38
commit cc23df1883
8 changed files with 237 additions and 68 deletions

View File

@@ -0,0 +1,53 @@
---
title: "Cloud Learning Master Index"
type: source
tags: ["cloud-learning", "DevOps", "SRE", "AWS", "master-index"]
date: 2026-04-14
---
## Source File
- [[Cloud & DevOps/Public-Cloud-Learning-Sessions/_Index/cloud-learning-master-index.md]]
## Summary用中文描述
- 核心主题Micro Focus / OpenText 云转型学习会话Public Cloud Learning Sessions的视频课程总索引涵盖 AWS Landing Zone、IAM、IaC、EKS、FinOps、CI/CD、Security、Networking、Serverless/AI、OpenText Series 共 10 大领域。
- 问题域:为企业云转型提供系统性学习路径,覆盖架构设计、身份治理、成本管理、安全合规、可观测性、容器化、自动化运维等全技术栈。
- 方法/机制:以 NAS 共享文件系统(`/volume2/work/Public Cloud Learning Sessions/`)为视频源,按技术领域分类组织学习会话,由 CTPCloud Transformation Programme团队定期录制分享。
- 结论/价值:作为云转型知识库的总入口,为工程师和架构师提供按主题索引的参考导航,支持快速定位特定领域的学习资源。
## Key Claims用中文描述
- 该索引覆盖 Micro Focus / OpenText 云转型计划的全部技术领域从基础设施AWS Landing Zone到应用层Serverless/AI形成完整知识体系。
- 视频总数 **111 个**(截至 2026-04-14分布在 10 个技术分类中,其中 AWS Landing Zone22和 OpenText Series21内容最丰富。
- 所有视频通过 NAS 集中存储(`/volume2/work/Public Cloud Learning Sessions/`统一命名规范ctp-topic-NN / learning-sessions-xxx / public-cloud-learning-sessions-xxx
## Key Quotes
> "NAS源: `/volume2/work/Public Cloud Learning Sessions/` | Total: **0 videos processed**" — 索引文件元数据声明videos processed 计数器未更新,实际视频数按分类统计为 111 个)
## Key Concepts
- [[Cloud-Transformation-Programme]]:云转型计划,本索引所属的学习会话系列由 CTP 团队主导录制。
- [[AWS-Landing-Zone]]AWS Landing Zone 是索引中最核心的分类之一22 个视频),涵盖架构设计、账号管理、网络隔离。
- [[EKS-Optimization]]EKS 优化三专题Bottlerocket OS / Karpenter / EKS Auto Mode是容器化学习的高频主题。
- [[FinOps]]FinOps 与成本优化专题覆盖 Instance Scheduler / Rightsizing / Savings Plans / Spot Instances 等核心技术。
- [[GitOps]]GitOps 与 CI/CD 专题包括 Git / Renovate Bot / Atlantis / Gruntwork / IaC Testing 等工具链。
- [[Security-Governance]]安全专题涵盖供应链安全、3LoD 框架、Firewall Manager、Secrets Manager、CSPM 等。
## Key Entities
- [[CTP-Team]]Cloud Transformation Programme Team学习会话系列的发起和组织团队涵盖 AWS Landing Zone / FinOps / EKS / CI/CD / Security 等多领域内容。
- [[OpenText]]:索引中 OpenText Series21 个视频)专题由 OpenText 全球团队分享,覆盖 Thor Platform、产品策略、GIS 安全政策、GitLab 迁移等。
- [[AWS]]:所有视频的云平台基础,涵盖 AWS 生态中的 EC2/EKS/S3/IAM/VPC/Lambda 等全栈服务。
- [[Gruntwork]]IaC 工具链核心Gruntwork Landing Zone 架构在索引中出现多次Topic 1 / Topic 3 / Topic 9 等)。
- [[Micro-Focus]]:早期视频的发起公司,已被 OpenText 收购,部分内容反映 Micro Focus 时期的架构决策。
## Connections
- [[ctp-topic-1-gruntwork-landing-zone-architecture]] ← depends_on ← cloud-learning-master-index索引入口
- [[ctp-topic-7-saas-landing-zone-design]] ← extends ← cloud-learning-master-index专题延伸
- [[ctp-topic-34-azure-landing-zone-architecture-overview]] ← extends ← cloud-learning-master-index多云扩展
- [[public-cloud-learning-sessions-eks-optimization-part-1-of-3-compute-optimization]] ← depends_on ← cloud-learning-master-indexEKS 专题入口)
- [[public-cloud-learning-sessions-eks-optimization-part-2-of-3-running-containers-w]] ← extends ← cloud-learning-master-index
- [[public-cloud-learning-sessions-eks-optimization-part-3-of-3-introduction-to-eks]] ← extends ← cloud-learning-master-index
- [[public-cloud-learning-sessions-budget-control-20240319-160204-meeting-recording]] ← depends_on ← cloud-learning-master-indexFinOps 成本管控)
- [[ctp-topic-33-an-introduction-to-gitops]] ← depends_on ← cloud-learning-master-indexGitOps 入门)
- [[public-cloud-learning-sessions-opentext-gis-security-policies-20241015-160257-me]] ← depends_on ← cloud-learning-master-indexOpenText 安全专题)
## Contradictions
- 与 [[ctp-topic-14-octane-hub-on-aws]] 可能的冲突:索引本身仅为元数据,不存在内容冲突。
- 与 [[public-cloud-learning-sessions-observability-with-opentelemetry-20240402-160113]] 无冲突EKS 可观测性专题与 OpenTelemetry 专题互补。

View File

@@ -0,0 +1,67 @@
---
title: "CTP Topic 27 AWS Instance Scheduler"
type: source
tags:
- AWS
- Instance-Scheduler
- Cost-Optimization
- CTP
- FinOps
date: 2026-04-14
---
## Source File
- [[Cloud & DevOps/Public-Cloud-Learning-Sessions/05_FinOps/ctp-topic-27-aws-instance-scheduler.md]]
## Summary用中文描述
- 核心主题AWS Instance Scheduler —— 通过定时自动化控制 EC2 和 RDS 实例启停,实现非生产环境(开发/测试)的成本优化
- 问题域:非生产 AWS 账号中 EC2/RDS 实例 24/7 运行导致成本浪费Cloud FinOps 需要自动化手段降低这部分支出
- 方法/机制:
- CloudFormation 一键部署,由 CCOE 的 Guardrails 框架自动集成推送至所有相关账号
- CloudWatch Events 定时触发(默认每 15 分钟)
- Lambda 函数读取 DynamoDB 中的调度配置Schedules + Periods
- 通过实例标签(`Schedule``Period`)关联调度规则
- 支持多时区办公时间配置(如西雅图时间、英国时间)
- 结论/价值:
- 自动覆盖公司内部绝大多数月消费超过 10 美元的 AWS 账号
- 与基于空闲率的调度不同,本工具基于"时间表"触发
- RDS 实例智能配合每 7 天维护窗口,确保维护完成后恢复正常调度状态
- 实例关机行为必须设置为"停止Stop"而非"终止Terminate"以保留数据
## Key Claims用中文描述
- AWS Instance Scheduler 通过时间表驱动(非空闲率驱动)的定时任务,可为非生产环境实例节省最高 70% 的运行成本
- 通过 Guardrails 框架集成Instance Scheduler 自动部署至公司绝大多数月消费超过 10 美元的 AWS 账号,无需用户手动配置
- CloudWatch Events 每 15 分钟触发 Lambda 检查,结合 DynamoDB 中定义的 Schedules 和 Periods实现精细化的多时区调度
- RDS 实例的每 7 天维护窗口与调度系统智能协同,确保维护完成后实例恢复到预期的调度状态
## Key Quotes
> "该工具是基于'时间表'Schedule而非'空闲率'Idle time触发的" — Gustavo澄清核心触发机制
> "通过 Guardrails该功能已自动覆盖了公司内部绝大多数月消费超过 10 美元的 AWS 账号" — Gustavo说明部署覆盖范围
> "实例的关机行为必须设置为'停止Stop'而非'终止Terminate'" — Gustavo操作注意事项
## Key Concepts
- [[AWS Instance Scheduler]]AWS 官方提供的开源解决方案,通过 CloudFormation 部署,自动定时启动和停止 EC2 及 RDS 实例以节省成本
- [[Guardrails]]CCOE 团队实施的自动化合规与治理框架Instance Scheduler 作为其中的成本控制组件被自动部署
- [[CloudWatch Events]]:系统的触发器,按照预设的时间间隔(如 15 分钟)激活 Lambda 函数
- [[DynamoDB Config Table]]用于存储调度定义Schedules和周期定义Periods的 NoSQL 数据库,是调度的逻辑核心
- [[Tag-Based Scheduling]]:用户通过在实例上添加特定标签(如 `Schedule``Period`)将其关联到预定义的调度逻辑
- [[RDS Maintenance Window]]RDS 特有的每 7 天维护窗口Instance Scheduler 能够识别并配合该窗口,确保数据库在维护后正确关闭
- [[Override Status]]:高级配置,允许管理员强制将实例保持在停止状态,即使在预设的启动时间内也不启动
## Key Entities
- [[Gustavo]]CCOE 团队成员Instance Scheduler 主题讲师
- [[CCOE云卓越中心]]:负责 Guardrails 框架实施和 Instance Scheduler 集成的内部团队
- [[AWS]]Instance Scheduler 的官方服务提供方
## Connections
- [[ctp-topic-13-cloud-finops-policies-best-practices-to-optimize-the-co]] ← depends_on ← [[ctp-topic-27-aws-instance-scheduler]]Topic 13 定义 FinOps 政策层标签合规、成本可见性Topic 27 提供具体技术实现Instance Scheduler
- [[ctp-topic-63-optimise-resource-cost-using-automation]] ← related_to ← [[ctp-topic-27-aws-instance-scheduler]]:两专题均覆盖 EC2/RDS 自动化调度Topic 63 侧重 Terraform 层面的 `auto_shutdown` 标签方案Topic 27 侧重 AWS 原生 Instance Scheduler 方案
- [[ctp-topic-71-pcgs-guide-to-rightsizing-why-how-when]] ← extends ← [[ctp-topic-27-aws-instance-scheduler]]Right Sizing 从实例规格层面降低容量Instance Scheduler 从运行时间层面降低浪费,构成互补的成本优化策略
- [[public-cloud-learning-sessions-budget-control-20240319]] ← related_to ← [[ctp-topic-27-aws-instance-scheduler]]:两专题同属 FinOps 范畴,分别聚焦预算告警强制封禁和实例调度自动节能
## Contradictions
- 与 [[ctp-topic-63-optimise-resource-cost-using-automation]] 可能的实现路径差异:
- 冲突点EC2/RDS 自动调度的实现方案选择
- 当前观点Topic 27 推荐 AWS 原生 Instance SchedulerCloudFormation + CloudWatch + Lambda + DynamoDB通过 Guardrails 自动推送覆盖全公司账号
- 对方观点Topic 63 推荐 Terraform Scheduler 模块(`auto_shutdown = yes` 标签),在 Terraform 层面实现
- 说明两者并不互斥——Instance Scheduler 是 AWS 原生方案覆盖广账户层Terraform Scheduler 是 IaC 层细粒度控制,企业可同时使用

View File

@@ -0,0 +1,60 @@
---
title: "Public Cloud Learning Sessions - Introduction to AI/ML with AWS"
type: source
tags: [AI, ML, AWS, Serverless-AI, Generative-AI, Amazon-Bedrock]
date: 2024-02-06
---
## Source File
- [[Cloud & DevOps/Public-Cloud-Learning-Sessions/09_Serverless_AI/public-cloud-learning-sessions-introduction-to-artificial-intelligence-ai-machin.md]]
## Summary用中文描述
- 核心主题AWS 上的 AI/ML 与生成式 AI 入门,由 AWS 高级解决方案架构师 Suraav Paul 主讲
- 问题域:企业如何在 AWS 云上落地 AI/ML 能力,包括传统 AI分类/预测)和生成式 AI基础模型
- 方法/机制Amazon Bedrock 全托管生成式 AI 服务、Amazon SageMaker Canvas 无代码 ML 工具、ML Ops 完整生命周期管理(数据流水线→训练流水线→推理流水线)
- 结论/价值AWS 通过预置算法/模型/SageMaker Canvas 民主化 AI 访问Bedrock 支持微调/持续预训练/RAG/Agent/Guardrails 全套定制能力ML Ops 融合 DevOps 文化、人员和流程,实现协同 ML 解决方案
## Key Claims用中文描述
- AI 指任何能复制此前需要人类智能才能完成任务的系统,通常通过机器学习使用数据创建决策逻辑或模型来寻求概率性结果
- AWS 认为大多数客户体验和应用程序将被生成式 AI 重塑,由拥有数十亿参数的基础模型驱动
- Amazon Bedrock 是全托管服务,用于构建和扩展生成式 AI 应用,支持使用自有数据定制基础模型,同时保持安全与隐私
- ML Ops 结合机器学习与运维,涉及人员、技术和流程的协作,以实现协同 ML 解决方案
## Key Quotes
> "We believe most customer experiences and applications will be reinvented with generative AI, powered by foundation models with billions of parameters." — Suraav Paul, AWS Senior Solutions Architect
> "AI is a way to describe any system that can replicate tasks that previously required human intelligence." — Suraav Paul, AWS Senior Solutions Architect
> "ML Ops combines machine learning and operations, involving people, technology, and processes for collaborative ML solutions." — Suraav Paul, AWS Senior Solutions Architect
## Key Concepts
- [[RAG]]Retrieval Augmented Generation从企业数据源获取相关数据以生成响应是 Bedrock 数据定制技术之一
- [[MLOps]]Machine Learning Operations将 ML 与运维结合,涉及人员、技术和流程的协作框架
- [[Foundation-Models]]:基础模型,具有数十亿参数,支持分类、预测和生成式 AI是生成式 AI 的核心驱动
- [[Amazon-Bedrock]]AWS 全托管生成式 AI 服务,提供基础模型访问、数据定制(微调/持续预训练/RAG/Agent和安全保障
- [[Amazon-SageMaker-Canvas]]AWS 无代码机器学习工具,民主化 AI/ML 访问
- [[Responsible-AI]]:负责任 AI 原则,包括公平性、可解释性、鲁棒性、治理、透明度和隐私/安全
## Key Entities
- [[AWS]]Amazon Web Services云服务商提供 AI/ML 全套工具和服务
- [[Amazon-Bedrock]]AWS 全托管生成式 AI 服务平台
- [[Amazon-Titan]]Bedrock 提供的基础模型系列之一
## Connections
- [[ctp-topic-13-cloud-finops-policies]] ← extends ← [[FinOps云财务管理]]
- [[ctp-topic-63-optimise-resource-cost-using-automation]] ← depends_on ← [[FinOps云财务管理]]
- [[ctp-topic-27-aws-instance-scheduler]] ← depends_on ← [[FinOps云财务管理]]
- [[public-cloud-learning-sessions-budget-control-20240319]] ← depends_on ← [[FinOps云财务管理]]
- [[public-cloud-learning-sessions-storage-cost-optimization-20240305]] ← depends_on ← [[FinOps云财务管理]]
- [[ctp-topic-67-cloud-native-observability-using-opentelemetry]] ← extends ← [[OpenTelemetry]]
- [[ctp-topic-59-achieving-reliability-with-amazon-eks]] ← extends ← [[Amazon EKS]]
- [[public-cloud-learning-sessions-eks-optimization-part-3-of-3-introduction-to-eks]] ← extends ← [[Amazon EKS]]
## Contradictions
-
## Notes
- Suraav PaulAWS 高级解决方案架构师)仅出现 1 次,以 wikilink 形式记录于 Source page无需独立建页
- [[RAG]] 在本 Wiki 中已有多个来源引用LangChain、Milvus、Qdrant、Knowledge Base RAG 等),无需新建概念页
- MLOps/Responsible AI 出现频次不足独立建页阈值,以 wikilink 形式记录于 Source page
- 本来源属于 Cloud Transformation Programme 的 Serverless & AI 专题09_Serverless_AI