Files
nexus/wiki/concepts/API-Server-Priority-and-Fairness.md

1.5 KiB
Raw Blame History

title, type, tags, sources, last_updated
title type tags sources last_updated
API Server Priority and Fairness concept
Kubernetes
EKS
API-Server
Performance
Multi-Tenancy
ctp-topic-64-scaling-out-with-amazon-eks
2026-04-28

Definition

API Server Priority and FairnessPPF是 Kubernetes 1.20+ 引入的 API Server 配置特性通过优先级类别Priority Class和并发限制Flow Schema管理 API 请求的调度和限流,确保关键工作负载在高负载下的 API 访问稳定性。

Key Mechanisms

  • Priority Class:为 API 请求分配优先级(整数越大优先级越高)
  • Flow Schema:定义请求匹配规则,将请求路由到对应的 Flow
  • Concurrency Limit:每个 Flow 的并发请求数限制
  • Request Limiting:超出限制的请求进入等待队列或被拒绝

Why Enable PPF

  • 多租户 EKS 集群中,防止单个租户/工作负载耗尽 API Server 资源
  • 在扩缩容期间(大量 HPA/Controller 并发请求)保护关键 API 调用
  • 提升 API Server 在高负载下的可预测性和稳定性

Configuration

  • 通过 kube-apiserver 启动参数 --enable-priority-and-fairness=true 启用
  • Flow Schema 和 Priority Level 通过 kube-apiserver 配置或 admission webhook 管理

Relationship with Scaling

  • 在大规模集群扩缩容时HPA、Cluster Autoscaler、Custom Controller 等大量并发 API 请求可能压垮 API Server
  • PPF 确保关键扩缩容操作的 API 请求优先处理

Sources