# 云控制器管理器的基础概念

# 云控制器管理器

云控制器管理器(CCM)的概念(不要与二进制混淆)最初提出的目的是使得云供应商特定代码和 k8s 核心代码相互独立。 云控制器管理器能够与其他管理组件(如 k8s 控制器管理器、API 服务器、调度器等)一起运行,也能够以 k8s 插件的形式启动,在这种情况下,它运行在 k8s 之上。

云控制器管理器的设计基于一种插件机制,这种插件机制使得新的云提供商通过使用插件能够很容易地与 k8s 集成。 目前已经有计划在 k8s 中(采用 CCM)集成新的云供应商,并将已有云供应商从旧模型迁移到新的 CCM 模型。

本文讨论了云控制器管理器背后的概念,并详细介绍了它的相关功能。

以下是没有引入云控制器管理器的 k8s 集群架构:

# 设计

在上面的图中,k8s 和云提供商通过几个不同的组件集成:

  • Kubelet
  • k8s 控制器管理器
  • k8s API 服务器

CCM 将前面三个组件中所有依赖云服务的逻辑进行合并,形成单一的云服务集成点,引入 CCM 的新架构如下所示:

# CCM 的组件

CCM 将 k8s 控制器管理器(KCM)的一部分功能剥离,并作为独立的进程运行。 具体地说,它将 KCM 中依赖云服务的控制器剥离,KCM 中存在以下依赖云服务的控制器:

  • 节点控制器
  • 卷控制器
  • 路由控制器
  • 服务控制器

在 1.8 版本中,CCM 当前运行上述列表中的以下控制器:

  • 节点控制器
  • 路由控制器
  • 服务控制器

此外,CCM 运行另一个名为 PersistentVolumeLabels 的控制器。 该控制器负责为 GCP 和 AWS 云中创建的 PersistentVolume 设置区域(zone)和地域(region)标签。

注意: 经过深入考虑,我们没有选择将卷控制器作为 CCM 的一部分。 由于(将卷控制器移至 CCM)涉及到的复杂性和已有的对供应商特定的卷逻辑进行抽象的成果,我们决定不将卷控制器移到 CCM 中。

最初计划使用 CCM 支持卷的目的是使用 Flex volume 支持插件式卷。 然而,社区计划采用名为 CSI 的成果来取代 Flex (两者为竞争关系)。

考虑到这些动态,我们决定采取一种临时措施,直到 CSI 就绪。

云供应商工作组(wg-cloud-provider)正致力于使用 CCM 支持 PersistentVolume。 参考 k8s/k8s#52371.

# CCM 的功能

CCM 的功能继承于 k8s 中依赖云供应商的组件。 本节基于 CCM 的功能来源组件展开描述。

# 1. k8s 控制器管理器

CCM 的功能大部分来自 KCM。 如前一节所述,CCM 运行以下控制回路:

  • 节点控制器
  • 路由控制器
  • 服务控制器
  • PersistentVolumeLabel 控制器

# 节点控制器

节点控制器负责从云提供商获取集群中运行的节点信息,并用该信息对节点进行初始化。节点控制器执行以下功能:

  1. 以云服务特定的区域/地域标签初始化节点。
  2. 以云服务特定的实例详细信息(如类型、规格)初始化节点。
  3. 获取节点的网络地址和 hostname。
  4. 检查云服务,查看节点是否已从云服务中删除,以防止节点无法响应。 如果节点已从云服务中删除,删除 k8s 中的节点对象。

# 路由控制器

路由控制器负责在云服务中适当地配置路由,以便 k8s 中不同节点上的容器间能够互相通信。 路由控制器只适用于谷歌计算引擎集群。

# 服务控制器

服务控制器负责监听服务创建、更新和删除事件。 基于当前 k8s 中的服务状态,配置云负载均衡器(如 ELB 或 Google LB) 来反映 k8s 中的服务状态。 此外,服务控制器保证云负载均衡器的服务后端是最新的。

# PersistentVolumeLabel 控制器

在用户创建 AWS EBS 或 GCE PD 卷时,PersistentVolumeLabel 控制器为其设置标签。 这使得用户不必手动为这些卷设置标签。

这些标签对 pod 调度来说是必不可少的,因为这些卷只有在它们所在的地域/区域中才能正常工作,因此任何使用这些卷的 pod 都需要被调度到同样的地域/区域中。

PersistentVolumeLabel 控制器是专门为 CCM 创建的,换句话说,CCM 出现之前该控制器并不存在。 我们创建该控制器,是为了将 k8s API 服务器中为 PV 设置标签的逻辑(通过准入控制器)移到 CCM 中。 该逻辑并不运行在 KCM 中。

# 2. Kubelet

节点控制器中包含了 kubelet 中依赖云服务的功能。 引入 CCM 之前,kubelet 负责以特定云服务的详细信息(如 IP 地址、 地域/区域标签和实例类型信息)对节点进行初始化。 引入 CCM 后,该初始化操作从 kubelet 移到了 CCM 中。

在这个新的模型中,kubelet 执行初始化节点时不感知特定云服务信息。 然而,它为新创建的节点添加 taint,使得节点处于不可调度的状态,直到 CCM 以特定云服务的信息对节点进行初始化后,才移除该 taint。

# 3. Kubernets API 服务器

如前面的章节所述,PersistentVolumeLabel 控制器将 k8s API 服务器中依赖云服务的功能移到了 CCM 中。

# 插件机制

云控制器管理器使用 Go 接口,容许接入任何云服务的实现。 具体地说,它使用 这里 定义的 CloudProvider 接口。

上面强调的四种共享控制器的实现以及共享 cloudprovider 接口相关的一些框架,会保留在 k8s 核心代码中,但特定云供应商的实现将在核心代码之外,并实现核心代码中定义的接口。

更多插件开发相关的信息,参见 开发云控制器管理器.

# 授权

本节分解描述 CCM 执行操作所需要的对各种 API 对象的访问权限。

# 节点控制器

节点控制器只作用于节点对象。 它需要对节点对象的全部访问权限:获取、列举、创建、更新、打补丁(patch)、监视(watch)和删除

v1/Node:

  • Get
  • List
  • Create
  • Update
  • Patch
  • Watch

# 路由控制器

路由控制器监听节点对象的创建,并适当地配置路由。 它需要节点对象的获取权限。

v1/Node:

  • Get

# 服务控制器

服务控制器监听服务对象的创建、更新和删除事件,然后适当地为那些服务配置端点(endpoint)。

为访问服务,服务控制器需要列举和监视权限。为更新服务,它需要打补丁和更新权限。

为给服务设置端点,它需要创建、列举、获取、监视和更新的权限。 v1/Service:

  • List
  • Get
  • Watch
  • Patch
  • Update

# PersistentVolumeLabel 控制器

PersistentVolumeLabel 控制器监听 PersistentVolume (PV) 创建事件,并对其进行更新。 该控制器需要 PV 对象的列举、监视、 获取和更新权限。

v1/PersistentVolume:

  • Get
  • List
  • Watch
  • Update

# 其他

CCM 的核心实现需要事件对象的创建权限,同时为保证安全操作,需要创建服务账户(ServiceAccount)的权限。

v1/Event:

  • Create
  • Patch
  • Update

v1/ServiceAccount:

  • Create

CCM 的 RBAC ClusterRole 形如:

apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRole
metadata:
  name: cloud-controller-manager
rules:
- apiGroups:
  - ""
  resources:
  - events
  verbs:
  - create
  - patch
  - update
- apiGroups:
  - ""
  resources:
  - nodes
  verbs:
  - '*'
- apiGroups:
  - ""
  resources:
  - nodes/status
  verbs:
  - patch
- apiGroups:
  - ""
  resources:
  - services
  verbs:
  - list
  - patch
  - update
  - watch
- apiGroups:
  - ""
  resources:
  - serviceaccounts
  verbs:
  - create
- apiGroups:
  - ""
  resources:
  - persistentvolumes
  verbs:
  - get
  - list
  - update
  - watch
- apiGroups:
  - ""
  resources:
  - endpoints
  verbs:
  - create
  - get
  - list
  - watch
  - update

# 云供应商实现

以下云供应商已经实现了针对其自身云服务的 CCM:

  • Digital Ocean
  • Oracle
  • Azure
  • GCE
  • AWS

# 集群管理

配置和运行 CCM 的完整说明详见 这里

Last Updated: 4/15/2023, 8:33:17 PM