# k8s 使用 Kubefed 创建集群联邦

k8s 的 1.5 及以上版本提供了一个命令行工具 kubefed，用于管理用户的集群联邦。kubefed 可以帮助你部署一个集群联邦的控制面板，您可以通过这个面板来添加或者删除一个联邦里面的集群。

这篇教程指导如何使用 kubefed 来管理一个 k8s 集群联邦。

注意: kubefed 在 k8s 1.6 版本中仍然是一个 beta 功能.

# 前提要求

这篇教程假设您已经有了正常运行的 k8s 集群。如果需要在您的平台上部署集群，请查阅文档 getting started.

# 安装 kubefed

使用下列命令下载对应最新发行的客户端安装包并将安装包里的二进制文件解压出来：

# Linux
curl -LO https://storage.googleapis.com/kubernetes-release/release/$(curl -s https://storage.googleapis.com/kubernetes-release/release/stable.txt)/kubernetes-client-linux-amd64.tar.gz
tar -xzvf kubernetes-client-linux-amd64.tar.gz

# OS X
curl -LO https://storage.googleapis.com/kubernetes-release/release/$(curl -s https://storage.googleapis.com/kubernetes-release/release/stable.txt)/kubernetes-client-darwin-amd64.tar.gz
tar -xzvf kubernetes-client-darwin-amd64.tar.gz

# Windows
curl -LO https://storage.googleapis.com/kubernetes-release/release/$(curl -s https://storage.googleapis.com/kubernetes-release/release/stable.txt)/kubernetes-client-windows-amd64.tar.gz
tar -xzvf kubernetes-client-windows-amd64.tar.gz

注意: 上述命令里的 URL 提供的都是适合 amd64 架构的包，如果您需要其他架构的包，请更换为对应的 URL，在这里列出了所有可用的发行版本，发布页面.

将解压出来的内容复制到你的环境变量 $PATH 里的随便一个路径，并设置可执行权限。

sudo cp kubernetes/client/bin/kubefed /usr/local/bin
sudo chmod +x /usr/local/bin/kubefed
sudo cp kubernetes/client/bin/kubectl /usr/local/bin
sudo chmod +x /usr/local/bin/kubectl

# 在 Ubuntu 上使用 snap 安装

kubefed 也提供了可用的 snap 软件包。

如果您使用的是 Ubuntu 或者其他支持

snap

包管理器的 Linux 发现版本，可以使用下列命令安装：
```
sudo snap install kubefed --classic
```
运行 kubefed version 来验证您安装的版本是不是最新的。

# 选择一个主集群

您将需要选择您其中的一个集群作为主集群，这个主集群将运行组成联邦控制面板的所有组件。确保在您本地的 kubeconfig 里有一个对应您的主集群的 kubeconfig 条目。可以使用下列命令来验证是否有需求的 kubeconfig 条目：

kubectl config get-contexts

输出里必须有一个条目对应您的主集群，类似下面的内容：

CURRENT   NAME                                          CLUSTER                                       AUTHINFO                                      NAMESPACE
*         gke_myproject_asia-east1-b_gce-asia-east1     gke_myproject_asia-east1-b_gce-asia-east1     gke_myproject_asia-east1-b_gce-asia-east1

当您部署联邦集群控制面板时，您将需要提供主集群的 kubeconfig 内容(就是上面条目对应的 name )。

# 部署一个联邦控制面板

想要在你的主集群上部署联邦控制面板，运行 kubefed init。使用 kubefed init 时，需要提供以下参数：

联邦名字
--host-cluster-context, 主集群的 kubeconfig 内容
--dns-provider, 可选 'google-clouddns', aws-route53 或者 coredns
--dns-zone-name, 联邦服务的域名后缀

如果您的主集群不是运行在一个云的环境，或者是这个环境不支持常见的云功能，比如负载均衡，那您可能还需要提供其他的参数。请查阅下面的内容 on-premises 主集群。

下面的命令部署了一个联邦集群，名称为 fellowship，主集群上下文（host cluster context）为 rivendell，域名后缀为 example.com.：

kubefed init fellowship \
    --host-cluster-context=rivendell \
    --dns-provider="google-clouddns" \
    --dns-zone-name="example.com."

--dns-zone-name 定义的联邦集群的域名后缀必须是一个属于您的已存在的域名，而且必须是受您的 DNS 提供商所管理的，结尾必须有个点号。

等联邦控制面板初始化完毕，查询 namespace：

kubectl get namespace --context=fellowship

如果没有列出来名字为 default 的 namespace (这是因为一个 Bug bug). 请使用下列命令自己创建一个：

kubectl create namespace default --context=fellowship

您的主集群里的节点必须有足够的权限来管理您所使用的 DNS 服务，比如说，如果您使用的集群是运行在 Google Compute Engine 上面，您必须启用 Google Cloud DNS API。

默认情况下，Google Container Engine (GKE) 集群里的节点创建时是不启用 Google Cloud DNS API 的，如果您需要使用一个 GKE 集群作为联邦主集群，请在创建的时候使用 gcloud 和正确的 --scopes 标签。您无法修改一个 GKE 集群来直接添加这个 scope，但是可以创建一个新的节点群并删除旧的节点。注意这样会导致集群里的 Pod 被重新调度。

添加新的节点群，请运行下列命令:

scopes="$(gcloud container node-pools describe --cluster=gke-cluster default-pool --format='value `delimiter=","` ')"
gcloud container node-pools create new-np \
    --cluster=gke-cluster \
    --scopes="${scopes},https://www.googleapis.com/auth/ndev.clouddns.readwrite"

删除旧的节点群，请运行:

gcloud container node-pools delete default-pool --cluster gke-cluster

kubefed init 在主集群里配置联邦控制面板，并在您本地的 kubeconfig 添加联邦 API 服务的配置条目。注意，在 k8s 1.6 beta 发行版本中，kubefed init 并不会自动将新部署的集群联邦的上下文配置为当前的内容, 因此您需要手动配置，运行下面的命令：

kubectl config use-context fellowship

在这里 fellowship 是您的联邦名字。

# 基本和令牌验证支持

kubefed init 默认只会用于联邦 API 服务验证的 TLS 证书和密钥，并写入到本地的 kubeconfig 文件里面。如果您需要 debug 而启用基本验证或者令牌验证，您可以通过传递 --apiserver-enable-basic-auth 或者 --apiserver-enable-token-auth 标签来实现。

kubefed init fellowship \
    --host-cluster-context=rivendell \
    --dns-provider="google-clouddns" \
    --dns-zone-name="example.com." \
    --apiserver-enable-basic-auth=true \
    --apiserver-enable-token-auth=true

# 给联邦组件传递命令行参数

kubefed init 使用了默认参数配置联邦 API 服务和联邦控制管理服务，从而部署了一个联邦控制管理面板。而其中的一些参数是衍生自 kubefed init 的标签。然而用户也可以自己通过对应的标签来定义这些参数。

您即可以使用--apiserver-arg-overrides 这个标签来定义联邦 API 服务的参数，也可以使用--controllermanager-arg-overrides 来定义联邦控制管理服务的参数。

kubefed init fellowship \
    --host-cluster-context=rivendell \
    --dns-provider="google-clouddns" \
    --dns-zone-name="example.com." \
    --apiserver-arg-overrides="--anonymous-auth=false,--v=4" \
    --controllermanager-arg-overrides="--controllers=services=false"

# 配置一个 DNS 服务提供商

联邦管理服务会使用 DNS 来通过域名开放联邦服务。有些云服务提供商会自动提供所需配置，前提是主集群的云提供商跟所使用的 DNS 服务提供商是同一家。如果不是这种情况的话，您就需要给联邦管理控制器提供 DNS 配置信息，而反过来，这个配置信息也会传递给联邦管理服务。可以把配置信息保存在文件里，然后通过文件的本地文件系统路径传递给 kubefed init 的 --dns-provider-config 标签来向联邦管理控制器提供配置。比如，将配置保存在 $HOME/coredns-provider.conf。

[Global]
etcd-endpoints = http://etcd-cluster.ns:2379
zones = example.com.

然后将这个文件路径传递给 kubefed init:

kubefed init fellowship \
    --host-cluster-context=rivendell \
    --dns-provider="coredns" \
    --dns-zone-name="example.com." \
    --dns-provider-config="$HOME/coredns-provider.conf"

# On-premises 主集群

# API 服务类型

kubefed init 在主集群上以 k8s 服务的方式开放联邦的 API 服务。默认情况下，这个服务是作为负载均衡服务. 大部分 on-premises 和 bare-metal 的环境和一些云环境，都缺乏负载均衡服务。因此 kubefed init 允许将联邦的 API 服务作为 NodePort 服务在这样的环境里开放出来。这可以通过传递 --api-server-service-type=NodePort 标签来实现。您也可以传递 --api-server-advertise-address=<IP-address> 来指定公开的联邦 API 服务的地址。否则，主集群上的其中一个节点地址将会被作为默认地址。

kubefed init fellowship \
    --host-cluster-context=rivendell \
    --dns-provider="google-clouddns" \
    --dns-zone-name="example.com." \
    --api-server-service-type="NodePort" \
    --api-server-advertise-address="10.0.10.20"

# 给 etcd 提供存储

联邦控制面板将它的数据存放在 etcd. 而 etcd 的数据必须存放在一个 PersistentVolume 里才能确保在联邦控制面板重启之后能提供正确的操作。在支持动态分配存储卷的主集群上, kubefed init 动态分配一个 PersistentVolume 并绑定到一个 PersistentVolumeClaim 用于存储 etcd 的数据。如果您的主集群不支持动态分配，您可以固定的分配一个 PersistentVolume. kubefed init 创建一个有下面的配置的 PersistentVolumeClaim：

apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  annotations:
    volume.alpha.kubernetes.io/storage-class: "yes"
  labels:
    app: federated-cluster
  name: fellowship-federation-apiserver-etcd-claim
  namespace: federation-system
spec:
  accessModes:
  - ReadWriteOnce
  resources:
    requests:
      storage: 10Gi

想要固定的分配一个 PersistentVolume, 您就必须确保您所创建的 PersistentVolume 有正确的存储类型，访问模式和 PersistentVolumeClaim 所需要的存储空间。

或者，您也可以通过给 kubefed init 传递标签 --etcd-persistent-storage=false 来完全的禁止永久存储。然而，我们并不建议您这么做，因为这样的话，您的联邦控制面板重启之后将无法正常工作。

kubefed init fellowship \
    --host-cluster-context=rivendell \
    --dns-provider="google-clouddns" \
    --dns-zone-name="example.com." \
    --etcd-persistent-storage=false

kubefed init 仍然不支持往一个已建立的联邦控制面板连接一个已存在的 PersistentVolumeClaim。我们计划在将来的 kubefed 版本提供这方面的支持。

# CoreDNS 支持

联邦服务现在支持 CoreDNS 作为 DNS 提供商，如果您现在的集群或者联邦集群的环境不支持基于云的 DNS 服务，那您可以运行您自己的 CoreDNS 实例并将公布的联邦 DNS 服务指向该节点。

想要配置联邦集群使用 CoreDNS, 只需要给 kubefed init 的标签 --dns-provider 和 --dns-provider-config 配置相应的值就可以了。

kubefed init fellowship \
    --host-cluster-context=rivendell \
    --dns-provider="coredns" \
    --dns-zone-name="example.com." \
    --dns-provider-config="$HOME/coredns-provider.conf"

更多信息请查看给联邦集群搭建 CoreDNS 作为 DNS 服务提供.

# 往联邦添加集群

一旦您部署成功一个联邦控制面板，您就需要让控制面板知道需要管理哪些集群。因此您可以使用 kubefed join 命令往控制面板添加集群。

要使用 kubefed join, 您需要提供集群的名字和--host-cluster-context 指定的联邦控制面板的主集群。

注意: 您在使用 join 命令时使用的名字将会作为待添加集群在这个联邦里的标识。这个名字必须符合这篇文章所描述的规则标识符文档. 如果您的待添加集群的 context 符合这个规则，您可以在 join 命令里使用相同的名字。否则，您将需要使用一个不同的名字作为集群的标识。更多信息请查阅命名规则和自定义。

下面的命令将名字为 gondor 的集群添加到运行在主集群 rivendell 上面的联邦集群里：

kubefed join gondor --host-cluster-context=rivendell

注意: Kubernetes 要求您手动添加集群到联邦里面，因为联邦控制面板只管理那些可响应的集群，添加集群就会告诉联邦控制面板，这个被添加的集群是可响应的，以便联邦管理。

# 命名规则和自定义

您提供给 kubefed join 的集群名字必须是一个有效的 RFC 1035 标签而且是符合标识符文档所列举的规范.

而且，联邦控制面板需要有被添加集群的验证信息以便管理。这些验证信息是从本地的 kubeconfig 获取的。kubefed join 使用这个集群的名字作为参数在本地的 kubeconfig 里查找集群的信息。如果找不到匹配的集群验证信息，它就会报错并退出。

如果联邦里的集群名字不遵循 RFC 1035 标签命名规则，这可能会造成错误。如果是这样的话，您可以通过给 --cluster-context 标签指定一个符合 RFC 1035 标签命名规则的名字。比如说，如果你要添加的集群的 context 为 gondor_needs-no_king，那可以这样添加这个集群：

kubefed join gondor --host-cluster-context=rivendell --cluster-context=gondor_needs-no_king

# Secret 命名

上面描述的联邦控制面板需要的集群验证信息，会作为 secret 保存在主集群里。而这个 secret 的名字就衍生自这个集群的名字。

然后，Kubernetes 里的 secret 对象命名，必须遵从这个文档 RFC 1123，所描述的 DNS 子域名的命名规则。如果不是这样的话，您可以将 secret 名字使用 --secret-name 的标签，传递给 kubefed join。比如说，如果集群名字是 noldor，而 secret 名字是 11kingdom，您可以这样添加这个集群：

kubefed join noldor --host-cluster-context=rivendell --secret-name=11kingdom

注意: 如果您的集群名字并不符合 DNS 子域名的命名规则，您所需要做的只是通过 --secret-name 标签，来提供这个 secret 的名字而已。kubefed join 会自动为您创建这个 secret .

# kube-dns 配置

每个被添加的集群里的 kube-dns 的配置必需更新，以便启用联邦服务发现功能。如果这个被添加的集群是 1.5 或者更高的版本，而您的 kubefed 是 1.6 或者更新，那这个配置在集群被添加时或者使用 kubefed join 或 unjoin 这样的命令的时候，会自动更新。

除此之外，您都必须更新 kube-dns 的配置，详情请查阅更新管理指南中的 KubeDNS 章节.

# 从联邦里移除一个集群

要从联邦里移除一个集群，执行命令 kubefed unjoin 并使用联邦的标签 --host-cluster-context 和集群的名字：

kubefed unjoin gondor --host-cluster-context=rivendell

# 清除联邦控制面板

在目前的 kubefed beta 版本里并未完全实现对联邦控制面板的彻底清理。然而，目前而言，删除联邦系统对应的 namespace 会删除所有的资源，除了自动分配给联邦集群的 etcd 服务的永久存储。您可以这样删除联邦的 namespace：

kubectl delete ns federation-system

← 使用 kubeadm 创建 k8s 集群通过 rkt 运行 k8s →