🚰 🙆🏽 ⭐️ Cómo conectar clústeres de Kubernetes en diferentes centros de datos 🙊 🖤 🌯

Bienvenido a la serie de tutoriales rápidos de Kubernetes. Esta es una columna regular con las preguntas más interesantes que recibimos en línea y en nuestros entrenamientos. El experto en Kubernetes responde.

La experta de hoy es Daniele Polencic . Daniel es instructor y desarrollador de software en Learnk8s .

Si desea responder su pregunta en la próxima publicación, contáctenos por correo electrónico o en Twitter: @ learnk8s .

¿Saltaste publicaciones anteriores? Búscalos aquí .

¿Cómo conectar clústeres de Kubernetes en diferentes centros de datos?

Brevemente : Kubefed v2 llegará pronto , y también le aconsejo que lea sobre Shipper y el proyecto del planificador de múltiples clústeres .

Muy a menudo, la infraestructura se replica y distribuye en diferentes regiones, especialmente en entornos controlados.

Si una región no está disponible, el tráfico se redirige a otra para evitar interrupciones.

Con Kubernetes, puede usar una estrategia similar y distribuir cargas de trabajo en diferentes regiones.

Puede tener uno o más grupos por equipo, región, entorno o una combinación de estos elementos.

Sus clústeres se pueden alojar en diferentes nubes y en un entorno local.

Pero, ¿cómo planificar la infraestructura para tal extensión geográfica?
¿Necesita crear un gran clúster en múltiples entornos de nube en una sola red?
¿O iniciar muchos grupos pequeños y encontrar una forma de controlarlos y sincronizarlos?

Un clúster principal

Crear un solo clúster en una sola red no es tan simple.

Imagine que tiene un accidente, perdió la conectividad entre los segmentos del clúster.

Si tiene un servidor maestro, la mitad de los recursos no podrá recibir nuevos comandos, ya que no podrán contactar al maestro.

Y al mismo tiempo, tiene tablas de enrutamiento antiguas ( kube-proxy no puede cargar nuevas) y no hay pods adicionales (kubelet no puede solicitar actualizaciones).

Para empeorar las cosas, si Kubernetes no ve el nodo, lo marca como perdido y distribuye las vainas faltantes a los nodos existentes.

Como resultado, tienes el doble de vainas.

Si crea un servidor maestro para cada región, habrá problemas con el algoritmo de consenso en la base de datos etcd. ( aprox. Ed. - En realidad, la base de datos etcd no tiene que estar ubicada en los servidores maestros. Se puede ejecutar en un grupo separado de servidores en la misma región. Sin embargo, recibió un punto de falla del clúster. Pero rápidamente. )

etcd utiliza el algoritmo de balsa para negociar el valor antes de escribirlo en el disco.
Es decir, la mayoría de las instancias deben llegar a un consenso antes de que el estado pueda escribirse en etcd.

Si el retraso entre instancias de etcd aumenta dramáticamente, como es el caso con tres instancias de etcd en diferentes regiones, lleva mucho tiempo conciliar el valor y escribirlo en el disco.
Esto se refleja en los controladores de Kubernetes.

El administrador del controlador necesita más tiempo para conocer el cambio y escribir la respuesta en la base de datos.

Y si el controlador no es uno, sino varios, se obtiene una reacción en cadena y todo el grupo comienza a funcionar muy lentamente .

etcd es tan sensible a la latencia que la documentación oficial recomienda usar SSD en lugar de discos duros normales .

Actualmente no hay buenos ejemplos de una red grande para un solo clúster.

Básicamente, la comunidad de desarrollo y el grupo SIG-cluster están tratando de descubrir cómo orquestar clústeres de la misma manera que Kubernetes organiza los contenedores.

Opción 1: federación de clúster con kubefed

La respuesta oficial de SIG-cluster es kubefed2, una nueva versión de la federación original de clientes y operadores de kube .

Por primera vez, intentaron administrar la colección de clústeres como un solo objeto utilizando la herramienta de federación de kube.

El comienzo fue bueno, pero al final, la federación de kube no se hizo popular porque no era compatible con todos los recursos.

Apoyó entregas y servicios conjuntos, pero, por ejemplo, no StatefulSets.
Y la configuración de la federación se transmitió en forma de anotaciones y no difirió en flexibilidad.

Imagine cómo puede describir la separación de réplicas para cada clúster en una federación utilizando solo anotaciones.

Resultó ser un completo desastre.

SIG-cluster hizo un gran trabajo después de kubefed v1 y decidió abordar el problema desde el otro lado.

En lugar de anotaciones, decidieron lanzar un controlador que está instalado en los clústeres. Se puede configurar mediante la Definición de recursos personalizados (CRD).

Para cada recurso que formará parte de la federación, tiene una definición CRD personalizada de tres secciones:

definición estándar de un recurso, como despliegue;
sección de placement , donde determina cómo se distribuirá el recurso en la federación;
override sección, donde para un recurso en particular puede anular el peso y los parámetros desde la ubicación.

Aquí hay un ejemplo de una entrega combinada con secciones de ubicación y anulación.

 apiVersion: types.federation.k8s.io/v1alpha1 kind: FederatedDeployment metadata: name: test-deployment namespace: test-namespace spec: template: metadata: labels: app: nginx spec: replicas: 3 selector: matchLabels: app: nginx template: metadata: labels: app: nginx spec: containers: - image: nginx name: nginx placement: clusterNames: - cluster2 - cluster1 overrides: - clusterName: cluster2 clusterOverrides: - path: spec.replicas value: 5

Como puede ver, el suministro se distribuye en dos clústeres: cluster2 y cluster2 .

El primer clúster entrega tres réplicas, mientras que el segundo se establece en 5.

Si necesita más control sobre el número de réplicas, kubefed2 proporciona un nuevo objeto ReplicaSchedulingPreference, donde se pueden ponderar las réplicas:

 apiVersion: scheduling.federation.k8s.io/v1alpha1 kind: ReplicaSchedulingPreference metadata: name: test-deployment namespace: test-ns spec: targetKind: FederatedDeployment totalReplicas: 9 clusters: A: weight: 1 B: weight: 2

La estructura CRD y la API aún no están listas, y se está trabajando activamente en el repositorio oficial del proyecto.

Tenga cuidado con kubefed2, pero recuerde que todavía no es adecuado para el entorno de trabajo.

Obtenga más información sobre kubefed2 en el artículo oficial de kubefed2 en el blog de Kubernetes y en el repositorio oficial de proyectos de kubefed .

Opción 2: agrupación de clústeres de estilo Booking.com

Los desarrolladores de Booking.com no trataron con kubefed v2, pero se les ocurrió Shipper, un operador para la entrega en varios clústeres, en varias regiones y en varias nubes.

Shipper es algo similar a kubefed2.

Ambas herramientas le permiten configurar la estrategia de implementación para varios clústeres (qué clústeres se usan y cuántas réplicas tienen).

Pero el objetivo de Shipper es reducir el riesgo de errores de entrega.

En Shipper, puede definir una serie de pasos que describen la separación de las réplicas entre la implementación anterior y la actual y la cantidad de tráfico entrante.

Cuando envía un recurso a un clúster, el controlador Shipper implementa este cambio paso a paso en todos los clústeres combinados.

Y Shipper es muy limitado.

Por ejemplo, acepta gráficos Helm como entrada y no admite recursos de vainilla.
En términos generales, Shipper funciona de la siguiente manera.

En lugar de la entrega estándar, debe crear un recurso de aplicación que incluya el gráfico Helm:

 apiVersion: shipper.booking.com/v1alpha1 kind: Application metadata: name: super-server spec: revisionHistoryLimit: 3 template: chart: name: nginx repoUrl: https://storage.googleapis.com/shipper-demo version: 0.0.1 clusterRequirements: regions: - name: local strategy: steps: - capacity: contender: 1 incumbent: 100 name: staging traffic: contender: 0 incumbent: 100 - capacity: contender: 100 incumbent: 0 name: full on traffic: contender: 100 incumbent: 0 values: replicaCount: 3

Shipper es una buena opción para administrar múltiples clústeres, pero su estrecha relación con Helm solo interfiere.

¿Qué pasa si todos pasamos de Helm a kustomize o kapitan ?

Obtenga más información sobre Shipper y su filosofía en este comunicado de prensa oficial .

Si desea profundizar en el código, vaya al repositorio oficial del proyecto .

Opción 3: unión de clúster "mágico"

Kubefed v2 y Shipper funcionan con la federación de clúster, proporcionando a los clústeres nuevos recursos a través de definiciones de recursos personalizadas.

Pero, ¿qué sucede si no desea reescribir todos los suministros, StatefulSets, DaemonSets, etc. para combinarlos?

¿Cómo incluir un clúster existente en una federación sin cambiar YAML?

multi-cluster-Scheduler es un proyecto de Admirality que maneja las cargas de trabajo de planificación en clusters.

Pero en lugar de encontrar una nueva forma de interactuar con el clúster y ajustar los recursos en definiciones definidas por el usuario, el programador de clústeres múltiples está integrado en el ciclo de vida estándar de Kubernetes e intercepta todas las llamadas que crean los pods.

Cada creado bajo reemplazado inmediatamente por un maniquí.

El programador de clúster múltiple utiliza enlaces web para modificar el acceso para interceptar la llamada y crear un dispositivo inactivo.

El pod de origen pasa por otro ciclo de planificación, donde después de una encuesta de toda la federación, se toma una decisión sobre la colocación.

Finalmente, el pod se entrega al clúster de destino.

Como resultado, tiene una cápsula adicional que no hace nada, solo ocupa espacio.

La ventaja es que no tuvo que escribir nuevos recursos para combinar los suministros.

Cada recurso que crea un pod está automáticamente listo para fusionarse.

Esto es interesante, porque de repente tiene entregas distribuidas en varias regiones, pero no lo ha notado. Sin embargo, esto es bastante arriesgado, porque aquí todo se basa en la magia.

Pero si Shipper trata principalmente de mitigar los efectos de los suministros, el programador de clústeres múltiples realiza tareas más generales y probablemente sea más adecuado para trabajos por lotes.

No tiene un mecanismo avanzado de suministro gradual.

Puede obtener más información sobre el programador de clústeres múltiples en la página del repositorio oficial .

Si desea leer sobre el planificador de múltiples clústeres en acción, Admiralty tiene un caso de uso interesante con Argo : flujos de trabajo, eventos, CI y CD de Kubernetes.

Otras herramientas y soluciones

Conectar y administrar múltiples clústeres es una tarea compleja; no existe una solución universal.

Si desea obtener más información sobre este tema, aquí hay algunos recursos:

Rancher's Submariner es una herramienta que conecta redes superpuestas de diferentes grupos de Kubernetes.
La cadena minorista de Target utiliza Unimatrix en combinación con Spinnaker para organizar implementaciones en múltiples clústeres .
Intente usar IPV6 y una sola red en varias regiones .
Puede usar una malla de servicio, como Istio, para conectar varios clústeres .
Cilium, un complemento de interfaz de red de contenedor, ofrece una función de malla de clúster que permite combinar varios clústeres

Eso es todo por hoy

¡Gracias por leer hasta el final!

Si sabe cómo conectar varios clústeres de manera más eficiente, infórmenos .

Agregaremos su método a los enlaces.

Un agradecimiento especial a Chris Nesbitt-Smith y Vincent De Smet (ingeniero de confiabilidad en swatmobile.io ) por leer este artículo y compartir información útil sobre cómo funciona la federación.

Cómo conectar clústeres de Kubernetes en diferentes centros de datos