Ejemplos de cálculo del "factor de disponibilidad" para conjuntos de equipos de red

imagen

La teoría y los puntos principales sobre la metodología para calcular el "coeficiente de disponibilidad" fueron descritos por mí anteriormente en este artículo .

En esta publicación, calcularemos el "factor de disponibilidad" de dos conjuntos de equipos de red de grado portador, cada uno instalado en un gabinete de telecomunicaciones, y lo compararemos con el cálculo del "factor de disponibilidad" para un conjunto de equipos sin elementos duplicados.

¿Por qué necesita hacer los cálculos del "factor de disponibilidad" para diferentes casos de configuración de equipos?

Nuestros datos sobre el cálculo del "coeficiente de disponibilidad" en los resultados finales pueden ser incorrectos, demasiado ideales, demasiado altos y demasiado bajos. Y cuando el error se deslizó allí o todo se calculó correctamente, solo puede comprender cuándo es posible ver todos los elementos del sistema juntos, sus opciones de uso y ubicación.

Un ejemplo de un cálculo "ideal" del "factor de disponibilidad".

Los componentes principales del kit de equipo de red No. 1:

  • Cisco ASR 9010 - 2 piezas;
  • Cisco ASR 9000v - 2 piezas;
  • cuadro de distribución de alimentación "48V" -10-2 - 2 uds.

Completitud del equipo Cisco ASR 9010:

imagen

El diagrama del gabinete con el kit instalado número 1 se ve así:

imagen

Cálculo del factor de disponibilidad del equipo del conjunto No. 1:

imagen

(*) - los datos iniciales sobre el parámetro MTBF son estimaciones proporcionadas para estos elementos del equipo del fabricante o sus análogos.

Los enrutadores Cisco ASR de la serie 9000 están diseñados para tener un alto tiempo medio entre fallas (MTBF) y bajas tasas de tiempo medio para resolver (MTTR), proporcionando así una plataforma confiable que minimiza las interrupciones o el tiempo de inactividad y maximiza la disponibilidad. El MTBF se calcula en función de la condición de tierra benigna. Los valores pueden ajustarse en función del uso diferente del enrutador.

Datos finales calculados para el conjunto No. 1:

  • probabilidad de falla del equipo del sistema durante el año: 0,0008023;
  • Sistema de equipo MTBF (años): 1246 (10918609 horas);
  • tiempo promedio de resolución de problemas (horas): 24;
  • coeficiente de disponibilidad del equipo del sistema (%): 99.99978;
  • tiempo de inactividad promedio por año (horas): 0.019 (1.15 minutos).

¿Qué se tiene en cuenta erróneamente en este cálculo?

Para calcular el factor de disponibilidad, debe comprender cómo y dónde se instala el equipo, cuál es su funcionalidad y la posibilidad de intercambio en caliente y duplicación de elementos, la complejidad de instalar y reemplazar componentes, sin apagar los sistemas principales del complejo.

En un cálculo ideal, todos los elementos están duplicados (lo que rara vez es el caso), se supone que las piezas de repuesto están a la mano, y podemos realizar trabajos en vivo en equipos de trabajo cercanos sin problemas.

Y si el diseño físico difiere del esquema lógico del sistema, entonces aquí las partes individuales del sistema no pueden duplicarse entre sí.

En el caso "ideal", tenemos un complejo de dos mitades que se duplican entre sí. Pero si no existe tal duplicación lógica, entonces ya nos estamos alejando del cálculo "ideal" a uno más correcto y obtenemos un resultado plausible.

Y seamos realistas, agregue 60 minutos por año al "Procedimiento de reinicio / apagado". Descargue el nuevo chasis, configúrelo y ejecútelo en modo normal, esta vez debería ser suficiente desde el momento en que presiona el interruptor de encendido de la carcasa. Para 60 minutos de tiempo de inactividad, la probabilidad de falla por año es 0.04167. Esta será la línea de fondo en los cálculos a continuación.

Un ejemplo de un cálculo "real" del "factor de disponibilidad".

Cálculo del factor de disponibilidad del equipo del conjunto No. 1 sin duplicación:

imagen

Datos finales calculados para el conjunto No. 1 sin duplicación:

  • probabilidad de falla del equipo del sistema durante el año: 0,5001666;
  • Sistema de equipo MTBF (años): 1.99 (17514 horas);
  • tiempo promedio de resolución de problemas (horas): 24;
  • factor de disponibilidad del equipo del sistema (%): 99.86;
  • tiempo de inactividad promedio por año (horas): 11.98 (719 minutos).

La diferencia entre los dos cálculos realizados anteriormente es enorme. Y este momento siempre debe ser recordado y analizado.

En el mejor de los casos, incluso si tenemos elementos duplicados en el sistema, debe ignorar la posibilidad de su participación como reemplazo, si estos elementos contienen otros componentes. Es decir, parece que tenemos dos chasis y dos placas de alimentación. Estos componentes están duplicados, pero tienen otros elementos dentro que pueden dejar de funcionar cuando falla el componente "madre".

Si esto es esencial para el chasis, entonces es menos problemático para el escudo, ya que solo se utilizan componentes electrónicos simples para probar y mostrar la carga de corriente, incluso si esta placa falla, el escudo funcionará normalmente.

Un ejemplo de un cálculo "estándar" del "factor de disponibilidad".

Los componentes principales del conjunto 2 de equipos de red:

  • Cisco ASR 9006 - 2 piezas;
  • Cisco ASR 9000v - 2 piezas;
  • cuadro de distribución de alimentación "48V" -48-5 - 2 uds.

Completitud del equipo Cisco ASR 9006:

imagen

El diagrama del gabinete con el kit instalado número 2 se ve así:

imagen

Cálculo del factor de disponibilidad del equipo del conjunto No. 2, teniendo en cuenta la no duplicación del chasis y los paneles de alimentación:

imagen

Datos finales calculados para el conjunto No. 2:

  • probabilidad de falla del equipo del sistema durante el año: 0.2167769;
  • Sistema de equipo MTBF (años): 4.7 (40410 horas);
  • tiempo promedio de resolución de problemas (horas): 24;
  • factor de disponibilidad del equipo del sistema (%): 99,94;
  • tiempo de inactividad promedio por año (horas): 5.2 (311 minutos).

Resulta que al calcular el factor de disponibilidad, es necesario comprender qué elemento más grande del sistema se puede reemplazar incluso dentro de las 24 horas. Y cuánto afectará el reemplazo de este elemento al funcionamiento de los componentes restantes.

Por ejemplo, al reemplazar el chasis, tendremos que desmontar todo el conjunto de placas y adaptadores de este chasis, y esto puede llevar tiempo y más de 2-3 horas. Y desmantelar los elementos cuando el equipo se enciende al lado del bastidor es un gran riesgo para una situación de emergencia adicional.

Para la opción ideal: dos gabinetes con equipo, cada uno con 2 chasis, uno funcionando, el segundo vacío para una activación rápida con la transferencia de elementos desde el fallido. Pero esta es una situación demasiado ideal.

Source: https://habr.com/ru/post/es419763/


All Articles