La théorie et les principaux points sur la méthodologie de calcul du «coefficient de disponibilité» ont été décrits par moi
plus haut dans cet article .
Dans cette publication, nous allons calculer le «facteur de disponibilité» de deux ensembles d'équipements de réseau de classe opérateur, chacun installé dans une armoire de télécommunications, et comparer avec le calcul du «facteur de disponibilité» pour un ensemble d'équipements sans éléments dupliqués.
Pourquoi avez-vous besoin de faire les calculs du «facteur de disponibilité» pour différents cas de configuration d'équipement?
Nos données sur le calcul du «coefficient de disponibilité» dans les résultats finaux peuvent être incorrectes, trop idéales, trop élevées et trop faibles. Et là où l'erreur s'est glissée là-dedans ou tout est correctement calculé, vous ne pouvez comprendre que lorsqu'il est possible de voir tous les éléments du système ensemble, leurs options d'utilisation et de localisation.
Un exemple de calcul «idéal» du «facteur de disponibilité».Les principaux composants du kit d'équipement réseau n ° 1:
- Cisco ASR 9010 - 2 pièces;
- Cisco ASR 9000v - 2 pièces;
- tableau d'alimentation "48V" -10-2 - 2 pcs.
Exhaustivité de l'équipement Cisco ASR 9010:

Le schéma de l'armoire avec le kit installé numéro 1 ressemble à ceci:

Calcul du facteur de disponibilité des équipements de l'ensemble n ° 1:

(*) - les données initiales sur le paramètre MTBF sont des estimations fournies pour ces équipements du fabricant ou leurs analogues.
Les routeurs de la gamme Cisco ASR 9000 sont conçus pour avoir des taux de temps moyen entre pannes (MTBF) et de temps de résolution moyen (MTTR) bas, offrant ainsi une plate-forme fiable qui minimise les pannes ou les temps d'arrêt et maximise la disponibilité. Le MTBF est calculé sur la base de la condition Ground Benign. Les valeurs peuvent être ajustées en fonction de l'utilisation différente du routeur.Données finales calculées pour l'ensemble n ° 1:
- probabilité de défaillance de l'équipement du système au cours de l'année: 0,0008023;
- Système d'équipement MTBF (années): 1246 (10918609 heures);
- temps moyen de dépannage (heures): 24;
- coefficient de disponibilité de l'équipement du système (%): 99,99978;
- temps d'arrêt moyen par an (heures): 0,019 (1,15 minutes).
Qu'est-ce qui est pris en compte à tort dans ce calcul?
Pour calculer le facteur de disponibilité, vous devez comprendre comment et où l'équipement est installé, quelles sont ses fonctionnalités et la possibilité de remplacement à chaud et de duplication des éléments, la complexité de l'installation et du remplacement des composants, sans arrêter les principaux systèmes du complexe.
Dans un calcul idéal, tous les éléments sont dupliqués (ce qui est rarement le cas), on suppose que des pièces de rechange sont à portée de main, et nous pouvons effectuer des travaux sous tension sur des équipements de travail à proximité sans problème.
Et si la disposition physique diverge du schéma logique du système, alors les différentes parties du système ne peuvent pas se dupliquer.
Dans le cas «idéal», nous avons un complexe de deux moitiés qui se dupliquent. Mais s'il n'y a pas une telle duplication logique, alors nous nous éloignons déjà du calcul «idéal» pour un calcul plus correct et nous obtenons un résultat plausible.
Et soyons réalistes, ajoutez 60 minutes par an à la «Procédure de redémarrage \ arrêt». Téléchargez le nouveau châssis, configurez et exécutez en mode normal cette fois devrait suffire à partir du moment où vous appuyez sur l'interrupteur d'alimentation du boîtier. Pour 60 minutes d'arrêt, la probabilité de défaillance par an est de 0,04167. Ce sera la ligne de fond dans les calculs ci-dessous.
Un exemple de calcul «réel» du «facteur de disponibilité».Calcul du facteur de disponibilité des équipements de l'ensemble n ° 1 sans duplication:

Données finales calculées pour l'ensemble n ° 1 sans duplication:
- probabilité de défaillance de l'équipement du système au cours de l'année: 0,5001666;
- Système d'équipement MTBF (années): 1,99 (17514 heures);
- temps moyen de dépannage (heures): 24;
- facteur de disponibilité de l'équipement du système (%): 99,86;
- temps d'arrêt moyen par an (heures): 11,98 (719 minutes).
La différence entre les deux calculs effectués ci-dessus est énorme. Et ce moment doit toujours être rappelé et analysé.
Dans le meilleur des cas, même si nous avons des éléments en double dans le système, vous devez ignorer la possibilité de leur implication en tant que remplacement, si ces éléments contiennent d'autres composants. Autrement dit, nous considérons que nous avons deux châssis et deux cartes d'alimentation. Ces composants sont dupliqués, mais ils contiennent d'autres éléments qui peuvent cesser de fonctionner lorsque le composant «mère» tombe en panne.
Si cela est essentiel pour le châssis, cela pose moins de problèmes pour le blindage, car de simples composants électroniques ne sont utilisés que pour les tests et l'affichage de la charge actuelle, même si cette carte tombe en panne, le blindage fonctionnera normalement.
Un exemple de calcul «standard» du «facteur de disponibilité».Les principaux composants de l'ensemble 2 de l'équipement réseau:
- Cisco ASR 9006 - 2 pièces;
- Cisco ASR 9000v - 2 pièces;
- tableau d'alimentation "48V" -48-5 - 2 pcs.
Exhaustivité de l'équipement Cisco ASR 9006:

Le schéma de l'armoire avec le kit installé numéro 2 ressemble à ceci:

Calcul du facteur de disponibilité des équipements de l'ensemble n ° 2, en tenant compte de la non-duplication du châssis et des panneaux d'alimentation:

Données finales calculées pour l'ensemble n ° 2:
- probabilité de défaillance de l'équipement du système au cours de l'année: 0,2167769;
- Système d'équipement MTBF (années): 4,7 (40410 heures);
- temps moyen de dépannage (heures): 24;
- facteur de disponibilité de l'équipement du système (%): 99,94;
- temps d'arrêt moyen par an (heures): 5,2 (311 minutes).
Il s'avère que lors du calcul du facteur de disponibilité, il est nécessaire de comprendre quel élément le plus important du système peut être remplacé même dans les 24 heures. Et dans quelle mesure le remplacement de cet élément affectera le fonctionnement des composants restants.
Par exemple, lors du remplacement du châssis, nous devrons démonter l'ensemble complet des cartes et adaptateurs de ce châssis, ce qui peut prendre du temps et plus de 2-3 heures. Et démonter les éléments lorsque l'équipement allumé à côté du rack est un gros risque pour une situation d'urgence supplémentaire.
Pour l'option idéale - deux armoires avec équipement, chacune avec 2 châssis - une fonctionnelle, la seconde vide pour une activation rapide avec le transfert des éléments de l'échec. Mais c'est une situation trop idéale.