Como verificar a confiabilidade do data center: 3 pontos principais que você precisa prestar atenção

Escolhendo um provedor de IaaS, as empresas se concentram nas características da nuvem. Eles avaliam a disponibilidade, escalabilidade etc. No entanto, o hardware instalado no data center é responsável pelo desempenho de qualquer ambiente virtualizado. Na maioria das vezes, a confiabilidade dos serviços em nuvem depende dessa infraestrutura (e do local em que está localizada).

Hoje, decidimos informar em quais pontos você deve prestar atenção ao avaliar os parâmetros de um data center de provedor de IaaS.


/ foto Arthur Caranta CC

Nível de confiabilidade e redundância


Antes de tudo, ao avaliar o data center de um provedor de IaaS, você deve prestar atenção à redundância da infraestrutura de engenharia, em particular, sistemas de fornecimento de energia. Como esse parâmetro em particular afeta o nível de disponibilidade, ou seja, o tempo de operação contínua sem falhas.

A classificação do Uptime Institute pode ser usada para avaliar os níveis de redundância.

  • Camada 1 - neste caso, não há esquema de redundância (N). A confiabilidade depende de cada elemento individual da infraestrutura e uma falha em um equipamento leva ao tempo de inatividade de todo o data center.
  • Camada 2 - implica um esquema de redundância N + 1. Um elemento adicional é adicionado aos elementos da infraestrutura N, reduzindo o risco de falha.
  • Nível 3 - esquema de redundância também N + 1, mas com a possibilidade de trabalho técnico paralelo.
  • Camada 4 - Reserva 2N. Quando cada elemento é duplicado da mesma forma.

A classificação Tier assume que os sistemas de engenharia são considerados uma única entidade. Se pelo menos um dos componentes não estiver reservado, a tolerância a falhas da interface do usuário será reduzida. Quanto maior o nível, maior a disponibilidade. No entanto, você deve entender que na classificação da interface do usuário não há "o pior e o melhor". Isso não quer dizer que em todas as situações um Nível funcionará. Portanto, a escolha de um provedor com um data center que tenha um ou outro nível de redundância deve se basear nas tarefas que a empresa enfrenta.

Para grandes organizações, com períodos de inatividade indesejáveis, faz sentido prestar atenção aos datacenters com redundância 2N. Por exemplo, esse caminho foi para o Facebook. O data center da empresa, localizado na cidade sueca de Lulea, tem uma reserva 2N. Os sistemas de energia do data center Sberbank em Skolkovo são igualmente reservados .

No entanto, em alguns casos, esse sistema pode ser redundante. Como quanto mais alto o nível, mais caro custa alugar o equipamento de um provedor de nuvem. Portanto, as empresas para as quais uma infraestrutura e serviços de TI simples não são essenciais por uma hora por ano devem escolher um data center com um Nível menor.

Por exemplo, o provedor de IaaS IT-GRAD coloca equipamentos nos datacenters DataSpace (Moscou) e Xelent (São Petersburgo). Este é um data center com uma classe de Nível III, cujo tempo de inatividade é de cerca de uma hora e meia por ano. Eles fizeram uma reserva de acordo com o esquema N + 1. Por exemplo, em uma instalação de Moscou, duas subestações da cidade, ao longo de seis linhas independentes, fornecem fornecimento contínuo de energia. Seis transformadores independentes de 2 MVA estão instalados no data center, cada um dos quais é um ponto de conexão de um circuito elétrico independente.

No caso de força maior e queda de tensão, o possível desligamento de uma ramificação da fonte de alimentação não afeta a operação do sistema como um todo, uma vez que toda a carga é transferida para a ramificação de backup. Como "plano de contingência", existem geradores automáticos a diesel com 6 tanques de combustível de 950 litros cada. Quando totalmente carregado, o estoque de reserva fornecerá ao data center 84 horas de operação contínua.

Microclima


O próximo aspecto importante é a avaliação do desempenho das "unidades de refrigeração" do data center. A capacidade dos sistemas de refrigeração de manter um microclima ideal na casa das máquinas afeta a confiabilidade do “ferro”, a quantidade de eletricidade consumida e, consequentemente, o preço dos serviços prestados para a colocação dos equipamentos.

Por exemplo, quando a temperatura sobe no data center de 22 ° C. até 35 ° C, o consumo de energia do servidor aumenta em média 20%. E como representantes da ASHRAE Society of Engineers , que está desenvolvendo padrões de comunicação e avaliação da qualidade do ar, escrevem, temperaturas abaixo de 18 ° C e acima de 27 ° C podem reduzir significativamente a potência de saída e a vida útil da bateria de sistemas de energia ininterrupta ( página 29 do relatório ).

No entanto, você também precisa considerar como a temperatura necessária é mantida no data center. Como se a eficiência do sistema de refrigeração for baixa, ela consumirá uma grande quantidade de eletricidade. Em alguns casos, até 40% de todo o consumo de energia do data center é gasto em ar condicionado. Isso, por sua vez, afeta as contas de aluguel de equipamentos.

Portanto, geralmente para controlar o microclima e a temperatura do ar no data center, use a tecnologia de "resfriamento livre" (ou freecooling). Permite reduzir o consumo de energia. De acordo com os dados mais recentes, o data center da Xelent possui o melhor indicador de eficiência energética para o data center ( PUE ) no mercado russo - foi de 1,29. O data center do Google é considerado o detentor do recorde nessa área - a gigante de TI conseguiu atingir um valor de PUE de 1,11.

No data center da Xelent, o regime de temperatura para todos os equipamentos de TI é mantido de acordo com as recomendações da ASHRAE. Um trocador de calor rotativo é responsável pelo microclima no data center. Trata-se de uma roda grande de cinco metros que fornece transferência de calor das salas de máquinas do data center para a rua, praticamente sem convecção de ar.

Também é necessário levar em consideração como no data center é fornecido um determinado nível de umidade. A condensação pode ser prejudicial ao hardware do servidor e danificá-lo. Como aconteceu com o primeiro data center do Facebook em Primeville, onde erros na operação do sistema de microclima levaram à entrada de líquidos no equipamento. Na sala do servidor, "chuva condensada" literalmente começou a chover. O equipamento teve que ser desconectado com urgência. A ASHRAE observa que o nível de umidade no data center não deve exceder 60%. No caso do Facebook, esse número chegou a 95%.


/ foto Tim Dorr CC

Segurança física


Hoje existem data centers localizados em bunkers subterrâneos, cuja entrada é guardada por soldados armados. Existem data centers protegidos contra explosões nucleares ou EMP. No entanto, na maioria das vezes eles são usados ​​pelas maiores empresas multinacionais ou estruturas militares. Para a maioria das organizações, essas medidas são redundantes e economicamente desvantajosas. No entanto, a questão da segurança e penetração física permanece relevante para todos.

Há três pontos que precisam ser levados em consideração : controle de acesso, presença de câmeras de vídeo e sensores de sinal ao longo do perímetro e segurança de “células” com racks de servidor. Talvez a melhor maneira de verificar cada um deles seja uma viagem ao data center. Assim, você pode avaliar independentemente como é difícil entrar nas salas de máquinas de um data center.

Por exemplo, o data center da Xelent na entrada possui um sistema de controle de acesso. Todos os visitantes e carros são inspecionados no ponto de verificação. Além disso, todos que entrarem no território do data center (incluindo funcionários) deverão se registrar. Duzentas câmeras de vídeo que monitoram a situação na sala do servidor estão “espalhadas” no próprio território. O acesso às salas de máquinas só é possível se acompanhado por funcionários do data center que possuam cartões de acesso especiais (podem ser cartões-chave ou cartões biométricos).

Ao verificar a proteção física das salas de máquinas, avalie não apenas a segurança do perímetro e do servidor, mas também a segurança contra incêndio nas instalações. Por exemplo, o data center do DataSpace usa um sistema de detecção precoce de incêndio. Sensores em todo o edifício avaliam amostras de ar para ajudar a evitar incêndios. O data center utiliza equipamentos seguros, um sistema de extinção de incêndio a gás, que em caso de emergência permite minimizar a quantidade de possíveis danos.

Resumir


Ao avaliar a confiabilidade de um provedor de nuvem do datacenter, as seguintes ações devem ser feitas:

  • Preste atenção à redundância da infraestrutura de engenharia. O nível de disponibilidade depende disso. Escolha o esquema de backup necessário, dependendo dos requisitos e tarefas da empresa.
  • Avalie o sistema de refrigeração e controle de temperatura na casa das máquinas. É bom que o data center use tecnologias destinadas a reduzir o PUE. Portanto, o data center gasta mais eletricidade na computação, em vez de nos servidores de refrigeração, o que economiza dinheiro para os clientes.
  • Dentro do data center, a proteção física das salas dos servidores (segurança, sistemas de extinção de incêndios, videovigilância) deve ser organizada e procedimentos estritos para a admissão de visitantes no território.

No entanto, a segurança e a confiabilidade do data center são determinadas não apenas por medidas físicas de segurança, mas também por software: firewalls, mecanismos de proteção DDoS, criptografia de dados, etc. Discutiremos esses aspectos em nosso próximo artigo.



PS Mais alguns materiais do Primeiro blog corporativo de IaaS:


PPS Fresh posts do nosso blog em Habré:




A principal atividade da empresa IT-GRAD é a prestação de serviços em nuvem:

Infraestrutura virtual (IaaS) | Hospedagem PCI DSS | Nuvem FZ-152 | Alugue 1C na nuvem


Source: https://habr.com/ru/post/pt416507/


All Articles