
Olá pessoal! Meu nome é Cyril Shadsky, sou o chefe do departamento de gerenciamento de data centers externos do DataLine.
Este artigo é dedicado aos aspectos mais importantes dos testes de aceitação, bem como aos possíveis problemas e armadilhas que podem prejudicar muitos nervos dos novatos "testadores".
Então, imagine: um contratado satisfeito nos
informará sobre o plano de cinco anos em quatro anos que não há problemas e que a instalação (data center ou um salão separado) está pronta para operação. Parece que agora é a hora de começar os testes, mas ... na verdade, já estamos atrasados. Os testes de aceitação devem ser planejados pelo menos na fase de projeto.
A primeira pergunta é a quem confiar os testes? Claro, construtores! Afinal, é muito mais fácil do que verificar independentemente cada nó ou contratar uma comissão independente. Só para garantir, eu esclareço: isso é uma piada. Se tudo fosse tão simples, este artigo não teria sido escrito.
Qualquer empreiteiro terá prazer em verificar o que ele construiu. É muito bom procurar batentes em si mesmo e escondê-los em outro lugar.
Lembre-se: mesmo o contratado melhor e mais confiável é uma pessoa interessada e tudo o que ele esconde pode se tornar um problema no futuro. Portanto, sempre faça você mesmo os testes de aceitação ou entre em contato com uma organização independente.
Se você é experiente e os testes não o assustam, você pode conduzi-los você mesmo. Tentarei explicar em detalhes como os testes de aceitação são organizados conosco e quais problemas encontramos em vários estágios.
Na Linha de Dados, há uma Diretoria de Construção de Capital, que está envolvida na construção de novos salões e data centers. Após a construção, tudo isso se torna responsabilidade do serviço de manutenção. É importante para ela que tudo seja construído com alta qualidade. Nosso diretor técnico Sergey Mishchuk é uma espécie de "juiz mundial" entre essas duas divisões da empresa.
Apesar de toda a nossa experiência, todas as vezes durante os testes encontramos uma variedade de escolas: sérias e pequenas. Isso é absolutamente normal. Você precisa capturá-los durante o teste, em vez de esperar até que se transformem em problemas. Aqui estão alguns exemplos.
Em 99% dos casos, há reclamações sobre orifícios de vedação entre paredes ou salas. Essa situação é compreensível: primeiro você precisa instalar SCS, cabos de energia, tubulações de Freon e outros tubos, e a vedação é adiada para o último momento. Portanto, verifique se ele foi concluído antes do início do teste.
Estamos obrigatoriamente fazendo um derramamento de germozona. Todas as instalações do data center estão localizadas em áreas pressurizadas separadas, “casa em casa”.
Vista superior do HermozoneSe o seu datacenter tiver zonas de contenção, ele deverá ser derramado com água da mangueira e garantir que nada esteja vazando.
Não há como escapar do lixo. Sob o piso elevado, encontrará inevitavelmente cortes de cabos, engrenagens, parafusos e outros arquivos esquecidos pelos trabalhadores. Não importa quantas verificações eu realize, sempre haverá comentários.
Se você não forçar os trabalhadores a limpar imediatamente, tudo permanecerá quando eles trouxerem e instalarem o equipamento. O que você acha que é mais fácil? Eliminar no local ou suar com uma lanterna sob racks de trabalho e limpar detritos de construção?
E tudo isso é apenas a ponta do iceberg, os problemas dados para uma compreensão geral da imagem. Agora, analisaremos cada etapa dos testes em detalhes e começaremos com uma “marca zero”, ou seja, o planejamento.
Preparação do teste

Em quase todos os artigos, falamos da importância do pré-planejamento e hoje também não interromperemos essa tradição gloriosa. Além disso, o planejamento deve ser seu primeiro passo (se não "zero") na condução dos testes.
O Uptime Institute recomenda que você comece a planejar e criar uma comissão para aceitação no estágio do design preliminar do data center, e o início do trabalho de verificação já está no estágio de design.
Começamos com a aceitação do projeto, não há como ficar sem ele. É melhor aceitar antes da construção, na fase de design. Lembre-se: é sempre mais fácil corrigir o que está “no papel” do que um objeto já construído. Em alguns casos, “ajustar um pouco” o data center final geralmente não é possível.
Os seguintes pontos também devem ser incluídos no seu plano de teste:
- Quais testes serão realizados?
- Quando os testes serão realizados?
- Quem será testado?
- Quais funcionários da empresa estarão envolvidos?
- Quais ferramentas e equipamentos serão necessários (pinças de corrente, vibrômetros, termovisores, anemômetros e muitas outras coisas obscuras, mas necessárias)?
Para cada teste, compilamos uma lista de sistemas a serem testados, pois em diferentes data centers cada unidade é responsável por seus equipamentos. Em um local, verificaremos apenas a eletricidade e os aparelhos de ar condicionado. Em outro, outros sistemas podem ser adicionados a eles, por exemplo, AUGPT, videovigilância, ACS (conforme acordado com o pessoal de segurança).
Damos especial atenção ao próprio edifício. Como regra, a marca do concreto e a forma como os pisos são despejados não são nosso patrimônio e especialização, mas precisamos verificar o
piso elevado, as portas, o sistema de abastecimento de água e o esgoto .
Em outras palavras, antes de iniciar o teste, você precisa saber claramente o que e onde testaremos para evitar sobreposições e confusão.
Uma observação importante: quando você verifica este ou aquele sistema, quem o construiu ou outra pessoa responsável deve estar perto de você. Aplica-se a todas as etapas.
Em geral, os testes de aceitação incluem as seguintes etapas:
- Verificação do Projeto
- Verificação da documentação
- Testes independentes
- Verificações abrangentes
Vamos considerar separadamente cada um deles.
Verificação de documentos

Em nenhum caso você deve pular esse estágio e, ainda mais, conduzi-lo em paralelo com testes independentes. Mesmo que o tempo esteja acabando, você deve ter certeza de que cada equipamento e cada sistema corresponde ao declarado no projeto. Sem verificar a documentação, você não poderá realizar qualitativamente mais testes, sem mencionar o lado legal do problema.
Uma lista completa dos documentos a serem verificados é individual e depende da sua configuração.
Dou um exemplo de documentos que precisam ser verificados durante os testes:
- documentação executiva para cada sistema;
- passaporte para equipamento;
- ato de start-up tecnológico;
- ato de medições e testes;
- atos de teste do sistema de crimpagem;
- relatório de laboratório sobre a medição da resistência do loop de terra e outras comunicações por cabo;
- instruções de instalação do equipamento.
Ainda existe documentação operacional. Nem sempre é indicado no contrato de construção e, se não for, solicite ao contratante um contrato adicional. A documentação operacional deve conter instruções e algoritmos básicos de comutação, mas retornaremos a isso na seção sobre testes complexos.
Além de todas as opções acima, é altamente desejável, eu diria mesmo, não se esqueça de compilar tabelas de carregamento. Infelizmente, eles nem sempre são feitos, mas este é um documento importante e conveniente.
Por que é necessário?
Normalmente, a redundância no datacenter é organizada por dois caminhos de energia, e você precisa entender qual carga irá para um feixe devido a uma queda de energia completa no outro.
Parece que um esquema comum para isso é suficiente. Mas será muito mais conveniente para seus especialistas trabalharem com tabelas. Menos provável que perca ou fique confuso.
Certamente, não podemos conciliar cada ato com a realidade, mas é necessário garantir que todos os atos existam.
Verificações offline

Verificações autônomas são o próximo passo nos testes de aceitação do data center. Aqui é necessário verificar manualmente cada equipamento: operabilidade, configurações, operação com carga máxima e, é claro, marcação - onde sem ela :) É importante que a marcação seja compatível com o design. Mas é igualmente importante que coincida com a realidade.
Exemplo de marcação de circuito glicolPor exemplo, para um sistema de distribuição de energia, aplicamos uma carga de teste e ligamos / desligamos fisicamente cada máquina no quadro de distribuição. E, começando pelo equipamento de TI, examinamos cada rack por vez, fazemos uma mesa e garantimos que, quando a máquina for desligada, o hardware correspondente também seja desligado.
Claro, às vezes nos quadros de distribuição aparecem magicamente máquinas que não estavam no projeto. Tudo bem, o principal é que a carga não excede a norma, e isso foi observado na documentação.
Quadro de distribuição direitoPara equipamentos como condicionadores de ar, grupos geradores a diesel e no-breaks, realizamos verificações simples e independentes: ligar / desligar, modos de operação, configurações, etc. Curiosamente, é importante verificar o quão bem o equipamento está consertado. Tivemos casos em que nozes importantes podiam ser desenroscadas com quase um dedo.
A primeira rodada terminou e damos aos instaladores tempo para corrigir as falhas, depois retornamos e tudo acontece na segunda rodada.
Dizem que entre si os trabalhadores os chamam de círculos do inferno crescente - muitas vezes, na segunda inspeção, encontramos batentes que não tínhamos percebido antes. E começa: "O que você não disse imediatamente?"
Você pode entender as pessoas, mas conosco é quase como no filme "Cuidado com o carro": você está se aproximando e eu estou fugindo. Exatamente o oposto: você elimina, mas eu acho.
Sob o spoiler, há uma lista dos testes autônomos mais importantes que realizamos.Refrigeração:- Inspeção visual do equipamento para cumprimento dos requisitos do manual de instalação;
- verificação da confiabilidade da fixação dos dutos, isolamento dos dutos e sua união;
- verificação da confiabilidade da fixação de equipamentos elétricos no painel elétrico (máquinas automáticas, partidas magnéticas, blocos de contato);
- verificação do painel de controle quanto à operacionalidade;
- verificação do algoritmo de operação do software de hardware: alternando do trabalho para o backup após a simulação de um acidente; verificação da rotação pelo tempo (se houver).
Fonte de alimentação:- inspeção visual do equipamento, verificação da conformidade com os requisitos do manual de instalação;
- verificação da conformidade do sistema e seus componentes com um diagrama unifilar;
- medições seletivas de temperatura sem contato (com a indicação de locais de controle).
DGU:- verificando o painel de controle;
- verificar o funcionamento correto da indicação de luz e som;
- verificação de problemas durante a partida de teste de grupos geradores a diesel nos modos automático e manual;
- verificação do desempenho dos grupos geradores a diesel por 6 horas a 30% da carga projetada.
UPS:- verificação do início automático do no-break quando as baterias estão descarregadas até o nível máximo permitido, verificação da vida útil da bateria (ao trabalhar com 100% da carga projetada);
- verificação dos principais parâmetros do no-break durante operação com carga de 100%;
- verificação da saída do no-break em desvio no modo automático e manual ao operar a 100% da carga projetada.
Quando tudo está funcionando como deveria, os testes independentes são concluídos e a parte mais engraçada começa: testes abrangentes.
Testes abrangentes

Deixe-me fazer uma digressão aqui e falar sobre o que é um data center e o que é importante para o seu funcionamento.
Primeiro de tudo, o data center é um sistema único, um organismo quase vivo. E sua "saúde" como um todo depende de como todos os seus órgãos interagem.
Por exemplo, os aparelhos de ar condicionado costumam nos dizer: “Do que você não gosta? Olha, ele sopra e esfria! Tudo está como deveria!
Os especialistas da DGU ecoam: "Olha, tudo começa e até dá eletricidade!" Em geral, cada equipamento funciona bem (verificamos em testes autônomos), mas apenas por conta própria. Vale a pena começar tudo junto, e o sistema desmorona. É para identificar problemas associados à operação conjunta do equipamento, verificações abrangentes são usadas.
O escopo dos testes pode variar dependendo do nível de redundância: quanto mais sistemas interconectados, mais opções de trabalho você precisa verificar e depurar.
Por exemplo, se estivermos construindo um data center de nível III, é imperativo que todos os elementos da infraestrutura, incluindo rotas de cabo e distribuição, possam ser desligados com segurança para substituição ou reparo. Consequentemente, o número de testes necessários está aumentando. Nós consistentemente desligamos / desativamos vários equipamentos quando o data center está operando sob carga. Mudanças em um sistema nunca devem levar a falhas nos sistemas adjacentes.
Esclarecimento importante nº 1: todos os testes abrangentes são realizados sob carga. Em 99% dos casos, as pistolas de calor são colocadas diretamente na sala de máquinas e o data center é "queimado" - é assim que verificamos a qualidade dos sistemas de engenharia.
Esclarecimento importante nº 2: DGU é a principal fonte de alimentação do data center. A cidade é uma fonte alternativa "barata", por isso realizamos todas as verificações complexas do diesel.
Um dos principais sistemas em qualquer data center é a automação no quadro principal e no grupo gerador a diesel. Este sistema deve ser verificado com muito cuidado. Batente padrão - não há transição para DGU se a entrada da cidade estiver desativada. Isso ocorre porque algumas pessoas montam a DGU, enquanto outras instalam a automação e o equipamento não se encaixa.
Quando o sistema é depurado, vale a pena preparar uma tabela de configurações e prescrever os algoritmos do ATS. Se você se deparar com um empreiteiro muito bom e responsável (designer, construtor) que documenta tudo independentemente, melhor. Caso contrário, não seja preguiçoso e anote os seguintes pontos:
- depois de quantos segundos chega o comando para dar partida no gerador a diesel;
- depois de quantos segundos há uma transição para a DGU;
- 1 e 2 em ordem inversa.
Sob o spoiler, um exemplo de algoritmo de uma das verificações usadas por nós e pelo Uptime Institute.- Realizamos a transição da rede da cidade para o grupo DGU, medimos indicadores.
- Nós voltamos.
- Desligue completamente um dos grupos geradores a diesel (desligue as comunicações, as máquinas automáticas) e observe como o sistema inicia sem um motor diesel de reserva. Isso pode causar problemas associados a configurações de automação incorretas.
- Quando os geradores a diesel são verificados, continuamos trabalhando neles e realizando os testes de energia restantes.
- Desligamos um no-break e observamos como a carga passa para outro feixe. Traduzimos em desvio e vice-versa, descarregamos as baterias.
- Continuamos a seguir consistentemente o esquema e desligar os quadros de distribuição.
Em seguida, o sistema de ar condicionado é verificado. Desligamos os aparelhos de ar condicionado e, se eles tiverem um sistema ABP integrado, verificamos também.
Se os aparelhos de ar condicionado estiverem configurados para trabalhar em grupo e mudarem automaticamente do backup para o primário, verifique como ele funciona.
- remova todas as conexões;
- reinicie o controlador responsável pela comutação;
- desligue o interruptor de distribuição que conecta os aparelhos de ar condicionado;
- automação de teste - trava aqui com muita frequência;
- estamos fazendo tudo o que poderia ser escrito no romance "50 Shades of the Data Center".
Para um sistema de glicol, é imperativo verificar o sistema hidráulico desligando as bombas e desligando um dos trocadores de calor e uma ou mais seções da rota.
Aqui você pode ver que cada escudo é marcado e fornecido com uma breve instruçãoImportante: se a alternância for feita manualmente, é imperativo que o contratado forneça um algoritmo. As marcações das válvulas e trincos devem indicar as posições de operação (abertura normal, fechamento normal).
Muitas vezes, os contratados dizem: isso não estava no plano de teste fornecido. Você pode responder a isso: os planos de acidentes não fornecem :)
Situações ocasionais também acontecem. Por exemplo, durante o teste de um no-break, um ar condicionado com defeito pode vir funcionando para descarregar:
"O que você está fazendo Herodes?!" Por que você desligou as bombas?
- Não desligamos nada, estamos testando o no-break.
- E por que estuprar os chillers? Eles podem quebrar!
- É por isso que estamos testando para encontrar momentos tão estreitos.Outro teste frequente é a verificação do sistema de extinção de incêndio. Para fazer isso, desconectamos toda a automação dos cilindros e testamos como as instruções funcionam. Acontece que as instruções estão confusas, a abertura / fechamento não funciona.
Não se esqueça do sistema de monitoramento (escrevemos mais sobre ele
aqui e
aqui ). Assim que ativarmos ou desativarmos algo, essa alteração deverá aparecer no painel. Também verificamos se o monitoramento está começando a ser "estúpido" com um grande número de alarmes.
Certifique-se de testar a energia de monitoramento. Em nenhum caso você deve perder o controle do data center em caso de emergência.
Fazemos tudo com as mãos de um construtor
No começo, escrevi que os testes de aceitação deveriam ser realizados por especialistas externos. Mas há coisas que devem ser cobradas diretamente ao contratado. Esta é uma demonstração de equipamentos dentro e fora (assim como alguns outros trabalhos). A parte receptora acompanha uma lista de verificação e anota os resultados. Algo assim:
- O lado receptor diz: “Precisamos desligar o ar condicionado nº 34. Colegas, desligue, mostre-nos como você faz. ”
- O construtor mostra e explica.
- O lado receptor está gravando.
Esta é uma regra de boa forma.
Questão de tempo

Como você já pode entender, os testes de aceitação são um processo demorado. Sua duração depende fortemente do tamanho do data center e da quantidade de equipamento, portanto, abaixo, darei os indicadores médios (data center para 50 a 100 racks).
- Verificando a documentação - 3-5 dias úteis de designers fortes.
- Verificações autônomas - de 3 a 5 dias para iteração, pois é necessário verificar cada elemento do datacenter e dar tempo ao contratado para corrigir erros. Quantas iterações serão, só Deus sabe.
- Verificações abrangentes - 2-3 dias, se tudo funcionar corretamente.
Obviamente, esses números são muito aproximados. Não espere encontrar 2-3 semanas. Às vezes, as inspeções podem levar vários meses.Construímos uma sala, lançamos o sistema - você pode realizar uma verificação offline. Verificado, corrigido tudo - lançou outro sistema. Ela também foi verificada e assinou atos. Bem, então, quando tudo estiver pronto, é realizada uma verificação abrangente.Sobre como jogamos canos

.
.
, . , , — . , 10 .
: « , , !». , , . . .
, , , . .
, ? , . , .
, , . — , .
: , , , . « », , IT-, . — , .
- , .