Escolher um data center para o seu projeto ainda é uma dor. Encontrar o melhor data center para suas tarefas é mais fácil se você souber o que procurar ao pesquisar. No caso da plataforma de jogos na nuvem Playkey, a qualidade do streaming depende diretamente do data center: confiabilidade, proximidade com o usuário, qualidade da rede e outros parâmetros. Portanto, trabalhamos com data centers todos os dias e conhecemos seus principais problemas principais.

Nesta publicação, o CTO da Playkey, Alexey Lykov, mostrará como escolher um data center, o que lembrar ao pesquisar, por que se aprofundar nos recursos das fontes de alimentação e como os datacenters europeus diferem dos russos. Passamos o andar para Alexei.
1. Aprenda o padrão de nível de data center
A primeira pergunta ao escolher um data center é confiabilidade ou tempo de atividade. A certificação mais popular para esse parâmetro é a metodologia do Uptime Institute, que divide todos os datacenters em quatro fileiras (Camada). Existe um sistema alternativo para avaliar a confiabilidade dos data centers de acordo com o padrão TIA 942, mas isso não é tão interessante para nós devido à sua natureza recomendatória. No caso do certificado do Uptime Institute, eles próprios verificam os CDs em vários estágios (desde o design da documentação da construção até a avaliação regular dos serviços operacionais do centro) e emitem uma avaliação com base nos resultados da auditoria. Obter um certificado "falso" para um controlador de domínio é quase impossível.
Aqui está uma breve descrição de cada um dos quatro níveis:
- Nível 1 . Infraestrutura de engenharia sem redundância e recursos redundantes. O tempo de inatividade por ano é de 28,8 horas. A taxa de tolerância a falhas é de 99,671%.
- Nível 2 . O sistema não possui redundância total, mas é equipado com elementos adicionais de refrigeração e fonte de alimentação. Tempo de inatividade por ano - 22,0 horas. Índice de resiliência - 99,749%.
- Nível 3 . O data center possui vários canais para distribuição de energia e refrigeração, além de componentes redundantes. O tempo de inatividade por ano é de 1,6 horas. A taxa de tolerância a falhas é de 99,982%.
- Camada 4 . Data centers com redundância dupla, levando em consideração pelo menos um componente adicional. Várias formas ativas de distribuição de carga e resfriamento com componentes redundantes 2 (N + 1), ou seja, 2 no-breaks com redundância N + 1 cada. O tempo de inatividade do data center no nível TIER IV por um ano não excede 24 minutos e a taxa de failover é de 99,999%.
Um mapa de todos os datacenters certificados do Uptime Institute está aqui , mas sua localização na Rússia. Apenas 26 peças, e todas elas estão exclusivamente na parte européia do país:

O azul no mapa marca o único datacenter russo certificado de acordo com o padrão TIER IV máximo e não está localizado em Moscou, mas em Saransk. Veja como fica por dentro:

A foto mostra claramente o piso elevado removível, organizado da seguinte maneira:

De acordo com a classificação do nível de disponibilidade do data center pelo Uptime Institute, o TIER IV fornece uma reserva completa de todos os sistemas de engenharia com um coeficiente de 2N + 1, o que permite qualquer trabalho de reparo sem suspensão dos serviços do data center.
Aqui está a aparência de um sistema de fonte de alimentação com entradas de eletricidade independentes para o data center de Saransk:

Segundo dados oficiais , o data center em Mordovia deve se tornar a unidade central da infraestrutura do governo eletrônico, mas também lidará com as tarefas de bancos, seguradoras e até militares.
Às vezes, os requisitos de vários níveis parecem um pouco confusos (por exemplo, a necessidade de ter um estacionamento separado para funcionários e convidados do DC), mas na maioria das vezes eles são adequados. Portanto, os CDs de acordo com o padrão de Nível 3 precisam ter propriedade das instalações. É claro que, se o data center for construído em um local alugado, o proprietário do edifício poderá inventar qualquer coisa a qualquer momento, e ele aumentará os preços ou quebrará o contrato completamente, sejam quais forem as penalidades. Se você vir um site com um certificado de nível 3 ou superior, esse risco será excluído. Optamos por trabalhar com um data center não inferior ao nível 2 e nosso data center europeu na Alemanha é certificado de acordo com o nível nível 3.
Houve um caso curioso em que o CD alugou um quarto em um andar alto, e o elevador pertencia a outras pessoas e, portanto, foi desligado no final de semana e à noite, e foi problemático iniciar o equipamento.
2. Especifique os parâmetros de fonte de alimentação e resfriamento do data center
Se você usar uma configuração de servidor não padrão, o segundo item poderá ser comparado com segurança ao primeiro. Estamos sempre especialmente atentos à fonte de alimentação e ao resfriamento de servidores, porque não usamos servidores comuns, mas GPU, para os quais a maioria dos data centers não são projetados.
Se usarmos o rack de servidor padrão em 42 unidades, ele normalmente se parecerá com este (laptop não incluído):

Geralmente, os proprietários do data center levam de 7 a 10 quilowatts de energia para esse rack e colocam o resfriamento apropriado. Isso é suficiente para um design com servidores típicos que consomem de 300 a 500 watts, incluindo vários sistemas de armazenamento, equipamentos de comutação, patch panels e assim por diante. Porém, no nosso caso, apenas a placa de vídeo no servidor GPU "consome" de 150 a 250 watts e até 8 dessas placas de vídeo são usadas em um dispositivo. Como resultado, o consumo total do servidor GPU é de cerca de 2 kilowatts.
Por esse motivo, podemos colocar apenas 3-4 servidores em um rack, ou seja, 6-8 unidades, se estamos falando de 2 servidores de unidade. Como resultado, no rack do servidor, podemos ocupar apenas 8 unidades e 34 unidades serão gratuitas. Isso levanta a questão da eficiência do espaço. E aumentando os preços de aluguel.
A conclusão? Se você tiver solicitações incomuns de equipamento, vale a pena procurar um data center que seja aprimorado (pelo menos parcialmente) para clientes como você. No nosso caso, para clientes com servidores GPU, com uma grande fonte de energia para os racks e refrigeração aprimorada. Até agora, no entanto, existem muito poucos clientes (e data centers).
3. Escolha um local pelo local dos seus usuários
Parece brega, mas vale lembrar que a localização da sua pesquisa e desenvolvimento ou da sede não precisa ser um local para o seu data center. Principalmente - onde a maioria dos usuários do serviço está localizada. Na Playkey, o escritório de desenvolvimento está localizado em Perm e, no início, também trabalhamos com o datacenter local de Perm, que simplificou a configuração e tornou possível resolver rapidamente quaisquer problemas com o datacenter. Mas quando a base de usuários começou a crescer rapidamente, e sua parte principal (daqueles que jogam na Rússia) ainda vinha de Moscou, decidimos agrupar todos os servidores no centro também.
Após a mudança da capital para o data center de Moscou, imediatamente vimos uma melhoria na qualidade da comunicação e um feedback positivo dos jogadores.
4. Procure contatos de gerenciamento e "teste" o suporte técnico com antecedência
Suporte técnico rápido e gerenciamento adequado são outro ponto crítico no trabalho do data center. Tente esclarecer algumas tarefas típicas com os funcionários do data center, por exemplo, configure de acordo com as instruções do BIOS e observe a reação. Se você for enviado para outro especialista ou começar a desacelerar com uma resposta - todos esses não são os melhores sinais. Lembre-se de que, se algo sério acontecer ao servidor, sem uma presença física, o problema geralmente não será resolvido. E suporte técnico - suas "mãos" em caso de problemas sérios.
Quanto ao gerenciamento do data center, lembre-se de que, sem o contato do “tomador de decisão”, qualquer coordenação levará longos dias e semanas. Se, até a assinatura do contrato, você não atender até a última pessoa que realmente toma decisões no datacenter, é melhor procurar uma plataforma alternativa para hospedagem de servidores.

5. Verifique a entidade legal do proprietário do data center
O ponto mais curto, mas não menos importante. Não tenha preguiça de "romper" a entidade legal no nalog.ru. Veja o extrato do registro - e você entenderá há quanto tempo a empresa existe, com que frequência a gerência e os proprietários mudam. E no banco de dados de casos de arbitragem, não se esqueça de ver seus processos judiciais.
6. Se você estiver trabalhando com um CD europeu - seja paciente
A mentalidade dos data centers europeus e sua organização do trabalho são seriamente diferentes da Rússia. Em nossa experiência de trabalho com data centers europeus, podemos dizer com certeza que eles estão fazendo tudo mais devagar. Se na Rússia a equipe de suporte técnico pode resolver rapidamente quase qualquer problema com as configurações do servidor, na Europa não é tão simples. Eles sempre têm uma divisão interna de funcionários entre os envolvidos em tarefas de baixo e alto nível. A máquina burocrática força os clientes a provar que o problema é realmente importante e requer a intervenção imediata de um especialista de "alto nível" do data center. Prepare-se para descrever detalhadamente o motivo de sua apelação, aguarde a aprovação "com o máximo" e só então espere ajuda.
Existem diferenças na abordagem ao trabalho. Por exemplo, na Rússia, quase todas as solicitações ao datacenter podem ser enviadas via chat ou carta e receber prontamente uma resposta. Quando trabalhamos com funcionários de data centers na Alemanha e no Reino Unido, somos obrigados a nos comunicar apenas por telefone. Porque É que é tão habitual para eles.
Tais nuances tornam os europeus ainda mais lentos. Vale a pena fazer um desconto no fato de que nós próprios somos da Rússia e é mais fácil interagirmos com o suporte de língua russa, mas mesmo sem isso, os processos do "nosso", na minha opinião, são melhor construídos e o trabalho é mais rápido.
Começamos agora os preparativos para entrar no mercado dos EUA, portanto, para todos os pontos descritos, estamos longe de ser uma frase vazia. Com os estados, não estaremos localizados a três horas do data center, além de haver uma diferença decente nos fusos horários. Portanto, abordaremos a escolha de um parceiro de longo prazo com toda a responsabilidade. Uma vantagem para um lançamento rápido será um provedor de nuvem, pois no ano passado dois grandes serviços já lançaram a capacidade de alugar servidores com uma GPU.
E para quem deseja verificar a qualidade de nossos data centers, preparamos o próximo código promocional PlaykeyGeekSummer por 720 minutos do jogo. Funciona por quatro dias a partir do momento da ativação, é adequado apenas para novos usuários e não se esqueça de ativá-lo até 31 de julho de 2017.