
Na minha opinião, pouca atenção é dada ao tópico de escolher um servidor ("eles são iguais para todos"). A seguir, tentarei descrever por que você não deve negligenciar isso e o que realmente precisa prestar atenção, e também falar sobre recursos que ajudarão a simplificar a vida do administrador e economizar dinheiro. Tudo descrito abaixo é uma opinião pessoal baseada em muitos anos de experiência.
Pontos-chave a serem considerados ao escolher um servidor
As tarefas
O principal e principal fator de escolha é o tipo e a natureza da carga. Com base neles, são selecionados parâmetros gerais de configuração: o número e as características da CPU, a quantidade de RAM, os parâmetros do subsistema de disco, etc. Obviamente, a configuração do servidor DBMS carregado será diferente do controlador de domínio ou host de virtualização. Aqui, eles geralmente partem dos requisitos de sistema de um software específico para a carga necessária, além da experiência na avaliação do desempenho necessário para o software necessário. Se falarmos sobre algumas dicas, então, para o host de virtualização, é melhor configurar o servidor com a quantidade máxima de RAM para o orçamento (em breve ele ficará pequeno de qualquer maneira :)). Para um servidor DBMS, é melhor cuidar do desempenho do processador e é muito rápido, tanto em IOPS quanto na latência mínima do subsistema de disco (a menos, é claro, que você planeje usar discos locais). Um servidor de armazenamento de arquivos deve ser escolhido com um grande número de slots de disco e um controlador RAID decente.
Extensibilidade
Apesar da prática padrão de adicionar uma certa margem em termos de características ao comprar um servidor, não é incomum que um aumento não planejado na carga exija mais recursos do que existe. Nesse caso, a prudência em relação a novas atualizações ajudará a gerenciar custos significativamente mais baixos. Isso se refere principalmente à quantidade de RAM (o número de slots livres e à utilização do canal), o número de discos e portas de expansão PCIe para adicionar algum tipo de adaptador de rede, HBA, SSD nVMe etc. No entanto, eu recomendo não comprar, por exemplo, um servidor de dois soquetes com um processador, pois geralmente há situações triviais nas quais você não pode comprar um segundo processador para uma atualização (nos últimos anos) em qualquer lugar, exceto no eBay. Economizar dinheiro no início se transforma em um pagamento a maior. Além disso, muitos clientes podem descobrir mais tarde que a revisão e a etapa dos processadores são diferentes e existem travamentos, erros e outros problemas estranhos, que, no entanto, geralmente são resolvidos com a atualização do BIOS / UEFI para a versão mais recente, se houver, é claro. E se os fornecedores de hardware de marca tentarem atualizar o firmware durante todo o ciclo de suporte ao servidor, no caso de uma solução montada automaticamente e de fabricantes de componentes quase sem nome (principalmente placas-mãe), é bem possível ficar sem nada.
RAS
Confiabilidade, Disponibilidade, Facilidade de Manutenção - o termo foi introduzido pela IBM e descreve a confiabilidade do sistema como um todo, pois garante a continuidade do trabalho a ele confiado. Se for necessário ter indicadores RAS suficientemente altos, vale a pena olhar na direção de máquinas de marcas sérias, pois elas prestam muita atenção a esses recursos, em contraste com marcas de gama baixa ou com montagem automática de componentes.
Confiabilidade (ou, em russo, confiabilidade)
Implica a capacidade do sistema de corrigir falhas independentemente, sem afetar o resultado final. Essa característica inclui uma variedade de tecnologias usadas em quase todos os componentes: detecção típica de erros nas instruções do processador e notificação deste sistema operacional (por exemplo, MCA da Intel), correção de erros na RAM (ECC, lavagem) e análise preditiva específica do fornecedor, no nível do processador de serviço (PFA).
Disponibilidade
Determina quanto tempo o sistema está em um estado íntegro em relação ao tempo planejado. A disponibilidade aumenta através do uso de componentes de alta qualidade, redundância de equipamentos críticos (fontes de alimentação, ventiladores, HBA), o fator de segurança geral do servidor para condições operacionais específicas. Um anti-exemplo típico são os SSDs de desktop sob carga do servidor: sim, é tão rápido, sim, é muito mais barato, mas ao exceder o limite de DWPD (que é extremamente baixo em unidades de desktop), os SSDs falham facilmente e é bom se a abordagem administrador e confluência de circunstâncias levaram apenas ao tempo de inatividade e não à perda de dados.
Facilidade de manutenção (simplicidade e velocidade do serviço)
Torna possível aumentar a disponibilidade em caso de falha, devido a uma rápida recuperação. Para isso, é usado um grande número de componentes hot-swap, trilhos convenientes com a possibilidade de manutenção sem interrupção do trabalho, várias soluções de diagnóstico, disponíveis através da rede através do processador de serviço e localizadas no gabinete do servidor - elas permitem identificar rapidamente um componente com falha. Alguns fabricantes adicionam a funcionalidade de Call Home, que relata automaticamente uma falha no suporte técnico, reduzindo assim o tempo de recuperação. Se a criticidade dos serviços localizados no servidor for alta o suficiente, vale a pena prestar muita atenção ao RAS.
Condições ambientais
Isso inclui parâmetros de energia (potência e eficiência da fonte de alimentação), resfriamento (a qualidade do sistema de resfriamento, capacidade de trabalhar em temperaturas elevadas, inclusive sem perda de garantia), sensores de temperatura dentro do gabinete, fator de forma (que também afeta o desempenho e a eficiência do resfriamento) - relevante em alta densidade). Na presença de componentes "quentes" (CPUs com alto TDP, GPU etc.), você não precisa perseguir o pequeno fator de forma sem a necessidade óbvia de posicionamento de alta densidade, é melhor escolher algo do tamanho 2U ou até mais.
Compatibilidade
A presença do servidor e dos componentes no HCL do fabricante certo ajudará a evitar situações desagradáveis associadas ao lançamento do software. Além disso, uma solicitação de suporte para um fornecedor de software pode se transformar em um pingue-pongue entre fornecedores de hardware e software e pode ser totalmente rejeitada se iniciada em hardware não suportado. No geral, é muito melhor obter uma solução pronta para uso do que reembalar a imagem do hipervisor para colocar o driver do controlador RAID lá (este exemplo é uma referência à compatibilidade dos controladores ESXi e Adaptec, que existe formalmente, mas requer carícias preliminares). Portanto, se a tarefa e o software exigirem compatibilidade com o hardware, esse item exigirá uma seleção cuidadosa de componentes (com servidores de grandes fabricantes, deste ponto de vista, tudo é muito simples - eles estão presentes no HCL de quase todas as empresas de desenvolvimento de software, seja em componentes ou como um todo).
Gerência
Quase todos os servidores estão equipados com controladores remotos que fornecem uma interface compatível com IPMI e / ou um console da web. Dependendo do fornecedor, os controladores podem ter várias funções, desde montar imagens em uma rede, instalar automaticamente o sistema operacional e atualizações de firmware centralizadas até um Gerenciamento completo do ciclo de vida, o que simplifica e acelera bastante o comissionamento de novos servidores e sua manutenção adicional. O grau de atenção a esse item depende do tamanho da frota de servidores e da necessidade de conveniência do controle remoto. Sinceramente, sempre coloco na configuração licenças opcionais para funcionalidade de gerenciamento adicional (com exceção do LCM sem indicar explicitamente a necessidade), uma vez que é muito conveniente e a facilidade de manutenção reduz seu tempo.
Desempenho
À primeira vista, esse é um ponto estranho: afinal, os servidores de diferentes fornecedores usam os mesmos processadores, RAM, discos etc. No entanto, se você medir diretamente o desempenho de servidores de diferentes fabricantes nas mesmas configurações, poderá obter resultados diferentes. Antes de tudo, isso ocorre (mas não se limita a) várias configurações e otimizações no nível do firmware. Para entender o nível de desempenho em relação às ofertas competitivas, você pode consultar os benchmarks do servidor (por exemplo, VMmark da VMware).
Garantia e Serviço
Muitos fornecedores oferecem pacotes de serviços que permitem identificar rapidamente a causa de uma falha de hardware e eliminá-la substituindo componentes. Os pacotes diferem nos períodos de garantia e serviço, bem como nos tempos de resposta e recuperação. Além disso, a disponibilidade de peças de reposição em armazéns de serviço após a remoção de um modelo específico da produção varia. No caso de montagem automática, é necessário manter as peças de reposição ou contar com o fornecedor / montador de equipamentos em questões de disponibilidade de peças de reposição no armazém e da duração da entrega.
Conclusão
Aqui estão os principais pontos que você deve prestar atenção ao escolher um servidor. Espero que isso seja útil para alguém e ajude a evitar erros comuns. Se você tiver outras perguntas, escreva nos comentários.
Você também pode se inscrever em nossos canais (
YouTube ,
VK ,
Telegram ) para não perder novos artigos, cursos e seminários.