Elige un servidor. ¿Qué buscar? Lista de verificación



En mi opinión, se presta muy poca atención al tema de elegir un servidor ("todos son iguales para todos"). A continuación, trataré de describir por qué no debe descuidar esto y a qué debe prestarle atención, y también hablaré sobre las características que ayudarán a simplificar la vida del administrador y ahorrar dinero. Todo lo que se describe a continuación es una opinión personal basada en muchos años de experiencia.

Puntos clave a considerar al elegir un servidor


Las tareas


El principal y principal factor de elección es el tipo y la naturaleza de la carga. En función de ellos, se seleccionan los parámetros de configuración generales: el número y las características de la CPU, la cantidad de RAM, los parámetros del subsistema de disco, etc. Obviamente, la configuración del servidor DBMS cargado diferirá del controlador de dominio o del host de virtualización. Aquí, generalmente comienzan a partir de los requisitos del sistema de un software en particular para la carga necesaria, así como de la experiencia en la evaluación del rendimiento requerido para el software necesario. Si hablamos de algunos consejos, entonces para el host de virtualización es mejor configurar el servidor con la cantidad máxima de RAM para el presupuesto (de todos modos, pronto será pequeño :)). Para un servidor DBMS, es mejor cuidar el rendimiento del procesador y es muy rápido tanto en IOPS como en la latencia mínima del subsistema de disco (a menos, por supuesto, que planee usar discos locales). Se debe elegir un servidor de almacenamiento de archivos con una gran cantidad de ranuras de disco y un controlador RAID decente.

Extensibilidad


A pesar de la práctica estándar de agregar un cierto margen en términos de características al comprar un servidor, no es raro que un aumento no planificado de la carga requiera más recursos de los que hay. En este caso, la prudencia en materia de actualizaciones adicionales ayudará a administrar costos significativamente más bajos. Esto se refiere principalmente a la cantidad de RAM (la cantidad de ranuras libres y la utilización de canales), la cantidad de discos y puertos de expansión PCIe para agregar algún tipo de adaptador de red, HBA, SSD nVMe, etc. Sin embargo, le recomiendo no, por ejemplo, comprar un servidor de dos sockets con un procesador, ya que a menudo hay situaciones triviales en las que no puede comprar un segundo procesador para una actualización (en los últimos años) en cualquier lugar, excepto eBay. Ahorrar dinero al principio se convierte en un sobrepago. Además, muchos clientes pueden encontrar más tarde que la revisión y la versión de los procesadores son diferentes, y que existen extraños bloqueos, errores y otros problemas, que, sin embargo, generalmente se resuelven actualizando el BIOS / UEFI a la última versión, si la hay, por supuesto. Y si los proveedores de hardware de marca intentan actualizar el firmware durante todo el ciclo de soporte del servidor, entonces, en el caso de una solución autoensamblada y fabricantes de componentes cercanos a los que no son conocidos (principalmente placas base), es muy posible quedarse sin nada.

RAS


Confiabilidad, disponibilidad, capacidad de servicio: el término fue introducido por IBM y describe la confiabilidad del sistema en su conjunto, ya que garantiza la continuidad del trabajo que se le confía. Si es necesario tener indicadores RAS suficientemente altos, vale la pena mirar en la dirección de las máquinas de marcas serias, ya que prestan mucha atención a estas características, en contraste con las marcas de gama baja o el autoensamblaje de componentes.

Fiabilidad (o, en ruso, fiabilidad)


Implica la capacidad del sistema para corregir fallas independientemente sin afectar el resultado final. Esta característica incluye una variedad de tecnologías utilizadas en casi todos los componentes: detección de errores típicos en las instrucciones del procesador y notificación de este sistema operativo (por ejemplo, MCA de Intel), corrección de errores en RAM (ECC, depuración) y análisis predictivo específico del proveedor como nivel de procesador de servicio (PFA).

Disponibilidad


Determina cuánto tiempo está el sistema en un estado saludable en relación con el tiempo planificado. La disponibilidad aumenta mediante el uso de componentes de alta calidad, la redundancia de equipos críticos (fuentes de alimentación, ventiladores, HBA), el factor de seguridad general del servidor para condiciones operativas específicas. Los SSD de escritorio bajo carga de servidor son un anti-ejemplo típico: sí, es casi tan rápido, sí, es mucho más barato, pero cuando se excede el umbral de DWPD (que es extremadamente bajo en unidades de escritorio), los SSD fallan fácilmente, y es bueno si el enfoque El administrador y la confluencia de circunstancias condujeron solo al tiempo de inactividad y no a la pérdida de datos.

Facilidad de servicio (simplicidad y velocidad de servicio)


Sin embargo, permite aumentar la disponibilidad en caso de que ocurra una falla debido a una recuperación rápida. Para esto, se utiliza una gran cantidad de componentes intercambiables en caliente, rieles convenientes con la posibilidad de servicio sin interrupción del trabajo, varias soluciones de diagnóstico, disponibles a través de la red a través del procesador de servicio y ubicadas en la carcasa del servidor, que le permiten identificar rápidamente un componente fallido. Algunos fabricantes agregan la funcionalidad Call Home, que informa automáticamente una falla al soporte técnico, reduciendo así el tiempo de recuperación. Si la criticidad de los servicios ubicados en el servidor es lo suficientemente alta, vale la pena prestarle mucha atención a RAS.

Condiciones ambientales


Esto incluye parámetros de potencia (potencia y eficiencia de la fuente de alimentación), enfriamiento (la calidad del sistema de enfriamiento, la capacidad de trabajar a temperaturas elevadas, incluso sin pérdida de garantía), sensores de temperatura dentro de la carcasa, factor de forma (que también afecta el rendimiento y la eficiencia del enfriamiento - relevante a alta densidad). En presencia de componentes "activos" (CPU con alto TDP, GPU, etc.), no necesita perseguir el factor de forma pequeño sin la necesidad obvia de una ubicación de alta densidad, es mejor elegir algo de tamaño 2U o incluso más.

Compatibilidad


La presencia del servidor y los componentes en el HCL del fabricante correcto ayudará a evitar situaciones desagradables asociadas con el lanzamiento del software. Además, una solicitud de soporte para un proveedor de software puede convertirse en un ping-pong entre los proveedores de hardware y software, y puede rechazarse por completo si se inicia en hardware no compatible. En general, es mucho mejor obtener una solución de trabajo lista para usar que reempaquetar la imagen del hipervisor para colocar el controlador del controlador RAID allí (este ejemplo es una referencia a la compatibilidad de los controladores ESXi y Adaptec, que existe formalmente, pero requiere caricias preliminares). Por lo tanto, si la tarea y el software requieren compatibilidad con el hardware, este elemento requiere una cuidadosa selección de componentes (con servidores de grandes fabricantes, desde este punto de vista, todo es muy simple: están presentes en el HCL de casi todas las empresas de desarrollo de software, ya sea en componentes o en su conjunto).

Gestión


Casi todos los servidores están equipados con controladores remotos que proporcionan una interfaz compatible con IPMI y / o una consola web. Dependiendo del proveedor, los controladores pueden tener varias funciones, desde montar imágenes en una red, instalar automáticamente el sistema operativo y actualizaciones de firmware centralizadas hasta una gestión completa del ciclo de vida, lo que simplifica y acelera en gran medida la puesta en marcha de nuevos servidores y su mantenimiento adicional. El grado de atención a este elemento depende del tamaño de la flota de servidores y la necesidad de conveniencia del control remoto. Honestamente, siempre pongo en la configuración licencias opcionales para la funcionalidad de administración adicional (con la excepción de LCM sin indicar explícitamente la necesidad), ya que es muy conveniente y la facilidad de mantenimiento reduce considerablemente su tiempo.

Rendimiento


A primera vista, este es un punto extraño: después de todo, los servidores de diferentes proveedores usan los mismos procesadores, RAM, discos, etc. Sin embargo, si mide directamente el rendimiento de servidores de diferentes fabricantes en las mismas configuraciones, puede obtener resultados diferentes. En primer lugar, esto se debe (pero no se limita a) varias configuraciones y optimizaciones a nivel de firmware. Para comprender el nivel de rendimiento en relación con las ofertas competitivas, puede consultar los puntos de referencia del servidor (por ejemplo, VMmark de VMware).

Garantía y servicio


Muchos proveedores ofrecen paquetes de servicios que permiten identificar rápidamente la causa de una falla de hardware y eliminarla reemplazando los componentes. Los paquetes difieren en los períodos de garantía y servicio, así como en los tiempos de respuesta y recuperación. Además, la disponibilidad de repuestos en los almacenes de servicio después de eliminar un modelo particular de la producción varía. En el caso del autoensamblaje, debe conservar piezas de repuesto o confiar en el proveedor / ensamblador de equipos en materia de disponibilidad de piezas de repuesto en el almacén y la duración de su entrega.

Conclusión


Estos son los puntos principales a los que debe prestar atención al elegir un servidor. Espero que esto sea útil para alguien y ayude a evitar errores comunes. Si tiene preguntas adicionales, escriba los comentarios.

También puede suscribirse a nuestros canales ( YouTube , VK , Telegram ) para no perderse nuevos artículos, cursos y seminarios.

Source: https://habr.com/ru/post/es417601/


All Articles