Elegir un centro de datos para su proyecto sigue siendo difícil. Encontrar el mejor centro de datos para sus tareas es más fácil si sabe qué buscar al buscar. En el caso de la plataforma de juegos en la nube Playkey, la calidad de transmisión depende directamente del centro de datos: su confiabilidad, proximidad al usuario, calidad de red y otros parámetros. Por lo tanto, trabajamos con centros de datos todos los días y conocemos sus principales problemas principales.

En esta publicación, el CTO de Playkey, Alexey Lykov, le dirá cómo elegir un centro de datos, qué recordar al buscar, por qué profundizar en las características de las fuentes de alimentación y cómo los centros de datos europeos difieren de los rusos. Pasamos el piso a Alexei.
1. Aprenda el estándar de nivel de centro de datos
La primera pregunta al elegir un centro de datos es la confiabilidad o el tiempo de actividad. La certificación más popular para este parámetro es la metodología del Uptime Institute, que divide todos los centros de datos en cuatro rangos (Nivel). Existe un sistema alternativo para evaluar la confiabilidad de los centros de datos de acuerdo con el estándar TIA 942, pero no es tan interesante para nosotros debido a su naturaleza recomendatoria. En el caso del certificado del Uptime Institute, ellos mismos verifican los DC en varias etapas (desde el diseño de la documentación de construcción hasta la evaluación regular de los servicios operativos del centro) y emiten una evaluación basada en los resultados de la auditoría. Obtener un certificado "falso" para un DC es casi imposible.
Aquí hay una breve descripción de cada uno de los cuatro niveles:
- Nivel 1 Ingeniería de infraestructura sin redundancia y recursos redundantes. El tiempo de inactividad por año es de 28.8 horas. La relación de tolerancia a fallas es 99.671%.
- Nivel 2 El sistema no tiene redundancia total, pero está equipado con elementos adicionales de refrigeración y fuente de alimentación. Tiempo de inactividad por año: 22.0 horas. Ratio de resistencia - 99.749%.
- Tier 3 . El centro de datos tiene varios canales para distribución de energía y enfriamiento, así como componentes redundantes. El tiempo de inactividad por año es de 1.6 horas. La relación de tolerancia a fallas es 99.982%.
- Tier 4 . Centros de datos con doble redundancia, teniendo en cuenta al menos un componente adicional. Varias formas activas de distribución de carga y enfriamiento con componentes redundantes 2 (N + 1), es decir 2 UPS con redundancia N + 1 cada uno. El tiempo de inactividad del centro de datos de nivel TIER IV durante un año no supera los 24 minutos, y la relación de conmutación por error es del 99,995%.
Un mapa de todos los centros de datos certificados del Uptime Institute está aquí , pero su ubicación en Rusia. Solo 26 piezas, y todas ellas están exclusivamente en la parte europea del país:

El azul en el mapa marca el único centro de datos ruso certificado según el estándar máximo TIER IV, y no se encuentra en Moscú, sino en Saransk. Así es como se ve desde adentro:

La foto muestra claramente el piso elevado extraíble, que está dispuesto aproximadamente de esta manera:

De acuerdo con la clasificación del nivel de disponibilidad del centro de datos por Uptime Institute, TIER IV proporciona una reserva completa de todos los sistemas de ingeniería con un coeficiente de 2N + 1, lo que permite cualquier trabajo de reparación sin suspensión de los servicios del centro de datos.
Así es como se ve un sistema de suministro de energía con entradas de electricidad independientes para el centro de datos de Saransk:

Según datos oficiales , el centro de datos en Mordovia debería convertirse en la unidad central de la infraestructura del gobierno electrónico, pero también se encargará de las tareas de los bancos, las compañías de seguros e incluso los militares.
Los requisitos de varios niveles a veces parecen un poco confusos (por ejemplo, la necesidad de tener un estacionamiento separado para los empleados e invitados de DC), pero en su mayor parte son adecuados. Por lo tanto, los DC de acuerdo con el estándar de Nivel 3 deben tener la propiedad de las instalaciones. Está claro que si el centro de datos se construye en una ubicación alquilada, el propietario del edificio puede encontrar cualquier cosa en cualquier momento, y aumentará los precios o romperá el contrato por completo, independientemente de las sanciones. Si ve un sitio con un certificado de Nivel 3 o superior, se excluye este riesgo. Para nosotros, elegimos trabajar con un centro de datos no inferior al Nivel 2, y nuestro centro de datos europeo en Alemania está certificado de acuerdo con el nivel de Nivel 3.
Hubo un caso curioso cuando el DC alquiló una habitación en un piso alto, y el ascensor pertenecía a otras personas y, en consecuencia, estaba apagado durante el fin de semana y por la noche, y era problemático encender el equipo.
2. Especifique los parámetros de suministro de energía y enfriamiento del centro de datos.
Si utiliza una configuración de servidor no estándar, el segundo elemento se puede equiparar de forma segura con el primero. Siempre estamos especialmente atentos a la fuente de alimentación y la refrigeración de los servidores, porque utilizamos servidores GPU no comunes, para los que la mayoría de los centros de datos no están diseñados.
Si tomamos el bastidor del servidor estándar en 42 unidades, normalmente se verá así (portátil no incluido):

Por lo general, los propietarios de centros de datos aportan de 7 a 10 kilovatios de potencia a dicho rack y colocan el enfriamiento adecuado. Esto es suficiente para un diseño con servidores típicos que consumen aproximadamente 300-500 vatios incluyendo Varios sistemas de almacenamiento, equipos de conmutación, paneles de conexión, etc. Pero en nuestro caso, solo la tarjeta de video en el servidor GPU "come" de 150 a 250 vatios, y hasta 8 de estas tarjetas de video se usan en un dispositivo. Como resultado, el consumo total del servidor GPU es de aproximadamente 2 kilovatios.
Debido a esto, podemos poner solo 3-4 servidores en un rack, es decir 6-8 unidades, si estamos hablando de servidores de 2 unidades. Como resultado, en el bastidor del servidor podemos ocupar solo 8 unidades, y 34 unidades serán gratuitas. Esto plantea la cuestión de la eficiencia espacial. Y elevándonos los precios de alquiler.
La conclusión? Si tiene solicitudes inusuales de equipos, entonces vale la pena buscar un centro de datos que esté afilado (al menos parcialmente) para clientes como usted. En nuestro caso, para clientes con servidores GPU, con un gran suministro de energía a los bastidores y refrigeración mejorada. Hasta ahora, sin embargo, hay muy pocos clientes (y centros de datos).
3. Elija una ubicación por la ubicación de sus usuarios
Parece cursi, pero vale la pena recordar que la ubicación de su I + D o sede no tiene que ser un lugar para su centro de datos. Principalmente, donde se encuentra la mayor parte de los usuarios del servicio. En Playkey, la oficina de desarrollo se encuentra en Perm, y al principio también trabajamos con el centro de datos local de Perm, lo que simplificó la configuración y permitió resolver rápidamente cualquier problema con el centro de datos. Pero cuando la base de usuarios comenzó a crecer rápidamente, y su parte principal (de los que juegan en Rusia) todavía provenía de Moscú, decidimos agrupar todos los servidores en el centro también.
Después del traslado de la capital al centro de datos de Moscú, de inmediato vimos una mejora en la calidad de la comunicación y una respuesta positiva de los jugadores.
4. Busque contactos de administración y "pruebe" el soporte técnico por adelantado
El soporte técnico rápido y la gestión adecuada es otro punto crítico en el trabajo del centro de datos. Intente aclarar alguna tarea típica con los empleados del centro de datos, por ejemplo, configure de acuerdo con las instrucciones del BIOS y observe la reacción. Si lo envían a otro especialista o comienza a disminuir la velocidad con una respuesta, todos estos no son los mejores signos. Recuerde que si algo grave le sucede al servidor, entonces, sin una presencia física, el problema a menudo no se resuelve. Y soporte técnico: sus "manos" en caso de problemas serios.
En cuanto a la gestión del centro de datos, recuerde que sin el contacto del "tomador de decisiones", cualquier coordinación llevará largos días y semanas. Si hasta la firma del contrato no cumple hasta la última persona que realmente toma decisiones en el centro de datos, es mejor buscar una plataforma alternativa para servidores de alojamiento.

5. Verifique la entidad legal del propietario del centro de datos
El punto más corto, pero no menos importante. No seas demasiado vago para "romper" la entidad legal en nalog.ru. Mire el extracto del registro y comprenderá cuánto tiempo ha existido la empresa, con qué frecuencia han cambiado la administración y los propietarios. Y en la base de datos de casos de arbitraje, no olvide ver sus casos judiciales.
6. Si está trabajando con un DC europeo, tenga paciencia
La mentalidad de los centros de datos europeos y su organización del trabajo son muy diferentes a las de Rusia. En nuestra experiencia trabajando con centros de datos europeos, podemos decir con certeza que están haciendo todo más lento. Si en Rusia el personal de soporte técnico puede resolver rápidamente casi cualquier problema con la configuración del servidor, entonces en Europa no es tan simple. Siempre tienen una división interna de empleados en aquellos involucrados en tareas de bajo y alto nivel. La máquina burocrática obliga a los clientes a demostrar que el problema es realmente importante y requiere la intervención inmediata de un especialista de "alto nivel" del centro de datos. Prepárese para describir en detalle el motivo de su apelación, espere la aprobación "con los mejores" y solo entonces espere ayuda.
Hay diferencias en el enfoque del trabajo. Por ejemplo, en Rusia, casi todas las solicitudes al centro de datos se pueden enviar por chat o carta y recibir una respuesta de inmediato. Cuando trabajamos con empleados de centros de datos en Alemania y el Reino Unido, nos vemos obligados a comunicarnos solo por teléfono. Por qué Es solo que lo han tomado así
Tales matices hacen que los europeos sean aún más lentos. Vale la pena hacer un descuento en el hecho de que nosotros mismos somos de Rusia y es más fácil para nosotros interactuar con el apoyo de habla rusa, pero incluso sin tener en cuenta esto, los procesos "nuestros", en mi opinión, están mejor organizados y el trabajo es más rápido.
Ahora hemos comenzado los preparativos para ingresar al mercado estadounidense, por lo que para nosotros todos los puntos descritos están lejos de ser una frase vacía. Con los estados, no estaremos ubicados a tres horas del centro de datos, además habrá una diferencia decente en las zonas horarias. Por lo tanto, abordaremos la elección de un socio a largo plazo con toda la responsabilidad. Una ventaja para un lanzamiento rápido será un proveedor de la nube, ya que durante el año pasado dos grandes servicios ya lanzaron la capacidad de alquilar servidores con una GPU.
Y para aquellos que quieran verificar la calidad de nuestros centros de datos, hemos preparado el próximo código promocional PlaykeyGeekSummer para 720 minutos del juego. Funciona durante cuatro días desde el momento de la activación, es adecuado solo para nuevos usuarios y no olvide activarlo hasta el 31 de julio de 2017.