Enam aturan untuk memilih pusat data

Memilih pusat data untuk proyek Anda masih menyebalkan. Menemukan pusat data terbaik untuk tugas Anda lebih mudah jika Anda tahu apa yang harus dicari ketika mencari. Dalam kasus platform gaming cloud Playkey, kualitas streaming langsung tergantung pada pusat data: keandalannya, kedekatannya dengan pengguna, kualitas jaringan, dan parameter lainnya. Karenanya, kami bekerja dengan pusat data setiap hari dan kami tahu masalah utama mereka.




Dalam publikasi ini, Playkey CTO Alexey Lykov akan memberi tahu Anda bagaimana memilih pusat data, apa yang harus diingat ketika mencari, mengapa mempelajari fitur pasokan daya dan bagaimana pusat data Eropa berbeda dari yang ada di Rusia. Kami melewati lantai ke Alexei.


1. Pelajari Standar Pusat Data Tier


Pertanyaan pertama ketika memilih pusat data adalah keandalan, atau waktu aktif. Sertifikasi paling populer untuk parameter ini adalah metodologi Uptime Institute, yang membagi semua pusat data menjadi empat peringkat (Tier). Ada sistem alternatif untuk menilai keandalan pusat data sesuai dengan standar TIA 942, tetapi tidak begitu menarik bagi kami karena sifatnya yang direkomendasikan. Dalam kasus sertifikat Uptime Institute, mereka sendiri memverifikasi DC pada beberapa tahap (dari merancang dokumentasi konstruksi hingga secara berkala mengevaluasi layanan operasional pusat) dan mengeluarkan penilaian berdasarkan hasil audit. Memperoleh sertifikat "palsu" untuk DC hampir tidak mungkin.


Berikut adalah deskripsi singkat dari masing-masing dari empat Tingkat:


  • Tingkat 1 . Infrastruktur rekayasa tanpa sumber daya redundansi dan redundan. Downtime per tahun adalah 28,8 jam. Rasio toleransi kesalahan adalah 99,671%.
  • Tingkat 2 . Sistem tidak memiliki redundansi penuh, tetapi dilengkapi dengan elemen pendingin dan catu daya tambahan. Downtime per tahun - 22,0 jam. Rasio Resiliensi - 99,749%.
  • Tingkat 3 . Pusat data memiliki beberapa saluran untuk distribusi daya dan pendinginan, serta komponen yang berlebihan. Waktu henti per tahun adalah 1,6 jam. Rasio toleransi kesalahan adalah 99,982%.
  • Tingkat 4 . Pusat data dengan redundansi ganda, dengan mempertimbangkan setidaknya komponen tambahan. Beberapa cara aktif distribusi dan pendinginan beban dengan komponen redundan 2 (N +1), yaitu 2 UPS masing-masing dengan redundansi N +1. Downtime pusat data level TIER IV selama setahun tidak melebihi 24 menit, dan rasio kegagalan adalah 99,995%.

Peta semua pusat data Lembaga Uptime yang disertifikasi ada di sini , tetapi lokasinya di Rusia. Hanya 26 buah, dan semuanya secara eksklusif di bagian negara Eropa:




Biru pada peta menandai satu-satunya pusat data Rusia yang disertifikasi menurut standar TIER IV maksimum, dan terletak bukan di Moskow, tetapi di Saransk. Begini tampilannya dari dalam:




Foto tersebut dengan jelas menunjukkan lantai yang dapat dilepas, yang disusun kira-kira seperti ini:




Sesuai dengan klasifikasi tingkat ketersediaan pusat data oleh Uptime Institute, TIER IV menyediakan reservasi penuh untuk semua sistem teknik dengan koefisien 2N + 1, yang memungkinkan pekerjaan perbaikan apa pun tanpa penangguhan layanan pusat data.


Inilah yang tampak seperti sistem catu daya dengan input listrik independen untuk pusat data Saransk:



Menurut data resmi , pusat data di Mordovia harus menjadi unit pusat untuk infrastruktur e-government, tetapi juga akan mengatasi tugas bank, perusahaan asuransi, dan bahkan militer.


Persyaratan dari berbagai Tier terkadang tampak sedikit membingungkan (misalnya, kebutuhan untuk memiliki tempat parkir yang terpisah untuk karyawan dan tamu DC), tetapi sebagian besar memadai. Dengan demikian, DC sesuai dengan standar Tier 3 diharuskan memiliki kepemilikan atas bangunan tersebut. Jelas bahwa jika pusat data dibangun di lokasi yang disewa, maka pemilik bangunan dapat datang dengan apa saja kapan saja, dan ia akan menaikkan harga atau memutus kontrak sama sekali, hukuman apa pun yang mungkin terjadi. Jika Anda melihat situs dengan sertifikat Tier 3 atau lebih tinggi, risiko ini dikecualikan. Untuk kami sendiri, kami memilih untuk bekerja dengan pusat data tidak lebih rendah dari Tingkat 2, dan pusat data Eropa kami di Jerman disertifikasi menurut tingkat Tier 3.


Ada kasus aneh ketika DC menyewa sebuah kamar di lantai tinggi, dan lift itu milik orang lain, dan karenanya, dimatikan untuk akhir pekan dan malam hari, dan bermasalah untuk memulai peralatan.


2. Tentukan parameter catu daya dan pendinginan pusat data


Jika Anda menggunakan konfigurasi server non-standar, maka item kedua dapat dengan aman setara dengan yang pertama. Kami selalu memperhatikan pasokan daya dan pendinginan server, karena kami menggunakan bukan server biasa, tetapi server GPU, yang tidak dirancang untuk sebagian besar pusat data.


Jika kami mengambil rak server standar di 42 unit, maka biasanya akan terlihat seperti ini (laptop tidak termasuk):



Biasanya, pemilik pusat data membawa daya 7-10 kilowatt ke rak seperti itu dan meletakkan pendingin yang sesuai. Ini cukup untuk desain dengan server tipikal yang mengkonsumsi sekitar 300-500 watt termasuk berbagai sistem penyimpanan, peralatan switching, panel patch dan sebagainya. Tetapi dalam kasus kami, hanya kartu video di server GPU "makan" dari 150 hingga 250 watt, dan hingga 8 kartu video ini digunakan pada satu perangkat. Akibatnya, total konsumsi server GPU adalah sekitar 2 kilowatt.


Karena itu, kita dapat menempatkan hanya 3-4 server dalam satu rak, mis. 6-8 unit, jika kita berbicara tentang 2 unit server. Alhasil, di rak server kami hanya bisa menempati 8 unit, dan 34 unit akan gratis. Ini menimbulkan pertanyaan tentang efisiensi ruang. Dan menaikkan harga sewa kami.


Kesimpulannya? Jika Anda memiliki permintaan peralatan yang tidak biasa, maka ada baiknya mencari pusat data yang dipertajam (setidaknya sebagian) untuk klien seperti Anda. Dalam kasus kami, untuk klien dengan server GPU, dengan pasokan daya yang besar ke rak dan pendinginan yang ditingkatkan. Sejauh ini, bagaimanapun, ada sangat sedikit klien seperti itu (dan pusat data).


3. Pilih lokasi berdasarkan lokasi pengguna Anda


Kedengarannya norak, tetapi perlu diingat bahwa lokasi R&D Anda atau kantor pusat tidak harus menjadi tempat untuk pusat data Anda. Terutama - di mana sebagian besar pengguna layanan berada. Di Playkey, kantor pengembangan terletak di Perm, dan pada awalnya kami juga bekerja dengan pusat data Perm lokal, yang menyederhanakan pengaturan dan memungkinkan untuk dengan cepat menyelesaikan masalah apa pun dengan pusat data. Tetapi ketika basis pengguna mulai tumbuh dengan cepat, dan bagian utamanya (dari mereka yang bermain di Rusia) masih berasal dari Moskow, kami memutuskan untuk mengelompokkan semua server di pusat juga.


Setelah ibukota pindah ke pusat data Moskow, kami segera melihat peningkatan dalam kualitas komunikasi dan umpan balik positif dari para pemain.


4. Cari kontak manajemen dan "uji" dukungan teknis sebelumnya


Dukungan teknis yang cepat dan manajemen yang memadai adalah titik kritis lain dalam pekerjaan pusat data. Cobalah untuk mengklarifikasi beberapa tugas khas dengan karyawan pusat data, misalnya, mengkonfigurasi sesuai dengan instruksi BIOS, dan melihat reaksinya. Jika Anda dikirim ke spesialis lain atau mulai melambat dengan jawaban - semua ini bukan pertanda terbaik. Ingatlah bahwa jika sesuatu yang serius terjadi pada server, maka tanpa kehadiran fisik masalah ini paling sering tidak terselesaikan. Dan dukungan teknis - "tangan" Anda jika ada masalah serius.


Mengenai manajemen pusat data, ingatlah bahwa tanpa kontak dengan "pengambil keputusan", koordinasi apa pun akan memakan waktu berhari-hari dan berminggu-minggu. Jika sampai menandatangani kontrak Anda tidak bertemu sampai orang terakhir yang benar-benar membuat keputusan di pusat data, lebih baik mencari platform alternatif untuk hosting server.



5. Periksa badan hukum pemilik pusat data


Poin terpendek, tapi tidak kalah pentingnya. Jangan terlalu malas untuk "menerobos" badan hukum di nalog.ru. Lihatlah ekstrak dari register - dan Anda akan mengerti berapa lama perusahaan telah ada, seberapa sering manajemen dan pemilik telah berubah. Dan dalam database kasus arbitrase, jangan lupa melihat kasus persidangannya.


6. Jika Anda bekerja dengan DC Eropa - harap bersabar


Mentalitas pusat data Eropa dan organisasi kerjanya sangat berbeda dari Rusia. Dalam pengalaman kami bekerja dengan pusat data Eropa, kami dapat mengatakan dengan pasti bahwa mereka melakukan semuanya lebih lambat. Jika di Rusia staf dukungan teknis dapat dengan cepat menyelesaikan hampir semua masalah dengan pengaturan server, maka di Eropa itu tidak begitu sederhana. Mereka selalu memiliki divisi internal karyawan menjadi mereka yang terlibat dalam tugas tingkat rendah dan tingkat tinggi. Mesin birokrasi memaksa pelanggan untuk membuktikan bahwa masalahnya benar-benar penting dan memerlukan intervensi segera dari spesialis "tingkat tinggi" dari pusat data. Bersiaplah untuk menjelaskan secara rinci alasan banding Anda, tunggu persetujuan "dengan atasan" dan baru kemudian berharap bantuan.


Ada perbedaan dalam pendekatan untuk bekerja. Misalnya, di Rusia, hampir semua permintaan ke pusat data dapat dikirim melalui obrolan atau surat dan segera menerima tanggapan. Ketika kami bekerja dengan karyawan pusat data di Jerman dan Inggris, kami terpaksa berkomunikasi hanya melalui telepon. Mengapa Hanya saja itu sangat biasa bagi mereka.


Nuansa seperti itu membuat orang Eropa bahkan lebih lambat. Layak untuk membuat diskon pada kenyataan bahwa kita sendiri berasal dari Rusia dan lebih mudah bagi kita untuk berinteraksi dengan dukungan berbahasa Rusia, tetapi bahkan tanpa memperhatikan hal ini, proses "milik kita", menurut saya, lebih baik dibangun dan bekerja lebih cepat.


Kami sekarang telah memulai persiapan untuk memasuki pasar AS, jadi bagi kami semua poin yang dijelaskan jauh dari ungkapan kosong. Dengan status tersebut, kami tidak akan berlokasi tiga jam dari pusat data, ditambah lagi akan ada perbedaan zona waktu yang layak. Jadi kita akan mendekati pilihan mitra jangka panjang dengan semua tanggung jawab. Nilai tambah untuk peluncuran cepat akan menjadi penyedia cloud, karena selama setahun terakhir dua layanan besar telah meluncurkan kemampuan untuk menyewa server dengan GPU.


Dan bagi mereka yang ingin memeriksa kualitas pusat data kami, kami telah menyiapkan kode promosi berikutnya PlaykeyGeekSummer selama 720 menit permainan. Ini berfungsi selama empat hari sejak saat aktivasi, hanya cocok untuk pengguna baru, dan jangan lupa untuk mengaktifkannya hingga 31 Juli 2017.

Source: https://habr.com/ru/post/id404939/


All Articles