Cara memeriksa keandalan pusat data: 3 poin utama yang perlu Anda perhatikan

Memilih penyedia IaaS, perusahaan fokus pada karakteristik cloud. Mereka mengevaluasi ketersediaan, skalabilitas, dll. Namun, perangkat keras yang dipasang di pusat data bertanggung jawab atas kinerja lingkungan tervirtualisasi apa pun. Untuk sebagian besar, keandalan layanan cloud tergantung pada infrastruktur ini (dan tempat di mana ia berada).

Hari ini kami memutuskan untuk memberi tahu Anda poin apa yang harus Anda perhatikan ketika mengevaluasi parameter dari pusat data penyedia IaaS.


/ foto Arthur Caranta CC

Tingkat Keandalan dan Redundansi


Pertama-tama, ketika mengevaluasi pusat data penyedia IaaS, Anda harus memperhatikan redundansi infrastruktur teknik, khususnya, sistem catu daya. Karena parameter khusus ini memengaruhi tingkat ketersediaan, yaitu, waktu operasi berkelanjutan tanpa kegagalan.

Klasifikasi Uptime Institute dapat digunakan untuk mengevaluasi tingkat redundansi.

  • Tingkat 1 - dalam hal ini tidak ada skema redundansi (N). Keandalan tergantung pada setiap elemen individu dari infrastruktur, dan kegagalan dalam satu peralatan menyebabkan downtime seluruh pusat data.
  • Tingkat 2 - menyiratkan skema redundansi N +1. Satu elemen tambahan ditambahkan ke elemen infrastruktur N, mengurangi risiko kegagalan.
  • Tingkat 3 - skema redundansi juga N +1, tetapi dengan kemungkinan kerja teknis paralel.
  • Reservasi Tier 4 - 2N. Ketika setiap elemen digandakan dengan cara yang sama.

Klasifikasi Tier mengasumsikan bahwa sistem teknik dianggap sebagai entitas tunggal. Jika setidaknya salah satu komponen tidak dicadangkan, toleransi kesalahan UI berkurang. Semakin tinggi Tier, semakin tinggi ketersediaannya. Namun, Anda harus memahami bahwa dalam klasifikasi UI tidak ada yang "terburuk dan terbaik". Ini bukan untuk mengatakan bahwa dalam semua situasi satu Tingkat akan dilakukan. Oleh karena itu, memilih penyedia dengan pusat data yang memiliki tingkat redundansi satu atau lain harus didasarkan pada tugas yang dihadapi perusahaan.

Untuk organisasi besar, downtime yang tidak diinginkan, masuk akal untuk memperhatikan pusat data dengan redundansi 2N. Misalnya, jalur ini menuju ke Facebook. Pusat data perusahaan, yang terletak di kota Lulea Swedia, memiliki reservasi 2N. Sistem energi pusat data Sberbank di Skolkovo juga dilindungi undang-undang .

Namun, dalam beberapa kasus, sistem seperti itu mungkin berlebihan. Karena semakin tinggi Tier, semakin mahal biayanya untuk menyewa peralatan penyedia cloud. Oleh karena itu, perusahaan yang infrastruktur dan layanan TI sederhananya tidak kritis selama satu jam setahun harus memilih pusat data dengan Tier yang lebih kecil.

Misalnya, penyedia IaaS IT-GRAD menempatkan peralatan di pusat data DataSpace (Moskow) dan Xelent (St. Petersburg). Ini adalah pusat data dengan kelas Tier III, waktu henti sekitar satu setengah jam per tahun. Mereka membuat reservasi sesuai dengan skema N +1. Misalnya, di situs Moskow, dua gardu kota di sepanjang enam jalur independen menyediakan catu daya berkelanjutan. Enam transformer independen dari 2 MVA dipasang di pusat data, yang masing-masingnya merupakan titik pemasangan sirkuit listrik independen.

Dalam kasus force majeure dan voltase turun, kemungkinan penutupan satu cabang catu daya tidak memengaruhi operasi sistem secara keseluruhan, karena semua beban dipindahkan ke cabang cadangan. Sebagai "rencana cadangan" ada generator diesel otomatis dengan 6 tangki bahan bakar masing-masing 950 liter. Ketika terisi penuh, cadangan cadangan akan menyediakan pusat data dengan 84 jam operasi berkelanjutan.

Iklim mikro


Aspek penting berikutnya adalah penilaian kinerja "unit pendingin" dari pusat data. Kemampuan sistem pendingin untuk mempertahankan iklim mikro yang optimal di ruang mesin memengaruhi keandalan "besi", jumlah listrik yang dikonsumsi, dan, oleh karena itu, label harga untuk layanan yang disediakan untuk penempatan peralatan.

Misalnya, ketika suhu naik di pusat data dari 22 ° C. hingga 35 ° C, konsumsi daya server meningkat rata-rata 20%. Dan sebagai perwakilan dari Perkumpulan Insinyur ASHRAE , yang sedang mengembangkan standar komunikasi dan penilaian kualitas udara, tulislah, suhu di bawah 18 ° C dan di atas 27 ° C dapat secara signifikan mengurangi daya output dan daya tahan baterai dari sistem daya yang tidak dapat terputus ( halaman 29 laporan ).

Namun, Anda juga perlu mempertimbangkan bagaimana suhu yang diperlukan dipertahankan di pusat data. Karena jika efisiensi sistem pendingin rendah, ia akan mengkonsumsi sejumlah besar listrik. Dalam beberapa kasus, hingga 40% dari semua konsumsi energi pusat data dihabiskan untuk AC. Ini, pada gilirannya, mempengaruhi tagihan penyewaan peralatan.

Oleh karena itu, sering untuk mengontrol iklim mikro dan suhu udara di pusat data menggunakan teknologi "pendinginan gratis" (atau pendinginan-bebas). Ini memungkinkan Anda mengurangi konsumsi daya. Menurut data terbaru, pusat data Xelent memiliki indikator efisiensi energi terbaik untuk pusat data ( PUE ) di pasar Rusia - jumlahnya mencapai 1,29. Pusat data Google dianggap sebagai pemegang rekor di bidang ini - raksasa IT telah berhasil mencapai nilai PUE sebesar 1,11.

Di pusat data Xelent, rezim suhu untuk semua peralatan TI dipertahankan sesuai dengan rekomendasi ASHRAE. Penukar panas putar bertanggung jawab atas iklim mikro di pusat data. Ini adalah roda lima meter besar yang menyediakan transfer panas dari ruang mesin dari pusat data ke jalan tanpa ada konveksi udara.

Penting juga untuk mempertimbangkan bagaimana di pusat data tingkat kelembaban yang diberikan. Kondensasi dapat merusak perangkat keras server dan menyebabkan kerusakan padanya. Seperti yang terjadi dengan pusat data Facebook pertama di Primeville, di mana kesalahan dalam pengoperasian sistem iklim mikro menyebabkan cairan masuk ke peralatan. Di ruang server, "hujan kondensat" secara harfiah mulai turun hujan. Peralatan harus segera diputus. ASHRAE mencatat bahwa tingkat kelembaban di pusat data tidak boleh melebihi 60%. Dalam hal Facebook, angka ini mencapai 95%.


/ foto Tim Dorr CC

Keamanan fisik


Saat ini ada pusat data yang terletak di bunker bawah tanah, pintu masuk yang dijaga oleh tentara bersenjata. Ada pusat data yang dilindungi dari ledakan nuklir atau EMP. Namun, paling sering digunakan oleh perusahaan multinasional atau struktur militer terbesar. Bagi sebagian besar organisasi, tindakan seperti itu berlebihan dan tidak menguntungkan secara ekonomi. Namun, masalah keamanan dan penetrasi fisik tetap relevan untuk semua orang.

Ada tiga poin yang perlu diperhitungkan : kontrol akses, keberadaan kamera video dan sensor sinyal di sepanjang perimeter, dan keamanan "sel" dengan rak server. Mungkin cara terbaik untuk memeriksa masing-masing adalah perjalanan ke pusat data. Jadi, Anda dapat secara independen mengevaluasi seberapa sulit untuk masuk ke ruang mesin pusat data.

Misalnya, pusat data Xelent di pintu masuk memiliki sistem kontrol akses. Semua pengunjung dan mobil diperiksa di pos pemeriksaan. Juga, setiap orang yang memasuki wilayah pusat data (termasuk karyawan) wajib mendaftar. Dua ratus kamera video yang memantau situasi di ruang server "tersebar" di wilayah itu sendiri. Akses ke ruang mesin hanya mungkin jika disertai oleh karyawan pusat data yang memiliki kartu akses khusus (ini dapat berupa kartu kunci atau kartu biometrik).

Saat memeriksa perlindungan fisik ruang mesin, evaluasi tidak hanya perimeter dan keamanan server, tetapi juga keselamatan kebakaran di fasilitas. Misalnya, pusat data DataSpace menggunakan sistem deteksi kebakaran dini. Sensor di seluruh gedung mengevaluasi sampel udara untuk membantu mencegah kebakaran. Pusat data menggunakan peralatan yang aman, sistem pemadam kebakaran gas, yang dalam keadaan darurat memungkinkan meminimalkan jumlah kemungkinan kerusakan.

Untuk meringkas


Saat mengevaluasi keandalan penyedia cloud pusat data, hal-hal berikut harus dilakukan:

  • Perhatikan redundansi infrastruktur teknik. Tingkat ketersediaan tergantung padanya. Pilih skema cadangan yang diperlukan tergantung pada persyaratan dan tugas perusahaan.
  • Mengevaluasi sistem pendingin dan kontrol iklim di ruang mesin. Baik jika pusat data menggunakan teknologi yang bertujuan mengurangi PUE. Jadi, pusat data menghabiskan lebih banyak listrik untuk komputasi, bukan pada server pendingin, yang menghemat uang pelanggan.
  • Di dalam pusat data, perlindungan fisik ruang server (keamanan, sistem pemadam kebakaran, pengawasan video) harus diatur, dan prosedur ketat untuk menerima pengunjung ke wilayah tersebut harus ditentukan.

Namun, keamanan dan keandalan pusat data ditentukan tidak hanya oleh langkah-langkah keamanan fisik, tetapi juga oleh perangkat lunak: firewall, mekanisme perlindungan DDoS, enkripsi data, dll. Kami akan membahas aspek-aspek ini dalam artikel kami berikutnya.



NB Beberapa materi lagi dari Blog Pertamaa IaaS Pertama:


PPS Posting baru dari blog kami di Habré:




Aktivitas utama perusahaan IT-GRAD adalah penyediaan layanan cloud:

Infrastruktur Virtual (IaaS) | Hosting PCI DSS | Cloud FZ-152 | Sewa 1C di awan


Source: https://habr.com/ru/post/id416507/


All Articles