Kami melanjutkan artikel, yang tujuannya adalah untuk berbagi pengalaman dan menunjukkan fitur utama dan kesalahan umum yang terjadi selama desain dan organisasi subsistem catu daya infrastruktur TI dan pusat data secara keseluruhan. Tetapi saya ingin sedikit memperluas audiens dan mencurahkan beberapa bagian pada elemen dasar untuk memastikan keselamatan listrik dan melindungi peralatan dan manusia.
Mereka yang melewatkan bagian pertama atau ingin mengingat bagian pertama
dapat pergi ke sini .
Bagi mereka yang mengerti apa yang otomat dan RCD, mengapa mereka diperlukan, apa yang mereka lindungi dan mengapa, pergi ke bagian
Apakah RCD diperlukan untuk peralatan IT, server, pusat data? .
Bagian dua
Mari kita lihat apa hubungan antara energi dan peralatan akhir IT, kita akan memahami pertanyaan, dalam hal pemadaman listrik, sistem operasi harus dijamin bekerja tanpa kegagalan.
Masalah Switching SiagaSuplai daya peralatan informasi diatur dengan redundansi. Pertimbangkan organisasi catu daya di bagian -- (papan catu daya tak terputus-unit distribusi daya-catu daya). Jenis reservasi adalah dari jenis berikut:
- Redundansi kabel ke rak, peralatan, menggunakan unit distribusi daya yang terpisah, PDU (Gambar 1)
- Redundansi bus daya di panel catu daya, menggunakan unit distribusi daya terpisah, PDU (Gambar 2)
Redundansi pada tingkat pasokan daya langsung di server, switch, perangkat IT (Gbr. 3)
Redundansi menggunakan sakelar beban yang dipasang di rak, ABP yang dipasang di rak (SPN, alias ATS) (Gbr. 4)

Untuk beralih antara input primer dan cadangan, Anda dapat menggunakan:
- di bidang sistem informasi: kabinet ABP / STS (Static Transfer Swith) untuk sistem berdaya tinggi, untuk beralih ke daya dari UPS cadangan pada saat pengoperasian sistem 2N yang lengkap atau kombinasi sistem N +1;
- di bidang sistem catu daya berbagai jenis skema ABP (pada kontaktor, pada pengontrol);
- di tingkat rak server: otomatis pemasangan berkecepatan tinggi ABP \ ATS (Automatic Transfer Swith);
- di tingkat peralatan informasi spesifik: catu daya duplikat.
Seperti yang kami
kutip di atas untuk peralatan IT, "gangguan pasokan listrik tidak dapat diterima." Dan apa yang tersembunyi di bawah frasa ini? Apa itu "istirahat" dalam kekuatan peralatan informasi? Sekarang mari kita lihat contoh hidup.
Pelanggan mengimplementasikan ruang server lokal bersama dengan infrastruktur TI dua lantai untuk kantor perusahaan. Pada tahap diskusi tentang sistem catu daya, ia ingin menempatkan semua peralatan informasi dengan satu unit catu daya (PSU), dan membiarkan slot kedua untuk server PSU gratis, dan memasang ATS rack-mount tunggal di seluruh rak. (Gbr. 4, diagram).
Tampilan belakang server dengan catu daya ganda
Bagaimana pelanggan mengemukakan keinginannya :
- Penghematan Biaya ($ 500-800 per perangkat rak)
- Anda dapat menempatkan dua PDU paling sederhana dan menerapkannya untuk distribusi daya setelah ATS
- Tingkat keandalan sistem sama sekali dibandingkan dengan metode distribusi klasik
Kami mengambil jeda waktu, memeriksa secara rinci keinginan Pelanggan dari berbagai sudut pandang, keandalan layanan secara umum, dalam masa garansi dan pasca-garansi, serta:
- biaya (penghematan) dari biaya modal selama implementasi (CAPEX)
- biaya penyusutan, perawatan suku cadang, biaya tenaga kerja klien ( OPEX )
- membandingkan algoritme operasi dan waktu pengalihan ke jalur pencadangan di kedua kasus, memeriksa โtitik kegagalan tunggalโ
- tingkat risiko pembekuan dan / atau reboot sistem operasi peralatan informasi, jatuhnya layanan informasi yang berjalan pada mereka.
Dan inilah yang ternyata:Menurut kerangka peraturan
GOST 32144-2013 (Energi listrik. Kompatibilitas elektromagnetik dari peralatan teknis. Standar kualitas listrik dalam jaringan tujuan umum. Tanggal pengantar - 1 Juli 2014), penyebab utama kerusakan peralatan informasi dapat berupa penurunan tegangan, yang
biasanya terjadi karena kegagalan fungsi di jaringan listrik atau di instalasi listrik konsumen, serta saat menghubungkan beban yang kuat
Baca terus:
durasi penurunan tegangan bisa sampai 1 menit
Frasa ini memberi tahu kita bahwa peralatan informasi harus disediakan oleh UPS dan / atau ATS kecepatan tinggi, karena penurunan tegangan pada durasi ini dapat diterima dan normal dari sudut pandang energi besar, tetapi akan berakibat fatal bagi peralatan dan layanan TI.
Ngomong-ngomong, perlu dicatat bahwa saat ini ada kontradiksi dalam kerangka peraturan saat ini dari Federasi Rusia dalam hal mengukur nilai-nilai yang berkaitan dengan kualitas listrik, rincian lebih lanjut dapat ditemukan
dalam artikel oleh Victor Cherdak, direktur teknis perusahaan kami, (sumber
digitalsubstation.com )
Beberapa kutipan dari artikel tersebutDalam beberapa tahun terakhir, standar negara di bidang pengukuran parameter energi listrik yang terkait dengan CE telah dikembangkan secara aktif dan telah berulang kali direvisi.

"
Perubahan penting adalah penggantian GOST 13109-97 โEnergi listrik. Kompatibilitas elektromagnetik. Standar kualitas untuk energi listrik dalam sistem catu daya tujuan umum โ[16] sesuai dengan GOST 32144-2013. Standar-standar ini menentukan kisaran indikator kualitas daya yang berbeda.
Tapi seberapa cepat? Bagaimana menentukan waktu dalam milidetik dimana layanan pelanggan (dan server) tidak akan jatuh dan sistem operasi tidak akan masuk ke "kesalahan kritis"?

Ada standar CBEMA (Asosiasi Produsen Komputer dan Peralatan Bisnis), yang, setelah beberapa penyesuaian, sekarang dikenal sebagai "Kurva ITIC" (Dewan Industri Teknologi Informasi), dan variannya dimasukkan dalam standar IEEE 446 ANSI. Menurut standar-standar ini, sirkuit elektronik catu daya harus tetap beroperasi selama 20 ms (atau 0,02 detik, yaitu periode).
Kurva ITIC yang samaMenurut persyaratan untuk catu daya untuk server dan sistem komputer
Server System Infrastructure, kita dapat mengatakan bahwa parameter unit catu daya
Tvout_holdup selama kegagalan tegangan memastikan pengoperasian peralatan informasi setidaknya selama 21 ms. Yaitu, periode penuh jaringan adalah waktu operasi normal yang dijamin dari server atau sakelar. Parameter
Tpwok_holdup didefinisikan setidaknya selama 20
ms .
beberapa perincian tentang parameter SSI dapat ditemukan di siniBantuan: Waktu penahanan adalah periode waktu di mana catu daya dapat mempertahankan voltase output dalam batas-batas tertentu setelah voltase hilang pada inputnya. Di sebagian besar catu daya komputer, waktu Penahanan juga mencirikan berapa lama sinyal daya baik (PWR_OK) memberi tahu sistem bahwa voltase yang dihasilkan oleh catu daya tidak stabil (untuk catu daya komputer parameter ini biasanya lebih dari 16 ms).

Ini adalah salah satu tabel dari dokumen

Dan ini adalah diagram garis waktu dengan algoritma operasi BP yang diatur.
Sekarang mari kita lihat apa yang dinyatakan oleh APC waktu perpindahan, untuk sakelar pemuatan rak dari merek
AP7721 . Kita melihat bahwa di sini kita biasanya memiliki 8-12 ms, tetapi 18 ms adalah waktu switching maksimum.
Kita dapat menyimpulkan bahwa waktu untuk beralih ke input cadangan untuk sakelar beban rak sesuai dengan spesifikasi unit catu daya peralatan server. Ternyata tidak akan ada kegagalan dalam pengoperasian peralatan informasi.
Tabel ringkasan pengaturan waktu elemen sistem Dan bagaimana dengan komponen ekonomi dan opsi mana yang lebih menguntungkan dan toleran terhadap kesalahan?
Misalkan kita memiliki tiga server kecil di rak, di mana Anda dapat menempatkan dua catu daya dan tiga perangkat dengan catu daya yang berlebihan. Semuanya penting dan kegagalan salah satu perangkat akan menyebabkan kegagalan seluruh sistem pelanggan secara keseluruhan. Bagaimanapun, kita membutuhkan sakelar beban yang terpasang di rak. Ini sekitar 18 ribu rubel.
Pelanggan menyatakan bahwa mereka tidak membutuhkan PDU (PDU), yang berarti bahwa anggaran hanya akan dikenakan biaya ATS - 18 ribu rubel yang sama. Sebagai pengganti Power Distribution Units (PDUs), Pelanggan menyarankan untuk menggunakan distribusi daya "di papan" dari sakelar beban pemasangan di rak. Pelanggan juga berencana untuk membeli server dengan dua slot untuk catu daya, tetapi dalam konfigurasi dengan satu PSU demi ekonomi.
(gambar 4)Versi klasik
(Gambar 3) melibatkan satu set 2 PDU - sekitar 32.000 rubel, 3 catu daya tambahan per server seharga $ 500 masing-masing untuk total 84 ribu rubel. ATS untuk 18 ribu rubel yang sama. Menyatukan semuanya, kami memahami bahwa solusi klasik akan menelan biaya pelanggan
sekitar 134 ribu rubel.Tampaknya benar, pelanggan benar, uangnya sangat berbeda. Tapi mari kita lihat dari sudut pandang toleransi kesalahan dan kemudahan servis dari kedua opsi:
Opsi Pelanggan: Satu-satunya titik kegagalan - sakelar beban pemasangan di rak. Jika sesuatu terjadi padanya, maka kita kehilangan seluruh rak. Jadi, Anda perlu memiliki suku cadang tepat di situs, yang menambah perkiraan 18.000 rubel. Catu daya di server adalah satu per satu, mereka juga merupakan titik kegagalan. Jadi, diinginkan untuk memiliki setidaknya satu, dan lebih disukai ketiga catu daya cadangan di situs. Mari kita asumsikan bahwa kita membutuhkan tiga unit catu daya di suku cadang, yang merupakan tambahan 36 ribu rubel. Anda perlu memeriksa daya yang ATS rack-mount bisa aktifkan. Sekarang kita lanjutkan dari fakta bahwa 3 kW atau 16A sudah cukup untuk semua peralatan rak. Jika kita membutuhkan ATS untuk 32A (7 kW), maka itu akan jauh lebih mahal (lebih dari 100 ribu rubel). Artinya, anggaran opsi Pelanggan, dengan pertimbangan keandalan yang terperinci,
tumbuh hingga 160 ribu rubel . Dalam hal ini, dalam keadaan darurat, terlepas dari kenyataan bahwa suku cadang akan berada di lokasi, down-time akan diperlukan untuk mengganti perangkat.
Single Point Of Failure (SPOF) - node, jalur komunikasi atau objek dari sistem ketersediaan data, kegagalan yang dapat merusak seluruh sistem, atau menyebabkan data tidak dapat diakses
Opsi Teknologi Terbuka : Seperti yang
ditunjukkan pada Gambar 3 , tetapi jika perlu ATS ditambahkan untuk peralatan jaringan kecil dengan catu daya tunggal.
Titik kegagalan adalah ATS yang sama. Jika sesuatu terjadi padanya, maka kita kehilangan seluruh rak. Kami setuju bahwa Anda perlu memiliki suku cadang tepat di situs. Tetapi dalam kasus kami, jika hanya ATS gagal, maka ini hanya dapat mempengaruhi pengoperasian sakelar dan peralatan bantu. Server sendiri akan terus bekerja dengan tenang. Pasokan listrik di suku cadang tidak diperlukan. Karena, jika salah satu catu daya yang digandakan gagal, server akan terus bekerja pada yang tersisa, dan kemungkinan besar akan menunggu catu daya baru dari vendor, terlepas dari keterpencilan situs.
Interpretasi dari istilah SPOF untuk sistem TISingle Point Of Failure (SPOF) - node, perangkat, atau titik sirkuit, kegagalan yang dapat menonaktifkan seluruh sistem, menyebabkan tidak tersedianya data dan layanan. Dipertimbangkan dalam pengembangan dan desain sistem kritis. Tidak adanya titik kegagalan tunggal menyebabkan peningkatan signifikan dalam biaya modal selama implementasi, sehingga kekritisan sistem atau layanan tertentu ditentukan pada tahap desain berdasarkan anggaran proyek, serta keinginan dan persyaratan Pelanggan. Kami selalu menemukan solusi ideal untuk setiap pelanggan, mengidentifikasi beberapa opsi untuk mengimplementasikan proyek, dan menawarkannya kepada pelanggan. Akibatnya, pada tahap pengiriman proyek, pelanggan menerima solusi tepat yang dia ingin lihat dalam hal harga / kualitas / keandalan.
Dengan demikian, dimungkinkan, tetapi tidak rasional, untuk menghubungkan semua peralatan rak ke ATS tunggal, karena dalam hal ini kita mendapatkan satu titik kegagalan daya. Membeli server dengan catu daya duplikat lebih disukai dalam hal apa pun, karena toleransi kesalahan pada tingkat peralatan informasi meningkat secara signifikan.
Sakelar pemuatan rack-mount memastikan peralihan yang benar dan hampir seketika ke input cadangan, peralatan informasi bahkan tidak akan merasakannya, produk perangkat lunak dan sistem operasi akan terus bekerja dengan benar. Bagaimanapun, unit distribusi daya yang dipasang di rak diperlukan dan tidak perlu dihemat. Penghematan yang jelas dalam biaya modal untuk distribusi daya dapat mengakibatkan masalah operasional yang tidak dapat diselesaikan, misalnya, kebutuhan untuk "memadamkan" seluruh rak hanya untuk memindahkan ATS ke unit lain atau untuk mengaudit sakelar beban rak.
Dalam kasus apa pun, untuk catu daya duplikat harus ada suku cadang, tetapi itu tidak selalu mungkin atau tersedia.Penampilan catu daya server yang dapat dilepas:

Penggunaan rack-mount ABP memiliki karakteristiknya sendiriSebagai contoh, kekuatan ATS seperti itu terbatas, dan itu dapat diubah dengan seperangkat beban yang relatif lemah dalam hal konsumsi daya. Ada pertanyaan tentang jumlah konektor daya output. Misalnya, ATS AP7721 tersebut dilengkapi dengan konektor input tipe C14, yang berarti daya switching maksimum 2,5 kW. Untuk daya muat yang lebih besar, ada model 2U
AP7724 , yang dilengkapi dengan konektor 32 A pada input, yaitu daya maksimum peralatan dapat mencapai 7 kW. Ini berarti bahwa rak peralatan khas dapat sepenuhnya terhubung ke ATS ini. Namun, harga keputusan seperti itu akan lebih dari 100 ribu rubel.
Pekerjaan peralatan informasi dengan dua catu daya dijelaskan dengan baik dalam sebuah
artikel oleh Vadim Sinitsky @dimskiy . Seperti yang Anda lihat, ada kelebihan dan kekurangan. Dan ketersediaan catu daya redundan untuk peralatan informasi dalam hal apa pun diperlukan, terutama jika objek berada di luar zona pasokan cepat catu daya dari vendor. Selain itu, kami ingin mencatat bahwa kalkulator online untuk menghitung kekuatan server baru dari vendor hanya dapat digunakan sebagai panduan untuk administrator sistem, personel pelanggan.
Kemungkinan nyata menghubungkan server kuat baru ke rak yang ada harus dievaluasi dengan mempertimbangkan proyek awal catu daya, keadaan saat ini dan beban rak, server, UPS, generator ... Dari sudut pandang koneksi di rak, ada baiknya juga mempertimbangkan:
- kemampuan PDU saat ini, seperti slot gratis di dalamnya
- peringkat mesin di perisai dan penampang dan fase garis kabel ke rak.
Keandalan sistem catu daya server perlu mendapat perhatian khusus, jika dibangun sesuai dengan sistem yang ditunjukkan pada
Gambar. 2 (dengan dua sistem bus), kehadiran server yang kuat baru dapat menyebabkan kelebihan seluruh sistem catu daya jika terjadi perbaikan dan mengurangi masa pakai baterai
UPS pada baterai. , buat saklar UPS untuk mem-bypass karena kelebihan beban dan banyak lagi ...
Dan bagaimana Anda membangun sistem distribusi rak?
Apa sumber daya BP untuk peralatan TI dan algoritme untuk redundansi perangkat lunak mereka?
PDU mana yang Anda lebih suka gunakan: dasar, dipantau? Seberapa bermanfaat fungsi PDU / PDU dalam praktik, dan apakah ini pernah membantu Anda?Penulis: Oleg Kulikov
Insinyur Desain Utama
Departemen Solusi Integrasi
"Teknologi Terbuka"
okulikov@ot.ru
Pendaftaran dalam Daftar Spesialis Nasional "NOPRIZ" P-045870