Semuanya terkendali. Mengapa kita membutuhkan sistem pemantauan untuk infrastruktur rekayasa pusat data

Habr, halo!

Saya seorang insinyur terkemuka di LANIT-Integration . Saya telah bekerja di sini selama lebih dari 20 tahun. Selama tujuh tahun terakhir, saya telah terlibat dalam dukungan rekayasa pusat data: Saya memasang dan meluncurkan peralatan.

Setiap tahun semakin banyak persyaratan untuk keandalan dan kegunaan pusat data. Namun, ini tidak dapat dicapai jika kita hanya fokus pada cadangan sistem dan kualitas elemen individual. Pasar memahami ide sederhana ini, sehingga perusahaan semakin memperkenalkan sistem pemantauan terpadu. Singkatnya, ini memonitor infrastruktur rekayasa pusat data dan membantu menghindari situasi darurat.

Dalam artikel ini, saya akan berbicara tentang solusi pemantauan perangkat keras dan perangkat lunak siap pakai yang kami dan kolega saya gunakan dalam proyek.

Sumber

Untuk memulai, saya akan berbicara tentang apa inti dari pusat data. Ini dibagi menjadi tiga komponen.

  • Sistem telekomunikasi menerima dan mentransmisikan data antara pusat data dan penggunanya, dan juga menghubungkan elemen-elemen pusat.
  • Arsitektur teknis adalah akses server, server aplikasi, server DBMS, sistem penyimpanan data. Dia bertanggung jawab atas berfungsinya aplikasi bisnis dan memungkinkan pengguna untuk mengaksesnya.
  • Infrastruktur rekayasa memastikan bahwa semua sistem bekerja dengan baik, yaitu mendukung kondisi yang optimal bagi mereka.

Infrastruktur rekayasa pusat data juga dibagi menjadi dua subsistem: fungsi dan keamanan. Yang pertama meliputi sistem catu daya umum, terjamin dan tidak terganggu, pengkondisian teknologi, pemasangan konstruksi. Subsistem keamanan meliputi sistem alarm kebakaran, sistem pemadam kebakaran gas otonom, pengawasan video, kontrol akses, dan manajemen.

Untuk memastikan bahwa semua sistem beroperasi secara normal, diperlukan pemantauan konstan, yang memberikan pemantauan.

Sumber

Pemantauan membantu insinyur pusat data untuk bekerja dengan lebih nyaman. Tanpanya, spesialis harus tinggal dan bekerja sepanjang waktu di dekat kabinet, atau meninggalkan kantor dan berlari ke sana setiap kali muncul masalah atau ada kecurigaan bahwa hal itu mungkin terjadi.

Sumber

Pemantauan waktu nyata menunjukkan cara kerja infrastruktur pusat data. Indikator kinerja biasanya dipantau oleh shift on duty. Jika penyimpangan atau keadaan darurat terjadi, staf pengalih tugas dapat mencegah situasi kritis tepat waktu atau meminimalkan konsekuensinya. Selain itu, sistem pemantauan mengumpulkan data tentang parameter, status peralatan, memantau ketentuan layanan, jam kerja, dll.

Apa sebenarnya yang dikendalikan oleh sistem pemantauan dan tugas-tugas apa yang dipecahkannya?

  • Monitor parameter jaringan catu daya dan status pemutus sirkuit;



  • memantau status dan parameter operasi catu daya yang tidak pernah terputus;


  • memantau status dan parameter operasi mesin pendingin, AC dan unit ventilasi;


  • mengumpulkan data tentang suhu dan kelembaban, belajar tentang adanya kebocoran dan asap di pusat data;


  • membuat laporan dan grafik pada parameter yang diperlukan;


  • mengirimkan pemberitahuan tentang segala peristiwa dan keadaan darurat;


Perlindungan dari orang


Sayangnya, statistik mengatakan bahwa banyak situasi darurat dengan peralatan terjadi karena kesalahan manusia. Itulah sebabnya pemantauan, antara lain, memantau tidak hanya parameter, tetapi juga mereka yang memiliki akses ke pusat data dan siapa / apa yang melakukannya.



Jenis Sistem Pemantauan
Ada banyak sistem berbeda yang entah bagaimana memungkinkan Anda untuk mengontrol parameter dan pengoperasian berbagai jenis peralatan - pemantauan sistem-TI, pemantauan SCS / LAN, pemantauan sistem teknik, dll.

Berdasarkan jenis implementasinya, sistem dibagi menjadi perangkat lunak, perangkat keras, dan solusi hybrid.

Menurut tingkat kontrol, sistem pemantauan dibagi menjadi terdistribusi dan terpusat.

Sistem terdistribusi memungkinkan Anda untuk memantau status satu atau lebih perangkat dari jenis yang sama.

Sistem terpusat memungkinkan untuk menggabungkan semua peralatan yang dikendalikan, termasuk beberapa sistem terdistribusi, ke dalam satu sistem tunggal yang memungkinkan Anda untuk memantau operasi semua peralatan dalam "jendela tunggal".

Sumber

Terdiri dari apa


Selama bertahun-tahun, kolega saya dan saya telah bekerja dengan sistem pemantauan NetBotz dan sistem manajemen infrastruktur data center Ahli StruxureWare Data center dari APC oleh Schneider Electric. Tim kami memiliki sertifikasi afiliasi DCIM.

Sebagian besar produsen peralatan teknik memiliki solusi komprehensif. Dengan bantuan mereka, Anda dapat membuat infrastruktur rekayasa data center turnkey dan merakit sistem pemantauan β€œout of cubes”.

Ini adalah:

  • pengendali pemantauan - perangkat yang terhubung dengan semua jenis sensor dan yang mengumpulkan informasi dari sensor ini;
  • ekspander port untuk menghubungkan sensor - unit tambahan yang terhubung ke pengontrol pemantauan untuk menambah jumlah sensor yang terhubung;
  • sensor untuk suhu, kelembaban, kebocoran, asap, bukaan pintu, deteksi gerakan, getaran, sensor analog 4-20 mA dan 0-5 volt, kontak kering, dll.;
  • perangkat untuk mengendalikan dan membatasi akses ke lemari komunikasi dan ke kamar;
  • kamera keamanan.

Namun, sistem yang sudah jadi juga memiliki kelemahan. Sebagai aturan, setiap produsen menawarkan sistem pemantauan untuk peralatannya, yaitu, yang ia hasilkan. Tentu saja, sangat nyaman ketika infrastruktur pusat data dibangun di atas peralatan satu merek. Implementasi sistem semacam itu membutuhkan sedikit waktu, tidak ada masalah dengan menghubungkan dan mengenali parameter peralatan.

Sumber

Bisa ditebak, masalah utama dari sistem tersebut adalah koneksi peralatan pihak ketiga. Kebetulan sistem seperti itu mendukung beberapa jenis dan model peralatan pihak ketiga, tetapi untuk koneksi dan tampilan parameter yang benar sangat sering diperlukan langkah dan waktu tambahan.

Misalnya, untuk menghubungkan perangkat merek lain yang terhubung melalui MODBUS ke sistem Pakar pusat data APC yang tidak ada dalam daftar yang didukung, Anda harus menghubungi layanan dukungan. Dalam hal ini, Anda perlu memberikan data teknis tentang peralatan yang terhubung, mengisi beberapa formulir dan menunggu sekitar satu bulan. Hampir tidak mungkin untuk melakukan ini sendiri.

Instalasi dan pengaturan


Dari teori ke praktik. Kami memasang sistem pemantauan pertama pada 2010. Secara total, kami telah menerapkan lebih dari 15 sistem pemantauan pusat data. Di satu sisi, pekerjaannya sama setiap kali, di sisi lain, setiap pelanggan memiliki kondisi dan persyaratan sendiri, sehingga setiap proyek dikenang oleh sesuatu yang berbeda. Di bawah ini saya akan berbicara tentang proyek yang paling menarik selama beberapa tahun terakhir.

NIS GLONASS


Dua pusat data berlokasi di Moskow dan St. Petersburg. Mereka dihubungkan oleh satu sistem pemantauan infrastruktur rekayasa. Untuk pertama kalinya dalam proyek ini, pengguna harus berbagi hak pengguna untuk mengakses grup perangkat. Bagaimana itu? Spesialis dari Moskow mengontrol semua perangkat di kedua pusat data, sementara spesialis di St. Petersburg hanya mengendalikan bagian dari peralatan mereka.


Proyek untuk pabrik metalurgi


Untuk pertama kalinya, tim kami harus "mengacaukan" peralatan pihak ketiga, generator diesel, panel otomasi, dan panel kontrol AC ke sistem pemantauan Pakar pusat data StruxureWare . Bukan tanpa bantuan para ahli Barat dari layanan dukungan dari produsen sistem pemantauan. Selama sebulan mereka menulis driver untuk perangkat yang kami butuhkan.



Unit Penelitian milik negara


Di sini, di samping solusi standar, untuk pertama kalinya, kami menerapkan pemantauan switchboard dari switchgear input dengan pemutus otomatis, dikendalikan oleh relai terprogram ZelioLogic, panel distribusi daya dengan status pemutus sirkuit pada pengontrol Acti-9 SmartLink dan meter listrik PowerLogic dari Schneider Electric.


Technopark


Untuk pertama kalinya di negara ini, kami menerapkan sistem pemantauan dan sistem manajemen infrastruktur pusat data menggunakan 190 sensor suhu dan kelembaban nirkabel yang terletak di 6 ruang mesin dan 4 ruang peralatan.


Segera relatif, proyek besar lainnya akan dimulai. Bagi kami itu akan menjadi pengalaman baru. Penting untuk memperkenalkan sistem pemantauan RAMOS dan sistem manajemen infrastruktur untuk pusat data Aegis DCIM (KONTEG pabrikan Ceko). Mungkin akan ada lagi alasan untuk memberitahumu sesuatu.

Omong-omong, tim kami selalu mencari profesional yang berbakat dan antusias.

Source: https://habr.com/ru/post/id428467/


All Articles