Perakitan server: dari memesan komponen hingga pengujian



Apa yang terjadi ketika klien kami memesan server konfigurasi yang sewenang-wenang? Seberapa andalkah server yang dibuat khusus? Kami akan membahas ini dan masalah lainnya secara rinci dalam artikel baru hari ini.

Pesanan server


Terlepas dari kenyataan bahwa di bagian server pemesanan yang tersedia ada beberapa lusin konfigurasi yang berbeda, beberapa klien memerlukan server dengan konfigurasi khusus. Paling sering, ini diperlukan untuk membuat server dengan kinerja sangat tinggi atau dengan sejumlah besar disk drive.

Untuk memenuhi kebutuhan ini, layanan " Server khusus konfigurasi sewenang-wenang " disediakan. Configurator di situs memungkinkan Anda membuat server dengan kompleksitas apa pun dan menyewanya sendiri dalam beberapa menit. Namun, beberapa orang bertanya-tanya bagaimana server ini dirakit.

Setelah klien memutuskan konfigurasi yang diinginkan, memesan dan membayarnya, sistem secara otomatis membuat tiket di panel kontrol. Tiket semacam itu pergi ke departemen perakitan, dan spesialis mulai memeriksa pesanan dan, pada kenyataannya, perakitan server itu sendiri.

Proses perakitan


Cek pesanan


Configurator di situs paling sering memilih versi komponen yang "benar", tetapi dalam beberapa kasus, pelanggan mungkin tidak memilih opsi yang paling optimal untuk menggabungkan komponen perangkat keras. Misalnya, pengontrol RAID yang tidak dapat memberikan kinerja maksimum dalam konfigurasi ini, atau jumlah slot RAM yang ganjil dalam sistem multiprosesor. Oleh karena itu, para insinyur pertama-tama memeriksa pesanan dan jika ada potensi masalah teridentifikasi, mereka harus memperingatkan klien dalam tiket.

Jika klien setuju bahwa konfigurasi tidak optimal, Anda dapat dengan mudah membatalkan pesanan dan membuat yang baru. Dana setelah pembatalan dikembalikan ke saldo panel kontrol secara penuh. Setelah pesanan diverifikasi, kami melanjutkan ke persiapan komponen dan perakitan server.

Aksesoris


Setiap server terdiri dari komponen-komponen berikut:

  • case (segera datang dengan catu daya);
  • motherboard ;
  • memori akses acak ;
  • pengolah
  • drive
  • pengontrol disk (jika tersedia dalam urutan);
  • kartu video (jika tersedia dalam urutan).

Insinyur yang bertanggung jawab untuk perakitan menyiapkan semua komponen dan memperbaikinya dalam sistem akuntansi, menggunakan nomor seri sebagai pengidentifikasi. Sekarang kita akan memberi tahu tentang semua tahapan yang harus dilalui setiap server dengan konfigurasi sewenang-wenang.

Persiapan kasus


Kami biasanya menggunakan kasing Supermicro, yang harus disiapkan untuk memasang motherboard menggunakan perangkat keras yang disediakan. Model motherboard yang berbeda memiliki titik pemasangan yang berbeda, jadi Anda harus menentukan jumlah perangkat keras dan baut untuk setiap unit tertentu.

Sementara jumlah pesanan kecil, kami hanya mengambil satu set pengencang yang dirancang untuk kasus ini, dan menunda pengencang yang tidak digunakan. Pada titik tertentu, menjadi jelas bahwa butuh waktu yang sangat lama untuk menemukan baut yang tepat dan kami memutuskan untuk mengemas semua perangkat keras yang tersedia di gudang.

Pengencang prepackaged

Setelah paket terakhir dengan fastener dikemas, menjadi jelas bahwa kami tidak melakukan pekerjaan ini dengan sia-sia. Sekarang setiap baut dan setiap perangkat keras terletak di tempat yang telah ditentukan untuk ini dan ini menghemat banyak waktu.

Untuk mencegah kontak motherboard menyentuh casing logam dan hubungan arus pendek, lapisan plastik khusus digunakan. Tanpa itu, perakitan dilarang. Selain itu, Anda harus dengan hati-hati keluar (ya, itu disediakan oleh pabrikan) port untuk port di stub dari belakang server. Ini dilakukan secara elemen dengan obeng pipih.

Setelah itu, stiker dengan pengidentifikasi pesanan, serta nomor seri dari server masa depan, diterapkan pada kasing. Untuk kenyamanan, selain pengenal alfanumerik, label berisi barcode yang memungkinkan Anda membaca informasi dengan cepat menggunakan pemindai.

Instalasi motherboard


Segera sebelum memasang motherboard, para insinyur melakukan beberapa langkah persiapan:

  • mengenakan sarung tangan tipis;
  • mengenakan gelang pentanahan.

Pertama-tama, ini perlu agar tidak merusak tangan. Cedera paling umum dalam kasus ini adalah luka. Gelang bumi tidak akan membiarkan kerusakan yang tidak disengaja pada komponen elektronik papan karena listrik statis.

Setelah motherboard terpasang, baut pemasangan dikencangkan. Harus diingat bahwa textolite cukup rapuh, dan tidak melakukan upaya berlebihan. Untuk menghemat waktu, teknisi menggunakan obeng nirkabel.

Sekarang kabel daya terhubung ke motherboard, serta kipas sistem pendingin. Adalah penting bahwa kadang-kadang panjang kabel lebih panjang dari yang diperlukan, sehingga mereka ditarik dengan rapi bersama dengan ikatan nilon tipis. Jika tidak mungkin untuk memperbaiki screed ke tubuh, pabrikan memasok bantalan pemasangan yang nyaman pada pita dua sisi. Ujung-ujungnya digunting dengan hati-hati dengan pemotong samping.

Kemudian panel depan dan backplane dihubungkan menggunakan kabel yang sesuai. Sekarang Anda dapat melanjutkan dengan pemasangan prosesor dan elemen lainnya.

Instalasi CPU


Operasi ini mungkin yang paling halus dan membutuhkan perhatian. Bahkan 10 tahun yang lalu, prosesor memiliki "kaki" yang nyaman, dan soket adalah matriks plastik berlubang. Berkat ini, cukup dengan memasukkan prosesor ke dalam soket dengan hati-hati dan menutup kaitnya. Dimulai dengan soket LGA 775, prosesor kehilangan "kaki" mereka, hanya menyisakan bantalan kontak yang halus. Soket, sebaliknya, sekarang memiliki kontak, tetapi mereka sangat kecil dan rapuh sehingga setiap operasi dengan pemasangan prosesor harus seakurat mungkin.

Socket Kontemporer FCLGA3647

Prosesor Intel Xeon Scalable

Setelah prosesor dipasang di tempatnya masing-masing, giliran untuk menginstal radiator pendingin. Sebagai aturan, radiator pasif digunakan, tetapi sebelum ini, pelumas termal diterapkan - lapisan bahan penghantar panas yang memisahkan prosesor dan radiator. Paling sering, pasta organosilicon seperti KPT-8 digunakan untuk ini.

Harus diingat bahwa tugas utama dari pasta termal adalah untuk menutup cacat mikroskopis baik pada permukaan prosesor dan pada permukaan radiator, menyediakan area kontak seluas mungkin. Oleh karena itu, ini diterapkan dalam lapisan yang sangat tipis dan rata. Untuk melakukan ini, gunakan spatula khusus atau kartu plastik kuno yang tidak perlu. Kelebihan dihilangkan dengan cotton buds.

Instalasi RAM


Setiap produsen motherboard menentukan sendiri urutan pemasangan modul RAM yang benar, tergantung pada jenis dan kecepatannya. Untuk Supermicro, prosedur pemasangan ini dijelaskan dalam instruksi untuk setiap model motherboard. Meskipun demikian, ada beberapa aturan universal yang berfungsi dalam kebanyakan kasus:

  • itu tidak diinginkan untuk menggunakan bilah jumlah ganjil (relevan untuk prosesor Intel Xeon di garis E5);
  • memori harus dialokasikan saluran demi saluran sehingga sistem dapat menggunakan semua mode mekanisme kontrol yang memungkinkan;
  • dalam satu server, diinginkan untuk menggunakan memori dengan latensi, voltase dan frekuensi yang sama dalam jangkauan yang didukung motherboard.

Sebelum pemasangan, para insinyur memeriksa bahwa tidak ada partikel debu atau kertas asing di dalam slot. Jika perlu, udara tekan digunakan untuk membersihkan.

Instalasi Drive


Semuanya sederhana di sini. Disk drive diperbaiki di skid standar, dan kemudian dimasukkan ke server. Jika pengontrol disk atau kartu jaringan tambahan dipesan, kartu tersebut dipasang di slot PCI-E yang sesuai dan diamankan dengan sekrup. Setelah semuanya terpasang di tempatnya, insinyur departemen perakitan sekali lagi memeriksa kepatuhan semua komponen dengan pesanan dan mengirimkan server ke dudukan untuk firmware dan pengujian.

Manajemen kabel


Kami menyentuh topik seperti manajemen kabel di dalam server. Di sini pun memiliki nuansa tersendiri, yang utamanya adalah ruang terbatas. Sebagian besar server dirancang untuk mengambil ruang rak minimal. Ketinggian satu unit pemasangan adalah 43,7 mm. Karena itu, ruang untuk kabel setelah memasang motherboard dan periferal lainnya cukup kecil.

Fakta menyenangkan: satu unit pemasangan tingginya persis sama dengan satu simpul (satuan panjang Rusia Lama).

Anda harus selalu mempertimbangkan bahwa udara harus melewati server tanpa hambatan untuk mendinginkan komponen secara efektif. Setiap rintangan di jalurnya akan memperburuk pembuangan panas, dan akibatnya, meningkatkan konsumsi energi karena meningkatnya beban pada sistem pendingin. Ini sangat penting untuk server dengan banyak GPU, suhunya yang mencapai 80 derajat.

Aliran udara dibagi rata antara semua GPU

Karena itu, semua kabel diletakkan sedemikian rupa agar tidak menghalangi jalan udara. Surplus dengan bantuan ikatan dipasang pada mata biasa, dan jika tidak ada pada platform plastik dengan selotip dua sisi.

Kabel diletakkan agar tidak mengganggu jalannya aliran udara

Firmware komponen


Untuk mulai dengan, kami akan menjawab pertanyaan yang sering diajukan - mengapa ini diperlukan? Jawabannya sederhana - prosedur ini diperlukan untuk memastikan bahwa semua komponen server bekerja tanpa kesalahan, serta untuk meningkatkan tingkat keamanan.

Sebagian besar komponen server dibangun dengan harapan dapat diprogram ulang. Setelah meninggalkan jalur perakitan selama pengujian dan operasi, dalam banyak kasus, kesalahan dan kerentanan perangkat lunak terdeteksi. Jika kemungkinan pemrograman ulang komponen tidak disediakan, maka untuk menghilangkan masalah perangkat lunak ini, semua produk harus ditarik kembali. Itu jauh lebih murah untuk menciptakan kemampuan mengganti firmware.

Flashing IPMI


Modul remote control (IPMI / iLO / iDrac) adalah salah satu elemen server yang paling penting. Ini adalah komputer mikro independen, yang selalu berfungsi ketika ada tegangan operasi pada motherboard.

Bahkan ketika tidak ada komponen di server, komputer mikro ini berfungsi, melakukan tugas menafsirkan dan menyesuaikan data dari sensor server. Modul ini terhubung erat dengan semua subsistem manajemen daya dan memungkinkan Anda untuk melakukan hampir semua operasi dari jarak jauh. Karena itu, masalah keamanan saat mengakses perangkat semacam itu sangat akut. Pembaruan firmware tepat waktu memungkinkan Anda melindungi modul dari peretasan.

Menginstal firmware biasanya dilakukan langsung dari antarmuka web, tetapi dalam beberapa kasus dapat dilakukan melalui jaringan dengan mengirimkan firmware dengan perangkat lunak yang sesuai ke modul.

Flashing BIOS


Sistem I / O dasar, selain alasan keamanan yang sudah terdaftar, memerlukan pembaruan untuk poin penting lainnya. Firmware BIOS berisi mikrokode untuk prosesor yang didukung oleh motherboard, serta mikrokode untuk antarmuka jaringan dan chipset. Ketika versi baru dari prosesor keluar, pabrikan motherboard merilis versi baru dari firmware yang berisi mikrokode yang diperlukan. Tanpa ini, prosesor baru tidak bisa dimulai.

Selain itu, rilis firmware baru mencegah konflik yang timbul dari interaksi berbagai komponen (baik yang ada di motherboard maupun perangkat pihak ketiga). Seiring dengan firmware BIOS, modul terkait, seperti Intel ME (Management Engine), sering diperbarui.

Agar tidak berdasar, kami memberikan contoh. Ambil motherboard Supermicro X10SRi / X10DRi / X10DRW yang mendukung prosesor Intel Xeon E5-XXXXv3. Jika Anda menempatkan prosesor versi berikutnya E5-XXXXv4 di sana, papan akan mulai, bagaimanapun, itu akan menghasilkan kesalahan aneh dari RAM "DIMM Gagal" di slot yang berbeda. Dan masalahnya di sini bukan di memori sama sekali, tetapi pada kenyataan bahwa pengontrol memori terletak di prosesor. Oleh karena itu, pengenalan prosesor yang salah oleh motherboard mengarah pada fakta bahwa masalah serupa muncul. Flashing dengan prosesor yang didukung sepenuhnya menyelesaikan situasi ini.

Dalam beberapa kasus, produsen peralatan secara artifisial menghentikan dukungan untuk peralatan yang lebih tua dengan model motherboard yang lebih baru. Contoh yang mencolok adalah motherboard Supermicro X11DPi, yang dengan versi BIOS firmware mana pun tidak akan bekerja dengan Adaptec 7th HBA series . Pengontrol disk tidak menginisialisasi, menyebabkan server membeku sepenuhnya. Dan saat ini masalah ini tidak memiliki solusi.

Pengontrol disk yang berkedip


Kesalahan dalam perangkat lunak dari perangkat penting seperti pengontrol disk tidak hanya dapat menyebabkan masalah, tetapi juga menjadi sumber masalah yang sangat besar. Dalam kebanyakan kasus, prosesnya sangat sederhana, flashing terjadi menggunakan utilitas asli, yang dibangun langsung ke controller itu sendiri.

Harus diingat bahwa firmware lama dari pengontrol disk tidak hanya dapat memperbaiki kesalahan, tetapi juga secara radikal mengubah cara penyimpanan metadata. Untuk menghindari situasi yang tidak menyenangkan dan menjaga data tetap utuh, sangat penting untuk membaca daftar perubahan yang dibuat pada fungsi sebelum melakukan flashing. Informasi ini selalu ada di situs web produsen peralatan dan paling sering diduplikasi dalam arsip dengan firmware itu sendiri.

Mem-flash kartu jaringan


Masalah yang tidak kalah serius, sangat sulit didiagnosis, dapat memberikan kartu jaringan dengan kesalahan di tingkat firmware. Selain pemecahan masalah, perangkat lunak kartu jaringan dapat secara langsung mempengaruhi kinerja. Jadi ini adalah item wajib lain untuk insinyur yang membangun server.

Itu penting


Saya ingin mencatat secara terpisah bahwa semua operasi pada komponen yang berkedip berpotensi berbahaya untuk peralatan, oleh karena itu diperbolehkan untuk melakukannya hanya oleh spesialis yang berkualifikasi. Jika Anda sudah menjadi klien kami dan telah menemukan kebutuhan untuk merombak komponen server apa pun, maka jangan coba-coba melakukannya sendiri . Cukup tulis kepada kami di tiket komponen mana yang harus direfleksikan, dan ini akan dilakukan dengan semua tindakan pencegahan.

Pengujian


Setelah selesai dengan pembaruan perangkat lunak, insinyur perakitan melanjutkan dengan stress menguji server yang dirakit. Pengujian semacam itu memungkinkan Anda untuk mengidentifikasi sebagian besar masalah bahkan sebelum server diserahkan kepada klien.

Tes RAM


Untuk memeriksa operabilitas semua modul RAM yang dipasang di server, alat yang sangat populer yang disebut memtester diluncurkan. Segera sebelum pengujian, insinyur bangunan memeriksa bahwa semua modul memori yang dipasang di server ditampilkan dengan benar di BIOS.

Ketika pengujian dimulai, proses membaca dan menulis data ke RAM terjadi menggunakan urutan data yang berbeda dan urutan pengisian sel. Kecepatan pelaksanaan semua tes secara langsung tergantung pada volume. Persyaratan minimum kami adalah satu siklus inspeksi lengkap.

Jika kesalahan terdeteksi selama proses pengujian, maka kami mencari modul RAM yang gagal dan mengeluarkannya dari konfigurasi, menggantinya dengan yang serupa. Kemudian proses pengujian diulangi secara keseluruhan. Hanya ketika semua iterasi pengujian selesai tanpa kesalahan, server beralih ke stress testing.

Tes CPU dan disk


Tes beban mensimulasikan beban maksimum pada server selama setidaknya 6 jam untuk server dengan drive magnetik. Dalam kasus solid-state drive, pengujian yang begitu lama dapat secara dramatis meningkatkan keausan drive, sehingga pengujian serupa dilakukan untuk mereka dengan waktu eksekusi yang lebih singkat.

Pengujian beban untuk prosesor Intel dilakukan menggunakan utilitas Intel IPDT (Processor Diagnostic Tool) asli. Proses ini menyebabkan suhu prosesor naik ke suhu operasi maksimum yang diijinkan, dan sistem pendingin harus secara efektif menghilangkan semua panas ini. Insinyur perakitan terus-menerus memastikan bahwa server melewati pengujian ini, dan suhu semua komponen tidak melebihi batas pengoperasian yang dinyatakan.

Setelah pengujian selesai, pengaturan SMART dari semua drive yang diinstal diperiksa. Jika setidaknya satu parameter dinyatakan oleh pabrikan sebagai alasan untuk mengganti drive adalah nol, disk diganti dengan yang lain dan juga diuji untuk menghilangkan kemungkinan masalah dalam "mode tempur".

Kesimpulan


Setiap server dari setiap konfigurasi yang disewa oleh kami diperiksa dan diuji berkali-kali, sehingga mereka dapat digunakan dengan aman untuk proyek apa pun sekaligus, tanpa membuang waktu untuk pengujian dan pemeriksaan yang berulang. Setiap server yang dipesan akan memiliki versi firmware terbaru dari setiap komponen, yang memberikan perlindungan yang baik terhadap kerentanan dan kesalahan yang ada.

Ceritakan tentang pengalaman Anda membangun atau menguji server. Fitur menarik apa yang Anda temui? Menunggu cerita Anda di komentar.

Source: https://habr.com/ru/post/id422959/


All Articles