Cara "merekatkan" server berbasis Intel dan mengatasi peningkatan skala 8 prosesor

Jika Anda menumbuhkan basis data besar dan tiba-tiba mengalami peningkatan kinerja - saatnya untuk berkembang. Dengan ekstensi skala-out itu jelas: Anda menambahkan server dan Anda tidak tahu kesedihan. Dengan peningkatan, itu tidak terlalu menyenangkan. Menurut arsitektur standar glueless, kami mengambil dua prosesor, lalu menambahkan dua lagi ke mereka ... jadi kami mendapatkan delapan prosesor dan hanya itu. Intel tidak melihat itu lagi, menabung di server baru.



Tetapi ada alternatif - arsitektur terpaku. Di dalamnya, unit komputasi prosesor ganda saling terhubung melalui pengontrol simpul. Dengan bantuan mereka, ambang batas atas per server naik menjadi 16 atau lebih prosesor. Dalam posting ini, kita akan berbicara lebih banyak tentang arsitektur terpaku pada umumnya dan bagaimana itu diterapkan di server kami.

Sebelum beralih ke arsitektur yang direkatkan, demi kejujuran, kami memikirkan pro dan kontra yang tidak terpaku.

Solusi yang dibuat sesuai arsitektur glueless adalah tipikal. Prosesor berkomunikasi satu sama lain tanpa perangkat tambahan, tetapi melalui bus QPI \ UPI standar. Hasilnya sedikit lebih murah daripada dengan terpaku. Tetapi setelah setiap delapan prosesor harus menghabiskan banyak uang - untuk menginstal server baru.


Arsitektur glueless yang khas

Dan dengan arsitektur terpaku, seperti yang telah kita katakan, langit-langit meningkat menjadi 16 atau lebih prosesor per server.

Bagaimana arsitektur Bull BCS2 terpaku bekerja


Keuntungan arsitektur Bull BCS2 disediakan oleh dua komponen - Tangguh eXternal Node-Controller dan caching prosesor. Tim yang kompatibel dengan prosesor seri Intel Xeon E7-4800 / 8800 v4 didukung.


Arsitektur terpaku Bull BCS2. Semua koneksi di server terlihat di sini. Setiap node BCS memiliki 7 tautan XQPI.

Berkat caching, jumlah interaksi antara prosesor berkurang - prosesor di setiap modul memiliki akses ke cache yang sama. Dengan demikian, beban pada RAM berkurang. Noda, pada gilirannya, berfungsi sebagai saklar lalu lintas dan memecahkan masalah "leher sempit" - itu mengarahkan lalu lintas di sepanjang jalur yang paling jarang digunakan.

Akibatnya, arsitektur Bull BCS2 hanya mengkonsumsi 5-10% dari bandwidth bus Intel QPI, standar untuk arsitektur glueless. Adapun keterlambatan akses ke memori lokal, mereka sebanding dengan sistem glueless 4-socket dan 44% kurang dari sistem 8-socket glueless. Menurut spesifikasinya, total kecepatan transfer data node BCS adalah 230 GB / s - 25,6 GB / s diperoleh untuk masing-masing dari 7 port. Bandwidth maksimum adalah 300 GB / s.



Di setiap server Bullion S, ada semacam saklar pada motherboard. Satu tautan XQPI (16 soket) dalam hal kecepatan setara dengan sepuluh port 10 GigE.


Rentang Bullion S

Dalam konfigurasi pada prosesor 4 dan 8, perbedaan antara arsitektur terpaku dan terpaku diabaikan. Namun, situasinya berubah ketika beralih ke 16 prosesor. Kami ingat bahwa di glueless, Anda sudah membutuhkan dua server untuk ini. Dan di server Bullion S dengan arsitektur terpaku, semuanya pecah seperti ini:


Modul dual-prosesor saling terhubung melalui jaringan XQPI dengan throughput 14 GT / s (milyaran transaksi per detik)

Slot mengakomodasi prosesor apa pun dari keluarga E7, dengan pengecualian E7-8893, yang hanya dapat digunakan dalam konfigurasi prosesor ganda. Dibandingkan dengan mengakses memori lokal, penundaan sistem NUMA mencapai sekitar x1.5 di dalam modul dan sekitar x4 di antara modul. Pengontrol host mengelola partisi perangkat keras dan memungkinkan Anda membuat hingga 8 partisi terpisah yang berjalan pada sistem operasi di server Bullion S.

Sebagai hasilnya, kami dapat meng-host hingga 384 core prosesor dalam satu server. Adapun RAM, di sini langit-langit adalah modul 384 DDR4 64 GB. Secara total, kami mendapatkan 24 terabyte.

Konfigurasi yang dijelaskan ini relevan untuk workhorses kami - server Bullion S. Selain itu, kami memiliki garis BullSequana S, yang dapat mencakup hingga 32 prosesor fisik berbasis pada platform Intel Purley dan arsitektur Skylake dan Cascadelake (Q1 2019).

Contoh Integrasi


Bullion S dirancang untuk tugas-tugas yang menuntut - SAP HANA, Oracle, MS SQL, Datalake (dengan sertifikasi Cloudera untuk BullSequana S), virtualisasi / VDI untuk VMware, dan solusi hyperconverged berdasarkan VMware vSAN. Sebagian di server Bullion S, Siemens menciptakan platform SAP HANA terbesar di dunia. Juga berbasis pada Bullion S, PWC telah membangun solusi besar untuk Hadoop dan analitik. Secara total, sekitar 300 perusahaan di dunia menggunakan solusi Bull.

Agar Anda mengetahui kemampuan server kami, kami akan menyajikan rencana untuk memigrasi basis data Oracle dari Power ke x86 di cabang-cabang salah satu operator telekomunikasi Rusia:



Kesimpulan


Berkat caching prosesor, arsitektur yang direkatkan memungkinkan prosesor untuk berkomunikasi langsung dengan prosesor lain di dalam simpul. Dan tautan cepat - jangan melambat saat berinteraksi dengan kelompok lain. Saat ini, hingga 16 prosesor (384 core) dan hingga 24 TB RAM masuk ke dalam satu server Bullion S. Langkah penskalaan adalah dua prosesor - ini memfasilitasi distribusi beban keuangan saat membuat infrastruktur TI.

Dalam materi mendatang, kami berencana untuk mengurai server kami secara lebih rinci. Kami akan dengan senang hati menjawab pertanyaan Anda di komentar.

Source: https://habr.com/ru/post/id432832/


All Articles