Dalam posting kami sebelumnya, kami berbagi pengukuran kinerja hypervisor kami setelah memasang tambalan terhadap kerentanan Meltdown dan Specter. Hari ini, saatnya berbicara tentang kinerja data warehouse.
Berkat optimalisasi VzKernel dan kompilasi ulangnya dengan opsi "Retpoline", kami mengganti urutan kode mesin yang rentan dan hampir dapat sepenuhnya menghilangkan masalah kinerja yang disebabkan oleh kebutuhan untuk melindungi hypervisor dari kerentanan pada prosesor Intel. Akibatnya, penurunan produktivitas berkurang menjadi 1-2%. Namun, dengan latar belakang ini, banyak yang memiliki pertanyaan tentang pengoperasian data warehouse. Dan ini tidak mengherankan, karena dalam lingkungan hiper-konvergen, penyimpanan data terdistribusi memainkan peran mendasar, dan dengan penyimpanan lambat semua keuntungan kinerja mesin dan wadah virtual dapat sia-sia.
Hari ini kami ingin berbagi dengan Anda dua uji demonstrasi yang dilakukan untuk mengevaluasi kinerja mesin virtual dan kepadatan data dalam penyimpanan terdistribusi VZ Storage, yang dibangun ke dalam kelompok produk Virtuozzo 7. Sekelompok 6 node digunakan sebagai bangku tes, dengan penyimpanan data secara langsung hanya 5 dari mereka yang ditempati, dan pada node yang tersisa mesin virtual berada.
Setiap node memiliki konfigurasi berikut:
- CPU: 2 x Intel Xeon E5-2620 v4 @ 2.1 GHz
- RAM: 64 GB DDR4 2133 MHz
- NET: 2 x 10 Gb / s - dua subnet terpisah untuk memisahkan lalu lintas uji dan lalu lintas penyimpanan data terdistribusi
- Kapasitas:
- HDD: 8 x 1 TB 7200 RPM - termasuk 7 HDD untuk server chunk (CS)
- SSD: 400 GB Intel DC P3600 PCIe - untuk metadata (MDS), penjurnalan, dan cache klien
Salah satu disk pada setiap node dialokasikan untuk sistem, dan 7 sisanya untuk chunk server (CS) untuk penyimpanan data. Akibatnya, cluster ternyata menjadi 42 chunk server. Untuk mengelola ekonomi ini, kami meluncurkan 3 server metadata (MDS). Replikasi data dilaksanakan sesuai dengan skema 3: 2, yang dapat dianggap sebagai solusi standar untuk sebagian besar tugas-tugas umum.
Menurut hasil uji WebBench, di mana kami mengevaluasi kinerja dan kepadatan mesin virtual dengan Windows Server 2012 R2, jumlah permintaan untuk penyimpanan virtual di VZ7 jauh lebih tinggi, dan kinerja keseluruhan adalah 30% lebih tinggi daripada hasil penyimpanan generasi sebelumnya yang dikirimkan dengan VZ6 . Pada saat yang sama, VZ Storage bersama dengan hypervisor Virtuozzo 7 dapat mendukung operasi simultan lebih dari 100 mesin virtual pada sekelompok ukuran ini, memberikan mereka kinerja yang dapat diterima.
WebBench: Density VM Windows 2012 R2 berdasarkan VStorage
Tes kedua dilakukan dengan menggunakan utilitas SysBench dan ditiru bukan permintaan OLTP, tetapi transaksi OLTP. Kami memuat mesin virtual yang sama dengan Microsoft Windows Server 2012 R2 pada kluster yang sama dan mendapatkan hasil yang lebih menarik. Selain keunggulan kinerja, dengan VM mulai dari 30 buah, VZ7 telah menunjukkan kepadatan yang lebih tinggi, mengatasi operasi simultan lebih dari 100 mesin virtual. Pada saat yang sama, penyimpanan usang pada VZ6 menunjukkan kinerja yang dapat diterima untuk maksimum 60 mesin virtual pada cluster yang dikurangi.
SysBench: Density VM berbasis Windows 2012 R2 VM

Dan sedikit lagi tentang Erasure Coding
Selain semua hal di atas, Virtuozzo tetap merupakan pendukung penggunaan teknologi kompresi berdasarkan kode Reed-Solomon atau Erasure Coding. Meskipun diskusi yang luas tentang teknologi ini, banyak yang masih lebih suka menggunakan salinan langsung dan menyimpan hingga 3 salinan data di jaringan mereka. Namun, seperti yang ditunjukkan oleh praktik, pendekatan ini mengurangi kinerja jaringan dan memperlambat proses pencadangan.
Untuk memverifikasi fakta ini, kami mengumpulkan dua cluster, masing-masing 6 node. Kedua cluster meluncurkan 3 server metadata (MDS) dan 66 server chunk (CS) untuk menyimpan data melalui drive SAS 15K. Salah satu cluster digunakan untuk meng-host mesin virtual, dan yang lain untuk cadangan. Kami mencoba dua cara menempatkan cadangan: EC dalam mode 3 + 2 (dua jumlah hash untuk tiga bagian data) dan cadangan lengkap 3: 2 (dua salinan penuh data disimpan di jaringan). Dari sudut pandang perlindungan data, konfigurasinya identik - memungkinkan untuk memulihkan semua informasi bahkan ketika dua titik kegagalan terjadi. Namun, dalam hal kinerja, EC menunjukkan hasil yang jauh lebih baik.
Menghapus Kode dan Replikasi Data dalam Skrip Cadangan VM Paralel
Abscissa menunjukkan jumlah mesin virtual yang secara bersamaan terlibat dalam proses pencadangan. Dan di sepanjang sumbu ordinat adalah kecepatan cadangan rata-rata dalam MB / s. Kecepatan dihitung per node, sehingga total throughput dan kinerja cluster jauh lebih tinggi, kelipatan dari jumlah node. Grafik menunjukkan bahwa dengan cadangan 15 mesin virtual secara simultan dari setiap node, kenaikan kinerja karena penggunaan EC berada pada level 10%.
Kesimpulan
Pengujian ini menunjukkan keuntungan dari arsitektur yang diperbarui dan peningkatan operasi Penyimpanan VZ ketika bekerja dengan mesin virtual MS Windows, yang secara tradisional lebih sulit untuk dioptimalkan dan dipadatkan daripada VM dengan guest Linux, yang umumnya dapat dikonversi ke wadah sistem. Dalam pengujian ini, kami menggunakan hard drive SAS 15K, bukan solid state drive, yang hasilnya akan lebih tinggi karena peningkatan waktu respons keseluruhan dan kecepatan subsistem penyimpanan.