Arsitektur pusat data untuk keperluan umum (pusat data seperti itu masih banyak digunakan saat ini) telah melakukan tugasnya dengan baik di masa lalu, tetapi kebanyakan dari mereka baru-baru ini mencapai batas skalabilitas, kinerja, dan efisiensi. Arsitektur pusat data tersebut biasanya menggunakan prinsip alokasi sumber daya agregat - prosesor, hard drive, dan lebar saluran jaringan.
Dalam hal ini, perubahan volume sumber daya yang digunakan (naik atau turun) terjadi di pusat data tersebut secara terpisah, dengan koefisien yang telah ditentukan. Misalnya, dengan koefisien 2, kita bisa mendapatkan serangkaian konfigurasi ini:
- 2CPU, 8 GB RAM, penyimpanan 40GB;
- 4CPU, 16GB RAM, penyimpanan 80GB;
- 8CPU, 32GB RAM, 160GB penyimpanan;
- ...
Namun, untuk banyak tugas, konfigurasi ini tidak efektif secara ekonomi, seringkali beberapa konfigurasi menengah sudah cukup untuk pelanggan, misalnya, - 6CPU, 16GB RAM, penyimpanan 100GB. Dengan demikian, kami sampai pada pemahaman bahwa pendekatan universal di atas untuk alokasi sumber daya pusat data tidak efektif, terutama ketika bekerja dengan data besar secara intensif (misalnya, data cepat, analitik, kecerdasan buatan, pembelajaran mesin). Pengguna dalam kasus seperti itu ingin memiliki kemampuan kontrol yang lebih fleksibel dari sumber daya yang digunakan, mereka membutuhkan kemampuan untuk secara mandiri mengukur prosesor, memori dan penyimpanan data, saluran jaringan. Tujuan akhir dari ide ini adalah untuk menciptakan infrastruktur komponen yang fleksibel.
Fig. 1. Arsitektur pusat data data-sentris.Menanggapi persyaratan tersebut datang pusat data infrastruktur hyperconverged (HCI, Hyper-Converged Infrastructure) yang menggabungkan semua sumber daya komputasi, sistem penyimpanan, dan saluran jaringan ke dalam sistem virtual tunggal (Gbr. 1). Namun, dalam struktur ini, untuk memperluas batas skalabilitas (menambahkan sistem penyimpanan baru, memori atau saluran jaringan), server tambahan diperlukan. Ini menentukan penampilan pendekatan yang didasarkan pada perluasan infrastruktur HCI dengan modul-modul tetap (masing-masing berisi prosesor, memori, dan penyimpanan data), yang pada akhirnya tidak memberikan tingkat fleksibilitas dan kinerja yang dapat diprediksi sehingga sangat diminati di pusat data modern.
HCI telah digantikan oleh infrastruktur komponen-terpilah (CDI, Infrastruktur Terpisah-Terpadu), yang dirancang untuk mengatasi keterbatasan solusi TI konvergen atau hyper-konvergen dan memberikan fleksibilitas yang lebih baik untuk pusat data.
Munculnya infrastruktur terpilah komponenUntuk mengatasi masalah yang terkait dengan arsitektur pusat data untuk tujuan umum (rasio sumber daya yang tetap, pemanfaatan yang kurang, dan redundansi), infrastruktur konvergensi pertama kali dikembangkan, yang terdiri dari sumber daya perangkat keras yang telah dikonfigurasi sebelumnya dalam satu sistem tunggal. Sumber daya komputasi, sistem penyimpanan, dan interaksi jaringan di dalamnya terpisah dan volume konsumsinya diprogram. Kemudian struktur konvergen diubah menjadi hyperconverged (HCI), di mana semua sumber daya perangkat keras divirtualisasikan, dan alokasi jumlah yang diperlukan dari sumber daya komputasi, penyimpanan dan saluran jaringan diotomatisasi pada tingkat perangkat lunak.
Terlepas dari kenyataan bahwa HCI mengintegrasikan semua sumber daya ke dalam sistem virtual tunggal, pendekatan ini juga memiliki kelemahan. Untuk menambah klien, misalnya, jumlah penyimpanan yang jauh lebih besar, RAM atau memperluas saluran jaringan, dalam arsitektur HCI, ini akan memerlukan penggunaan modul prosesor tambahan, bahkan jika mereka tidak akan digunakan secara langsung untuk operasi komputasi. Akibatnya, kami memiliki situasi di mana, saat membuat pusat data yang lebih fleksibel daripada arsitektur sebelumnya, mereka masih menggunakan elemen bangunan yang tidak fleksibel.
Menurut survei pengguna TI pusat data perusahaan menengah dan besar, sekitar 50% dari total kapasitas penyimpanan yang tersedia dialokasikan untuk penggunaan nyata, sementara aplikasi hanya menggunakan setengah dari volume penyimpanan yang dialokasikan, dan waktu CPU juga digunakan oleh sekitar 50%. Dengan demikian, pendekatan yang menggunakan sistem struktural tetap mengarah pada kekurangan muatan dan tidak memberikan fleksibilitas yang diperlukan dan kinerja yang dapat diprediksi. Untuk mengatasi masalah ini, model terpilah dibuat, yang mudah dirakit dari modul fungsional terpisah menggunakan alat perangkat lunak dengan API terbuka.
Component Disaggregated Infrastructure (CDI) adalah arsitektur pusat data di mana sumber daya fisik - daya komputasi, penyimpanan, dan saluran jaringan - diperlakukan sebagai layanan. Memberikan aplikasi kepada pengguna semua sumber daya yang diperlukan untuk memenuhi beban mereka saat ini terjadi secara real time, sehingga mencapai kinerja optimal di dalam pusat data.
Model Anti-Konvergensi Terpisah Komponen
Server virtual dalam infrastruktur komponen-terpilah (Gbr. 2) dibuat dengan menghubungkan sumber daya dari kumpulan independen sistem komputasi, penyimpanan dan perangkat jaringan, berbeda dengan HCI, di mana sumber daya fisik terkait dengan server HCI. Dengan cara ini, server CDI dapat dibuat dan dikonfigurasi ulang sesuai kebutuhan sesuai dengan persyaratan beban kerja tertentu. Menggunakan akses API ke perangkat lunak virtualisasi, aplikasi dapat meminta sumber daya yang diperlukan, menerima konfigurasi ulang server instan secara real time, tanpa campur tangan manusia - langkah nyata menuju pusat data yang dikelola sendiri.
Fig. 2: Model Hyperconverged (HCI) dan Component Disaggregated (CDI).Bagian penting dari arsitektur CDI adalah antarmuka komunikasi internal, yang memastikan pemisahan (disagregasi) perangkat penyimpanan server tertentu dari daya komputasi dan penyediaannya untuk digunakan oleh aplikasi lain.
NVMe-over-Fabrics digunakan di sini sebagai protokol utama. Ini memberikan penundaan transfer data ujung-ke-ujung terkecil antara aplikasi dan perangkat penyimpanan itu sendiri. Sebagai hasilnya, ini memungkinkan CDI untuk memberi para pengguna semua manfaat dari penyimpanan yang terpasang langsung (latensi rendah dan kinerja tinggi), memberikan respons dan fleksibilitas melalui berbagi sumber daya.
Fig. 3. Struktur NVMe-over-Fabrics.Teknologi NVMe (Non-Volatile Memory Express) itu sendiri adalah antarmuka yang dioptimalkan, berkinerja tinggi, dan latensi rendah yang menggunakan arsitektur dan seperangkat protokol yang dirancang khusus untuk menghubungkan SSD ke server melalui bus PCI Express. Untuk CDI, standar ini telah diperluas ke NVMe-over-Fabrics - di luar server lokal.
Spesifikasi ini memungkinkan perangkat flash untuk berkomunikasi melalui jaringan (menggunakan protokol jaringan dan media transmisi yang berbeda - lihat Gambar 3), memberikan kinerja tinggi dan penundaan transmisi yang sama rendahnya dengan perangkat NVMe lokal. Pada saat yang sama, praktis tidak ada batasan pada jumlah server yang dapat berbagi perangkat NVMe-over-Fabrics atau pada jumlah perangkat penyimpanan tersebut yang dapat diakses oleh satu server.
Kebutuhan aplikasi intensif data besar saat ini melebihi kemampuan arsitektur pusat data tradisional, terutama dalam hal skalabilitas, kinerja, dan efisiensi. Dengan munculnya CDI (infrastruktur terpilah komponen), arsitek pusat data, penyedia layanan cloud, integrator sistem, pengembang perangkat lunak penyimpanan dan OEM dapat menyediakan layanan penyimpanan dan komputasi dengan efektivitas biaya yang lebih besar, fleksibilitas, efisiensi dan kemudahan skalabilitas, secara dinamis menyediakan SLA yang diperlukan untuk semua orang beban kerja.