Teknologi WDM: menggabungkan pusat data ke dalam kelompok tahan bencana

Terlepas dari keandalan pusat data modern, tingkat redundansi kritis lain diperlukan untuk fasilitas penting, karena seluruh infrastruktur TI mungkin gagal karena bencana buatan manusia atau bencana alam. Untuk memastikan toleransi terhadap bencana, perlu membangun pusat data cadangan. Di bawah potongan, cerita kami tentang masalah yang timbul dari kombinasi mereka (DCI - Data Center Interonnection).




Volume data yang diproses oleh manusia telah tumbuh dengan jumlah yang luar biasa, dan peran infrastruktur TI dalam proses bisnis sangat besar sehingga kegagalan jangka pendek dapat sepenuhnya melumpuhkan perusahaan. Teknologi digital sedang diperkenalkan di mana-mana, dan sektor keuangan, telekomunikasi, atau, misalnya, pengecer internet besar, sangat bergantung padanya. Keandalan pusat data tidak cukup untuk penyedia cloud besar, bank atau operator telekomunikasi besar: kerugian dari downtime kecil dapat dihitung dalam jumlah astronomi dan, untuk menghindarinya, diperlukan infrastruktur tahan bencana. Anda dapat membuatnya hanya dengan meningkatkan redundansi - Anda harus membangun pusat data cadangan.

Memisahkan Ketersediaan Tinggi dari Pemulihan Bencana


Pusat data perusahaan atau peralatan yang dipasang di tempat sewaan dapat digabungkan. Toleransi kesalahan solusi geo-didistribusikan dicapai melalui arsitektur perangkat lunak, dan pemilik dapat menghemat fasilitas mereka sendiri: mereka tidak perlu membangun pusat data, misalnya, tingkat Tier III atau bahkan Tier II. Anda dapat meninggalkan generator diesel, menggunakan server bingkai terbuka, bermain dengan kondisi suhu ekstrem dan melakukan trik menarik lainnya. Ada sedikit tingkat kebebasan di area sewaan, di sini penyedia menentukan aturan permainan, tetapi prinsip-prinsip penyatuan adalah sama. Sebelum berbicara tentang layanan TI yang tahan bencana, ada baiknya mengingat tiga singkatan ajaib: RTO, RPO dan RCO. Indikator kinerja utama ini menentukan kemampuan infrastruktur TI untuk menahan gangguan.

RTO (Tujuan waktu pemulihan) - waktu yang diizinkan untuk memulihkan sistem TI setelah insiden;
RPO (Tujuan titik pemulihan) - kehilangan data dapat diterima selama pemulihan bencana. Biasanya diukur sebagai periode maksimum selama data dapat hilang;
RCO (Tujuan kapasitas pemulihan) adalah bagian dari beban TI yang dapat diambil oleh sistem cadangan. Indikator terakhir dapat diukur dalam persentase, transaksi, dan "burung beo" lainnya.

Penting untuk membedakan antara ketersediaan Tinggi (HA) dan solusi Disaster Recovery (DR). Perbedaan di antara mereka dapat divisualisasikan dalam bentuk diagram dengan RPO dan RTO sebagai sumbu koordinat:


Idealnya, kami tidak kehilangan data dan tidak membuang waktu untuk memulihkan dari kegagalan, dan situs cadangan akan memastikan fungsionalitas penuh dari layanan, bahkan jika yang utama dihancurkan. Zero RTO dan RPO hanya dapat dicapai dengan operasi pusat data yang sinkron: pada kenyataannya, ini adalah cluster toleran kesalahan yang terdistribusi secara geografis dengan replikasi data real-time dan kesenangan lainnya. Dalam mode asinkron, integritas data tidak lagi dijamin: karena replikasi dilakukan secara berkala, beberapa informasi mungkin hilang. Waktu untuk beralih ke situs cadangan dalam hal ini adalah dari beberapa menit hingga beberapa jam, jika menyangkut apa yang disebut cadangan dingin, ketika sebagian besar peralatan cadangan dimatikan dan tidak mengkonsumsi listrik.


Rincian teknis


Kesulitan teknis yang timbul ketika menggabungkan dua atau lebih pusat data dibagi menjadi tiga kategori: keterlambatan pengiriman data, bandwidth saluran komunikasi yang tidak mencukupi, dan masalah keamanan informasi. Komunikasi antara pusat data biasanya disediakan oleh jalur komunikasi serat optik mereka sendiri atau yang disewa, jadi kita akan membicarakannya nanti. Untuk DPC yang beroperasi dalam mode sinkron, masalah utamanya adalah penundaan. Untuk memastikan replikasi data real-time, mereka tidak boleh melebihi 20 milidetik, dan kadang-kadang 10 milidetik - itu tergantung pada jenis aplikasi atau layanan.

Kalau tidak, misalnya, keluarga protokol Fibre Channel tidak akan berfungsi, yang hampir mustahil dilakukan tanpa sistem penyimpanan modern. Di sana, semakin tinggi kecepatannya, semakin sedikit penundaannya. Tentu saja ada protokol yang memungkinkan Anda bekerja dengan jaringan penyimpanan melalui Ethernet, tetapi di sini banyak tergantung pada aplikasi dan peralatan yang dipasang yang digunakan di pusat data. Berikut ini adalah contoh persyaratan latensi untuk aplikasi Oracle dan VMware umum:

Persyaratan Keterlambatan Jarak Diperpanjang Oracle Diperpanjang:


Dari data resmi Oracle: Bagaimana Mengenalinya jika IO Database Lambat [ID 1275596.1]

Persyaratan Keterlambatan VMware:


Studi Kasus VMware vSphere Metro Storage Cluster (VMware vSphere 5.0)


Saat mengirimkan data, penundaan sinyal dapat direpresentasikan dalam bentuk dua komponen: T total = T melengkapi. + T dimana T equ. - penundaan yang disebabkan oleh berlalunya sinyal melalui peralatan, dan Ts - penundaan yang disebabkan oleh lewatnya sinyal melalui serat optik. Penundaan yang disebabkan oleh lewatnya sinyal melalui peralatan (peralatan T) tergantung pada arsitektur peralatan dan metode enkapsulasi data selama konversi sinyal optoelektrik. Dalam peralatan DWDM, fungsi ini ditugaskan untuk modul transponder atau muxponder. Karena itu, ketika mengatur komunikasi antara dua pusat data, mereka sangat berhati-hati dalam memilih jenis transponder (muxponder) sehingga keterlambatan pada transponder (muxponder) adalah yang terkecil.

Dalam mode sinkron, kecepatan rambat sinyal dalam serat optik (Ts) memainkan peran penting. Diketahui bahwa kecepatan perambatan cahaya dalam serat optik standar (misalnya, G.652) tergantung pada indeks bias intinya dan kira-kira sama dengan 70% kecepatan cahaya dalam ruang hampa udara (~ 300.000 km / dtk). Kami tidak akan membahas dasar-dasar fisik, tetapi mudah untuk menghitung bahwa keterlambatan dalam kasus ini adalah sekitar 5 mikrodetik per kilometer. Oleh karena itu, dua pusat data dapat beroperasi secara serempak pada jarak hanya sekitar 100 kilometer.

Dalam mode asinkron, persyaratan penundaan tidak begitu ketat, tetapi jika jarak antara objek sangat meningkat, pelemahan sinyal optik dalam serat mulai mempengaruhi. Sinyal harus diperkuat dan dibuat ulang, yaitu, Anda harus membuat sistem transmisi Anda sendiri atau menyewa saluran komunikasi trunk. Volume lalu lintas yang lewat di antara dua pusat data cukup besar dan cenderung terus bertambah. Penggerak utama pertumbuhan lalu lintas antara pusat data: virtualisasi, layanan cloud, migrasi dan koneksi server baru dan sistem penyimpanan. Di sini Anda mungkin menghadapi masalah bandwidth saluran transmisi data yang tidak mencukupi. Untuk meningkatkannya hingga tak terbatas tidak akan berfungsi karena kurangnya serat gratis sendiri atau tingginya biaya sewa. Poin penting terakhir terkait dengan keamanan informasi: data yang berjalan di antara pusat data harus dienkripsi, yang juga meningkatkan penundaan. Ada beberapa poin lain, seperti kerumitan mengelola sistem terdistribusi, tetapi pengaruhnya tidak begitu besar, dan semua kendala teknis terutama terkait dengan fitur saluran komunikasi dan peralatan terminal.

Dua atau tiga adalah kesulitan ekonomi


Kedua mode penggabungan pusat data memiliki kelemahan yang signifikan. Objek yang beroperasi secara sinkron harus ditempatkan berdekatan satu sama lain, yang tidak menjamin kelangsungan hidup setidaknya satu dari mereka dalam hal terjadi bencana skala besar. Ya, opsi ini secara andal dilindungi dari kesalahan manusia, dari kebakaran, dari perusakan ruang mesin sebagai akibat dari kecelakaan pesawat atau dari keadaan darurat lokal lainnya, tetapi jauh dari kenyataan bahwa kedua pusat data dapat bertahan, misalnya, gempa bumi yang dahsyat. Dalam mode asinkron, objek dapat berjarak ribuan kilometer, tetapi memastikan nilai RTO dan RPO yang dapat diterima akan gagal. Solusi ideal adalah sirkuit dengan tiga pusat data, dua di antaranya bekerja secara serempak, dan yang ketiga terletak sejauh mungkin dari mereka dan memainkan peran sebagai cadangan tidak sinkron.



Satu-satunya masalah dengan tiga pusat data adalah biayanya yang sangat tinggi. Organisasi bahkan satu situs cadangan tidaklah murah, dan hanya sedikit yang mampu mempertahankan dua pusat data yang tidak digunakan. Pendekatan serupa kadang-kadang diterapkan di sektor keuangan jika biaya transaksi sangat tinggi: pertukaran besar dapat meluncurkan skema dengan tiga pusat data kecil, tetapi di sektor perbankan mereka lebih suka menggunakan kombinasi sinkron dari keduanya. Industri lain biasanya menggabungkan dua pusat data yang beroperasi dalam mode sinkron atau asinkron.

DWDM - Solusi Optimal untuk DCI


Jika pelanggan perlu menggabungkan dua pusat data, ia pasti akan menghadapi masalah di atas. Untuk mengatasinya, kami menggunakan teknologi DWDM spektral multiplexing, yang memungkinkan multiplexing sejumlah sinyal pembawa menjadi serat optik tunggal menggunakan panjang gelombang yang berbeda (λ, yaitu, lambda). Selain itu, dalam satu pasangan optik bisa ada hingga 80 (96) panjang gelombang menurut grid frekuensi ITU-T G.694.1. Kecepatan transfer data dari setiap panjang gelombang adalah 100 Gbit / dtk, 200 Gbit / dtk atau 400 Gbit / dtk, dan kapasitas satu pasangan optik dapat mencapai 80 λ * 400 Gbit / dtk = 32 Tbit / dtk. Sudah ada desain siap pakai yang menyediakan 1 Tbit / s per panjang gelombang: mereka akan memberikan bandwidth yang lebih besar dalam waktu dekat. Hari ini, ini menyelesaikan masalah bandwidth saluran sepenuhnya: alih-alih serat tambahan, pelanggan akan menggunakan yang tersedia secara lebih efisien - pemanfaatan lalu lintas akan mencapai nilai yang fantastis.



Multiplexing spektral memungkinkan Anda untuk menyelesaikan masalah bandwidth, dan untuk pusat data yang beroperasi dalam mode sinkron, ini cukup, karena keterlambatan pengiriman data di antara mereka kecil karena jarak yang kecil dan lebih bergantung pada jenis transponder (atau muxponder) yang digunakan dalam sistem DWDM. Perlu dicatat salah satu fitur utama dari teknologi kompresi spektral DWDM: transmisi lalu lintas yang sepenuhnya transparan karena fakta bahwa teknologi tersebut bekerja pada level fisik pertama dari model OSI tujuh level. Jika saya dapat mengatakan demikian, sistem DWDM “transparan” untuk koneksi kliennya, seolah-olah mereka akan dihubungkan oleh kabel patch langsung. Jika kita berbicara tentang mode asinkron, maka jumlah penundaan utama tergantung pada jarak antara pusat data (kita ingat bahwa di OB ada penundaan 5 mikrodetik per kilometer), tetapi tidak ada persyaratan ketat untuk penundaan. Oleh karena itu, jangkauan transmisi ditentukan oleh kemampuan sistem DWDM dan dibatasi oleh tiga faktor: atenuasi sinyal, rasio sinyal-ke-noise, dan dispersi cahaya mode-polarisasi.

Ketika menghitung bagian optik dari jalur DWDM, semua faktor ini diperhitungkan dan berdasarkan pada perhitungan, jenis transponder (atau muxponders), jumlah dan jenis amplifier yang diperlukan, serta komponen lain dari jalur optik dipilih. Dengan pengembangan sistem DWDM dan tampilan transponder dalam komposisi mereka yang mendukung penerimaan yang koheren pada kecepatan 40 Gbit / detik dan 100 Gbit / detik dan lebih tinggi, dispersi cahaya mode-polarisasi sebagai faktor pembatas telah berhenti diperhitungkan. Pertanyaan menghitung garis optik dan memilih jenis penguat adalah topik terpisah besar yang mengharuskan pembaca untuk mengetahui dasar-dasar optik fisik, dan kami tidak akan membahasnya secara rinci dalam artikel ini.

Teknologi WDM dapat memecahkan masalah keamanan informasi. Tentu saja, enkripsi tidak harus dilakukan pada tingkat optik, tetapi pendekatan ini memiliki sejumlah keunggulan yang tak terbantahkan. Enkripsi pada tingkat yang lebih tinggi sering memerlukan perangkat otonom untuk arus lalu lintas yang berbeda dan berkontribusi terhadap penundaan yang signifikan. Dengan meningkatnya jumlah perangkat seperti itu, penundaan juga tumbuh, dan kompleksitas manajemen jaringan juga meningkat. Enkripsi optik OTN (G.709 - Rekomendasi ITU-T yang menjelaskan format bingkai dalam sistem DWDM) tidak bergantung pada jenis layanan, tidak memerlukan perangkat terpisah dan sangat cepat - perbedaan antara aliran data yang dienkripsi dan tidak terenkripsi biasanya tidak melebihi 10 milidetik.



Tanpa menggunakan teknologi multiplexing spektral DWDM, hampir tidak mungkin untuk menggabungkan pusat data besar dan membuat cluster terdistribusi tahan bencana. Volume informasi yang dikirimkan melalui jaringan tumbuh secara eksponensial dan cepat atau lambat kemungkinan jalur komunikasi serat optik yang ada akan habis. Menempatkan atau menyewa yang tambahan akan membuat pelanggan lebih mahal daripada membeli peralatan, pada kenyataannya, hari ini, penyegelan adalah satu-satunya pilihan yang ekonomis. Pada jarak pendek, teknologi DWDM memungkinkan untuk lebih efisien menggunakan serat optik yang ada, meningkatkan pemanfaatan lalu lintas ke surga, dan pada jarak jauh mereka juga meminimalkan keterlambatan pengiriman data. Saat ini mungkin merupakan teknologi terbaik yang tersedia di pasar dan perlu dicermati.

Source: https://habr.com/ru/post/id428249/


All Articles