Impor Distribusi Distribusi Hadoop

Baru-baru ini, melihat pada daftar perangkat lunak dalam negeri, saya menemukan perakitan Rusia Hadoop, yang cukup terkejut.
Apalagi pendaftarannya sudah tahun 2017. ( link untuk tertarik ) dan sejak saat itu pada habr bukan garis tentang hal itu.
Jadi, ketemu - Arenadata Hadoop (ADH)!

Kesan pertama:
Saya pergi ke situs tersebut dan ... Terakhir kali saya mengalami kombinasi kebingungan dan kebingungan pada tahun 2014, ketika saya bertemu tiram Belarusia di sebuah toko.

Nilailah sendiri:
di sini adalah situs web Arenadata


di sini adalah situs web Hortonworks



Warna primer adalah hijau dan abu-abu.
Kedua distribusi menggunakan Ambari untuk mengelola cluster, hanya ADP yang Arenadata dan Horton tidak:



Setelah itu, saya pergi ke bagian Roadmap, melihat versi komponen dan reaksi pertama adalah "mengapa Anda perlu mengubah tabel?":
Opsi dari Horton:


Dan versi Arenadata:


Setelah itu, menjadi sedikit sedih dan memutuskan bahwa "substitusi impor" berakhir dengan label ulang, terutama mencatat Greenplum sebagai Arenadata DB dan Arenadata Grid dalam daftar produk, tetapi kemudian dengan hati-hati melihat versi paket dan menyadari bahwa pangkalan itu diambil dari Hortonworks, dan kontennya dan itu menyenangkan.

Sedikit penyimpangan lirik: ya, saya tahu bahwa Hortonworks dan Cloudera bergabung, tetapi perusahaan akan merilis distribusi di bawah merek dagang sebelumnya selama 3 tahun lagi, jadi saya tidak memanggil Hortonworks Clouder, walaupun saya bisa.

Dari plus - ada dokumentasi dan dukungan berbahasa Rusia (pemula dan mereka yang bekerja dengan dukungan seperti orang India di Amerika harus menghargai), namun, dukungan adalah dengan berlangganan, dan saya tidak memiliki forum di mana Anda dapat mengajukan pertanyaan tentang menyakitkan seperti Cloudera / Horton ditemukan.

Dan sekarang ada beberapa keanehan: 2 versi terdaftar di situs : Enterprise dan Platform, dan Enterprise cukup jelas - tanpa Spark, Zeppelin dan Ranger, dan hanya satu versi yang tersedia untuk diunduh, dan yang satu tanpa hak untuk memilih.
Namun, jika dilihat dari kehadiran Ranger, bangunan terlengkap dari Platform Arenadata Hadoop tersedia.

Tapi ini benar, hal-hal kecil.
Hanya 2 hal yang menarik: ketika ADP 2.0 dirilis dengan Hadoop 3 di bawah tenda - Anda memberikan Yarn-on-GPU yang dapat bersaing dengan rilis dari Cloudera dan kualitas dukungan - apakah ia dapat menemukan dan menyelesaikan bug tingkat rendah atau tiket akan diluncurkan di Apache Foundation dan Anda harus menunggu jawaban.

PS: Saya tidak mengunduh dan menginstal distribusi secara lokal karena satu alasan sederhana: Saya terbiasa bekerja dengan kluster multi-node, dan setelah instalasi lokal (baca - tidak ada ribuan core dan terabyte RAM) kesan akan sangat manja.

Source: https://habr.com/ru/post/id454416/


All Articles