Importar distribuição de distribuição do Hadoop

Recentemente, olhando para o registro de software doméstico, encontrei a montagem russa Hadoop, que ficou bastante surpresa.
Além disso, o registro já era em 2017. (o link para interessados ) e, desde então, em um habr, não há uma linha sobre isso.
Então, conheça - Arenadata Hadoop (ADH)!

Primeiras impressões:
Fui ao site e ... A última vez que experimentei essa combinação de perplexidade e perplexidade em 2014, quando conheci ostras bielorrussas em uma loja.

Julgue por si mesmo:
aqui está o site da Arenadata


aqui está o site da Hortonworks



As cores primárias são verde e cinza.
Ambas as distribuições usam o Ambari para gerenciar o cluster, apenas o ADP possui Arenadata e Horton não:



Depois disso, fui à seção Roteiro, veja as versões dos componentes e a primeira reação foi “por que você precisou transpor a tabela?”:
Opção de Horton:


E a versão do Arenadata:


Depois disso, ficou um pouco triste e decidiu que a “substituição de importação” terminava com um rótulo rotulado novamente, notando Greenplum como Arenadata DB e Arenadata Grid na lista de produtos, mas depois analisou cuidadosamente a versão da embalagem e percebeu que a base foi retirada do Hortonworks e seu preenchimento. e agrada.

Um pouco de digressão lírica: sim, eu sei que a Hortonworks e a Cloudera se fundiram, mas a empresa lançará distribuições sob as marcas comerciais anteriores por mais 3 anos, por isso não ligo para a Hortonworks Clouder, embora eu pudesse.

Das vantagens - existe documentação e suporte em idioma russo (os iniciantes e aqueles que trabalharam com suporte na forma de índios na América devem gostar), no entanto, o suporte é por assinatura e eu não tenho um fórum onde você possa fazer perguntas dolorosas como Cloudera / Horton encontrado.

E agora existem algumas curiosidades: duas versões estão registradas no site : Enterprise e Platform, e a Enterprise é bastante obscura - sem Spark, Zeppelin e Ranger, e apenas uma versão está disponível para download e aquela sem o direito de escolha.
No entanto, a julgar pela presença do Ranger, a versão mais completa da plataforma Arenadata Hadoop está disponível.

Mas é assim, pequenas coisas.
Apenas duas coisas são interessantes: quando o ADP 2.0 é lançado com o Hadoop 3 - você fornece um Yarn-on-GPU que pode competir com os lançamentos da Cloudera e a qualidade do suporte - se ele é capaz de descobrir e solucionar um bug de baixo nível ou se um ticket será lançado na Apache Foundation e Você precisará esperar por uma resposta.

PS: não baixei e instalei a distribuição localmente por um simples motivo: estou acostumado a trabalhar com clusters de vários nós e, depois de uma instalação local (leia - não há milhares de núcleos e terabytes de RAM), a impressão seria estragada.

Source: https://habr.com/ru/post/pt454416/


All Articles