Importer la distribution de distribution Hadoop

Récemment, en regardant le registre des logiciels domestiques, j'ai trouvé l'assemblage russe Hadoop, qui a été assez surpris.
De plus, l'enregistrement était déjà en 2017. (le lien pour les intéressés ) et depuis lors sur un habr pas une ligne à ce sujet.
Alors, rencontrez - Arenadata Hadoop (ADH)!

Premières impressions:
Je suis allé sur le site et ... La dernière fois que j'ai vécu une telle combinaison de perplexité et de perplexité en 2014, lorsque j'ai rencontré des huîtres biélorusses dans un magasin.

Jugez par vous-même:
voici le site d'Arenadata


voici le site Hortonworks



Les couleurs primaires sont le vert et le gris.
Les deux distributions utilisent Ambari pour gérer le cluster, seul ADP a Arenadata et Horton n'a pas:



Après cela, je suis allé à la section Feuille de route, voir les versions des composants et la première réaction a été "pourquoi avez-vous eu besoin de transposer le tableau?":
Option d'Horton:


Et la version d'Arenadata:


Après cela, il est devenu un peu triste et a décidé que la «substitution à l'importation» se terminait par une étiquette réétiquetée, notant en particulier Greenplum comme Arenadata DB et Arenadata Grid dans la liste des produits, mais a ensuite soigneusement examiné la version de l'emballage et s'est rendu compte que la base était tirée d'Hortonworks et de son contenu. et ça fait plaisir.

Une petite digression lyrique: oui, je sais que Hortonworks et Cloudera ont fusionné, mais la société publiera les distributions sous les marques précédentes pendant encore 3 ans, donc je n'appelle pas Hortonworks Clouder, bien que je le puisse.

Parmi les avantages - il existe une documentation et un support en russe (les débutants et ceux qui ont travaillé avec le support en tant qu'Indiens en Amérique devraient l'apprécier), cependant, le support est par abonnement, et je n'ai pas de forum où vous pouvez poser des questions sur douloureuses comme Cloudera / Horton trouvé.

Et maintenant, il y a quelques bizarreries: le site a 2 versions: Enterprise et Platform, et Enterprise est assez obscure - sans Spark, Zeppelin et Ranger, et une seule version est disponible en téléchargement, et celle-ci sans droit de choisir.
Cependant, à en juger par la présence du Ranger, la version la plus complète de la plate-forme Arenadata Hadoop est disponible.

Mais c'est ainsi, petites choses.
Seules deux choses sont intéressantes: lorsque ADP 2.0 est sorti avec Hadoop 3 sous le capot - vous donnez un Yarn-on-GPU qui peut rivaliser avec les versions de Cloudera et la qualité du support - s'il est capable de dénicher et de résoudre un bogue de bas niveau ou un ticket sera lancé dans la Fondation Apache et Vous devrez attendre une réponse.

PS: Je n'ai pas téléchargé et installé la distribution localement pour une raison simple: j'ai l'habitude de travailler avec des clusters multi-nœuds, et après une installation locale (lecture - pas de milliers de cœurs et téraoctets de RAM) l'impression serait assez gâtée.

Source: https://habr.com/ru/post/fr454416/


All Articles