Recientemente, mirando el registro de software dom茅stico, encontr茅 el ensamblado ruso Hadoop, que estaba bastante sorprendido.
Adem谩s, el registro ya fue en 2017. (el
enlace para interesados ) y desde entonces en un habr no hay una l铆nea al respecto.
Entonces, conoce a Arenadata Hadoop (ADH).
Primeras impresiones:
Fui al sitio y ... La 煤ltima vez que experiment茅 tal combinaci贸n de desconcierto y perplejidad en 2014, cuando conoc铆 las ostras bielorrusas en una tienda.
Juzga por ti mismo:
aqu铆 est谩 el sitio web de Arenadata

aqu铆 est谩 el sitio web de Hortonworks

Los colores primarios son verde y gris.
Ambas distribuciones usan Ambari para administrar el cl煤ster, solo ADP tiene Arenadata y Horton no:


Despu茅s de eso, fui a la secci贸n Hoja de ruta, vi las versiones de los componentes y la primera reacci贸n fue "驴por qu茅 necesitaban transponer la tabla?":
Opci贸n de Horton:

Y la versi贸n de Arenadata:

Despu茅s de eso, se puso un poco triste y decidi贸 que la "sustituci贸n de importaci贸n" termin贸 con una etiqueta etiquetada, especialmente se帽alando a Greenplum como Arenadata DB y Arenadata Grid en la lista de productos, pero luego mir贸 cuidadosamente la versi贸n del paquete y se dio cuenta de que la base fue tomada de Hortonworks y su relleno y le agrada
Una peque帽a digresi贸n l铆rica: s铆, s茅 que Hortonworks y Cloudera se fusionaron, pero la compa帽铆a lanzar谩 distribuciones bajo las marcas registradas anteriores durante otros 3 a帽os, por lo que no llamo a Hortonworks Clouder, aunque podr铆a hacerlo.
De las ventajas: hay documentaci贸n y soporte en ruso (los principiantes y aquellos que trabajaron con el apoyo que los indios en Estados Unidos deber铆an apreciar), sin embargo, el soporte es por suscripci贸n, y no tengo un foro donde pueda hacer preguntas sobre dolorosas como Cloudera / Horton encontrado.
Y ahora hay algunas rarezas: hay 2 versiones registradas
en el sitio : Enterprise y Platform, y Enterprise es bastante oscura: sin Spark, Zeppelin y Ranger, y solo hay una versi贸n disponible para descargar, y esa sin derecho a elegir.
Sin embargo, a juzgar por la presencia del Ranger, la versi贸n m谩s completa de la Plataforma Arenadata Hadoop est谩 disponible.
Pero esto es as铆, peque帽as cosas.
Solo 2 cosas son interesantes: cuando se lanza ADP 2.0 con Hadoop 3 bajo el cap贸, le das un Yarn-on-GPU que puede competir con los lanzamientos de Cloudera y la calidad del soporte, ya sea que sea capaz de desenterrar y resolver un error de bajo nivel o se lanzar谩 un ticket en la Fundaci贸n Apache y Tendr谩 que esperar una respuesta.
PD: No descargu茅 e instal茅 la distribuci贸n localmente por una simple raz贸n: estoy acostumbrado a trabajar con cl煤steres de m煤ltiples nodos, y despu茅s de una instalaci贸n local (l茅ase, sin miles de n煤cleos y terabytes de RAM) la impresi贸n ser铆a bastante da帽ada.