Als ich kürzlich die Registrierung von inländischer Software betrachtete, fand ich die russische Versammlung Hadoop, die ziemlich überrascht war.
Darüber hinaus war die Registrierung bereits im Jahr 2017. (der
link für interessierte ) und seitdem auf einem habr keine linie darüber.
Treffen Sie sich also - Arenadata Hadoop (ADH)!
Erster Eindruck:
Ich ging auf die Website und ... Das letzte Mal, als ich 2014 eine solche Kombination aus Verwirrung und Verwirrung erlebte, als ich belarussische Austern in einem Geschäft traf.
Überzeugen Sie sich selbst:
Hier ist die Arenadata-Website

Hier ist die Hortonworks-Website

Primärfarben sind grün und grau.
Beide Distributionen verwenden Ambari, um den Cluster zu verwalten. Nur ADP verfügt über Arenadata und Horton nicht:


Danach ging ich zum Abschnitt Roadmap, sah mir die Komponentenversionen an und die erste Reaktion war: „Warum mussten Sie die Tabelle transponieren?“:
Option von Horton:

Und die Version von Arenadata:

Danach wurde es ein wenig traurig und entschied, dass die „Importsubstitution“ mit einem neu gekennzeichneten Etikett endete, wobei Greenplum als Arenadata DB und Arenadata Grid in der Produktliste aufgeführt wurde. Dann wurde die Paketversion sorgfältig geprüft und festgestellt, dass die Basis von Hortonworks und deren Inhalt stammt und es gefällt.
Ein kleiner lyrischer Exkurs: Ja, ich weiß, dass Hortonworks und Cloudera fusioniert sind, aber das Unternehmen wird für weitere 3 Jahre Distributionen unter den vorherigen Marken veröffentlichen, daher rufe ich Hortonworks Clouder nicht an, obwohl ich könnte.
Von den Pluspunkten: Es gibt russischsprachige Dokumentation und Unterstützung (Anfänger und diejenigen, die mit Unterstützung als Inder in Amerika gearbeitet haben, sollten dies zu schätzen wissen). Die Unterstützung erfolgt jedoch im Abonnement, und ich habe kein Forum, in dem Sie Fragen zu schmerzhaften Themen wie Cloudera / Horton stellen können gefunden.
Und jetzt gibt es ein paar Kuriositäten: 2 Versionen sind
auf der Website registriert: Enterprise und Platform, und Enterprise ist ziemlich dunkel - ohne Spark, Zeppelin und Ranger steht nur eine Version zum Download zur Verfügung, und diese ohne das Recht zu wählen.
Gemessen an der Anwesenheit des Waldläufers ist jedoch der vollständigste Build der Arenadata Hadoop-Plattform verfügbar.
Aber das ist so, kleine Dinge.
Nur zwei Dinge sind interessant: Wenn ADP 2.0 mit Hadoop 3 unter der Haube veröffentlicht wird - Sie geben eine Yarn-on-GPU, die mit Versionen von Cloudera und der Qualität des Supports konkurrieren kann -, ob es in der Lage ist, einen Fehler auf niedriger Ebene aufzudecken und zu lösen, oder ein Ticket wird in der Apache Foundation und gestartet Sie müssen auf eine Antwort warten.
PS: Ich habe die Distribution aus einem einfachen Grund nicht lokal heruntergeladen und installiert: Ich bin es gewohnt, mit Clustern mit mehreren Knoten zu arbeiten, und nach einer lokalen Installation (lesen - keine Tausenden von Kernen und Terabyte RAM) wäre der Eindruck ziemlich verdorben.