Kommt die Ära der ARM-Server?


SynQuacer E-Series-Motherboard für einen 24-Core-ARM-Server auf einem ARM Cortex A53-Prozessor mit 32 GB RAM, Dezember 2018

ARM-Prozessoren mit reduziertem Befehlssatz (RISC) dominieren seit vielen Jahren den Markt für mobile Geräte. Es gelang ihnen jedoch nie, in die Rechenzentren einzudringen, in denen Intel und AMD mit dem x86-Befehlssatz immer noch dominieren. Gelegentlich tauchen bestimmte exotische Lösungen auf, z. B. ein 24-Core-ARM-Server, der auf der Banana Pi-Plattform basiert , aber es gibt noch keine ernsthaften Angebote. Genauer gesagt, erst in dieser Woche.

Diese Woche hat AWS einen eigenen 64-Kern- Graviton2- ARM-Prozessor in der Cloud vorgestellt - ein On-Chip-System mit dem ARM Neoverse N1-Kern. Das Unternehmen behauptet, Graviton2 sei in EC2 A1-Instanzen viel schneller als die ARM-Prozessoren der vorherigen Generation, und hier sind die ersten unabhängigen Tests .

Das Infrastrukturgeschäft ist ein Zahlenvergleich. In der Tat ist es den Kunden eines Rechenzentrums oder eines Cloud-Dienstes egal, welche Architektur die Prozessoren haben. Ihnen ist das Preis-Leistungsverhältnis wichtig. Wenn die Arbeit mit ARM billiger ist als mit x86, werden sie ausgewählt.

Bis vor kurzem war es unmöglich, eindeutig zu sagen, dass Berechnungen mit ARM rentabler wären als mit x86. Beispielsweise handelt es sich bei dem serverseitigen 24-Core-ARM-Cortex A53 um ein SocioNext-SC2A11- Modell, das etwa 1000 US-Dollar kostet und einen Webserver unter Ubuntu aufruft , dessen Leistung jedoch dem x86-Prozessor weit unterlegen ist.

Die erstaunliche Energieeffizienz von ARM-Prozessoren lässt Sie diese jedoch immer wieder betrachten. Zum Beispiel verbraucht SocioNext SC2A11 nur 5 Watt. Fast 20% der Kosten eines Rechenzentrums entfallen auf Strom. Wenn diese Chips eine anständige Leistung zeigen, hat x86 keine Chance.

ARMs erstes Erscheinen: EC2 A1-Instanzen


Ende 2018 führte AWS EC2 A1-Instanzen auf eigenen ARM-Prozessoren ein. Dies war sicherlich ein Signal für die Branche hinsichtlich möglicher Veränderungen des Marktes, aber die Benchmark-Ergebnisse waren enttäuschend.

In der folgenden Tabelle sind die Ergebnisse von Belastungstests für EC2 A1 (ARM) und EC2 M5d.metal (x86) aufgeführt. Zum Testen wurde das Dienstprogramm stress-ng verwendet:

stress-ng --metrics-brief --cache 16 --icache 16 --matrix 16 --cpu 16 --memcpy 16 --qsort 16 --dentry 16 --timer 16 -t 1m

Wie Sie sehen, schnitt A1 in allen Tests mit Ausnahme des Caches schlechter ab. Für die meisten anderen Indikatoren erbrachte ARM sehr viel. Dieser Leistungsunterschied ist größer als der Preisunterschied von 46% zwischen A1 und M5. Mit anderen Worten, Instanzen auf x86-Prozessoren blieben immer noch kostengünstiger:
TestEC2 A1EC2 M5d.metalDer unterschied
Cache1280311311,58%
icache1820934368-47,02%
Matrix77932252190-69,10%
CPU933624077-61,22%
memcpy21085111877-81,15%
qsort522728-28,30%
dentry13896342770985-49,85%
Timer497012515367075-67,66%

Natürlich zeigen Mikrobenchmarks nicht immer ein objektives Bild. Der Unterschied in der tatsächlichen Anwendungsleistung ist wichtig. Aber hier war das Bild nicht besser. Scylla-Kollegen verglichen a1.metal- und m5.4xlarge-Instanzen mit der gleichen Anzahl von Prozessoren. Beim Standardtest zum Lesen einer NoSQL-Datenbank in einer Einzelknotenkonfiguration zeigten die ersten 102.000 Lesevorgänge pro Sekunde und die zweiten 610.000. In beiden Fällen werden alle verfügbaren Prozessoren zu 100% verwendet. Dies entspricht einem Produktivitätsrückgang von etwa dem Sechsfachen, der nicht durch einen niedrigeren Preis ausgeglichen wird.

Darüber hinaus werden A1-Instanzen wie in anderen Fällen nur auf EBS ohne Unterstützung für schnelle NVMe-Geräte ausgeführt.

Im Allgemeinen war A1 ein Schritt in eine neue Richtung, erfüllte jedoch nicht die Erwartungen von ARM.

ARMs zweites Kommen: EC2 M6-Instanzen




Diese Woche änderte sich alles, als AWS eine neue Klasse von ARM-Servern sowie eine Reihe von Instanzen auf den neuen Graviton2- Prozessoren vorstellte , darunter M6g und M6gd .

Ein Vergleich dieser Instanzen zeigt ein völlig anderes Bild. In einigen Tests ist die Leistung von ARM besser und manchmal sogar viel besser als bei x86.

Hier sind die Ergebnisse des gleichen Stresstest-Teams:
TestEC2 M6gEC2 M5d.metalDer unterschied
Cache218311-29,90%
icache458873436833,52%
Matrix45398225219080,02%
CPU1469424077-38,97%
memcpy13471111187720,53%
qsort94372829,53%
dentry3088242277098511,45%
Timer5551566315367075261,26%

Dies ist eine ganz andere Sache: M6g ist fünfmal schneller als A1, wenn es aus der Scylla NoSQL-Datenbank liest, und neuere M6gd-Instanzen führen schnelle NVMe-Laufwerke aus.

ARM-Offensive an allen Fronten


Der AWS Graviton2-Prozessor ist nur ein Beispiel für die Verwendung von ARM in Rechenzentren. Aber die Signale kommen aus verschiedenen Richtungen. Beispielsweise hat das US- amerikanische Start-up Nuvia am 15. November 2019 Risikokapital in Höhe von 53 Mio. USD eingeworben.

Das Startup wurde von drei führenden Ingenieuren gegründet, die an der Entwicklung von Prozessoren bei Apple und Google beteiligt waren. Sie versprechen, Prozessoren für Rechenzentren zu entwickeln, die mit Intel und AMD konkurrieren.

Nach vorliegenden Informationen hat Nuvia einen Prozessorkern von Grund auf neu entwickelt, der "auf" der ARM-Architektur aufgebaut werden kann, ohne jedoch eine ARM-Lizenz zu erhalten.

All dies zeigt, dass ARM-Prozessoren bereit sind, den Servermarkt zu erobern. Schließlich leben wir in der Post-PC-Ära. Die jährlichen X86-Lieferungen gingen gegenüber dem Höchststand 2011 um fast 10% zurück, während die RISC-Chips auf 20 Milliarden stiegen. Heutzutage sind 99% der 32- und 64-Bit-Prozessoren auf der Welt RISC.

Die Gewinner des Turing-Preises John Hennessey und David Patterson veröffentlichten im Februar 2019 einen Artikel mit dem Titel „Das neue goldene Zeitalter für Computerarchitektur“ . Folgendes schreiben sie:
Der Markt hat den Streit zwischen RISC und CISC beigelegt. Obwohl CISC die späteren Phasen der PC-Ära gewann, gewinnt RISC jetzt, da die Post-PC-Ära gekommen ist. Es gibt seit Jahrzehnten keine neuen ISAs bei CISC. Zu unserer Überraschung spricht der allgemeine Konsens über die besten ISA-Prinzipien für Universalprozessoren auch 35 Jahre nach seiner Erfindung für RISC ... In Open-Source-Ökosystemen werden gekonnt gestaltete Chips Leistungen überzeugend demonstrieren und damit die kommerzielle Implementierung beschleunigen. Die allgemeine Prozessorphilosophie in diesen Chips ist wahrscheinlich RISC, das sich im Laufe der Zeit bewährt hat. Erwarten Sie die gleiche rasante Innovation wie in der letzten Blütezeit, diesmal jedoch in Bezug auf Kosten, Energie und Sicherheit, nicht nur in Bezug auf die Leistung.

"In den nächsten zehn Jahren wird eine kambrische Explosion neuer Computerarchitekturen stattfinden, was für Computerarchitekten in Wissenschaft und Industrie aufregende Zeiten bedeutet", schließen sie am Ende des Artikels.

Source: https://habr.com/ru/post/de479074/


All Articles