X86-Hochleistungsrechner für das Zeitalter der Präsenztechnologie
Suche, maschinelles Lernen, Datenanalyse, Erstellung und Bereitstellung von Inhalten, erweiterte und virtuelle Realität, Computerspiele - die Liste der ressourcenintensiven Aufgaben für Computersysteme wird täglich erweitert. Wenn wir über die technologische Seite des Problems sprechen, diskutieren wir zwei Themen.
Das erste ist die ständig wachsende Notwendigkeit, die Rechenleistung zu steigern. Was auch immer die Halbleiterindustrie bietet, Endbenutzer stellen sich schnell auf neue Produkte ein und fordern erneut mehr.Das zweite sind natürlich Marktveränderungen. Ich arbeite seit über 30 Jahren auf diesem Gebiet und in der letzten Zeit hat sich eine Vielzahl von Veränderungen ergeben. Schauen wir uns nur ein Beispiel an: Das Aufkommen des World Wide Web und eine grafische Benutzeroberfläche verwandelten PCs von einem Textverarbeitungswerkzeug in ein echtes Portal für den Zugang zur ganzen Welt, das das Leben der Menschen radikal veränderte. Infolgedessen konnten wir Informationen mit einer solchen Leichtigkeit finden und teilen, die zuvor unzugänglich schien. Außerdem wurden die Geräte tragbar und erhielten eine dauerhafte Verbindung zum Netzwerk - zuerst waren es Laptops, dann Smartphones und Tablets. Bald gab es eine echte Explosion in der Popularität von Anwendungen, und die riesige Datenmenge, die gespeichert, verarbeitet und analysiert werden musste, erforderte noch mehr Rechenleistung.Vor vier Jahren begann AMD mit der Renovierung seiner Hochleistungs-x86-Kernarchitektur, um diesen wachsenden Anforderungen gerecht zu werden. Unsere frühere Prozessorfamilie hat auf dem Gebiet der Energieeffizienz erhebliche Erfolge erzielt, aber diese Chips waren nicht bereit, das erforderliche Niveau für die Unterstützung anspruchsvoller Leistungsanwendungen bereitzustellen. Basierend auf dieser Aufgabe haben wir ein Kernel-Design mit dem Codenamen „Zen“ buchstäblich von Grund auf neu erstellt.
Bei der Entwicklung von Zen wollten wir in jeder Hinsicht einen neuen und modernen Kern entwickeln. Die Architektur wurde optimiert, um eine höhere Leistung, einen höheren Durchsatz und eine höhere Energieeffizienz zu erzielen, damit Prozessoren die anspruchsvollsten Anwendungen bewältigen können. Infolgedessen erwies sich Zen als eine viel produktivere Lösung, die die Rückkehr von AMD auf den Markt für Hochleistungssysteme kennzeichnete und die Ausführung von 40% mehr Anweisungen pro Zyklus zeigte, ohne den Energieverbrauch zu erhöhen 1. Dieses ehrgeizige Ziel haben wir durch eine gezielte Betonung von Leistung und Energieverbrauch erreicht. Die neu entwickelte Mikroarchitektur umfasst wesentliche Änderungen im Bereich der Befehlsverarbeitung, der Betriebsschemata von Exekutivmodulen und des Cache-Subsystems, um die Ausführung von Aufgaben und deren parallele Arbeit zu beschleunigen. Wie wir auf der Hot Chips Conference der Stanford University 2016 gezeigt habenZen bietet eine verbesserte Verzweigungsvorhersage, wählt die richtigen Anweisungen aus und arbeitet mit dem Micro-Op-Cache zusammen, um diese Anweisungen besser zu befolgen. Außerdem unterstützt die neue Architektur eine um 75% größere Planungstiefe, erhöht die Anzahl der Befehle und führt dank einer um 50% größeren Befehlsbreite im Vergleich zur vorherigen Generation von Kernen mehr Befehle parallel aus. Diese Kombination bietet eine enorme Steigerung der Verarbeitungsleistung pro Zyklus.Aber wenn Sie einen leistungsstarken Motor haben, müssen Sie ihn tanken. Wir nennen diesen Prozess bedingt „Füttere das Biest“. In unserem Fall handelt es sich bei Kraftstoff um Daten und Anweisungen, die aus dem Speicher empfangen werden. Wir haben die Cache-Hierarchie neu gestaltet und dem Chip einen 8-MB-L3-Cache, einen gemeinsam genutzten L2-Cache für Anweisungen und Daten sowie separate Cache-Volumes mit geringer Latenz für Befehle und Daten bereitgestellt. Ein einzelner Kern kann jetzt fünfmal schneller mit dem Cache arbeiten als in der vorherigen Architektur.
Der Zen Kernel Pre-Fetcher spielt eine entscheidende Rolle bei der Bandbreite und verkörpert einen der anspruchsvollsten Workflows für Prozessoren. Pre-Fetcher übernimmt und bestimmt anhand der Daten zur aktuellen Aufgabe, welche Anweisung in der nächsten Maßnahme benötigt wird. Wie gut Sie Ihren Plan umsetzen und wie schnell Sie Fehler korrigieren können, ist nicht nur eine Frage der Wissenschaft, sondern auch der Kunst. Im Fall von Zen haben wir in dieser Hinsicht beeindruckende Ergebnisse erzielt.Der signifikante Anstieg der Bandbreite in Zen im Vergleich zur vorherigen Prozessorgeneration ist auf den Übergang zu einer SMT-Architektur (Parallel Multithreading) zurückzuführen. Dieser Ansatz ermöglicht es dem Kernel, Aufgaben innerhalb des Programms zu verfolgen. Wenn die Aufgabe angehalten wird und auf die Ausführung eines anderen Befehls oder den Empfang von Daten gewartet wird, wird eine andere Aufgabe zur Verarbeitung verwendet, die sich nicht im Standby-Modus befindet. Aus Sicht der Software erhalten wir daher zusätzliche Prozessorressourcen, wenn der SMT-Modus aktiviert ist.Schließlich zur Verbesserung der Energieeffizienz. Die Zen-CPU wurde für den Einsatz in einer Vielzahl von Geräten entwickelt, von passiv gekühlten Laptops bis hin zu Supercomputern. Alle erfordern eine hohe Energieeffizienz. In einer Welt, in der eine Steigerung der Produktivität um 10% als signifikant angesehen wird, schien unser Ziel einer Steigerung der Produktivität um 40% ohne zusätzliche Leistungssteigerung auf den ersten Blick unmöglich. Die AMD-Ingenieure konzentrierten sich jedoch auf die Aufgabe und fanden neue Wege, um den Stromverbrauch zu senken und die Mikroarchitektur zu optimieren. Außerdem wandten sie ein fortschrittlicheres Taktfrequenzregelungsschema an.Der Wunsch, die Energieeffizienz zu verbessern, war von Anfang an in das Produkt integriert: Bei der Erstellung eines neuen Designs versuchten die Ingenieure, jedes Mikrowatt einzusparen, und jeder Stromkreis wurde hinsichtlich der Leistung optimiert. Selbst wenn ein kleiner Teil des Prozessors nicht aktiv arbeitet, wird er vollständig ausgeschaltet, um einen übermäßigen Stromverbrauch zu vermeiden. Wenn Sie jedoch die Taktfrequenz beschleunigen und die Last erhöhen, zeigt der Prozessor eine sehr hohe Leistung pro Watt. Darüber hinaus wird Zen mit der neuen 14-nm-FinFET-Prozesstechnologie hergestellt. FinFET-Transistoren sind kleiner, wirtschaftlicher und effizienter als Gegenstücke der vorherigen Generation. Diese erfolgreiche Lösung unseres Industriepartners ermöglichte es uns, maximale Wirkung bei der Implementierung der neuen Mikroarchitektur von Rechenkernen zu erzielen.Mit den Möglichkeiten zur Modifizierung von FinFET-Transistoren können Sie eine breite Palette von Lösungen erstellen: von geringem Stromverbrauch bei geringem Verbrauch bis zu Chips für große Lasten mit höherer Frequenz und Leistung.Welche Ergebnisse all diese Innovationen letztendlich bringen werden, wird im nächsten Jahr klar, wenn die ersten Produkte mit Prozessoren auf Basis von Zen-Kernen auf den Markt kommen. Heute können wir jedoch sagen, dass uns Labortests beeindrucken. Wir haben kürzlich den Summit Ridge 8-Core / 16-Thread-Desktop-Prozessor und den 32-Core / 64-Thread-Server-Prozessor von Naples demonstriert. Beide Prozessoren mit Zen-Kernen lassen uns sehr optimistisch in die Zukunft blicken. Es ist auch wichtig zu verstehen, dass Zen nur ein Zwischenschritt in Richtung der Zukunft des AMD x86-Hochleistungscomputers ist. Unser Entwicklungsplan umfasst nachfolgende Generationen von Chips mit zusätzlichen Verbesserungen, und unsere Teams arbeiten bereits heute an neuen Projekten.weil ständige Veränderungen und ein Aufwärtstrend der Produktivität weiterhin das Tempo der Branchenentwicklung bestimmen., - AMD
Zen x86 «Excavator» x86. Source: https://habr.com/ru/post/de399941/
All Articles