نابولي إلى روما: وحدات AMD EPYC جديدة



في 7 أغسطس ، تم إطلاق خط AMD EPYC ™ من الجيل الثاني في جميع أنحاء العالم. تعتمد المعالجات الجديدة على الهندسة المعمارية Zen 2 وهي مبنية على عملية تبلغ 7 نانومتر.

ملامح



تقول الحكمة الشعبية "لقد استقبلوا بالملابس ، برفقة العقل". لذلك سوف نبدأ بـ "ملابس" الجيل الجديد. لقد خضع تعليم المعالجات لتغييرات بسيطة: الرقم الرابع الذي يشير إلى أن الجيل قد تغير من 1 إلى 2 . الشكل الأول ، كما كان من قبل ، يشير إلى السلسلة ، والثاني والثالث - النموذج. لم تتخلى AMD عن المعالجات باستخدام مؤشر P ، والتي لا تدعم العمل في الأنظمة متعددة المقابس.

لقد ورث الجيل الثاني مأخذ توصيل SP3 من الجيل الأول بدون تغييرات ، مما يسمح باستخدام معالجات جديدة دون تحديث اللوحة الأم ، لكن هذا لن يكون قادرًا على الكشف عن إمكاناتها بشكل كامل. يمكن تحقيق الأداء الكامل باستخدام اللوحات الأم الجديدة التي تدعم 3200 ميجاهرتز لذاكرة DDR4.

تم تحويل "ملء" المعالج إلى درجة لا يمكن التعرف عليها: لقد تغيرت العملية التكنولوجية ، وتم تطبيق الهيكل الجديد Zen 2 وظهرت وحدة تحكم جديدة في الذاكرة عالية السرعة.

إنتاجية


أدى الانتقال إلى عملية 7 نانومتر إلى انضغاط البلورة وزيادة في عدد النوى إلى 64 ، وهو ضعف هذا العدد في الجيل الأول. يتراوح التردد الأساسي لمعالجات الجيل الثاني بين 2.00 و 2.90 جيجاهيرتز . للمقارنة ، لم تتجاوز قاعدة الجيل الأول 2.30 جيجاهرتز . أدت الزيادة في عدد النوى والتردد الأساسي للمعالج إلى زيادة تبديد الحرارة يصل إلى 120 واط في إصدارات الميزانية وما يصل إلى 225 واط في الإصدارات العليا.

تحسين العملية ليست هي الابتكار الوحيد. ساهمت بنية مصغرة جديدة تسمى Zen 2 في تحسين مواصفات المعالج. تهدف التحسينات إلى التفاعل مع ذاكرات التخزين المؤقت: تضاعفت سرعة تبادل البيانات مع L1 ، وزادت سرعة نقل البيانات بين ذاكرات التخزين المؤقت ، وزاد حجم ذاكرة التخزين المؤقت L3.

وترد المواصفات التفصيلية للخط في الجدول.
نموذجTDP ، واتعدد النوىتردد القاعدة ، غيغاهرتزالتردد الأقصى ، غيغاهرتزحجم L3 ذاكرة التخزين المؤقت ، ميغابايت
7742225642.253.40256
7702 / 7702P200642.003.35256
7642225482.303.30256
7552200482.203.30192
7542225322.903.40128
7502 / 7502P180322.503.35128
7452155322.353.35128
7402 / 7402P180242.803.35128
7352155242.303.20128
7302 / 7302P155163.003.30128
7282120162.803.2064
7272120122.903.2064
726215583.203.40128
725212083.103.2064
7232P12083.103.2032
تتميز روما بتحسن في العمل مع الأجهزة الخارجية: لأول مرة ، أصبح من الممكن العمل مع وحدة تحكم مقاطعة x2APIC خارجية ، وأيضًا تدعم حارات DDR4-3200 و 128-PCIe . يتضمن الجيل الجديد من المعالجات دعمًا لتقنية IOMMU الافتراضية ، والتي تتيح للأجهزة الافتراضية الوصول المباشر إلى الأجهزة الطرفية المادية.

تؤدي زيادة السعة وتحسين شروط المحاكاة الافتراضية إلى زيادة عدد التطبيقات قيد التشغيل في وقت واحد. تعمل التطبيقات مع البيانات السرية التي تحتاج إلى حماية معززة.

سلامة


في خط المعالجات المحدّث ، لم تكن مشكلات الأمان هي آخر مكان. داخل النظام ، يتم تثبيت المعالج على شريحة تسمى AMD Secure Processor استنادًا إلى ARM® Cortex® A5 ، الذي يقوم بتخزين المفاتيح وتشفير محتويات ذاكرة الوصول العشوائي باستخدام خوارزمية AES-128 .

يوفر AMD Secure Processor نوعين من تشفير الذاكرة (تتطلب هذه الطرق دعم نظام التشغيل):

  • الشركات الصغيرة والمتوسطة (تأمين تشفير الذاكرة) ؛

    يقوم SME بتشفير الذاكرة بمفتاح واحد ويحمي من الهجمات المادية مثل هجوم الإقلاع البارد. لا يتطلب استخدام هذا النوع من التشفير تغيير تطبيقات المستخدم: يقوم نظام التشغيل بتمييز صفحات الذاكرة التي تحتاج إلى تشفيرها.
  • SEV (تأمين المحاكاة الافتراضية المشفرة).

    تم تصميم SEV لتوفير الأمان عند العمل مع الأجهزة الافتراضية (VMs). يتم تشفير الذاكرة التي يستخدمها المشرف وكل جهاز VM باستخدام المفتاح الخاص به. هذا النهج يعزل تشفير hypervisor و VM عن بعضها البعض.

خوادم الاختبار


الآن وقد أصبحت نظرية الجدة معروفة ، سنقوم بإجراء اختبارات عملية. ستكون AMD EPYC ™ 7452 ممثلة للجيل الثاني ، وتم اختيار AMD EPYC ™ 7551 ليكون الخصم من الجيل الأول ، أما الخصم من المعسكر "الأزرق" فهو Intel® Xeon® Gold 5218 كجزء من نظام ثنائي المقبس. هناك ما يبرر اختيار هذه الأنظمة من خلال تشابه خصائصها التقنية.
EPYC 7452EPYC 7551زيون 5218
عدد النوى323216
عدد المواضيع646432
تردد القاعدة ، غيغاهرتز2.352.002.30
التردد الأقصى ، غيغاهرتز3.703.003.90
TDP ، وات155180125
نوع ذاكرة الوصول العشوائيDDR4-3200DDR4-2666DDR4-2666
ذاكرة التخزين المؤقت L1 ، KB204830721024
ذاكرة التخزين المؤقت L2 ، KB163841638416384
ذاكرة التخزين المؤقت L3 ، ميغابايت1286422
في الاختبارات ، يتم وضع المعالجات على قدم المساواة: نفس الذاكرة ، ونفس محركات الأقراص ، وأنظمة التشغيل المتماثلة ذات الإعدادات المتماثلة.

لتحقيق أقصى قدر من الأداء ، يجب تمكين جميع قنوات وحدة تحكم ذاكرة المعالج. تحتوي معالجات Intel® على ست قنوات ، ومعالجات AMD بها ثماني قنوات. نظرًا لهذا الاختلاف ، يصعب إنشاء ظروف متطابقة ، لذلك تم التوصل إلى حل وسط: تحتوي الأنظمة التي تحتوي على معالجات AMD على 8 وحدات بسعة 16 جيجابايت لكل منها ، ونظام مزدوج المقبس مع Intel® Xeon® يحتوي على 12 وحدة بسعة 8 جيجابايت لكل منهما. جميع وحدات ذاكرة الوصول العشوائي تعمل على تردد 2666 ميغاهيرتز .

يتم استضافة نظام التشغيل (OS) على محركات أقراص الحالة الصلبة لتقليل تأثير النظام الفرعي للقرص على الاختبار. أجريت جميع الاختبارات على CentOS الإصدار 7.
EPYC 7452EPYC 7551زيون 5218
المعالجات1 × AMD EPYC 74521 × AMD EPYC 75512 × إنتل زيون 5218
ذاكرة الوصول العشوائي8 × 16 جيجابايت DDR4-26668 × 16 جيجابايت DDR4-266612 × 8 جيجابايت DDR4-2666
أقراص1 × سامسونج SSD 850 EVO 250GB1 × إنتل SSD S4510 480 جيجابايت1 × إنتل SSD S4510 480 جيجابايت

اختبارات


يجب أن يكون الاختبار موضوعيًا قدر الإمكان ، خاصة وأننا نتحدث عن مقارنة معالجات Intel® و AMD. لذلك ، لن نستخدم برنامج التحويل البرمجي الأمثل لإنشاء الاختبارات التي يتم توفيرها كرموز مصدر.

GeekBench 4


GeekBench هو اختبار أداء المعالج عبر منصة شعبية مع قاعدة البيانات الخاصة به على الإنترنت من النتائج. يتم تسليم الاختبار في شكل ملفات قابلة للتنفيذ جاهزة ، وهذا هو السبب في عدم توفير التحسين لمعالجات محددة.

بالنسبة لنا ، تعد المقاييس العامة لمجموعات GeekBench مهمة:

  • تشفير النتيجة.
  • عدد صحيح
  • نقاط الفاصلة العائمة
  • درجة الذاكرة.

يتم إطلاق مجموعات الاختبارات المشار إليها في وضعين: في خيط واحد وعند تنفيذها في وقت واحد على جميع النوى. بناءً على النتائج ، تضع GeekBench التصنيفات النهائية: نقاط أحادية النواة ونقاط متعددة النوى .


المعركة الرئيسية بين AMD EPYC ™ 7452 و Intel® Xeon® Gold 5218 ، في حين أن الجيل الأول من EPYC ™ أدنى من الثاني في جميع الاختبارات.

النظر في الاختبارات مترابطة واحدة. تظهر روما نتائج ممتازة عند العمل مع مهام التشفير والذاكرة ، ولكنها تفقد عند إجراء حسابات عدد صحيح. نتيجة لذلك ، حقق الجيل الثاني من EPYC ™ 4893 نقطة ويصبح الفائز في ترشيح Single-Core . يشغل Xeon و EPYC المركزين الثاني والثالث من الجيل الأول برصيد 4695 و 3981 نقطة على التوالي.


في الاختبارات متعددة الخيوط ، يتغير ميزان الطاقة بشكل كبير. يقوم EPYC ™ 7452 بعمل رائع في مجال الحوسبة ، لكنه يفقد مهامه في مهام التشفير ويعمل مع الذاكرة ، مما لا يمنعه من أن يصبح رائدًا برصيد 96009 نقطة في ترشيح Multi-Core .

SPEC وحدة المعالجة المركزية 2017


SPEC CPU 2017 هي مجموعة من اختبارات الأداء المعترف بها من قبل الشركات المصنعة للمعالجات. يتم توزيع اختبارات هذه المجموعة في شكل أكواد مصدر ، مما يسمح لك بتحسينها لمعدات معينة على نظام تشغيل معين.

يتكون SPEC CPU من أربعة أجنحة اختبار:

  • int_rate.
  • int_speed.
  • fp_rate.
  • fp_speed.

يحدد الجزء الأول من اسم الاختبار نوع الحساب على المعالج: أعداد صحيحة (int) أو أعلى من أرقام الفاصلة العائمة (fp). يحدد الجزء الثاني نوع الاختبار: أحادي النواة (معدل) أو متعدد النواة (السرعة).

أجرينا جميع أجنحة الاختبار الأربعة. يتم تجميع الاختبارات في المستوى الثالث من التحسينات باستخدام مجموعة المترجم GNU 4.8.5 . امتدت الاختبارات متعددة النوى في 64 سلسلة ، والاختبارات أحادية النواة شملت 32 نسخة.


تُظهر الاختبارات المترجمة مع التحسينات نتائج غير متسقة مع GeekBench. يتفوق الجيل الثاني من AMD EPYC ™ على نظام ثنائي المقبس مع معالجات Intel® في جميع الاختبارات باستثناء السرعة ، ولكن بهامش أصغر بكثير من GeekBench.

جناح اختبار Phoronix


Phoronix Test Suite (PTS) - برنامج يتيح لك تشغيل الاختبارات من قاعدة بيانات كبيرة لاختبارات أداء المستخدم. يتيح لك هذا الحل تشغيل الاختبارات المطلوبة تلقائيًا على عدة خوادم تجريبية في وقت واحد مع تجميع النتائج على الخادم الرئيسي.

قمنا بتطوير مجموعتنا الخاصة من 21 اختبارًا ، بما في ذلك:

  • اختبار عرض النطاق الترددي المؤقت (CacheBench) ؛
  • اختبار عرض النطاق الترددي لذاكرة الوصول العشوائي (RAMspeed ، Stream ، MBW) ؛
  • حل مهام التشفير (Botan ، OpenSSL ، John the Ripper) ؛
  • تقديم الصورة باستخدام تتبع الأشعة (C-Ray ، POV-Ray ، Smallpt) ؛
  • مضاهاة خادم NGINX تحت الحمل ؛
  • تحويل الصوت / الفيديو.
EPYC 7452EPYC 75512 × زيون 5218
RAMPeed SMP - النوع: إضافة - المعيار: عدد صحيح32476.926531.4928942.2
RAMPeed SMP - النوع: نسخة - المعيار: عدد صحيح30325.7623419.8627165.75
RAMPeed SMP - النوع: مقياس - المعيار: عدد صحيح30429.7622011.0828629.12
RAMPeed SMP - النوع: Triad - المعيار: عدد صحيح31482.618208.5828299.14
RAMPeed SMP - النوع: متوسط ​​- المعيار: عدد صحيح31060.831745.7128432.31
RAMPeed SMP - النوع: إضافة - المعيار: Floating Point32434.2637939.528445.26
RAMPeed SMP - النوع: نسخ - المعيار: Floating Point30386.9935209.9727119.9
RAMPeed SMP - النوع: مقياس - المعيار: النقطة العائمة30097.1130509.0526508.4
RAMPeed SMP - النوع: Triad - المعيار: Floating Point32473.0438458.628385.89
RAMPeed SMP - النوع: متوسط ​​- المعيار: النقطة العائمة31295.534393.327637.44
تيار - النوع: نسخة107،192.8110،996.94126،257.4
دفق - النوع: مقياس72434.4287300.88105،633.7
تيار - النوع: ثالوث77729.7297735.96115،100.86
تيار - النوع: إضافة77021.1697204.36114،907.6
MBW - اختبار: نسخة الذاكرة - حجم المصفوفة: 8192 MiB16888.5212402.324845.29
MBW - اختبار: نسخة الذاكرة ، حجم الكتلة الثابتة - حجم المصفوفة: 8192 ميجابايت10752.127410.172982.56
CacheBench - اختبار: قراءة2312.412079.623286.28
CacheBench - اختبار: الكتابة24357.420329.2127520.75
CacheBench - اختبار: قراءة / تعديل / الكتابة24920.321598.9828966.95
GNU MPC - المعيار متعدد الدقة714358108950
NAMD - محاكاة ATPase - 327،506 ذرات0.800790.941190.77091
Botan - اختبار: KASUMI - تشفير69.6961.7478.69
Botan - اختبار: KASUMI - فك تشفير67.1658.5774.85
Botan - اختبار: AES-256 - تشفير4575.944173.763687.71
Botan - اختبار: AES-256 - فك تشفير4552.924152.073704.3
Botan - اختبار: Twofish - تشفير279.59247.38325.1
Botan - اختبار: Twofish - فك تشفير281.87249.85333.97
Botan - اختبار: السمكة المنتفخة - تشفير247.76217.14282.4
Botan - اختبار: السمكة المنتفخة - فك تشفير249.19217.89283.61
Botan - اختبار: CAST-256 - تشفير116،150101،470124،690
Botan - اختبار: CAST-256 - فك تشفير116.68101،95125.75
جون الخارق - اختبار: السمكة المنتفخة498514056839555
ضغط 7-Zip - اختبار سرعة الضغط163202107009135458
C-Ray - الوقت الإجمالي - 4K ، 16 أشعة لكل بكسل23.4126.6529،48
بوف راي - تتبع الوقت18.6723.320.46
سمبت - عارض الإضاءة العالمي ؛ 128 عينة15.065.5258.97
dav1d - إدخال الفيديو: Summer Nature 4K17.6728.3720.98
FLAC ترميز الصوت - WAV إلى FLAC12.2214.1711.43
FFmpeg - H.264 HD إلى NTSC DV9.1410.8511.46
Hackbench - عدد: 1 - النوع: الموضوع3.95.823.35
Hackbench - عدد: 8 - النوع: الموضوع10.918،118.73
Hackbench - عدد: 1 - النوع: عملية3.785.433.15
Hackbench - عدد: 8 - النوع: عملية9.6613.318.14
Hackbench - عدد: 32 - النوع: عملية39.0232.2527.74
OpenSSL - RSA 4096-bit Performance6825.94351.476809.23
ctx_clock - وقت تبديل السياق211220160
NGINX المعيار - ثابت صفحة الويب التي تخدم26991.7917497.0228274.97
Schbench - المواضيع الرسالة: 2 - العمال في كل رسالة الموضوع: 242204101
Schbench - رسالة المواضيع: 8 - العمال في كل رسالة الموضوع: 8462447047009
Schbench - عدد الرسائل: 32 - عدد العمال لكل رسالة: 32156416157952167509
Radiance Benchmark - Test: Serial807.01783.481102.24
Radiance Benchmark - Test: SMP Parallel260.47238.69333.32
لأول مرة في الاختبارات ، يأتي AMD EPYC ™ 7551 في المرتبة الأولى. تعد معالجات AMD ، بصرف النظر عن الجيل ، أفضل في العمل المفرد مع الذاكرة والتجسيد وترميز الفيديو. تعمل معالجات Intel® ، بدورها ، بشكل أفضل مع مهام التشفير والعمل متعدد الخيوط مع الذاكرة ، كما تم الكشف عنه سابقًا في اختبارات GeekBench.

النتائج


على الرغم من تنوع الاختبارات ، فإن الاختيار بين الجيل الأول والثاني من AMD EPYC ™ واضح: روما تفوق على سابقتها في الغالبية العظمى من الاختبارات. ومع ذلك ، فإن الجيل الأول لا يفقد الأرض في العمل مع الذاكرة والتقديم.

مقارنة معالجات Intel® و AMD - معركة حقيقية من العمالقة ، تتطلب دراسة تفصيلية. تعمل حلول البرامج المثبتة بشكل أفضل في المتوسط ​​مع الجيل الثاني من AMD EPYC ™. على وجه الخصوص ، تُظهر روما نتائج ممتازة في مهام الحوسبة متعددة الخيوط والتشفير المفرد. عند العمل مع برنامج يتم تجميعه من الكود المصدري ، يتم إعطاء الأفضلية للجيل الجديد من معالجات EPYC ™ ، والتي تؤدي إلى اختبارات الفاصلة العائمة والتي تتخلف قليلاً في حسابات الأعداد الصحيحة متعددة الخيوط.

يُظهر Intel® Xeon® Gold ، بدوره ، نتائج جيدة في تشفير متعدد الخيوط ، وترميز الصوت ومعالجة الذاكرة. كان أداء النظام ثنائي المقبس مع معالجات Intel® Xeon® جيدًا عند معالجة طلبات خادم الويب.

في الخلاصة ، تجدر الإشارة إلى أن الاختبارات التي أجريت هي الاصطناعية وأن النتائج في المهام الحقيقية قد تختلف. للحصول على نتائج دقيقة بشأن مهام محددة ، يلزم إجراء اختبار إضافي. الآن فقط بضع كلمات حول التكلفة. السعر الموصى به لـ AMD EPYC® 7452 هو 2025 دولارًا ، و Intel® Xeon® Gold 5218 - 1250 دولارًا ، أي 2500 دولارًا لنظام ثنائي المقبس.
سيتوفر AMD EPYC ™ 7452 الجديد قريبًا في Selectel Lab.

كن أول من يعرف!

الجيل الثاني من EPYC ™ هو مجرد جولة أخرى في المواجهة بين AMD و Intel. يمكنك قراءة المزيد حول كيفية بدء التنافس بين الشركتين في مدونتنا .
UPD. معالجات الجيل الثاني الجديدة من AMD EPYC متاحة بالفعل.

قم ببناء خادم AMD EPYC ™ Rome 7402P الخاص بك باستخدام أداة التهيئة ، أو اترك طلبًا للاختبار في مختبر Selectel LAB.

التكوينات التالية متاحة للاختبار:

  • AMD EPYC ™ 7402P / 128 GB DDR4 / 2 × 1920 GB SSD + 2 × 8 TB HDD
  • 1 × AMD EPYC ™ 7552/512 GB DDR4 / 2 × 1940 GB SSD + 2 × 8 TB HDD

Source: https://habr.com/ru/post/ar463401/


All Articles