في جهاز كمبيوتر صغير مثل Biostar Racing P1 ، يحسب كل ميغاهيرتز. ويفرض ذلك الاكتناز وانخفاض استهلاك الطاقة.
معالج Intel Atom x5-Z8350 موجود هنا. وليس عليك توقع سجلات أداء خاصة منه. خاصة ، بالنظر إلى أداء الكتابة الفاشل لذاكرة التخزين المؤقت على مستوى L1.
ومع ذلك ، فإن هذا المستهلك "لم يعد ثابتًا ، ولكن ليس أيضًا كمبيوتر محمول" سيظل يجد المستهلك. الضمان هو أربعة نوى من وحدة المعالجة المركزية التي تبدو بسيطة. هل يجب أن يكون لديهم أي آمال؟
في
مقال سابق ، قمنا بتحليل نتائج اختبارات ذاكرة التخزين المؤقت التي أجريت في خيط واحد ، والذي يعطي فكرة عن الأداء "المعزول" لنواة واحدة. ماذا سيكون التقييم المتكامل لمعالج متعدد النواة؟ لذا ، قم بتعيين خانة الاختيار
استخدام العمليات المتوازية في الأداة المساعدة NCRB وقم بإجراء سلسلة مماثلة من القياسات.
الشكل 1 .
تحديد سيناريو للاختبار متعدد الخيوط للنظام الأساسي باستخدام الأداة المساعدة NCRBاختبار ذاكرة التخزين المؤقت L1 متعددة مؤشرات الترابط
في معالج Intel Atom x5-Z8350 ، تعد ذاكرة التخزين المؤقت من المستوى الأول مصدرًا خاصًا لكل من النوى الأربعة. هذا يعني أنه عند معالجة كتلة البيانات التي يكون حجمها أصغر من الحجم L1 (في مثالنا ، 24 كيلوبايت) ، يستخدم كل قلب ذاكرة التخزين المؤقت الخاصة به ، لا توجد منافسة عمليًا عند الوصول ، مما يعني أنه يمكننا توقع زيادة متعددة في الأداء وفقًا للرقم النوى. تصف العبارة الشائعة "لن تقاتل" بدقة سيناريو القياس هذا.
الشكل 2 .
رسم بياني لسرعة قراءة كتلة البيانات مقابل حجمها لأربع نوى للمعالج تعمل في وقت واحد ؛ الحي X = الحجم L1قد تشمل الحجج المضادة عوامل مثل تقليل الحد الأعلى لرفع تردد التشغيل الديناميكي عند تنفيذ سيناريو معين لاستهلاك الطاقة والوضع الحراري ، بالإضافة إلى تحديد وقت المعالج المخصص من قبل نظام التشغيل للتطبيق في بيئة متعددة المهام.
تذكر أن أعلى أداء في اختبار أحادي الخيوط (انظر "
Biostar Racing P1: Cold Exhaust ") كان يزيد قليلاً عن 30 جيجابايت في الثانية. باستخدام 4 نوى ، نحصل على نتيجة حوالي 107 جيجابايت في الثانية ، وهي قريبة جدًا من القيمة النظرية لـ 120 جيجابايت في الثانية.
الشكل 3 .
رسم بياني لاعتماد سرعة الكتابة لكتلة بيانات على حجمها للعمل في وقت واحد 4 نوى معالج ؛ الحي X = الحجم L1عند فحص L1 ، يكون الجزء الأيسر من الرسم البياني المقابل لكتلة تصل إلى 24 كيلوبايت مهمًا. هنا نرى قسمين للأداء: القسم السريع للمعاملات الصغيرة (أكثر من 105 غيغابايت في الثانية) ، والقسم البطيء للبيانات الأكبر من 6.4 كيلوبايت ، ولكن لا يزال "مناسبًا" للعين الإبرية لذاكرة التخزين المؤقت L1. كل شيء واضح مع الأول: فهو ، كما هو الحال في اختبار القراءة ، قريب من القيمة الرباعية لنواة واحدة تبلغ 120 جيجابايت في الثانية. لماذا فشلت كتابة البيانات إلى L1 مرة أخرى؟ يمكن للمرء أن يخمن فقط حول هذا.
على الأرجح ، قام مهندسو Intel ، الذين قاموا بتصميم نسخة اقتصادية من المعالج ، بتحويل تركيز التخزين المؤقت للبيانات من L1 إلى L2. لا يزال التخزين المؤقت للتعليمات من المستوى 1 فعالًا ، ولا يزال Atom x5-Z8350 مناسبًا لذلك. في ظروف نقص الموارد ، ينفق المعالج بخيلًا متهورًا ذاكرة ثابتة لخدمة تدفقات البيانات ، معتمداً بشكل أكبر على قدرات مستوى ذاكرة التخزين المؤقت الثاني.
هذا هو المكان الذي يتبادر إلى الذهن النهج المقبول بشكل عام لبناء ملف تعريف تحميل لمعالجة
المعاملات في الوقت الفعلي . المعيار المقبول بشكل عام هو نسبة القراءة إلى الكتابة بنسبة 70٪ إلى 30٪. يرتبط هذا تقريبًا بالحجم المخصص للتسجيل "السريع" للمساحة المتبقية في ذاكرة التخزين المؤقت L1. هل من الممكن الافتراض على هذا الأساس أن Intel تستهدف معالجات Atom بشكل خاص لمعالجة تدفق المعلومات ، على سبيل المثال ، محتوى الوسائط؟
من الواضح أن تقييد المعالج في تسجيل التخزين المؤقت مفيد إذا لم يكن هناك إعادة وصول إلى المعلومات المسجلة حديثًا: التخزين المؤقت للبيانات "غير الضرورية" يسد الذاكرة ، مما يجبر البيانات "الضرورية" على الخروج منها. للوهلة الأولى ، الكتابة إلى الذاكرة التي يتم إجراؤها عند تفريغ محتويات الوسائط هي عملية غير مربحة للتخزين المؤقت. إذا رفضت التخزين المؤقت ، فسيخسر الوصول إلى البيانات المسجلة مسبقًا ، على العكس.
اختبار ذاكرة التخزين المؤقت L2 متعدد مؤشرات الترابط
يتم تقسيم ذاكرة التخزين المؤقت للمستوى الثاني ، بسعة إجمالية تبلغ 2 ميغابايت ، إلى جزأين متساويين من 1 ميغابايت ، كل منهما يخدم مجموعة من نواتين. هذا يعني أنه في اختبار متعدد الخيوط ، يحتوي كل قلب على 512 كيلوبايت من ذاكرة التخزين المؤقت L2 ، على عكس 1 ميجابايت في واحد مترابط. لذلك ، على الرسم البياني لاعتماد سرعة المعالجة للكتلة على حجمها ، يجب توقع نقطة الانعطاف بالقرب من X = 512 كيلوبايت ، وليس X = 1024 كيلوبايت ، كما كان الحال في اختبار الخيوط الفردية (انظر "
Biostar Racing P1: العادم البارد "). تؤثر السمات الطوبولوجية المدروسة لذاكرة التخزين المؤقت L2 أيضًا على توسيع سرعة الوصول إليها.
الشكل 4 .
رسم بياني لسرعة قراءة كتلة البيانات مقابل حجمها لأربع نوى للمعالج تعمل في وقت واحد ؛ الحي X = الحجم L2يميز Performance L2 جزء الرسم الذي يرضي عدم المساواة المزدوجة 24 كيلوبايت <X <512 كيلوبايت ، والذي يتوافق مع كتلة البيانات التي لم تعد مناسبة في L1 ولكنها لا تزال مناسبة في L2.
الشكل 5 .
رسم بياني لاعتماد سرعة الكتابة لكتلة بيانات على حجمها للعمل في وقت واحد 4 نوى معالج ؛ الحي X = الحجم L2تذكر أن سرعة قراءة L2 في اختبار أحادي الخيوط تبلغ حوالي 11.5 جيجابايت في الثانية. نتيجة التحجيم حوالي 39 GBPS. جميل جدا! تبلغ سرعة كتابة L2 أحادية الخيوط حوالي 12 جيجابايت في الثانية. نتيجة التحجيم حوالي 31 GBPS.
بدلا من السيرة الذاتية
يمكننا تحديد مستوى جيد من الأداء متعدد الخيوط للمنصة قيد الدراسة. كان من المتوقع أن تؤثر بنية معالج Intel Atom x5-Z8350 ، الذي يحدد ذاكرة التخزين المؤقت الخاصة L1 و L2 المشتركة جزئيًا ، على نتائج المعايير.
الشكل 6 .
مراقبة استخدام وحدة المعالجة المركزية باستخدام Windows 10: تتوافق اللحظة التي يزيد فيها حمل kernel إلى 100 بالمائة مع وقت تشغيل الاختبارعند تشغيل اختبار متعدد الخيوط ، يزداد تحميل كل من نوى المعالج الأربعة إلى 100 بالمائة. ماذا يحدث لدرجات الحرارة واستهلاك الطاقة؟
الشكل 7 .
مراقبة درجة الحرارة واستهلاك الطاقة باستخدام الأداة المساعدة AIDA64تم الحصول على النتيجة باستخدام أداة التشخيص والمعلومات AIDA64 الشائعة بعد 20 دقيقة تقريبًا من بدء اختبار NCRB متعدد مؤشرات الترابط.
تحذير هام
في محاولة لتكرار التجارب المذكورة أعلاه على جهاز الكمبيوتر الخاص بك ، تحتاج إلى نسخ احتياطي للبيانات ، والتأكد من كفاءة نظام تبريد المعالج ، وموثوقية إمدادات الطاقة وجهاز التحكم بالنبض Vcore. يمكن أن يتسبب اختبار الإجهاد في إتلاف نظام رفع تردد التشغيل أو عدم الاستقرار.
ومن الأفضل تجربة المعدات المملوكة للدولة.