تعدد البلورات: من التاريخ إلى المضاربة حول المستقبل



MCM: تخطيط متعدد الشرائح


تشتهر الإلكترونيات الدقيقة بعدد كبير من الحلول الهندسية الأصلية والغريبة والفعالة. واحد منهم هو ترتيب متعدد الرقائق ، والذي يوجد بطريقة أو بأخرى في كل مكان تقريبًا - من محطات العمل عالية الأداء إلى أجهزة الكمبيوتر المحمولة فائقة الحمل ، من أجهزة الكمبيوتر ذات اللوحة الفردية مقابل 10 دولارات إلى أجهزة الكمبيوتر المركزية من IBM.

يتحدث هذا المنشور عن تاريخ استخدامه فيما يتعلق بالمعالجات ذات الأغراض العامة.

أحذر مقدمًا: أنا لا أدعي أن لدي معرفة مطلقة وعرضًا أكاديميًا ، فأنا غالبًا ما أحكي عما صادفته وعملت وحبسته في يدي.
تحذير حركة المرور! تحت قطع الكثير من الصور!

ما هذا


MCM (وحدة متعددة الرقائق ، وحدة متعددة الرقائق) أو MCP (حزمة متعددة الرقائق ، تكوين متعدد الرقائق) هو حل هندسي لتقسيم وظائف الدائرة المصغرة إلى عدة شرائح مدمجة في مبيت واحد. وهو يختلف عن الوحدات الموجودة في أن الدوائر المصغرة عادة ما تكون "عارية" ، بدون مركب ، ويتم لحامها مباشرة عن طريق البلورات إلى اللوحة. يتم استخدامه لزيادة إنتاج رقائق مناسبة (تقليل حجم بلورة واحدة) ، اتصال مضغوط من البلورات المصنوعة وفقًا للعمليات والتقنيات التكنولوجية المختلفة.

حسنًا ، لنبدأ؟


1995: عندما لا تتناسب ذاكرة التخزين المؤقت مع أي بوابات

(المعروف أيضًا باسم Pentium Pro)


مخبأ - نخر ، الأبعاد وسريعة. من هنا تنشأ مشكلتان: مع زيادة سرعة عمله ، يصبح إنتاج الباص الخاص به عنق زجاجة ، ويبدأ في تدفئة نفسه. نحن بحاجة إلى إصلاحه بطريقة أو بأخرى. الطريقة الأكثر منطقية هي نقل L2 إلى المعالج ، حيث كان L1 يرعى لفترة طويلة. ولكن هناك مشكلة ، وليست واحدة: مع زيادة حجم البلورة ، فإن النسبة المئوية للرقاقة ترفض الزيادات ، وتقريبًا بشكل كبير. ماذا تفعل بالطبع ، اجعل ذاكرة التخزين المؤقت شريحة منفصلة ، ولكنها أقرب إلى الشريحة الرئيسية. نتيجة لذلك ، يمكننا الإعجاب بهذا الطوب:



الحل جيد ، لكنه معقد بشكل جيد في العبوة.

1997: الظهور الآن ، ولكن ليس كما هو

(المعروف أيضًا باسم Pentium II)


علبة خزفية كبيرة ، بالطبع ، جيدة ، ولكنها مكلفة. حاول إعادة تشغيل؟ ولما لا. المهمة هي جعلها أرخص ، وهذا كل شيء. إن نقل ذاكرة التخزين المؤقت مرة أخرى إلى اللوحة ليس خيارًا - سيكون خطوة إلى الوراء. كما زاد عرض ذاكرة التخزين المؤقت ... هل يمكن أن يجمع كل شيء مع التبريد في وحدة واحدة؟ حتى ولد بنتيوم الثاني:



لا يمكنك بالطبع التفكير في هذا "إدارة العملاء المتعددين" (MCM) ، ولكن بما أنني تذكرت ذلك ، فسيكون هنا.

(بالمناسبة ، بدون هذا العجوز الدائم والخلود ، لم يكن خادمك المتواضع يكتب هذه المقالة - PII-400 ، التي كانت تعمل لي كبوابة وموجه WiFi لسنوات عديدة ، بعد أن تجاوزت العديد من أحفادها)

2005: D - تعني القاع المزدوج

(الملقب بنتيوم D)


عندما تكون الخطة "جوهر واحد ، ولكن للحد من!" بدأ يتصدع بشكل كبير في اللحامات ، وكان المنافسون ، يضحكون ، على وشك إطلاق معالجات ثنائية النواة على رقاقة واحدة ، وكان عليهم القيام بشيء ما ، وبسرعة. لذلك ظهرت هذه النزعة اللاذعة ، التي سدوا بها فجوة في السوق ، في حين ألقيت القوى الرئيسية على العمارة الأساسية الواعدة. ربما كان السبب الرئيسي لاستخدام هذا الحل هو على وجه التحديد تقليل وقت التطوير - لم يكن حجم البلورات كبيرًا إلى حد أن مضاعفته تسبب في مشاكل. حسنًا ، حدث ما يلي:



كانت هناك معالجات Xeon مماثلة لقطاع الخادم ، لكن لا يمكنني أن أقول الكثير عنها.

2007: لم لا؟

(المعروف أيضًا باسم Core 2 Quad)


بما أننا أتقننا بلورات ثنائية النواة في عام 2006 ، فلماذا الإجهاد؟ نستخدم حلًا تم اختباره بمرور الوقت - ألصق بلورتين في حالة واحدة ولا توجد مشاكل! لا يوجد شيء للحديث عنه ، فالصورة لم تتغير كثيراً:



زيون في تلك الحقبة كان كذلك ، باستثناء النموذج سداسي النوى - هناك بلورة كبيرة واحدة.

2010: قبل وصول الرمال

(الملقب بالجيل الأول Core i3 / 5/7)


في الجيل الأول من معالجات Core i ثنائية النواة ، قرروا تشغيل عملية 32 نانومتر ، والقيام بشيء مضحك إلى حد ما - في عملية 45 نانومتر التي تم اختبارها وقتًا ، قاموا بعمل وحدة أساسية للفيديو ووحدة تحكم في الذاكرة ، وتم وضع زوجين من النوى مع ذاكرة تخزين مؤقت على بلورة منفصلة 32 نانومتر. بينما استخدم نظرائهم الأكبر سنًا رباعية النوى عملية 45 نانومتر! أحجام البلورات مسلية أيضًا:



(ومع ذلك ، فإن قلب الفيديو من المعالجات ثنائية النواة ، والآن في كثير من الأحيان أكثر من كل من النوى مجتمعة)

2011: جرافة واحدة جيدة واثنتان أفضل

(المعروف أيضًا باسم Opteron 6000)


البلورة كبيرة جدًا بالفعل ، يتم تعديل تقنية إنتاجها ، ما هي المشاكل في الواقع؟ NUMA؟ لكننا نقوم بالفعل بهذه المعالجات للخوادم ، وتلك متعددة المقابس. نظرًا لعدم وجود مشاكل ، نقوم بجمع بلورتين تحت غطاء واحد:



(نعم ، ومن ثم يستمتع الناس - المعالج واحد ، وعقد NUMA اثنان)

2013: باترسكوتش لكنه غير صالح للأكل

(تعرف أيضًا باسم ذاكرة التخزين المؤقت لوحدة معالجة الرسومات / وحدة معالجة الرسومات eDRAM L4)


من جيل Haswell ، تأتي المعالجات المجهزة برسوم مدمجة Iris Pro / Iris Plus (وفي جيل Skylake - تلك التي تحتوي على Iris العادية) في نفس الحزمة مع شريحة ذاكرة 64 / 128MB تعمل مثل ذاكرة التخزين المؤقت L4 وترفع بشكل خطير أداء الرسومات المدمجة. والشريحة ليست صغيرة (على الرغم من أن الذاكرة تشغل دائمًا مساحة كبيرة):



2017: عام عندما انتل بركس

(الملقب Ryzen Threadripper & EPYC)


لعب مهندسو AMD مع Infinity Fabric ، ولعبوا ... وبعد ذلك - عفوًا! أربع بلورات تحت غطاء واحد متصل بواسطة IF لكل منها (في حالة EPYC من جانب الخادم) أو زوج من بعضها البعض (Threadripper مع بلورتين نشطتين). كل شيء على ما يرام ، مشكلة واحدة فقط هي NUMA (ما يصل إلى 4 عقد لكل معالج!) ، ولكنها مشكلة حصريًا للبرامج التي لا تتكيف معها. لذلك خرجت بشكل جيد للغاية:



2018: مضاعفة الرقم - ضعف المتعة

(المعروف أيضًا باسم Zen 2 و Cascade Lake AP)


لذلك وصلنا إلى الأحداث الجارية. في 5 نوفمبر ، أعلنت إنتل بسرعة عن معالجات ثنائية النوى ذات 48 نواة (لم يكن لديهم حتى وقت لالتقاط الصور) ، وفي 6 نوفمبر ، عرضت AMD EPYCs جديدة في حدث Next Horizon. سيتم استبدال ألف كلمة بصورة:



تسعة بلورات. تسعة اللعنة! أسباب هذا القرار واضحة بالنسبة لي ، وهي بسيطة للغاية: من أجل زيادة إنتاج رقائق كاملة ، وخفض التكلفة الإجمالية للمعالج وتسريع التطوير. 7 نانومتر لا يزال عملية خام. إنتل ، مع 10 نانومتر (+ - يساوي عملية TSMC 7 نانومتر) بالفعل من هذه أشعل النار. لدرجة أننا ما زلنا نرى 10 معالجات نانومتر تعيش فقط على شكل نموذج واحد من كعب الكمبيوتر المحمول i3.

يتم تصنيع البلورة المركزية على عملية 14 نانومتر مثبتة وتعمل كوحدة تحكم في الذاكرة وجميع المدخلات / المخرجات باستثناء PCIe 4.0 ، حيث يتم توفير 16 سطرًا من كل بلورات الأقمار الصناعية مع ثمانية نوى على كل منها.

توفر وحدة تحكم مشتركة للذاكرة الشيء الرئيسي - الوصول الموحد للذاكرة (UMA). ولن يكون لزومًا أبدًا.

زمن المضاربة


يتم توصيل البلورة المركزية بالأقمار الصناعية باستخدام Infinity Fabric ، والتي توفر بدورها عددًا كبيرًا من الاحتمالات لاستخدام المكونات معًا وبشكل منفصل. هل تحتاج إلى معالج سطح مكتب 16 نواة؟ نحن نشهد بلورة تحتوي على وحدة تحكم في الذاكرة ثنائية القناة ومتصلة بمجمعين نوويين تحت غطاء واحد. هل تحتاج إلى معالج برسومات مدمجة؟ نطرح مجمعًا نوويًا واحدًا ، بدلاً من ذلك نضع رقاقة GPU. ستنخفض تكلفة توسيع نطاق المعالجات بترتيب الحجم. إن تقليل حجم البلورات الفردية يقلل من نسبة الرفض ، وهذا بدوره له تأثير إيجابي على التكلفة.

Moar المهوس الإباحية


شيء لم أكتب عنه ، ولكن جدير بالذكر:

عبر Nano QuadCore ، نسيت ذلك تمامًا. لم يكن لي عمل معها ؛ لم يكن هناك ما أقوله.


وحدة المعالجة المركزية IBM 9121/311


قوة اي بي ام 5


والمزيد من القوة الجديدة 7


متحكم GD32 ، رقاقة ذاكرة فلاش في الأعلى. صورة من صديق BarsMonster

Source: https://habr.com/ru/post/ar429166/


All Articles