تغييرات كبيرة في الرقائق الرائدة

يتيح لك إدخال الذكاء الاصطناعي على مستوى الشريحة معالجة المزيد من البيانات محليًا ، لأن زيادة عدد الأجهزة لم تعد تعطي نفس التأثير


يعمل مصنعو الرقائق على معماريات جديدة تزيد بشكل كبير من كمية البيانات المعالجة لكل واط ودورة. تم تعيين الأرض لواحدة من أكبر الثورات في هندسة الرقائق في العقود الأخيرة.

جميع الشركات المصنعة الرئيسية للرقائق والأنظمة تغير اتجاه التنمية. لقد دخلوا في سباق البُنى المعمارية ، الذي يوفر نقلة نوعية في كل شيء: من أساليب القراءة والكتابة إلى الذاكرة ، إلى معالجتها ، وفي النهاية ، تخطيط العناصر المختلفة على الشريحة. على الرغم من استمرار التصغير ، لا يراهن أحد على التوسع لمواكبة النمو الهائل للبيانات من أجهزة الاستشعار وزيادة حجم حركة المرور بين الأجهزة.

من بين التغييرات في البنيات الجديدة:

  • طرق جديدة لمعالجة كمية أكبر من البيانات في دورة ساعة واحدة ، وأحيانًا بدقة أقل أو حسب أولوية عمليات معينة ، اعتمادًا على التطبيق.
  • بنى ذاكرة جديدة تغير طريقة تخزين البيانات وقراءتها وكتابتها والوصول إليها.
  • وحدات معالجة أكثر تخصصًا تقع في جميع أنحاء النظام بالقرب من الذاكرة. بدلاً من المعالج المركزي ، يتم تحديد المسرعات بناءً على نوع البيانات والتطبيق.
  • في مجال الذكاء الاصطناعي ، يجري العمل لدمج أنواع مختلفة من البيانات في شكل قوالب ، مما يزيد بشكل فعال من كثافة البيانات مع تقليل الاختلافات بين الأنواع المختلفة.
  • الآن التصميم في الحالة هو المكون الرئيسي للهندسة المعمارية ، مع إيلاء المزيد والمزيد من الاهتمام لسهولة تغيير هذه التصاميم.

قال ستيفن وو ، مهندس رامبوس المميز: "هناك العديد من الاتجاهات التي تؤثر على التقدم التكنولوجي". - في مراكز البيانات ، تحقق أقصى استفادة من الأجهزة والبرامج. من هذه الزاوية ، ينظر أصحاب مراكز البيانات في الاقتصاد. تقديم شيء جديد أمر مكلف. لكن الاختناقات تتغير ، لذلك يتم إدخال الرقائق المتخصصة للحصول على حوسبة أكثر كفاءة. وإذا قمت بتقليل تدفقات البيانات ذهابًا وإيابًا إلى I / O والذاكرة ، فقد يكون لذلك تأثير كبير ".

أصبحت التغييرات أكثر وضوحًا على حافة البنية التحتية للحوسبة ، أي من بين أجهزة الاستشعار النهائية. أدرك المصنعون فجأة أن عشرات المليارات من الأجهزة ستولد الكثير من البيانات: لا يمكن إرسال مثل هذا الحجم إلى السحابة للمعالجة. لكن معالجة جميع هذه البيانات على الحافة يطرح مشاكل أخرى: فهي تتطلب تحسينات كبيرة في الأداء دون زيادة كبيرة في استهلاك الطاقة.

قال روبرت أوبر ، مهندس منصة تسلا الرائد في نفيديا: "هناك اتجاه جديد نحو دقة أقل". - هذه ليست مجرد دورات حسابية. هذا هو تعبئة بيانات أكثر كثافة في الذاكرة ، حيث يتم استخدام تنسيق الإرشادات ذات 16 بت. "

يعتقد أوبيرت أنه بفضل سلسلة من التحسينات المعمارية في المستقبل المنظور ، يمكنك مضاعفة سرعة المعالجة كل عامين. وقال "سوف نشهد زيادة كبيرة في الإنتاجية". - لهذا عليك القيام بثلاثة أشياء. الأول هو الحوسبة. والثاني هو الذاكرة. المنطقة الثالثة هي عرض النطاق الترددي المضيف وعرض النطاق الترددي I / O. هناك الكثير من العمل الذي يتعين القيام به لتحسين التخزين ومكدس الشبكة. "

شيء ما يجري تنفيذه بالفعل. في عرض تقديمي في مؤتمر Hot Chips لعام 2018 ، أشار جيف روبلي ، كبير المهندسين المعماريين في مركز أبحاث أوستن من سامسونج ، إلى العديد من التغييرات المعمارية الرئيسية على معالج M3. واحد يتضمن المزيد من التعليمات لكل نبضة - ستة بدلاً من أربعة في شريحة M2 الأخيرة. بالإضافة إلى ذلك ، تم تنفيذ توقع الفروع على الشبكات العصبية ومضاعفة قائمة انتظار التعليمات.

هذه التغييرات تحول نقطة الابتكار من التصنيع المباشر للدوائر الصغيرة إلى العمارة والتصميم من ناحية وتخطيط العناصر على الجانب الآخر من سلسلة الإنتاج. على الرغم من أن الابتكارات ستستمر في العمليات التكنولوجية ، إلا أنه على حسابها فقط ، من الصعب للغاية تحقيق زيادة في الإنتاجية والطاقة بنسبة 15-20٪ في كل طراز جديد من الشرائح - وهذا لا يكفي للتعامل مع النمو السريع في حجم البيانات.

قال فيكتور بان ، الرئيس والمدير التنفيذي لشركة Xilinx ، في خطاب ألقاه في مؤتمر Hot Chips: "تحدث التغييرات بمعدل أسي. سيتم إنشاء 10 زيتابايت [10 21 بايت] من البيانات كل عام ، ومعظمها غير منظم".

مقاربات جديدة للذاكرة


يتطلب العمل مع الكثير من البيانات إعادة التفكير في كل مكون في النظام ، من طرق معالجة البيانات إلى تخزينها.

قال كارلوس ماتشين ، مدير الابتكار في eSilicon EMEA: "كانت هناك محاولات عديدة لإنشاء بنيات ذاكرة جديدة". - المشكلة هي أنك بحاجة إلى قراءة جميع الأسطر وتحديد بت واحد في كل منها. أحد الخيارات هو إنشاء ذاكرة يمكن قراءتها من اليسار إلى اليمين ، وكذلك إلى أعلى وأسفل. يمكنك الذهاب إلى أبعد من ذلك وإضافة حساب إلى الذاكرة ".

تتضمن هذه التغييرات تغيير طرق قراءة الذاكرة وموقع ونوع عناصر المعالجة ، بالإضافة إلى إدخال الذكاء الاصطناعي لإعطاء الأولوية لتخزين البيانات ومعالجتها ونقلها عبر النظام.

"ماذا لو كان في حالة البيانات المتناثرة يمكننا فقط قراءة بايت واحد من هذا الصفيف في كل مرة - أو ربما ثمانية بايتات متتالية من نفس مسار البايت دون إهدار الطاقة على بايتات أخرى أو مسارات بايت لا نهتم بها ؟؟؟ "يسأل مارك جرينبيرج ، مدير تسويق منتجات Cadence." - هذا ممكن في المستقبل. إذا نظرت إلى بنية HBM2 ، على سبيل المثال ، فإن المكدس منظم في 16 قناة افتراضية كل منها 64 بت ، وتحتاج إلى الحصول على 4 كلمات متتالية 64 بت فقط للوصول إلى أي قناة افتراضية. وبالتالي ، من الممكن إنشاء مصفوفات من البيانات بعرض 1024 بت ، والكتابة أفقيًا ، ولكن قراءة عموديًا لأربع كلمات 64 بت في المرة الواحدة. "

الذاكرة هي أحد المكونات الرئيسية لهندسة فون نيومان ، ولكنها أصبحت الآن أيضًا واحدة من الساحات الرئيسية للتجارب. قال دان بوفييه ، كبير المهندسين المعماريين لمنتجات العملاء في AMD: "إن العدو الرئيسي هو أنظمة الذاكرة الافتراضية ، حيث يتم نقل البيانات بطرق غير طبيعية". - هذا بث إذاعي. اعتدنا على ذلك في مجال الرسومات. ولكن إذا قمنا بحل التعارضات في بنك ذاكرة DRAM ، فسوف نحصل على تدفق أكثر كفاءة. ثم يمكن لوحدة معالجة الرسومات المنفصلة استخدام ذاكرة الوصول العشوائي الديناميكية (DRAM) في نطاق 90٪ من الكفاءة ، وهو أمر جيد جدًا. ولكن إذا قمت بإعداد الدفق دون انقطاع ، فإن وحدة المعالجة المركزية ووحدة APU ستقع أيضًا في نطاق الكفاءة من 80٪ إلى 85٪. "


التين. 1. العمارة فون نيومان. المصدر: هندسة أشباه الموصلات

تعمل شركة IBM على تطوير نوع مختلف من بنية الذاكرة ، وهو في الأساس نسخة مطورة من تجميع القرص. الهدف هو أنه بدلاً من استخدام قرص واحد ، يمكن للنظام استخدام أي ذاكرة متوفرة بشكل تعسفي من خلال موصل ، والذي يسميه جيف ستوتشلي ، مهندس أجهزة IBM ، "سكين الجيش السويسري" لتوصيل العناصر. ميزة هذا النهج هو أنه يسمح لك بخلط أنواع مختلفة من البيانات ومطابقتها.

يقول Stucelli: "يتحول المعالج إلى مركز واجهة إشارات عالية الأداء". "إذا قمت بتغيير العمارة المصغرة ، يقوم القلب بإجراء المزيد من العمليات لكل دورة بنفس التردد."

يجب أن يضمن الاتصال والإنتاج معالجة الحجم المتزايد بشكل جذري للبيانات المولدة. قال وو من رامبوس "الاختناقات الرئيسية موجودة الآن في مواقع حركة البيانات". "لقد قامت الصناعة بعمل رائع في زيادة سرعة الحوسبة." ولكن إذا كنت تتوقع بيانات أو قوالب بيانات متخصصة ، فأنت بحاجة إلى تشغيل الذاكرة بشكل أسرع. وبالتالي ، إذا نظرت إلى DRAM و NVM ، فإن الأداء يعتمد على نمط حركة المرور. إذا كانت البيانات متدفقة ، فستوفر الذاكرة أداءً جيدًا للغاية. ولكن إذا جاءت البيانات في قطرات عشوائية ، فهي أقل كفاءة. وبغض النظر عما تفعله ، فمع زيادة الحجم لا يزال عليك القيام بذلك بشكل أسرع ".

المزيد من الحوسبة ، وحركة مرور أقل.


تتفاقم المشكلة بحقيقة أن هناك عدة أنواع مختلفة من البيانات التي تم إنشاؤها بترددات وسرعات مختلفة بواسطة الأجهزة الموجودة على الحافة. لكي تنتقل هذه البيانات بحرية بين وحدات المعالجة المختلفة ، يجب أن تصبح الإدارة أكثر كفاءة مما كانت عليه في الماضي.

يقول تشارلي جاناك ، رئيس مجلس الإدارة والرئيس التنفيذي لشركة Arteris IP: "هناك أربعة تكوينات رئيسية: العديد من الكثيرين ، والأنظمة الفرعية للذاكرة ، وال IOs منخفضة الطاقة ، والشبكات وطوبولوجيا الحلقات". - يمكنك وضع الأربعة على شريحة واحدة ، والتي تحدث مع رقائق إنترنت الأشياء الرئيسية. أو يمكنك إضافة أنظمة فرعية HBM عالية الإنتاجية. لكن التعقيد ضخم ، لأن بعض أعباء العمل هذه محددة للغاية ، ولدى الرقاقة عدة مهام عمل مختلفة. إذا نظرت إلى بعض هذه الرقائق الدقيقة ، فإنها تحصل على كميات هائلة من البيانات. هذا في أنظمة مثل رادارات السيارة و Lidars. لا يمكن أن توجد بدون بعض الترابطات المتقدمة. "

وتتمثل المهمة في كيفية تقليل حركة البيانات إلى الحد الأدنى ، ولكن في نفس الوقت زيادة تدفق البيانات إلى أقصى حد عندما تكون مطلوبة - وإيجاد توازن بطريقة ما بين المعالجة المحلية والمركزية دون زيادة استهلاك الطاقة بشكل غير ضروري.

قال راجيش رامانوجام ، مدير تسويق المنتجات في NetSpeed ​​Systems: "من ناحية ، هذه مشكلة عرض النطاق الترددي". - تريد تقليل حركة البيانات قدر الإمكان ، لذا قم بنقل البيانات بالقرب من المعالج. ولكن إذا كنت لا تزال بحاجة إلى نقل البيانات ، فمن المستحسن ضغطها قدر الإمكان. ولكن لا يوجد شيء في حد ذاته. كل شيء يحتاج إلى التخطيط من مستوى النظام. في كل خطوة ، يجب مراعاة عدة محاور مترابطة. إنها تحدد ما إذا كنت تستخدم الذاكرة بالطريقة التقليدية للقراءة والكتابة ، أو ما إذا كنت تستخدم تقنيات جديدة. في بعض الحالات ، قد تحتاج إلى تغيير طريقة تخزين البيانات نفسها. إذا كنت بحاجة إلى أداء أعلى ، فهذا يعني عادة زيادة في مساحة الشريحة ، مما يؤثر على تبديد الحرارة. والآن ، مع مراعاة السلامة الوظيفية ، لا يمكن السماح بزيادة تحميل البيانات. "

هذا هو السبب في إيلاء الكثير من الاهتمام لمعالجة البيانات على الحافة وعرض النطاق الترددي للقناة من خلال وحدات معالجة البيانات المختلفة. ولكن أثناء تطوير بنيات مختلفة ، يختلف الأمر عن كيفية ومكان تنفيذ معالجة البيانات هذه.

على سبيل المثال ، قدمت Marvell وحدة تحكم SSD مع AI مدمج للتعامل مع حمل الحوسبة الثقيلة على الحافة. يمكن استخدام محرك AI للتحليلات داخل محرك أقراص SSD.

قال نيد فارنيتسا ، كبير مهندسي مارفيل: "يمكنك تحميل النماذج مباشرة في الأجهزة والقيام بمعالجة الأجهزة على وحدة تحكم SSD". - اليوم يجعل الخادم في السحابة (المضيف). ولكن إذا أرسل كل قرص بيانات إلى السحابة ، فسيؤدي ذلك إلى إنشاء كمية هائلة من حركة مرور الشبكة. من الأفضل إجراء المعالجة على الحافة ، ولا يصدر المضيف سوى أمر ، وهو مجرد بيانات وصفية. كلما زاد عدد محركات الأقراص لديك ، زادت قوة المعالجة. هذه فائدة كبيرة من انخفاض حركة المرور ".

هذا النهج مثير للاهتمام بشكل خاص أنه يتكيف مع البيانات المختلفة اعتمادًا على التطبيق. لذلك ، يمكن للمضيف إنشاء مهمة وإرسالها إلى جهاز التخزين للمعالجة ، وبعد ذلك يتم فقط إعادة البيانات الوصفية أو نتائج الحساب. في سيناريو آخر ، يمكن لجهاز التخزين تخزين البيانات ومعالجتها مسبقًا وإنشاء البيانات الوصفية والعلامات والفهارس ، والتي يتم استردادها من قبل المضيف عند الحاجة لمزيد من التحليل.

هذا هو أحد الخيارات الممكنة. هناك آخرون. شدد Rupli من شركة سامسونج على أهمية معالجة ودمج التعابير التي يمكنها فك شفرتين من التعليمات ودمجها في عملية واحدة.

يتعامل الذكاء الاصطناعي مع التحكم والتحسين


في جميع مستويات التحسين ، يتم استخدام الذكاء الاصطناعي - وهذا هو أحد العناصر الجديدة حقًا في هندسة الرقائق. بدلاً من السماح لنظام التشغيل والبرامج الوسيطة بإدارة الوظائف ، يتم توزيع وظيفة المراقبة هذه عبر الشريحة ، بين الشرائح ، وعلى مستوى النظام. في بعض الحالات ، يتم إدخال الشبكات العصبية للأجهزة.

يقول مايك جيانفانيا ، نائب رئيس التسويق في شركة eSilicon: "ليس الهدف هو تجميع المزيد من الأشياء معًا ، ولكن تغيير البنية التقليدية". - بمساعدة الذكاء الاصطناعي والتعلم الآلي ، يمكنك توزيع العناصر عبر النظام ، والحصول على معالجة أكثر كفاءة من خلال التنبؤ. أو يمكنك استخدام رقائق منفصلة تعمل بشكل مستقل في النظام أو في الوحدة النمطية. "

قامت ARM بتطوير أول شريحة تعلم آلي ، والتي تخطط لإصدارها في وقت لاحق من هذا العام للعديد من الأسواق. قال إيان برات ، مهندس مشرف في ARM: "هذا نوع جديد من المعالجات". - يتضمن كتلة أساسية - إنه محرك حاسوبي ، بالإضافة إلى محرك MAC ومحرك DMA مع وحدة تحكم وشبكة بث. إجمالاً ، هناك 16 نواة حاسوبية تم تصنيعها باستخدام تقنية المعالجة 7 نانومتر ، والتي تنتج 4 تيراوبس بتردد 1 جيجا هرتز. "

نظرًا لأن ARM يعمل مع نظام بيئي شريك ، فإن رقاقاته أكثر تنوعًا وقابلية للتخصيص من شرائح AI / ML الأخرى التي يتم تطويرها. بدلاً من بنية متجانسة ، فإنها تفصل المعالجة حسب الوظيفة ، بحيث تعمل كل وحدة حاسوبية على خريطة معالم منفصلة. حدد Bratt أربعة مكونات رئيسية: التخطيط الساكن ، الطي الفعال ، آليات التضييق والتكيف المبرمج مع تغييرات التصميم المستقبلية.


التين. 2. معالج ARM العمارة ML. المصدر: ARM / Hot Chips

وفي الوقت نفسه ، اختارت Nvidia تكتيكًا مختلفًا: إنشاء محرك تعلم عميق مخصص بجوار GPU لتحسين معالجة الصور والفيديو.

الخلاصة


باستخدام بعض أو كل هذه الأساليب ، يتوقع مصنعو الرقائق مضاعفة الأداء كل عامين ، مواكبة النمو الهائل في البيانات ، مع البقاء ضمن الإطار المحكم لميزانيات الطاقة. لكن هذا ليس مجرد حوسبة. هذا تغيير في النظام الأساسي لتصميم الرقائق والنظام ، عندما يصبح حجم البيانات المتزايد ، بدلاً من قيود الأجهزة والبرامج ، هو العامل الرئيسي.

قال آرت دي جويس ، رئيس مجلس الإدارة والرئيس التنفيذي لشركة سينوبسيس "عندما ظهرت أجهزة الكمبيوتر في الشركات ، بدا للكثيرين أن العالم من حولنا قد تسارع". - قاموا بحساب قطع من الورق مع أكوام من الكتب. تحول دفتر الأستاذ إلى مجموعة من البطاقات المثقبة للطباعة والحوسبة. لقد حدث تغيير هائل ونراه مرة أخرى. مع ظهور أجهزة الكمبيوتر البسيطة عقليًا ، لم تتغير خوارزمية الإجراءات: يمكنك تتبع كل خطوة. ولكن الآن يحدث شيء آخر يمكن أن يؤدي إلى تسارع جديد. يشبه الأمر في المجال الزراعي تضمين الري وتطبيق نوع معين من السماد فقط في يوم معين ، عندما تصل درجة الحرارة إلى المستوى المطلوب. هذا الاستخدام للتعلم الآلي هو تحسين لم يكن واضحا في الماضي ".

ليس هو الوحيد في هذا التقييم. قال والي رينز ، الرئيس والمدير التنفيذي لشركة مينتور ، سيمنز بيزنس: "سيتم اعتماد البنيات الجديدة". - سيتم تصميمها. سيتم استخدام التعلم الآلي في العديد أو معظم الحالات ، لأن دماغك يتعلم من تجربته الخاصة. قمت بزيارة 20 شركة أو أكثر تقوم بتطوير معالجات الذكاء الاصطناعي المتخصصة من نوع أو آخر ، ولكل منها مكانه الخاص الصغير. لكنك سترى تطبيقهم بشكل متزايد في تطبيقات محددة ، وسوف يكملون بنية فون نيومان التقليدية. سوف تصبح الحوسبة العصبية السائدة. هذه خطوة كبيرة في كفاءة الحوسبة وخفض التكلفة. ستبدأ الأجهزة المحمولة وأجهزة الاستشعار في أداء العمل الذي تقوم به الخوادم اليوم ".

Source: https://habr.com/ru/post/ar422787/


All Articles