Intel Nervana NNP-T و NNP-I - رقائق متخصصة لـ AI



وإدراكًا لأهمية الذكاء الاصطناعي ، فإن Intel تتخذ خطوة أخرى في هذا الاتجاه. قبل شهر ، في مؤتمر Hot Chips 2019 ، قدمت الشركة رسميًا شيبتين متخصصتين صممت للتدريب والاستدلال على الشبكات العصبية. تم تسمية الرقائق Intel Nervana NNP- T (معالج الشبكة العصبية) و Intel Nervana NNP- I على التوالي. تحت التخفيض ، ستجد خصائص ومخططات المنتجات الجديدة.

Intel Nervana NNP-T (Spring Crest)


يعد وقت التدريب على الشبكة العصبية ، إلى جانب كفاءة استخدام الطاقة ، أحد المعايير الرئيسية لنظام الذكاء الاصطناعي ، الذي يحدد نطاق تطبيقه. تتضاعف قوة الحوسبة المستخدمة في أكبر النماذج ومجموعات التدريب كل ثلاثة أشهر. في الوقت نفسه ، يتم استخدام مجموعة محدودة من العمليات الحسابية في الشبكات العصبية ، وخاصة التلافيف وتكرار المصفوفة ، مما يفتح مجالًا كبيرًا للتحسينات. من الناحية المثالية ، يجب موازنة الجهاز الذي نحتاجه من حيث الاستهلاك والاتصالات وقوة الحوسبة وقابلية التوسع.



تم تصنيع وحدة Intel Nervana NNP-T في شكل بطاقة PCIe 4.0 x16 أو OAM. يتمثل العنصر الرئيسي للحوسبة في NNP-T في مجموعة Tensor Processing Cluster (TPC) المكونة من 24 قطعة ، والتي توفر ما يصل إلى 119 أداءً من أعلى قمم. يتم توصيل ما مجموعه 32 جيجابايت من الذاكرة HBM2-2400 من خلال 4 منافذ HBM. على متن الطائرة هناك أيضا وحدة التسلسل / إلغاء التسلسل على 64 خطوط ، واجهات SPI ، I2C ، GPIO. مقدار الذاكرة الموزعة على الشريحة 60 ميغا بايت (2.5 ميغا بايت لكل TPC).


Tensor معالجة الكتلة (TPC) الهندسة المعمارية

مواصفات أداء Intel Nervana NNP-T الأخرى.
تكنولوجيا العمليةSMC CLN16FF +
منطقة المتدخل680 مم 2 ، 1200 مم 2
عدد الترانزستورات27 مليار
حجم ونوع القضية شركة نفط الجنوب60x60 ملم ، 3325 دبوس بغا
تردد القاعدة1.1 جيجا هرتز
استهلاك العمل150-250 واط

كما ترون من الرسم التوضيحي ، فإن لكل TPC نواة مضاعفة 32 × 32 مصفوفة بدعم BFloat16. يتم تنفيذ عمليات أخرى بتنسيق BFloat16 أو FP32. في المجموع ، يمكن تثبيت ما يصل إلى 8 بطاقات على مضيف واحد ، وقابلية التوسع القصوى - ما يصل إلى 1024 عقدة.

Intel Nervana NNP-I (Spring Hill)


عند تصميم Intel Nervana NNP-I ، كان الهدف هو توفير الحد الأقصى من كفاءة الطاقة مع الاستدلال على نطاق مراكز البيانات الكبيرة - حوالي 5 TOP / W.



NNP-I هي شركة نفط الجنوب ، التي يتم تصنيعها وفقًا لتقنية المعالجة التي تبلغ 10 نانومتر ، وتتضمن اثنين من النوى x86 القياسية مع دعم AVX و VNNI ، بالإضافة إلى 12 مركزًا متخصصًا لحساب محرك الاستدلال (ICE). الحد الأقصى للأداء هو 92 TORS ، TDP - 50 واط. مقدار الذاكرة الداخلية 75 ميجابايت. هيكليا ، الجهاز مصنوع في شكل بطاقة توسع M.2.


هندسة حساب الاستدلال (ICE)

العناصر الرئيسية لمحرك حساب الاستدلال:
التعلم العميق حساب الشبكة

  • 4k MAC (int8) لكل دورة
  • دعم قابل للتطوير لـ FP16 و INT8 و INT 4/2/1
  • كمية كبيرة من الذاكرة الداخلية
  • العمليات غير الخطية والتجميع

ناقلات المعالج للبرمجة

  • عالية الأداء - 5 VLIW 512 ب
  • دعم NN الموسّع - FP16 / 16b / 8b

تم الحصول على مؤشرات الأداء التالية من Intel Nervana NNP-I: على شبكة ResNet مكونة من 50 طبقة ، تم تحقيق سرعة تصل إلى 3600 استدلال في الثانية باستهلاك طاقة 10 وات ، أي أن كفاءة الطاقة هي 360 صورة في الثانية من حيث وات.

Source: https://habr.com/ru/post/ar467691/


All Articles