
وإدراكًا لأهمية الذكاء الاصطناعي ، فإن Intel تتخذ خطوة أخرى في هذا الاتجاه. قبل شهر ، في مؤتمر Hot Chips 2019 ، قدمت الشركة رسميًا شيبتين متخصصتين صممت للتدريب والاستدلال على الشبكات العصبية. تم تسمية الرقائق Intel Nervana NNP-
T (معالج الشبكة العصبية) و Intel Nervana NNP-
I على التوالي. تحت التخفيض ، ستجد خصائص ومخططات المنتجات الجديدة.
Intel Nervana NNP-T (Spring Crest)
يعد وقت التدريب على الشبكة العصبية ، إلى جانب كفاءة استخدام الطاقة ، أحد المعايير الرئيسية لنظام الذكاء الاصطناعي ، الذي يحدد نطاق تطبيقه. تتضاعف قوة الحوسبة المستخدمة في أكبر النماذج ومجموعات التدريب كل ثلاثة أشهر. في الوقت نفسه ، يتم استخدام مجموعة محدودة من العمليات الحسابية في الشبكات العصبية ، وخاصة التلافيف وتكرار المصفوفة ، مما يفتح مجالًا كبيرًا للتحسينات. من الناحية المثالية ، يجب موازنة الجهاز الذي نحتاجه من حيث الاستهلاك والاتصالات وقوة الحوسبة وقابلية التوسع.

تم تصنيع وحدة Intel Nervana NNP-T في شكل بطاقة PCIe 4.0 x16 أو OAM. يتمثل العنصر الرئيسي للحوسبة في NNP-T في مجموعة Tensor Processing Cluster (TPC) المكونة من 24 قطعة ، والتي توفر ما يصل إلى 119 أداءً من أعلى قمم. يتم توصيل ما مجموعه 32 جيجابايت من الذاكرة HBM2-2400 من خلال 4 منافذ HBM. على متن الطائرة هناك أيضا وحدة التسلسل / إلغاء التسلسل على 64 خطوط ، واجهات SPI ، I2C ، GPIO. مقدار الذاكرة الموزعة على الشريحة 60 ميغا بايت (2.5 ميغا بايت لكل TPC).
Tensor معالجة الكتلة (TPC) الهندسة المعماريةمواصفات أداء Intel Nervana NNP-T الأخرى.
كما ترون من الرسم التوضيحي ، فإن لكل TPC نواة مضاعفة 32 × 32 مصفوفة بدعم BFloat16. يتم تنفيذ عمليات أخرى بتنسيق BFloat16 أو FP32. في المجموع ، يمكن تثبيت ما يصل إلى 8 بطاقات على مضيف واحد ، وقابلية التوسع القصوى - ما يصل إلى 1024 عقدة.
Intel Nervana NNP-I (Spring Hill)
عند تصميم Intel Nervana NNP-I ، كان الهدف هو توفير الحد الأقصى من كفاءة الطاقة مع الاستدلال على نطاق مراكز البيانات الكبيرة - حوالي 5 TOP / W.

NNP-I هي شركة نفط الجنوب ، التي يتم تصنيعها وفقًا لتقنية المعالجة التي تبلغ 10 نانومتر ، وتتضمن اثنين من النوى x86 القياسية مع دعم AVX و VNNI ، بالإضافة إلى 12 مركزًا متخصصًا لحساب محرك الاستدلال (ICE). الحد الأقصى للأداء هو 92 TORS ، TDP - 50 واط. مقدار الذاكرة الداخلية 75 ميجابايت. هيكليا ، الجهاز مصنوع في شكل بطاقة توسع M.2.
هندسة حساب الاستدلال (ICE)العناصر الرئيسية لمحرك حساب الاستدلال:
التعلم العميق حساب الشبكة- 4k MAC (int8) لكل دورة
- دعم قابل للتطوير لـ FP16 و INT8 و INT 4/2/1
- كمية كبيرة من الذاكرة الداخلية
- العمليات غير الخطية والتجميع
ناقلات المعالج للبرمجة- عالية الأداء - 5 VLIW 512 ب
- دعم NN الموسّع - FP16 / 16b / 8b
تم الحصول على مؤشرات الأداء التالية من Intel Nervana NNP-I: على شبكة ResNet مكونة من 50 طبقة ، تم تحقيق سرعة تصل إلى 3600 استدلال في الثانية باستهلاك طاقة 10 وات ، أي أن كفاءة الطاقة هي 360 صورة في الثانية من حيث وات.