رقائق ل ML - الحديث عن المنتجات الجديدة

نحن نتحدث عن أبنية جديدة لكل من الشركات العالمية الكبرى والشركات الناشئة - رقائق waferscale ، معالجات التنسور والأجهزة القائمة على الرسوم البيانية.

اختيار الموضوع:



صور - جيسون ليونج - Unsplash

Waferscale للتعلم العميق


في إنتاج المعالجات الكلاسيكية ، يتم تقسيم ركيزة السيليكون إلى بلورات فردية. ولكن في حالة معالجات waferscale ، لا يتم تقسيم رقاقة أشباه الموصلات - إنها تصبح شريحة كبيرة. نتيجة لذلك ، تكون المكونات أقرب إلى بعضها البعض ، ويزيد أداء النظام.

تم تبني هذا النهج من قبل مهندسي Cerebras Systems و TSMC ، حيث قاموا بتطوير شريحة للتعلم العميق - Cerebras WSE . تم عرضه في مؤتمر Hot Chips في أواخر الصيف. الجهاز عبارة عن بلورة مربعة ذات جوانب 21.5 سم ، ويتكون من 1.2 ترليون ترنزستور ، مجمعة في 400 ألف نواة. "تتواصل" هذه النوى مع بعضها البعض باستخدام نظام Swarm الخاص بعرض نطاق قدره 100 Pbit / s.

يقول المطورون إن الشريحة تعمل على تحسين الحسابات عن طريق تصفية بيانات صفرية في عمليات المصفوفة - فهي تشكل من 50 إلى 98٪ من جميع القيم. نتيجة لذلك ، فإن تعلم نموذج على Cerebras أسرع بمائة مرة من تعلم وحدات معالجة الرسومات الكلاسيكية. ومع ذلك ، تفاعلت NYTimes مع مثل هذه التصريحات بحصة صحية من الشك - لم يختبر الخبراء المستقلون الأجهزة حتى الآن.

الدماغ النوى الحسابية قابلة للبرمجة. يمكن تحسينها للعمل مع أي شبكات عصبية. من المتوقع أن تجد الشريحة الجديدة تطبيقًا في الأنظمة السحابية وتطبيقات التعلم الآلي: من الطائرات بدون طيار إلى المساعدين الصوتيين. لم يُعرف بعد متى سيتم بيع الشريحة ، لكن هناك عددًا من الشركات التي تختبرها بالفعل على أعباء العمل.

Silicon Interconnect Fabric (Si-IF) هو جهاز waferscale آخر لتطبيقات MO. تم تطويره في مختبر جامعة كاليفورنيا. Si-IF هو جهاز يجمع بين العشرات من وحدات معالجة الرسومات على رقاقة سيليكون واحدة. قام المطورون بالفعل بتقديم نموذجين أوليين لـ 24 و 40 وحدة معالجة الرسومات. أدائها أعلى 2.5 مرة من قدرات الأجهزة الكلاسيكية. انهم يخططون لاستخدام النظام في مركز البيانات.

معالجات التنسور


في مايو 2018 ، أعلنت Google عن TPU v3 ، الجيل الثالث من معالجات التنسور الخاصة بها للعمل مع مكتبة تعلم الآلة TensorFlow . لا يُعرف سوى القليل عن الخصائص التقنية للجهاز الجديد. سيتم تصنيع نسخة الإنتاج باستخدام تقنية معالجة 12 أو 16 نانومتر. قوة التصميم الحراري - 200 واط ، أداء - 105 TFLOPS عند العمل مع bfloat 16. هذا هو نظام تمثيل الفاصلة العائمة 16 بت والذي يستخدم في التعلم العميق.

في عدد من المهام ، تجاوز أداء الجيل الثاني من Google TPU إمكانيات NVIDIA Tesla V100 خمسة أضعاف. يقول المهندسون إن الجيل الثالث أقوى بثمانية أضعاف من سابقه. كان علينا حتى تثبيت التبريد السائل على الرقائق.


صور - Cineca - CC BY

تخطط الشركة لنقل عدد من أنظمتها إلى معالجات التنسور الجديدة: المساعد الصوتي ، وخدمة معالجة الصور ، وخوارزمية ترتيب البحث في RankBrain. وتريد الشركة أيضًا بناء أجهزة كمبيوتر عملاقة قابلة للتوسعة على السحابة على أساس TPU وفتح الوصول إليها للعلماء المشاركين في دراسة أنظمة الذكاء الاصطناعي. في أواخر الربيع ، تم إطلاق الخدمة في الوضع التجريبي.

رقائق العمل مع الرسوم البيانية المعقدة


قامت شركة بدء التشغيل Graphcore البريطانية بتطوير شريحة لمهام التعلم العميق - وحدة معالجة الاستخبارات ( Colossus IPU ). أنه يحتوي على 1200 النوى ومجموعة من الوظائف التجاوزي المتخصصة. كل العمليات الأساسية ستة خيوط. يقترن الحديد مع برنامج الحور. إنه يجمع النماذج ويبني على أساسها رسومات بيانية حسابية متعددة المراحل معقدة تعمل على معالجات IPU. أظهرت الاختبارات التي أجريت على عينات Graphcore الأولى أن لديهم أداء يفوق مائة ضعف أداء الجرافيك التقليدي.

بدء التشغيل يشحن بالفعل بطاقة PCI-E كاملة الحجم للخوادم. لديها في تكوينها اثنين من رقائق IPU ، مصنوعة وفقا لتكنولوجيا عملية 16 نانومتر وتتألف من 24 مليار الترانزستورات. قوة الحوسبة لهذا الجهاز هي 125 TFLOPS. تم تصميم البطاقات للعمل في مراكز بيانات مزودي خدمة IaaS والسيارات مع الطيار الآلي. يقول مؤسسو بدء التشغيل أن أكثر من مائة عميل يعملون مع أجهزتهم ، لكنهم لا يذكرون شركات محددة.

أصبحت المنافسة في مجال أجهزة الأجهزة للتعلم الآلي خطيرة للغاية. يدخل لاعبون جدد السوق ، ويقدمون هياكل مبتكرة ، وتستمر الشركات البارزة في زيادة قدرة الحلول الحالية. على أي حال ، فإن هذا يلعب دور أصحاب مراكز البيانات ومهندسي علوم البيانات وغيرهم من المتخصصين في تطوير أنظمة الذكاء الاصطناعي.


التابعة لبرنامج 1cloud.ru . يمكن لمستخدمي السحابة لدينا كسب الدخل وتقليل تكلفة استئجار البنية التحتية الافتراضية.

على سبيل المثال ، نحن نقدم خدمة السحابة الخاصة . من خلال مساعدتها ، يمكنك نشر البنية التحتية لتكنولوجيا المعلومات للمشاريع بأي تعقيد.

Source: https://habr.com/ru/post/ar472230/


All Articles