استخدام بنية فون نيومان للتطبيقات ذات الذكاء الاصطناعي غير فعال. ماذا سيحل محلها؟
أصبح استخدام البنى الحالية لحل مشاكل التعلم الآلي (MO) والذكاء الاصطناعي (AI) غير عملي. نمت الطاقة التي يستهلكها الذكاء الاصطناعي بشكل ملحوظ ، ويبدو أن وحدة المعالجة المركزية ، إلى جانب وحدة معالجة الرسومات ، أصبحت بشكل متزايد أدوات غير مناسبة لهذا العمل.
اتفق المشاركون في العديد من الندوات على أن أفضل الفرص للتغيير الكبير تنشأ في غياب السمات الموروثة التي يجب جرها. تطورت معظم الأنظمة تدريجيًا بمرور الوقت - وحتى إذا كان هذا يضمن تقدمًا آمنًا ، فإن مثل هذا المخطط لا يوفر الحلول المثلى. عندما يظهر شيء جديد ، يصبح من الممكن إلقاء نظرة جديدة على الأشياء واختيار اتجاه أفضل مما ستقدمه التقنيات التقليدية. هذا هو بالضبط ما تمت مناقشته في مؤتمر عقد مؤخرًا حيث تم فحص السؤال عما إذا كانت بنية أكسيد الفلز شبه الموصل (
CMOS ) التكميلية هي أفضل تقنية أساسية يجب أن تبنى عليها تطبيقات الذكاء الاصطناعي.
مهد شين ، الذي عينته شركة آي بي إم كمدير تنفيذي لمبادرة أبحاث الإلكترونيات النانوية (NRI) ، الطريق للمناقشة. "لسنوات عديدة ، كنا نبحث عن تقنيات جديدة وحديثة ، بما في ذلك البحث عن بديل لـ CMOS ، خاصة بسبب مشاكله المتعلقة باستهلاك الطاقة والتوسع. بعد كل هذه السنوات ، تطور رأي مفاده أننا لم نجد أي شيء أفضل كأساس لإنشاء دوائر منطقية. اليوم ، يركز العديد من الباحثين على الذكاء الاصطناعي ، ويقدم بالفعل طرقًا جديدة للتفكير وأنماط جديدة ، ولديهم منتجات تكنولوجية جديدة. هل ستتمكن أجهزة الذكاء الاصطناعي الجديدة من استبدال CMOS؟ "
منظمة العفو الدولية اليوم
تستخدم معظم تطبيقات MO و AI بنية von Neumann. يوضح مارفن تشين ، أستاذ الهندسة الكهربائية في جامعة شينخوا الوطنية: "يستخدم الذاكرة لتخزين مصفوفات البيانات ، وتقوم وحدة المعالجة المركزية بجميع الحسابات". "كميات كبيرة من البيانات تتحرك عبر الحافلة. اليوم ، غالبًا ما تُستخدم وحدات معالجة الرسومات أيضًا للتدريب المتعمق ، بما في ذلك [الشبكات العصبية] التلافيفية. إحدى المشاكل الرئيسية هي ظهور البيانات الوسيطة اللازمة لاستخلاص النتائج. يؤدي نقل البيانات ، وخاصة ما بعد الشريحة ، إلى فقد الطاقة وتأخيرها. هذه عنق الزجاجة التكنولوجي ".
البنيات المستخدمة للذكاء الاصطناعيما تحتاجه اليوم هو الجمع بين معالجة البيانات والذاكرة. يقول تشين: "لقد اقترح خبراء هندسة الكمبيوتر مفهوم الحوسبة في الذاكرة لسنوات عديدة". - هناك العديد من المخططات للذاكرة العشوائية العشوائية والذاكرة غير المتطايرة ، والتي حاولوا من خلالها استخدام وتنفيذ هذا المفهوم. من الناحية المثالية ، إذا نجح ذلك ، يمكنك توفير كمية هائلة من الطاقة من خلال القضاء على حركة البيانات بين وحدة المعالجة المركزية والذاكرة. لكن هذا مثالي ".
لكن اليوم ، ليس لدينا حسابات في الاعتبار. "ما زال لدينا AI 1.0 يستخدم بنية von Neumann ، لأن أجهزة السيليكون التي تنفذ المعالجة في الذاكرة لم تظهر أبدًا" ، يشكو. تشن "إن الطريقة الوحيدة لاستخدام 3D TSV بأي طريقة هي استخدام ذاكرة عالية السرعة مع وحدة معالجة الرسومات لحل مشكلة النطاق الترددي." لكنها ما زالت تشكل عقبة أمام الطاقة والوقت ".
هل سيكون هناك ما يكفي من معالجة البيانات في الذاكرة لحل مشكلة فقدان الطاقة؟ قال شون لي ، مساعد المدير في شركة تايوان لصناعة أشباه الموصلات: "يحتوي الدماغ البشري على مائة مليار خلية عصبية و 10
15 مشابك عصبية". "انظر الآن إلى IBM TrueNorth". TrueNorth هو معالج متعدد النواة تم تطويره بواسطة IBM في عام 2014. ولديه 4096 نواة ولكل منها 256 عصبون اصطناعي قابل للبرمجة. "لنفترض أننا نريد قياسه وإعادة إنتاج حجم الدماغ. الفرق هو 5 مرات من الحجم. ولكن إذا قمنا فقط بزيادة الأعداد مباشرة ومضاعفة TrueNorth ، باستهلاك 65 ميجاوات ، فإننا نحصل على آلة تستهلك 65 كيلووات مقابل دماغ شخص يستهلك 25 واط. يجب تخفيض الاستهلاك بعدة درجات من الحجم ".
يقدم لي طريقة أخرى لتخيل هذه الفرصة. "أكثر الحواسيب الفائقة كفاءة حتى الآن هو Green500 من اليابان ، حيث تصدر 17 Gflops لكل وات ، أو 1
flop at 59 pJ." يقول موقع Green500 أن نظام ZettaScaler-2.2 المثبت في مركز الحوسبة والاتصالات المتقدمة في اليابان (RIKEN) يقيس 18.4 Gflops / W أثناء تشغيل اختبار Linpack ، والذي يتطلب 858 TFlops. "قارن هذا
بمبدأ لانداور ، والذي بموجبه يكون الحد الأدنى لطاقة تبديل الترانزستور في درجة حرارة الغرفة 2.75 zJ [10
-21 J]. مرة أخرى ، الفرق هو عدة مرات من حيث الحجم. 59 pJ حوالي 10
-11 مقابل أدنى مستوى نظري يبلغ حوالي 10
-21 . لدينا مجال كبير للبحث ".
هل من العدل مقارنة مثل هذه الحواسيب بالدماغ؟ يقول كاوشيك روي ، أستاذ فخري في الهندسة الكهربائية وعلوم الكمبيوتر في جامعة بوردو: "بعد فحص النجاحات الأخيرة للتدريب المتعمق ، سنرى أنه في معظم الحالات يتنافس الناس والآلات على مدى السنوات السبع الماضية على التوالي". "في عام 1997 ، هزم ديب بلو كاسباروف ، وفي عام 2011 فاز IBM Watson في لعبة Jeopardy! ، وفي عام 2016 هزم Alpha Go Lee Sedola. هذه هي أعظم الإنجازات. ولكن بأي ثمن؟ استهلكت هذه الآلات 200 إلى 300 كيلو واط. يستهلك دماغ الإنسان حوالي 20 واط. فجوة كبيرة. من أين سيأتي الابتكار؟
في قلب معظم التطبيقات ، تعتبر MO و AI أبسط الحسابات التي يتم إجراؤها على نطاق واسع. يوضح روي: "إذا كنت تأخذ أبسط شبكة عصبية ، فإنها تُجري عملية تجميع مرجحة ، تليها عملية عتبة". - يمكن القيام بذلك في أنواع مختلفة من المصفوفات. يمكن أن يكون جهازًا من أجهزة إلكترونية أو ذاكرة مقاومة. في هذه الحالة ، سيتم ربط جهد الدخل والتوصيل الناتج مع كل نقطة تقاطع. عند الإخراج ، تحصل على مجموع الفولتية مضروبًا في الموصلية. هذا هو التيار. ثم يمكنك أخذ الأجهزة المماثلة التي تؤدي عملية عتبة. يمكن تخيل العمارة على أنها مجموعة من هذه العقد المتصلة ببعضها البعض لإجراء الحسابات ".
المكونات الرئيسية للشبكة العصبيةأنواع جديدة من الذاكرة
ترتبط معظم البنيات المحتملة بأنواع ناشئة من الذاكرة غير المتطايرة. "ما هي أهم الخصائص؟" يسأل جيفري بار ، الباحث في IBM Research. "كنت أضع ذاكرة مقاومة تناظرية غير متطايرة ، مثل الذاكرة مع تغيير المرحلة ، والذاكرة ، وما إلى ذلك. الفكرة هي أن هذه الأجهزة قادرة على القيام بجميع المضاعفات للطبقات المتصلة بالكامل من الشبكات العصبية في دورة واحدة. في مجموعة المعالجات ، يمكن أن يستغرق ذلك مليون دورة ساعة ، وفي جهاز تناظري ، يمكن القيام بذلك باستخدام الفيزياء التي تعمل في موقع البيانات. هناك جوانب كافية مثيرة للاهتمام للغاية من حيث الوقت والطاقة لكي تتطور هذه الفكرة إلى شيء أكثر ".
تقنيات الذاكرة الجديدةيوافق تشن على ذلك. "PCM ، STT لديها عروض جدية للفوز. هذه الأنواع الثلاثة من الذاكرة هي مرشحات جيدة لتطبيق الحوسبة في الذاكرة. إنهم قادرون على العمليات المنطقية الأساسية. بعض الأنواع لديها مشاكل في الموثوقية ، ولا يمكن استخدامها للتدريب ، ولكن من الممكن الحصول على نتيجة ".
ولكن قد يتبين أنه ليس من الضروري التبديل إلى هذه الذاكرة. ويضيف لي: "يتحدث الناس عن استخدام SRAM لنفس الغرض بالضبط". "إنهم يفعلون الحوسبة التناظرية مع SRAM". السلبية الوحيدة هي أن SRAM كبير جدًا - 6 أو 8 ترانزستورات لكل بت. لذلك ، ليس حقيقة أننا سنستخدم هذه التقنيات الجديدة في الحوسبة التناظرية ".
يشير الانتقال إلى الحوسبة التناظرية أيضًا إلى أن دقة الحسابات لن تكون ضرورية بعد الآن. يقول: "إن منظمة العفو الدولية متخصصة وتصنف وتتنبأ". "إنه يتخذ قرارات يمكن أن تكون وقحة". من حيث الدقة ، يمكننا التخلي عن شيء ما. نحن بحاجة إلى تحديد الحسابات التي مقاومة للخطأ. ثم يمكن تطبيق بعض التقنيات لتقليل استهلاك الطاقة أو تسريع الحوسبة. تعمل CMOS الاحتمالية منذ عام 2003. وهذا يشمل خفض الجهد حتى ظهور العديد من الأخطاء ، والتي لا يزال عددها مقبولًا. اليوم ، يستخدم الناس بالفعل تقنيات حسابية تقريبية ، مثل القياس الكمي. بدلاً من رقم فاصلة عائمة 32 بت ، سيكون لديك أعداد صحيحة 8 بت. أجهزة الكمبيوتر التناظرية ميزة أخرى سبق ذكرها.
اخرج من المعمل
يمكن أن يمثل نقل التكنولوجيا من المختبر إلى الجمهور تحديًا. يقول بار: "في بعض الأحيان يتعين عليك البحث عن بدائل". - عندما لم تقلع ذاكرة الفلاش ثنائية الأبعاد ، بدأت ذاكرة الفلاش ثلاثية الأبعاد تبدو وكأنها لم تعد مهمة صعبة. إذا واصلنا تحسين التقنيات الحالية ، والحصول على مضاعفة الخصائص هنا ، والمضاعفة هناك ، فسيتم التخلي عن الحسابات التناظرية داخل الذاكرة. ولكن إذا تبين أن التحسينات التالية غير ذات أهمية ، فستبدو الذاكرة التناظرية أكثر جاذبية. كباحثين ، يجب أن نكون مستعدين لفرص جديدة ".
غالبًا ما يبطئ الاقتصاد التنمية ، خاصة في مجال الذاكرة ، لكن بار يقول إن هذا لن يحدث في هذه الحالة. "إحدى مزايانا هي أن هذا المنتج لن يكون مرتبطًا بالذاكرة. لن يكون هناك شيء مع تحسينات طفيفة. هذا ليس منتج استهلاكي. هذا شيء يتنافس مع GPU. يتم بيعها بسعر 70 ضعفًا من تكلفة ذاكرة الوصول العشوائي (DRAM) الموضوعة عليها ، لذلك من الواضح أن هذا منتج لا يحتوي على ذاكرة. ولن تختلف تكلفة المنتج كثيرًا عن الذاكرة. يبدو الأمر جيدًا ، ولكن عند اتخاذ قرارات بمليارات الدولارات ، يجب أن تكون جميع التكاليف وخطة تطوير المنتج واضحة تمامًا. للتغلب على هذا الحاجز ، نحتاج إلى تقديم نماذج أولية رائعة. "
استبدال CMOS
يمكن أن توفر معالجة البيانات داخل الذاكرة فوائد رائعة ، ولكن هناك حاجة إلى المزيد لتنفيذ التكنولوجيا. هل يمكن لأي مادة أخرى إلى جانب CMOS أن تساعد في ذلك؟ يقول Lee: "بالنظر إلى الانتقال من CMOS منخفض الاستهلاك إلى نفق FETs ، فإننا نتحدث عن انخفاض في الاستهلاك بمقدار 1-2 مرة". - احتمال آخر هو الدوائر المتكاملة ثلاثية الأبعاد. تقلل من طول الأسلاك باستخدام TSV. هذا يقلل من استهلاك الطاقة ووقت الاستجابة. انظروا إلى مراكز البيانات ، جميعهم يزيلون الأسلاك المعدنية ويربطون الأجهزة البصرية ".
عمودي - استهلاك الطاقة ، وتأخير الجهاز الأفقيعلى الرغم من أنه يمكنك تحقيق بعض الفوائد عند الانتقال إلى تقنية مختلفة ، إلا أنها قد لا تستحق ذلك. يقول روي: "سيكون من الصعب جدًا استبدال CMOS ، ولكن بعض الأجهزة التي تمت مناقشتها يمكن أن تكمل تقنية CMOS بحيث تجري حسابات في الذاكرة". - يمكن أن يدعم CMOS العمليات الحسابية في الذاكرة بشكل تناظري ، ربما في الخلية 8T. هل من الممكن إنشاء بنية بميزة واضحة على CMOS؟ إذا تم عمل كل شيء بشكل صحيح ، فإن CMOS سيعطيني آلاف المرات من كفاءة الطاقة. لكن الأمر يستغرق بعض الوقت. "
من الواضح أن CMOS لن يحل محلها. ويختتم بار قائلاً: "لن ترفض التقنيات الجديدة التقنيات القديمة ، ولن يتم تصنيعها على أي ركائز بخلاف CMOS".