كيف تعمل الشبكات العصبية الثنائية ، ولماذا ستكون شعبية في عام 2020

الشبكات العصبية شيء رائع ، لكن إمكاناتها لا تزال محدودة بسبب التكلفة والطاقة. الشبكات العصبية الثنائية قد تساعد في التعامل مع هذا




ظهر مفهوم الشبكات العصبية لأول مرة منذ أكثر من 40 عامًا ، عندما جرب العلماء النمذجة الرياضية لوظائف الدماغ. اكتشفوا كيفية إجراء تنفيذ ميكانيكي لشبكة عصبية يمكن تعليمها على التعرف على الأنماط وتصنيف البيانات - على سبيل المثال ، لمعرفة ما إذا كان هناك قطة أو كلب على الفيديو.

على مدى العقد الماضي ، ازداد تعقيد وقدرة الشبكات العصبية بشكل ملحوظ. جنبا إلى جنب مع زيادة غير مسبوقة في قوة الحواسيب الفائقة منخفضة التكلفة ومعالجات الرسوم البيانية (GPUs) ، فقد وصلوا إلى الواجهة كطريقة افتراضية لحل المشكلات ، والتعرف على الأنماط ، واكتشاف الحالات الشاذة. تستخدمها المؤسسات اليوم للتنبؤ ، والبحث في تفضيلات المستخدم ، والتحقق من صحة البيانات ، وإدارة المخاطر.

ولكن على الرغم من استخدامها النشط ، إلا أن لديهم عيوبهم التي تحد من إمكاناتهم. The Holy Grail هي شبكة عصبية يمكنها تحليل المعلومات بسرعة ، كونها غير مكلفة وليست جائعة للطاقة. يعد إنشاء شبكة تفي بهذه المعايير مهمة صعبة ، ولكن يجب حلها حتى نتمكن من الاستفادة من الشبكات العصبية القريبة من حافة شبكات تكنولوجيا المعلومات والاتصالات ، وكذلك على الأجهزة الطرفية.

أحد البدائل التي تستكشفها العديد من المنظمات هو الشبكات الثنائية. هذه تقنية جديدة إلى حد ما ، ولكن من المحتمل أن تصبح مؤثرة للغاية في عام 2020. لفهم السبب ، نحتاج إلى فهم كيفية عمل كلا النوعين من الشبكات.

كيف تعمل الشبكات العصبية؟


تتكون الشبكات العصبية من عدة طبقات من المبالغ الموزونة. يعطي كل مبلغ موزون رقماً يشير إما إلى أنه من المحتمل وجود بعض العلامات في هذه البيانات ، أو ربما ليس هناك. تجمع هذه الطبقات ، على سبيل المثال ، الصور الأولية في مجموعات من الميزات ، وتعيد تجميعها للوصول في النهاية إلى إجابة.

ببساطة ، لنفترض أنك تريد أن تكون الشبكة العصبية قادرة على التعرف على الوجوه في الصور. يقسم النظام الصورة إلى مقاطع صغيرة ، ثم تقوم طبقات الشبكة بفحص كل جزء من الصورة ، بحثًا عن علامة تم تعليمها لتحديدها. يمكن أن تبحث الطبقة الأولى ، على سبيل المثال ، عن الميزات الأساسية: الدوائر السوداء ، الدوائر البيضاء ، المستطيلات البيضاء ، لون البشرة. هذه العلامات هي سهلة لاحظت.

يمكن أن تبحث الطبقة الثانية عن العينين (دائرة سوداء داخل أبيض) ، أفواه (مجموعة من المستطيلات البيضاء تقع في مكان قريب وتحيط بها البشرة) ، يمكن أن تبحث الطبقة التالية عن عينين فوق الفم وبها جلد حولها. توفر كل ميزة لكل مقطع صورة تقديراً لاحتمال وجود الميزة المطلوبة في هذا الجزء من الصورة. ثم يتم الجمع بين هذه الاحتمالات ، وإذا كان هناك عدد كاف من الطبقات التي تعتقد أن الإشارة المطلوبة في الصورة ، فإن الشبكة تستنتج أن الشخص موجود هناك.


التين. 1

في التين. يوضح الشكل 1 (وهذه صورة لباراك أوباما) كيف يتم تلخيص طبقات التحليل والاحتمال هذه ، مما يتيح للشبكة التي تعمل بقيم تقريبية إنتاج إجابة دقيقة نسبيًا.

لاحظ أن الميزات مثل الدوائر السوداء أو العينين أو الفم لا يتم برمجتها بواسطة شخص ، ولكن يتم اكتشافها بواسطة الشبكة أثناء التدريب. من الممكن أن يكون النمط الآخر (على سبيل المثال ، الأنف أو الأذنين أو خط الشعر) أكثر ملاءمة للبحث عن الأشخاص ، وجمال الشبكات العصبية هو أنه يمكن استخدامها للبحث عن مثل هذه الأنماط.

عيوب الشبكات العصبية التقليدية


المشكلة هي أنه في البحث عن أعلى دقة ممكنة ، هناك حاجة للتعامل مع مستويات محددة للغاية من الاحتمالات ، ولهذه الحسابات الرياضية ، هناك حاجة إلى موارد جادة. نظرًا لاستخدام أرقام الفاصلة العائمة لتحليل المقاطع ، تتطلب الشبكات العصبية قدرًا كبيرًا من القوة الحاسوبية والذاكرة ووقت العمل.

على الرغم من أن السحابة لديها ما يكفي من قوة الحوسبة والذاكرة ، إلا أن العديد من تطبيقات الحافة لا يمكن الاعتماد عليها على سبيل المثال ، تحتاج أجهزة الجوال إلى اتخاذ القرارات على الفور بناءً على بيئتها ، وفي هذا لا يمكنها الاعتماد على اتصالات محدودة النطاق الترددي.

لا يمكن استخدام الشبكات العصبية التي تعمل مع أرقام الفاصلة العائمة على الأجهزة الطرفية. لهذا السبب ، تستخدم العديد من الشركات حسابًا صحيحًا ، مما يوفر مقدارًا كبيرًا من الذاكرة وقوة الحوسبة ، ولكن هناك طريقة أفضل - حيث تظهر الشبكات العصبية الثنائية نفسها.

كيف تعمل الشبكات الثنائية


إذا كانت الشبكة العصبية العادية عبارة عن لوحة بيكاسو ، فعندئذ تكون الشبكة العصبية الثنائية عبارة عن رسم قلم رصاص تقريبي.

إذا عيّنت الشبكات العصبية لكل قطعة احتمالًا محسوبًا بدقة ، فإن الشبكات العصبية الثنائية ، كما يوحي اسمها ، تقلل القيم المحتملة إلى نسخة بالأبيض والأسود ، أي إلى -1 (إذا اعتبرت الشبكة أنه لا توجد علامة في هذه القطعة) ، أو + 1 (إن وجد).

الآن يُقيِّم المجموع الموزون كل سمة بإيجابية (ضرب ب +1) أو سالبًا (ضرب ب -1) ، وبدلاً من الضرب الكامل ، نحتاج فقط إلى التفكير في الضرب ب +1 و -1.


التين. 2

يضحّي هذا النهج بدرجة معينة من الدقة ، لكن يمكننا تعويض الخسائر عن طريق زيادة الشبكة قليلاً. الشبكات الثنائية بطبيعتها أبسط بكثير.

مقارنة بنظرائهم في الفاصلة العائمة ، فإنهم يحتاجون إلى مساحة أقل 32 مرة لتخزين الرقم (1 بت بدلاً من 32) ، ومئات المرات أقل من الطاقة ، وهذا هو السبب في أنها أكثر ملاءمة "للتطبيقات المتطورة" مثل robomobile ، عندما تستطيع الأجهزة نفسها معالجة المعلومات دون استخدام الحوسبة السحابية.

غالبًا ما تحدث في طبقات الشبكة الثنائية مع وجود قيم غير ثنائية ، خاصةً عند الإدخال ، وأحيانًا عند الإخراج. عند الإدخال ، من المرجح أن تكون الصورة بالألوان الكاملة ، وستحتاج إلى تفسير رقمي بعد بدء الطبقات الثنائية. وسوف يكون لطبقة الخرج دائمًا مخرجات غير ثنائية.

مستقبل الشبكات الثنائية


يفتح هذا البساطة مجالًا واسعًا للاستخدام التجاري في ظروف تكون فيها الكفاءة هي كل شيء. على شريحة مدمجة ، من الأرجح تخزين معاملات الشبكة الثنائية أكثر من الشبكات ذات معاملات الفاصلة العائمة. سيحتاج مصنعو المعالجات إلى اعتماد هذه التكنولوجيا وتقديم الدعم للشبكات الثنائية.

من المحتمل أن يكون عام 2020 عام الشبكات الثنائية. تعمل الشركات بنشاط على تنفيذ هذه التكنولوجيا ، ويتطور البرنامج المطلوب لتدريب الشبكات الثنائية بسرعة. من المحتمل أن نرى أول تطبيق حقيقي لهذه التقنية قريبًا ، وستظهر رقائق منخفضة الطاقة منخفضة الطاقة على أجهزة متطورة يمكنها تصنيف الصور أو غيرها من البيانات.

وبالتالي ، سيتم بناء الجيل القادم من التكنولوجيا على البساطة.

Source: https://habr.com/ru/post/ar483674/


All Articles