دربت منظمة العفو الدولية في Google طفلاً ذكاءً اصطناعيًا يفوق كل الذكاء الاصطناعي من صنع الإنسان



في مايو 2017 ، قدم باحثو Google Brain مشروع AutoML ، الذي يعمل تلقائيًا على تصميم نماذج التعلم الآلي. أظهرت تجارب AutoML أن هذا النظام يمكن أن يولد شبكات عصبية صغيرة ذات أداء جيد جدًا - يمكن مقارنته تمامًا بالشبكات العصبية التي تم تصميمها وتدريبها من قبل خبراء بشريين. ومع ذلك ، كانت AutoML في البداية مقتصرة على مجموعات البيانات العلمية الصغيرة مثل CIFAR-10 و Penn Treebank.

تساءل مهندسو جوجل - ماذا لو وضعنا مهام أكثر جدية لمولد الذكاء الاصطناعي؟ هل نظام الذكاء الاصطناعي هذا قادر على توليد ذكاء اصطناعي آخر سيكون أفضل من الذكاء الاصطناعي من صنع الإنسان في بعض المهام المهمة مثل تصنيف الكائنات من ImageNet - أشهر مجموعات البيانات واسعة النطاق في رؤية الجهاز؟ لذلك كانت هناك شبكة NASNet العصبية ، تم إنشاؤها تقريبًا دون تدخل بشري.

كما اتضح ، يتكيف الذكاء الاصطناعي مع تصميم وتدريب الشبكات العصبية ليس أسوأ من البشر. كانت مهمة تصنيف الكائنات من مجموعة بيانات ImageNet وتعريف الكائنات من مجموعة بيانات COCO جزءًا من مشروع تعلم الهياكل القابلة للتحويل للتعرف على الصور القابلة للتحجيم .

يقول مطورو مشروع AutoML أن المهمة اتضح أنها غير تافهة ، لأن مجموعات البيانات الجديدة أكبر بعدة أوامر من تلك التي استخدمها النظام للعمل معها. اضطررت إلى تغيير بعض خوارزميات AutoML ، بما في ذلك إعادة تصميم مساحة البحث بحيث يمكن لـ AutoML العثور على أفضل طبقة وتكرارها عدة مرات قبل إنشاء النسخة النهائية من الشبكة العصبية. بالإضافة إلى ذلك ، استكشف المطورون خيارات بنية الشبكات العصبية لـ CIFAR-10 - ونقلوا يدويًا أنجح هندسة إلى مهام ImageNet و COCO.

بفضل هذه التلاعبات ، تمكن نظام AutoML من اكتشاف الطبقات الأكثر كفاءة في الشبكة العصبية التي عملت بشكل جيد لـ CIFAR-10 وفي نفس الوقت كان أداؤها جيدًا في مهام ImageNet و COCO. تم الجمع بين هاتين الطبقتين المكتشفتين لتكوين بنية مبتكرة تسمى NASNet.


تتكون بنية NASNet من نوعين من الطبقات: طبقة عادية (يسار) وطبقة اختزال (يمين). تم تصميم هاتين الطبقتين بواسطة مولد AutoML.

أظهرت المعايير أن الذكاء الاصطناعي الناتج تلقائيًا يفوق جميع أنظمة رؤية الماكينة الأخرى التي تم إنشاؤها وتدريبها من قبل خبراء بشريين في تصنيف الكائنات وتعريفها.



لذلك ، في مهمة التصنيف القائمة على ImageNet ، أظهرت الشبكة العصبية لـ NASNet دقة تنبؤية تبلغ 82.7٪ في مجموعة الاختبار. هذه النتيجة أعلى من جميع نماذج رؤية الماكينة المصممة سابقًا لعائلة Inception. أظهر نظام NASNet نتيجة لا تقل عن 1.2 نقطة مئوية أعلى من جميع الشبكات العصبية المعروفة للرؤية الآلية ، بما في ذلك أحدث النتائج من الأعمال التي لم تنشر بعد في الصحافة العلمية ، ولكن تم نشرها بالفعل على موقع arXiv.org.

يؤكد الباحثون أنه يمكن توسيع نطاق NASNet ، وبالتالي تكييفه للعمل على أنظمة ذات موارد حوسبة ضعيفة دون فقدان الكثير من الدقة. الشبكة العصبية قادرة على العمل حتى على الهاتف المحمول مع وحدة معالجة مركزية ضعيفة مع مورد ذاكرة محدود. يقول المؤلفون إن النسخة المصغرة من NASNet تُظهر دقة 74٪ ، وهي 3.1 نقطة مئوية أفضل من الشبكات العصبية المعروفة عالية الجودة لمنصات الهواتف المحمولة.

عندما تم نقل السمات المكتسبة من مصنف ImageNet إلى التعرف على الكائنات ودمجها مع إطار عمل Faster-RCNN ، أظهر النظام أفضل النتائج في مشكلة التعرف على كائن COCO سواء في النموذج الكبير أو في الإصدار المخفض للمنصات المحمولة. أظهر النموذج الضخم نتيجة 43.1٪ mAP ، وهو أفضل بـ 4 نقاط مئوية من أقرب منافس.

فتح المؤلفون شفرة المصدر لـ NASNet في مستودعات Slim and Object Detection for TensorFlow ، بحيث يمكن للجميع تجربة شبكة عصبية جديدة في عملهم.

تم نشر المقالة العلمية في 1 ديسمبر 2017 على موقع ما قبل الطباعة arXiv.org (arXiv: 1707.07012v3 ، الإصدار الثالث).

Source: https://habr.com/ru/post/ar408641/


All Articles