للحصول على بيانات تدريب كافية على أجهزة الجوال ، ليس من الضروري استخدام حشود من الناس يقومون بترميز مقاطع الفيديو يدويًا

بعد قراءة كتاب عن موضوع معين ، لن تصبح خبيرا في ذلك. كيف لا يمكنك أن تصبح له من خلال قراءة الكثير عن نفس الكتب. لكي تصبح محترفًا حقيقيًا في أي مجال من مجالات المعرفة ، من الضروري جمع قدر كبير من المعلومات من مصادر مختلفة.
سوف يكون الأمر نفسه صحيحًا بالنسبة لأجهزة الجوال وغيرها من التقنيات المعتمدة على الذكاء الاصطناعي.
تحتاج الشبكات العصبية العميقة المسؤولة عن تشغيل الجهاز إلى تدريب شامل. يحتاجون إلى دراسة كل المواقف التي قد يواجهونها في الظروف اليومية ، وتلك الحالات غير العادية التي لن يضطروا إلى مواجهتها أبدًا إذا كانوا محظوظين. مفتاح النجاح هو ضمان تدريبهم على البيانات الصحيحة.
ولكن ما هي البيانات المناسبة؟ هذه مواقف جديدة أو غير مؤكدة وليست تكرارًا ثابتًا لنفسها.
التعلم النشط هو وسيلة لاختيار بيانات التعلم للتعلم الآلي التي تجد هذه البيانات المتنوعة تلقائيًا. علاوة على ذلك ، فهو يجمع مجموعات البيانات لجزء صغير من الوقت الذي سيستغرقه الأشخاص لإكمال هذه المهمة.
إنه يعمل بمساعدة نموذج مدرّب ، يتكرّر على البيانات المجمّعة ويميز تلك الإطارات ، مع إدراك أنه واجه صعوبات. ثم يتم تمييز هذه الإطارات من قبل الناس. ثم يتم إضافتها إلى بيانات التدريب. هذا يزيد من دقة النموذج في مواقف مثل التعرف على الأشياء في الظروف الصعبة.
كيفية البحث عن إبرة في كومة البيانات
كمية البيانات اللازمة لتدريب robomobile هائلة. يعتقد خبراء من
شركة RAND أن السيارة تحتاج إلى السفر 17 مليار كم لتجاوز الشخص في الدقة بنسبة 20 ٪. للقيام بذلك ، سيتعين على أسطول مكون من 100 سيارة في العالم الحقيقي قيادة السيارة بشكل مستمر لمدة 500 عام.
بالإضافة إلى ذلك ، ليست كل البيانات التي تم الحصول عليها أثناء القيادة على الطريق مناسبة لهذه المهمة. يجب أن تحتوي بيانات التدريب الفعالة على ظروف متنوعة ومعقدة لضمان رحلة آمنة.
إذا كان الأشخاص منخرطون في البحث عن هذه البيانات وترميزها ، فإن معالجة البيانات التي تلقاها أسطول مكون من 100 سيارة كانت تسافر لمدة 8 ساعات يوميًا تتطلب عمل أكثر من مليون علامة ، والتي كانت ضرورية لتمييز البيانات من جميع كاميرات جميع السيارات - من الواضح أنها مهمة مستحيلة. بصرف النظر عن تكلفة العمالة البشرية ، فإن تخصيص الموارد لتخزين البيانات والحوسبة الشبكية العصبية سيكون غير عملي.
يمثل الجمع بين العلامات والموافقة على البيانات تحديًا خطيرًا لتطوير أجهزة الروبوت. من خلال تطبيق الذكاء الاصطناعي على هذه العملية ، يمكنك توفير الوقت والمال في التدريب ، مع زيادة دقة الشبكات العصبية.
لماذا التعلم النشط
هناك ثلاث طرق شائعة لاختيار البيانات لتدريب الشبكات العصبية لأجهزة الجوال. تختار العينات العشوائية الإطارات من قاعدة البيانات على فترات زمنية منتظمة ، والتي تصف السيناريوهات الأكثر شيوعًا ، ولكن من المحتمل أن تفوت الحالات النادرة.
تستخدم طريقة أخذ العينات المستندة إلى البيانات التعريفية التسميات الأساسية (على سبيل المثال ، "المطر" و "الليل") لأخذ عينات من البيانات ، مما يسهل العثور على المواقف الصعبة الشائعة ، ولكن أيضًا يفقد الإطارات الفريدة التي لا يمكن تصنيفها بسهولة - مثل مقطورة مع جرار أو شخص مع لاعبي القفز عبور الطريق.
مقارنة المشهد المعتاد على الطريق السريع (أعلى اليسار) بسيناريوهات غير عادية: سائق ليلي على العجلات الخلفية ، شاحنة صغيرة مع مقطورة مع مقطورة ، مشاة على لاعبيها.أخيرًا ، يستخدم أخذ العينات اليدوي علامات بيانات التعريف إلى جانب الأشخاص الذين يشاهدون الإطارات - مثل هذه المهمة تستغرق وقتًا طويلاً وعرضة للخطأ ولا تتسع بشكل جيد.
التعلم النشط يجعل من الممكن أتمتة عملية اختيار الإطارات ، مع اختيار نقاط مرجعية قيّمة في البيانات. يبدأ بتدريب شبكة عصبية خاصة على البيانات المصنفة بالفعل. بعد ذلك ، تقوم الشبكة بمعالجة البيانات غير المخصصة ، واختيار الإطارات التي لا يمكن التعرف عليها - وبالتالي ، فإنها تبحث عن البيانات التي ستكون صعبة لخوارزمية سيارة الروبوت. ثم تتم دراسة هذه البيانات وترميزها بواسطة الأشخاص ، وإضافتها إلى قاعدة بيانات التدريب.
حلقة من التعلم النشط: لتدريب النموذج على البيانات التي تحمل علامات ، واختيار مجموعة من البيانات غير المخصصة ، ووضع علامة على البيانات المحددة باستخدام العمالة البشرية ، وإضافة بيانات جديدة تحمل علامات إلى قاعدة البيانات ؛ تكرار.أظهر التدريب النشط بالفعل قدرته على زيادة دقة تشغيل الشبكات العصبية للروبوتات مقارنة بالإضافة اليدوية للبيانات. في
دراستنا ، وجدنا أن الزيادة في الدقة عند استخدام التدريب النشط تتجاوز الزيادة في الدقة مع أخذ العينات اليدوية للبيانات حتى 3 مرات للتعرف على المشاة ، وحتى 4.4 مرة لراكبي الدراجات.
في الوقت نفسه ، تعمل أساليب التدريب المتقدمة للشبكات العصبية ، على سبيل المثال ، التعلم النشط ، والتعلم في مجال
النقل ، والتعلم
التعاوني بكفاءة أكبر على بنية تحتية موثوقة وقابلة للتطوير تتيح لك معالجة كميات هائلة من البيانات في وقت واحد ، وتقصير دورة التطوير. يتم توفير الوصول إلى هذه القدرات من خلال مشروع
NVIDIA GPU Cloud ، حيث توجد كل من أدوات التدريب المذكورة ومكتبة كبيرة من الشبكات العصبية العميقة لأجهزة الجوال.