شبكات الخصومات التوليدية (GAN) - فئة من النماذج التوليفية العميقة مع ميزات مثيرة للاهتمام. فكرتهم الأساسية هي تدريب شبكتين عصبيتين ، مولد يتعلم توليف البيانات (على سبيل المثال ، الصور) ، ومميز يتعلم كيفية التمييز بين البيانات الحقيقية وما توليفه المولد. تم استخدام هذا النهج بنجاح
لتوليف الصور عالي الجودة وضغط الصور المحسن والمزيد.
تطور الأنماط المتولدة في عملية التعلم على ImageNet. يقتصر المولد على فئة الصورة (على سبيل المثال ، "البومة الملتحية" أو "المسترد الذهبي").في مجال تركيب الصور الطبيعية ، تحقق
GSSs الشرطية أفضل النتائج ، والتي ، على عكس تلك غير المشروطة ، تستخدم الملصقات ("الآلة" ، "الكلب" ، إلخ) أثناء التدريب. على الرغم من أن هذا يبسط المهمة ويوفر تحسنا كبيرا في النتيجة ، فإن هذا النهج يتطلب قدرا كبيرا من البيانات الموسومة ، والتي نادرا ما توجد في الممارسة العملية.
في عملنا "إنشاء صور عالية الجودة مع عدد أقل من العلامات" ، نقترح طريقة جديدة لتقليل كمية البيانات التي تم تمييزها المطلوبة لتدريب GSS الشرطي المتقدم. عند دمج هذا النهج مع الاختراقات الحديثة في تطوير GSSs على نطاق واسع ، فإننا ننتج صورًا طبيعية قابلة للمقارنة باستخدام علامات أقل بعشر مرات. نحن نصدر أيضًا تحديثًا كبيرًا
لمكتبة Compare GAN استنادًا إلى هذه الدراسة ، والتي تحتوي على جميع المكونات اللازمة للتدريب وتقييم GSS الحديث.
تحسينات من خلال الإشراف شبه والإشراف الذاتي
في GSS الشرطي ، يقتصر المولد والمميز على تسميات الفصل. في عملنا ، نقترح استبدال العلامات الملصقة يدويًا بالعلامات المفترضة. لعرض تسميات جيدة النوعية لمجموعة كبيرة تتكون من بيانات غير مميزة ، نستخدم نهجًا من خطوتين. أولاً ، نتعلم كيفية تقديم ميزات الصور فقط من خلال مثال الجزء غير المخصص من قاعدة البيانات. للتعرّف على عرض العلامات ، نستخدم الإشراف الذاتي في شكل
منهج مقترح مؤخرًا حيث يتم خلط البيانات غير المُعلَّمة عشوائيًا ، وتتوقع الشبكة العصبية التلافيفية العميقة زاوية الدوران. الفكرة هي أن النماذج يجب أن تكون قادرة على التعرف على الكائنات الأساسية وأشكالها من أجل إكمال هذه المهمة بنجاح:

بعد ذلك ، نعتبر تسلسل التنشيط لإحدى الطبقات الوسيطة للشبكة المدربة تمثيلًا جديدًا لخصائص بيانات الإدخال ، ونقوم بتدريب المصنف على التعرف على تسمية بيانات الإدخال هذه باستخدام الجزء المعنون في مجموعة البيانات الأولية. نظرًا لأن الشبكة تم تدريبها بشكل مسبق على استخراج سمات البيانات ذات المعنى الدلالة (في المهمة مع التنبؤ بالتناوب) ، فإن تدريب هذا المصنف يكون أكثر كفاءة من خلال الأمثلة بدلاً من تدريب الشبكة بالكامل من نقطة الصفر. أخيرًا ، نستخدم هذا المصنف لترميز البيانات غير المخصصة.
لزيادة تحسين جودة النموذج واستقرار التدريب ، نشجع شبكة المتميزين على تعلم تمثيلات ذات مغزى للسمات التي لا يتم نسيانها أثناء التدريب بسبب الخسائر المساعدة التي قدمناها مسبقًا. توفر هاتان الميزتان ، جنبًا إلى جنب مع التدريب على نطاق واسع ، أنظمة GSS مشروطة متقدمة مناسبة تمامًا لتجميع الصور من ImageNet ، إذا حكمنا على
مسافة Fréchet.
تقوم شبكة المولد بإنتاج صورة استنادًا إلى eigenvector. في كل صف ، يؤدي الاستيفاء الخطي للرموز المتجاورة للصور الموجودة في أقصى اليمين وأقصى اليمين إلى الاستكمال الدلالي في مساحة الصورة.قارن مكتبة GAN للتدريب وتقييم GSS
تعتمد الأبحاث المتقدمة في مجال GSS بشدة على رمز تم تطويره واختباره جيدًا ، حتى أن استنساخ النتائج والتقنيات السابقة يتطلب الكثير من الجهد. لدعم العلوم المفتوحة والسماح لمجتمع البحث بالبناء على الاختراقات الحديثة ، نقوم بإصدار تحديث كبير لمكتبة مقارنة GAN. ويشمل وظائف الخسارة ، وأنظمة التطبيع والتطبيع ، وهندسة الشبكات العصبية ، والمقاييس العددية ، التي تستخدم غالبًا في GSS الحديثة. كما أنها تدعم بالفعل:
- التدريب على GPU و TPU.
- سهل الإعداد مع الجن ( أمثلة ).
- هناك عدد كبير من مجموعات البيانات من خلال مكتبة TensorFlow .
خاتمة وخطط للمستقبل
بالنظر إلى الفجوة بين مصادر البيانات المصنفة وغير المصنفة ،
أصبح من المهم بشكل متزايد التعلم من البيانات المصنفة جزئيًا فقط. لقد أظهرنا أن وجود مجموعة بسيطة ولكنها قوية من الإشراف الذاتي وشبه المراقبة يمكن أن تساعد في سد هذه الفجوة في GSS. نحن نعتقد أن الإشراف الذاتي هو فكرة واعدة يجب استكشافها في مجالات أخرى من النمذجة التوليدية.