ولادة المصفوفة: تعلمت الشبكات العصبية الاصطناعية كيفية إنشاء وجوه واقعية للأشخاص والداخلية لغرف النوم



في المصفوفة ، في الجزء الأول ، لا يمكن لنظام الكمبيوتر الذكي فقط أن يخلق عالمًا افتراضيًا ، ولكن يمكن لأجهزة الكمبيوتر في نبوخذنصر ، وهي سفينة متمردة ، أن تولد أيضًا عالمًا افتراضيًا مصغرًا. يتذكر الكثيرون الفتاة ذات اللون الأحمر ، التي ظهرت في إحدى المحاكاة - وتظهر في الصورة في الإعلان. قبل إنشاء مثل هذا النموذج الافتراضي للعالم الحقيقي ، ما زلنا (وأجهزة الكمبيوتر الخاصة بنا) بعيدة جدًا. ولكن هناك شيء موجود بالفعل الآن. أنشأ

فريق من الباحثين من إنديكو وفيسبوك شبكة عصبية يمكنها "الخروج" بصور واقعية. بالمناسبة ، يمكن العثور على تطور الشبكات العصبية هنا . الشبكة العصبية الاصطناعية ( ANN) - نموذج رياضي ، بالإضافة إلى تطبيقه للبرمجيات أو الأجهزة ، مبني على مبدأ تنظيم وعمل الشبكات العصبية البيولوجية - شبكات الخلايا العصبية للكائن الحي. الآن يتم استخدام ANNs في العديد من المجالات ، بما في ذلك التنبؤ والتعرف على الأنماط والعمل مع البيانات الكبيرة. قرر أليك رادفورد من إنديكو وزملاؤه الاهتمام بنوع من NIS مثل شبكة الخصومة التوليدية.



في مثل هذه الشبكة ، يحاول جزء من النظام إنشاء مجموعة من البيانات الخاطئة من أجل "خداع" الجزء الثاني. كانت الفكرة هي أنك إذا كررت هذه العملية باستمرار ، فسوف يتعلم النظام كيفية إنشاء صور أفضل.

قام مؤلفو الدراسة بتدريب نظام يعتمد على مجموعة من صور غرف النوم. ثم طلب من النظام إنشاء صورهم الخاصة. للتأكد من أن النظام يقوم بالفعل بإنشاء الصور الأصلية ، ولا ينسخها من قاعدة البيانات ، أعطى الخبراء الأمر لإنشاء سلسلة من التعديلات لصورة غرفة النوم نفسها - على سبيل المثال ، بدون نافذة ، مع طاولة أو تلفزيون. جعلت هذه التقنية من الممكن التحقق من أن النظام تعلم إنشاء الداخلية من تلقاء نفسها.

بالإضافة إلى ذلك ، قام الخبراء بتدريب النظام على إنشاء الصور ، حيث يتم استبدال جزء مهم (على سبيل المثال ، نافذة) بشيء. على سبيل المثال ، يستبدل النظام نافذة بتلفزيون أو مدفأة. هذا يشير إلى أن النظام قد تعلم "فهم" ما يشكل جزءًا معينًا من الداخل.



يمكن استخدام مبدأ مماثل للقطات أخرى ، مثل الصور الشخصية. في تجربة أخرى ، طلب الباحثون من النظام إبراز صورة لامرأة مبتسمة ، ثم إضافة تعبير محايد و "إضافة" رجل بتعبير محايد. الهدف هو تحديد مفهوم "الابتسامة" ودمجها مع مفهوم "الرجل".

ونتيجة لذلك ، تلقى الباحثون مجموعة من الصور لرجال مبتسمون.

الآن ، لسوء الحظ ، يقتصر حجم الصور على 32 * 32 بكسل ، مما يجعل النظام أسرع وأكثر كفاءة. المرحلة التالية من العمل هي نقل مثل هذا المخطط إلى الفيديو والصوت.

وبعد إضافة التأثير ثلاثي الأبعاد ، بالإضافة إلى الديناميكيات ، بالإضافة إلى التفاصيل البيئية الإضافية ، نحصل على "Matrix" كاملة. أم لا؟

Source: https://habr.com/ru/post/ar387209/


All Articles