شبكة Nvidia العصبية تتحول إلى رسومات بسيطة في المناظر الطبيعية الجميلة


مدخن الشلال وشلال الرجل الصحي

نعلم جميعا كيفية رسم البومة. تحتاج أولاً إلى رسم بيضاوي ، ثم دائرة أخرى ، ثم تحصل على بومة رائعة. بالطبع ، هذه مزحة ، إنها قديمة جدًا ، لكن مهندسي نفيديا حاولوا جعل الخيال حقيقة.

يُحدث التطوير الجديد ، المسمى GauGAN ، مناظر طبيعية رائعة من رسومات بسيطة جدًا (تلك بسيطة جدًا - الدوائر والخطوط وجميعها). بالطبع ، يعتمد هذا التطور على التقنيات الحديثة - أي الشبكات العصبية الخصمية التوليفية.

يتيح لك GauGAN إنشاء عوالم افتراضية ملونة - ليس فقط للترفيه ، ولكن أيضًا للعمل. لذلك ، يمكن للمهندسين المعماريين ومصممي المناظر الطبيعية ومطوري الألعاب - تعلم جميعهم شيئًا مفيدًا. الذكاء الاصطناعي "يفهم" على الفور ما يريده الشخص ويكمل الفكرة الأصلية بكمية هائلة من التفاصيل.

وقال أحد مطوري GauGAN "العصف الذهني فيما يتعلق بتطوير التصميم أصبح أسهل بكثير بمساعدة GauGAN ، حيث أن الفرشاة الذكية يمكن أن تكمل الرسم الأولي عن طريق إضافة صور عالية الجودة".

يمكن لمستخدمي هذه الأداة تغيير الفكرة الأولية أو تعديل المشهد أو صورة أخرى أو إضافة السماء أو الرمال أو البحر ، إلخ. كل ما يرغب به قلبك ، وتتم الإضافة في بضع ثوانٍ فقط.

تم تدريب الشبكة العصبية باستخدام قاعدة بيانات تضم ملايين الصور. بفضل هذا ، يمكن للنظام فهم ما يريده الشخص وكيفية تحقيق ما يريد. علاوة على ذلك ، لا تنسى الشبكة العصبية أصغر التفاصيل. لذلك ، إذا رسمت البركة وبعض الأشجار المجاورة لها ، فبعد إحياء المشهد ، ستنعكس جميع الكائنات القريبة في مرآة مياه البركة.

يمكن تحديد النظام على النحو الذي ينبغي أن يكون عليه السطح المرئي - يمكن تغطيته بالعشب أو الثلج أو الماء أو الرمل. كل هذا يمكن تحويله في الثانية ، بحيث يصبح الثلج رمالًا وبدلاً من أرض قاحلة ثلجية ، سيتلقى الفنان منظرًا صحراويًا.

"يشبه كتاب التلوين الذي يوضح مكان وضع الشجرة وأين الشمس وأين السماء. ثم ، بعد المهمة الأولية ، تنشط الشبكة العصبية الصورة ، وتضيف التفاصيل والقوام الضرورية ، وتوجه الانعكاسات. كل هذا يعتمد على صور حقيقية "، كما يقول أحد المطورين.


على الرغم من أن النظام يفتقر إلى "فهم" للعالم الحقيقي ، فإن النظام يخلق مناظر طبيعية رائعة. هذا لأنه يتم استخدام شبكتين عصبية ، مولد ومميز ، هنا. يقوم المولد بإنشاء صورة ويظهرها للمتمييز. هذا ، بناءً على ملايين الصور التي تم مشاهدتها سابقًا ، يختار الخيارات الأكثر واقعية.

هذا هو السبب في أن المولد "يعرف" أين يجب أن تكون الانعكاسات. تجدر الإشارة إلى أن الأداة مرنة للغاية ومجهزة بعدد كبير من الإعدادات. لذلك ، بمساعدتها يمكنك طلاء الصور ، والتكيف مع أسلوب فنان معين أو مجرد الانغماس في الإضافة السريعة لشروق الشمس أو غروبها.

يدعي المطورون أن النظام لا يلتقط الصور من مكان ما ، ويضيفهم معًا ويحصل على النتيجة. لا ، يتم إنشاء جميع "الصور" المستلمة. أي أن الشبكة العصبية "تخلق" كفنان حقيقي (أو حتى أفضل).

حتى الآن ، لا يوجد البرنامج في المجال العام ، لكن قريبًا سيكون من الممكن اختباره في العمل. يمكن القيام بذلك في مؤتمر GPU Technology 2019 ، الذي يعقد في كاليفورنيا الآن. يستطيع المحظوظون الذين تمكنوا من زيارة المعرض اختبار GauGAN بالفعل.

منذ فترة طويلة يتم تدريس الشبكات العصبية للمشاركة في العملية الإبداعية. على سبيل المثال ، في العام الماضي ، يمكن أن ينشئ بعضها نماذج ثلاثية الأبعاد . بالإضافة إلى ذلك ، قام المطورون من DeepMind بتدريب الشبكة العصبية لاستعادة المساحات والكائنات ثلاثية الأبعاد من الرسومات والصور والرسومات. لإعادة إنشاء شخصية بسيطة ، تكفي الشبكة العصبية لصورة واحدة ؛ لإنشاء كائنات أكثر تعقيدًا ، هناك حاجة إلى خمس صور "للسحب".

بالنسبة إلى GauGAN ، من الواضح أن هذه الأداة سوف تجد تطبيقًا تجاريًا جديرًا - فهناك العديد من مجالات الأعمال والعلوم تحتاج إلى مثل هذه الخدمات.

Source: https://habr.com/ru/post/ar444468/


All Articles