कार्नेगी मेलन के शोधकर्ताओं ने सबसे विश्वसनीय "डीपफेक" बनाया है

कभी "डीपफेक" के बारे में सुना है? AI, जो एक व्यक्ति के शरीर को दूसरे के चेहरे पर लगाता है, का उपयोग हेरिसन फोर्ड को निकोलस केज के साथ अनगिनत वीडियो क्लिप में बदलने के लिए किया गया था, साथ ही अधिक जघन्य प्रयोजनों के लिए: मशहूर हस्तियों को उनके ज्ञान के बिना पोर्न और प्रचार में दिखाई दिया। अब, बेहतर या बदतर के लिए, कार्नेगी मेलन विश्वविद्यालय के शोधकर्ताओं ने एक नया, अधिक शक्तिशाली और बहुमुखी सिस्टम विकसित किया है।


इसे "रीसायकल-गण" कहा जाता है। यह एक वीडियो या फोटोग्राफ की सामग्री को दूसरे की समानता में बदलने के लिए एक प्रणाली है, जो इनपुट रहित डेटा (शिक्षक के बिना प्रशिक्षण) से विशेष रूप से सीखता है। "मूल की शैली को संरक्षित करते हुए सामग्री को बदलने के कार्य के कई उपयोग हैं, उदाहरण के लिए, एक व्यक्ति के आंदोलनों और चेहरे की अभिव्यक्तियों को दूसरे पर थोपना," करते हैं "विधि का उपयोग करते हुए रोबोट को प्रशिक्षित करना, शोधकर्ताओं का कहना है, या काले और सफेद वीडियो को रंग में परिवर्तित करना।"

अब तक, परिवर्तन के सबसे उन्नत तरीके मानव चेहरों के उद्देश्य से किए गए हैं, और शोधकर्ताओं के अनुसार, "वे अन्य क्षेत्रों में लागू करने के लिए व्यावहारिक रूप से असंभव थे," इसके अलावा वे "आंशिक रूप से छिपे हुए चेहरे के साथ बहुत खराब काम करते हैं।" अन्य विधियों में फ्रेम-बाय-फ्रेम परिवर्तन का उपयोग किया जाता है, जिसके लिए श्रमसाध्य मैनुअल लेबलिंग और डेटा संरेखण की आवश्यकता होती है।

छवि

रीसायकल-जीएएन दो चित्रों या वीडियो को "लिंक" करने के लिए जेनेरेटर के प्रतिकूल नेटवर्क (GAN) और "स्पेस-टाइम मार्कर" का उपयोग करता है। (GANs एक जनरेटर से युक्त मॉडल हैं जो इनपुट डेटा से तेजी से यथार्थवादी परिणाम उत्पन्न करके "चालबाज" करने की कोशिश करता है।) जब लोगों के साथ वीडियो पर प्रशिक्षण करते हैं, तो वे गालों पर डिंपल के रूप में ऐसे मायावी क्षणों के साथ वीडियो बनाते हैं जब आप मुस्कुराते हैं। और होंठ आंदोलन।

"किसी भी हस्तक्षेप और वीडियो की बारीकियों से संबंधित बुनियादी ज्ञान के बिना, हमारा दृष्टिकोण इंटरनेट से सार्वजनिक रूप से सुलभ विषय वीडियो का उपयोग करके सीखने में सक्षम है," विकास टीम लिखती है

रीसायकल-गण चेहरे के भावों को प्रसारित करने की तुलना में बहुत अधिक सक्षम है। शोधकर्ताओं ने एक घुमावदार दिन पर पूर्ण शांत में परिवर्तित करके एक वीडियो में मौसम की स्थिति को बदलने के लिए इसका इस्तेमाल किया। उन्होंने फूल खिलने और मरने की नकल की, और इंटरनेट पर एक वीडियो से एक ठोस सूर्योदय का संश्लेषण किया।


परीक्षण के परिणाम काफी अच्छे हैं: सिस्टम 28.3% मामलों में 15 विषयों को रौंदने में कामयाब रहा, लेकिन टीम का मानना ​​है कि सिस्टम के भविष्य के संस्करणों के उत्पाद अधिक विश्वसनीय हो सकते हैं यदि वे प्लेबैक गति को ध्यान में रखते हैं, उदाहरण के लिए, वीडियो में लोग कितना तेज या धीमा कहते हैं

"एक प्रशंसनीय शैली हस्तांतरण भी भाषण / सामग्री के प्रजनन से उत्पन्न समय अंतर को ध्यान में रखने में सक्षम होना चाहिए," टीम ने लिखा। "हम मानते हैं कि एक तंत्रिका नेटवर्क का सबसे अच्छा अनुपात-लौकिक वास्तुकला निकट भविष्य में इस समस्या को हल कर सकता है।"


आश्चर्य की बात नहीं है, डीपफेक एक गर्म बहस वाला गर्म विषय बना हुआ है। सार्वजनिक रूप से उपलब्ध सेवाएं उनके निर्माण को अपेक्षाकृत आसान बनाती हैं, और ऐसे वीडियो के पीड़ितों की सुरक्षा के लिए कोई कानूनी आधार नहीं है।

रेडिट, पोर्नहब, ट्विटर, और अन्य लोगों ने उनके खिलाफ एक स्टैंड लिया है, और शोधकर्ता (सबसे हाल ही में संयुक्त राज्य अमेरिका के रक्षा विभाग में शामिल हुए) डीपफेक का पता लगाने के तरीकों की तलाश जारी रखते हैं। लेकिन, एरिक गोल्डमैन के रूप में, सांता क्लारा लॉ स्कूल के एक प्रोफेसर और उच्च प्रौद्योगिकी संस्थान के निदेशक ने हाल ही में कहा, यह "दुनिया में रहने के लिए तैयार होने के लिए सबसे अच्छा है जहां वास्तविक और नकली दोनों तस्वीरें और वीडियो हमें घेर लेंगे।"

Source: https://habr.com/ru/post/hi420541/


All Articles