तेजी से आकार वीडियो जीप

छवियों के साथ काम करने के लिए अनुप्रयोगों में, जीप (जेपीईजी एल्गोरिथ्म का उपयोग करके संपीड़ित छवियां) के आकार बदलने का कार्य काफी सामान्य है। इस स्थिति में, आप तुरंत आकार नहीं बदल सकते हैं और आपको पहले मूल डेटा को डीकोड करना होगा। इस बारे में कुछ भी जटिल और नया नहीं है, लेकिन अगर आपको इसे दिन में कई बार करने की आवश्यकता है, तो ऐसे समाधान के प्रदर्शन का अनुकूलन करना, जो बहुत तेज़ होना चाहिए, विशेष महत्व का है।



जब जेपीईजी फॉर्मेट में ज्यादातर कैमरा और फोन शूट होते हैं, तो पिक्चर रिपॉजिटरी के लिए रिमोट होस्टिंग का आयोजन करते समय यह समस्या अक्सर सामने आती है। हर दिन, अग्रणी वेब सेवाओं (सामाजिक नेटवर्क, फ़ोरम, फोटो होस्टिंग और कई अन्य) के फोटो अभिलेखागार को इस तरह की छवियों की एक महत्वपूर्ण संख्या के साथ फिर से भर दिया जाता है, इसलिए ऐसी छवियों को कैसे संग्रहीत किया जाए, यह सवाल बेहद महत्वपूर्ण है। आउटगोइंग ट्रैफ़िक का आकार कम करने और उपयोगकर्ता के अनुरोध पर प्रतिक्रिया समय को बेहतर बनाने के लिए, कई वेब सेवाएँ विभिन्न संकल्पों में एकल छवि के लिए दर्जनों फाइलें संग्रहीत करती हैं। प्रतिक्रिया की गति अच्छी है, लेकिन ये प्रतियां बहुत अधिक स्थान लेती हैं। यह एक बड़ी समस्या है, हालांकि इस दृष्टिकोण के अन्य नुकसान भी हैं।

इस समस्या को हल करने का विचार सर्वर पर मूल छवि के कई संस्करणों को विभिन्न प्रस्तावों में संग्रहीत करने के लिए नहीं है, लेकिन पहले से तैयार मूल से दिए गए आकारों के साथ वांछित छवि बनाने के लिए, और जितनी जल्दी हो सके। इस प्रकार, वास्तविक समय में, आप वांछित रिज़ॉल्यूशन की एक छवि बना सकते हैं और तुरंत उपयोगकर्ता को भेज सकते हैं। यह बहुत महत्वपूर्ण है कि इस छवि का रिज़ॉल्यूशन तुरंत बनाया जा सकता है ताकि उपयोगकर्ता का डिवाइस स्क्रीन आकार परिवर्तन न करे, क्योंकि यह केवल आवश्यक नहीं होगा।

JPEG के अलावा अन्य स्वरूपों का उपयोग करके छवियों के इस तरह के भंडार के आयोजन का आधार उचित नहीं लगता है। बेशक, मानक, व्यापक रूप से उपयोग किए जाने वाले प्रारूप हैं जो समान गुणवत्ता (JPEG2000, WebP) के साथ बेहतर संपीड़न देते हैं, लेकिन JPEG की तुलना में ऐसी छवियों की एन्कोडिंग और डिकोडिंग की गति बहुत कम है, इसलिए मूल तस्वीरों को संग्रहीत करने के लिए आधार प्रारूप के रूप में JPEG का चयन करना समझ में आता है, जो, यदि आवश्यक हो, तो उपयोगकर्ता से अनुरोध प्राप्त करने के बाद वास्तविक समय में बढ़ाया जाएगा।

बेशक, जीपों के अलावा, प्रत्येक साइट में सबसे अधिक बार पीएनजी और जीआईएफ छवियां होती हैं, लेकिन आमतौर पर उनकी सापेक्ष संख्या छोटी होती है और इन प्रारूपों में तस्वीरें बेहद दुर्लभ होती हैं। इसलिए, ये प्रारूप अधिकांश मामलों में विचाराधीन कार्य पर महत्वपूर्ण प्रभाव नहीं डालेंगे।

मक्खी पर आकार बदलने एल्गोरिदम का विवरण


तो, इनपुट डेटा जेपीईजी फाइलें हैं, और तेजी से डिकोडिंग प्राप्त करने के लिए (यह सीपीयू और जीपीयू दोनों के लिए सच है), संपीड़ित चित्रों में अंतर्निहित पुनरारंभ मार्कर होना चाहिए। इन मार्करों को जेपीईजी मानक में वर्णित किया गया है और कोडेक्स का हिस्सा उनके साथ काम कर सकता है, बाकी सभी जानते हैं कि उन्हें कैसे नोटिस नहीं करना है। यदि जीप में ऐसे मार्कर नहीं हैं, तो उन्हें अग्रिम में jpegtran उपयोगिता का उपयोग करके जोड़ा जा सकता है। जब मार्कर जोड़े जाते हैं, तो छवि नहीं बदलती है, लेकिन फ़ाइल का आकार थोड़ा बड़ा हो जाता है। परिणामस्वरूप, हम निम्नलिखित कार्य योजना प्राप्त करते हैं:

  1. सीपीयू मेमोरी से छवि डेटा प्राप्त करें
  2. यदि कोई रंग प्रोफ़ाइल है, तो इसे EXIF ​​अनुभाग से प्राप्त करें और सहेजें
  3. चित्र को वीडियो कार्ड में कॉपी करें
  4. जेपीईजी को डिकोड करें
  5. हम लैंकोज़ एल्गोरिथ्म (कमी) के अनुसार एक आकार बदलते हैं
  6. तीखेपन थोपना
  7. हम JPEG का उपयोग करके छवि को एन्कोड करते हैं
  8. होस्ट करने के लिए छवि की प्रतिलिपि बनाएँ
  9. परिणामी फ़ाइल में मूल रंग प्रोफ़ाइल जोड़ें।

आप अधिक सटीक निर्णय ले सकते हैं, जब आकार बदलने से पहले, उलटा गामा पिक्सेल के प्रत्येक घटक पर आरोपित होता है, ताकि आकार रैखिक स्थान पर हो, और फिर गामा को फिर से लागू किया जाता है, लेकिन शार्प के बाद। उपयोगकर्ता के लिए वास्तविक अंतर छोटा है, लेकिन यह मौजूद है, और इस तरह के संशोधन के लिए कम्प्यूटेशनल लागत न्यूनतम है। केवल उलटा और प्रत्यक्ष गामा के सुपरपोजिशन को सामान्य प्रसंस्करण योजना में सम्मिलित करना आवश्यक है।

एक संभव समाधान भी है जब लिक्विडजप-टर्बो लाइब्रेरी का उपयोग करके जीपों को डिकोडिंग मल्टी-कोर सीपीयू पर किया जाता है। इस स्थिति में, प्रत्येक तस्वीर को एक अलग सीपीयू स्ट्रीम में डिकोड किया जाता है, और अन्य सभी क्रियाएं वीडियो कार्ड पर की जाती हैं। बड़ी संख्या में सीपीयू कोर के साथ, यह तेजी से भी हो सकता है, लेकिन विलंबता में गंभीर नुकसान होगा। यदि एकल सीपीयू कोर पर एक जीप को डिकोड करने के दौरान विलंबता स्वीकार्य है, तो यह विकल्प बहुत तेज हो सकता है, खासकर उस स्थिति के लिए जब मूल जीप में एक छोटा संकल्प होता है। यदि आप मूल छवि का रिज़ॉल्यूशन बढ़ाते हैं, तो एक सीपीयू स्ट्रीम में जीप का डिकोडिंग समय बढ़ जाएगा, इसलिए यह विकल्प केवल छोटे प्रस्तावों के लिए उपयुक्त हो सकता है।

वेब के लिए बुनियादी आवश्यकताओं का आकार कार्य है


  • यह सलाह दी जाती है कि सर्वर पर अलग-अलग प्रस्तावों में प्रत्येक छवि की दर्जनों प्रतियां संग्रहीत न करें, लेकिन अनुरोध प्राप्त होने पर तुरंत सही समाधान के साथ वांछित चित्र बनाएं। भंडारण के आकार को कम करने के लिए यह महत्वपूर्ण है, क्योंकि अन्यथा आपको प्रत्येक छवि की कई अलग-अलग प्रतियां संग्रहीत करनी होंगी।
  • समस्या को जल्द से जल्द हल किया जाना चाहिए। यह उपयोगकर्ता के अनुरोध पर प्रतिक्रिया समय को कम करने के संदर्भ में प्रदान की गई सेवा की गुणवत्ता के बारे में एक प्रश्न है।
  • भेजी गई छवि की गुणवत्ता उच्च होनी चाहिए।
  • भेजी गई छवि के लिए फ़ाइल का आकार यथासंभव छोटा होना चाहिए, और इसका रिज़ॉल्यूशन उस विंडो के आकार से बिल्कुल मेल खाना चाहिए जिसमें यह दिखाई देता है। निम्नलिखित बिंदु यहाँ महत्वपूर्ण हैं:

a) यदि छवि का आकार विंडो के आकार से मेल नहीं खाता है, तो उपयोगकर्ता डिवाइस (फोन, टैबलेट, लैपटॉप) स्क्रीन पर छवि प्रदर्शित करने से पहले डिकोडिंग के बाद एक हार्डवेयर आकार देगा। ओपनजीएल में, यह हार्डवेयर आकार परिवर्तन केवल एक बिलिनियर एल्गोरिथ्म के अनुसार किया जाता है, जो अक्सर छोटे विवरणों वाले चित्रों में मायर (दाग) और अन्य कलाकृतियों की उपस्थिति का कारण बनता है।

बी) स्क्रीन आकार अतिरिक्त रूप से डिवाइस ऊर्जा की खपत करता है।

ग) यदि आप समस्या को हल करने के लिए पूर्व-स्केल छवियों की एक श्रृंखला का उपयोग करते हैं, तो हमेशा सही आकार प्राप्त करना संभव नहीं होता है, जिसका अर्थ है कि आपको एक बड़ा रिज़ॉल्यूशन चित्र भेजना होगा। बढ़ी हुई छवि का आकार अधिक ट्रैफ़िक की ओर जाता है, जिससे मैं भी बचना चाहूंगा।

कार्य की सामान्य योजना का विवरण


  1. हम किसी भी प्रारूप में और किसी भी संकल्प में उपयोगकर्ताओं से चित्र प्राप्त करते हैं। मूल को एक अलग डेटाबेस में संग्रहीत किया जाता है (यदि आवश्यक हो)।
  2. ऑफ़लाइन, ImageMagick या इसी तरह के सॉफ़्टवेयर का उपयोग करके, रंग प्रोफ़ाइल को सहेजें, मूल मूल छवियों को मानक BMP या PPM प्रारूप में परिवर्तित करें, फिर 1K या 2K रिज़ॉल्यूशन का आकार बदलें और JPEG को संपीड़ित करें, फिर हम jpegtran उपयोगिता का उपयोग करके निर्दिष्ट निश्चित अंतराल के साथ पुनरारंभ मार्कर जोड़ते हैं।
  3. हम ऐसी 1K या 2K छवियों का एक डेटाबेस बनाते हैं।
  4. उपयोगकर्ता से एक अनुरोध प्राप्त होने पर, हम उस चित्र और खिड़की के आकार के बारे में जानकारी प्राप्त करते हैं जहां इस छवि को प्रदर्शित किया जाना चाहिए।
  5. हम डेटाबेस में छवि ढूंढते हैं और इसे रिसाइज़र को भेजते हैं।
  6. Resizer छवि फ़ाइल प्राप्त करता है, डिकोड करता है, आकार बदलता है, शार्प करता है, परिणामी जीप में मूल रंग प्रोफ़ाइल को सम्मिलित करता है और सम्मिलित करता है। उसके बाद, यह चित्र को एक बाहरी कार्यक्रम देता है।
  7. प्रत्येक वीडियो कार्ड पर, आप कई थ्रेड चला सकते हैं, और आप अपने कंप्यूटर पर कई वीडियो कार्ड स्थापित कर सकते हैं - इस प्रकार प्रदर्शन स्केलिंग प्राप्त कर सकते हैं।
  8. यह सब NVIDIA टेस्ला वीडियो कार्ड (उदाहरण के लिए, P40 या V100) के आधार पर किया जा सकता है, क्योंकि NVIDIA GeForce वीडियो कार्ड निरंतर दीर्घकालिक संचालन के लिए डिज़ाइन नहीं किए गए हैं, और NVIDIA क्वाड्रो के कई वीडियो आउटपुट हैं जिनकी इस मामले में आवश्यकता नहीं है। इस समस्या को हल करने के लिए, GPU मेमोरी साइज़ की आवश्यकताएँ न्यूनतम हैं।
  9. इसके अलावा, तैयार छवियों के साथ डेटाबेस से, आप बार-बार उपयोग की जाने वाली फ़ाइलों के लिए कैश को गतिशील रूप से आवंटित कर सकते हैं। यह पिछली अवधि के आंकड़ों के अनुसार अक्सर उपयोग की जाने वाली छवियों को संग्रहीत करने के लिए समझ में आता है।



कार्यक्रम के मापदंडों


  1. नई छवि की चौड़ाई और ऊंचाई। वे कोई भी हो सकते हैं और उन्हें स्पष्ट रूप से सेट करना बेहतर है।
  2. जेपीईजी थिनिंग मोड (सबसम्पलिंग)। तीन विकल्प हैं: 4: 2: 0, 4: 2: 2 और 4: 4: 4, लेकिन वे आमतौर पर 4: 4: 4 या 4: 2: 0 का उपयोग करते हैं। अधिकतम गुणवत्ता 4: 4: 4 है, न्यूनतम फ्रेम आकार 4: 2: 0 है। थिनिंग रंग अंतर घटकों के लिए किया जाता है, जो किसी व्यक्ति की दृष्टि के साथ-साथ चमक को भी नहीं देखता है। अधिकतम डिकोडिंग या डिकोडिंग गति प्राप्त करने के लिए पुनरारंभ मार्करों के लिए प्रत्येक डिसीमेशन मोड का अपना इष्टतम अंतराल है।
  3. छवि डेटाबेस बनाते समय JPEG संपीड़न गुणवत्ता और विघटन मोड।
  4. तीव्र एक 3x3 विंडो में किया जाता है, सिग्मा (त्रिज्या) को नियंत्रित किया जा सकता है।
  5. JPEG संपीड़न गुणवत्ता और अंतिम छवि को एन्कोडिंग करते समय विघटन मोड। आमतौर पर, कम से कम 90% की गुणवत्ता का मतलब है कि यह संपीड़न "नेत्रहीन दोषरहित" है, अर्थात। अप्रशिक्षित उपयोगकर्ताओं को मानक देखने की स्थिति में JPEG एल्गोरिथ्म की कलाकृतियों को नहीं देखना चाहिए। ऐसा माना जाता है कि प्रशिक्षित उपयोगकर्ता के लिए 93-95% की जरूरत होती है। यह मान जितना बड़ा होगा, उपयोगकर्ता को भेजे गए फ़्रेम का आकार उतना ही बड़ा होगा, और डिकोडिंग और एन्कोडिंग समय जितना लंबा होगा।

महत्वपूर्ण सीमाएँ


मार्कर को पुनरारंभ करें। हम जेपीईजी छवियों को वीडियो कार्ड पर जल्दी से डिकोड कर सकते हैं केवल अगर इसके अंदर पुनरारंभ मार्कर हैं। आधिकारिक जेपीईजी मानक में, इन मार्करों का वर्णन किया गया है, यह एक मानक पैरामीटर है। यदि कोई पुनरारंभ मार्कर नहीं हैं, तो वीडियो कार्ड पर चित्र के डिकोडिंग को समानांतर करना असंभव है, जो बहुत कम डिकोडर गति को जन्म देगा। इसलिए, हमें तैयार छवियों के एक डेटाबेस की आवश्यकता है जिसमें ये मार्कर हैं।

छवि कोडेक के लिए निश्चित एल्गोरिथ्म। JPEG एल्गोरिथ्म का उपयोग करके छवियों को डीकोडिंग और एन्कोडिंग अब तक का सबसे तेज विकल्प है।

तैयार डेटाबेस में छवियों का रिज़ॉल्यूशन कोई भी हो सकता है, लेकिन विकल्प के रूप में हम 1K और 2K (आप 4K ले सकते हैं) पर विचार करेंगे। आप न केवल कमी कर सकते हैं, बल्कि आकार बदलने पर छवियों में वृद्धि भी कर सकते हैं।

त्वरित आकार प्रदर्शन


हमने 24-बिट चित्रों 1k_wild.ppm और 2k_wild.ppm पर 1K और 2K (1280x720) के संकल्प के साथ NVIDIA टेस्ला V100 वीडियो कार्ड (ओएस विंडोज सर्वर 2016, 64-बिट, ड्राइवर 24.21.13.9826) पर फास्टविडियो एसडीके से त्वरित आकार देने के लिए आवेदन का परीक्षण किया। 1920x1080)। एक ही वीडियो कार्ड पर चलने वाले विभिन्न थ्रेड्स के लिए टेस्ट आयोजित किए गए थे। इसके लिए प्रति स्ट्रीम वीडियो कार्ड पर 110 एमबी से अधिक मेमोरी की आवश्यकता नहीं है। 4 धाराओं को 440 एमबी से अधिक की आवश्यकता नहीं है।

सबसे पहले, हम जेपीईजी में मूल छवि को 90% गुणवत्ता के साथ संकुचित करते हैं, जिसमें 4: 2: 0 या 4: 4: 4 होता है। फिर हम चौड़ाई और ऊंचाई में 2 बार डिकोड और आकार बदलते हैं, एक तेज बनाते हैं, फिर फिर से 90% गुणवत्ता के साथ 4: 2: 0 या 4: 4: 4 पर सांकेतिक शब्दों में बदलना। स्रोत डेटा रैम में है, अंतिम तस्वीर वहां रखी गई है।

परिचालन समय को रैम से मूल छवि को लोड करने की शुरुआत से गिना जाता है ताकि संसाधित छवि को रैम में बचाया जा सके। वीडियो कार्ड पर प्रोग्राम आरंभीकरण समय और मेमोरी आवंटन माप में शामिल नहीं हैं।

24-बिट 1K छवि के लिए उदाहरण कमांड लाइन
PhotoHostingSample.exe -i 1k_wild.90.444.jpg -o 1k_wild.640.jpg -outputWidth 640 -q 90 -s 444 -sharp_after 0.95 -preeat 200

एक धागे में एक छवि 1K प्रसंस्करण के लिए बेंचमार्क


डिकोडिंग (वीडियो कार्ड में डेटा ट्रांसफर सहित): 0.70 एमएस
दो बार (चौड़ाई और ऊंचाई में) का आकार बदलें: 0.27 एमएस
तेज: 0.02 मिसे
JPEG एन्कोडिंग (वीडियो कार्ड से डेटा ट्रांसफर सहित): 0.20 ms
प्रति फ्रेम कुल समय: 1.2 एमएस

1K के लिए प्रदर्शन


गुणवत्तापतलेआकारधाराओंफ्रेम दर (हर्ट्ज)
190%4: 4: 4/4: 2: 02 बार1868/682
290%4: 4: 4/4: 2: 02 बार21039/790
390%4: 4: 4/4: 2: 02 बार3993/831
490%4: 4: 4/4: 2: 02 बार41003/740


2K के लिए प्रदर्शन


गुणवत्तापतलेआकारधाराओंफ्रेम दर (हर्ट्ज)
190%4: 4: 4/4: 2: 02 बार1732/643
290%4: 4: 4/4: 2: 02 बार2913/762
390%4: 4: 4/4: 2: 02 बार3891/742
490%4: 4: 4/4: 2: 02 बार4923/763


स्रोत छवि के लिए थिनिंग 4: 2: 0 की गति कम हो जाती है, लेकिन स्रोत और गंतव्य फ़ाइलों का आकार छोटा हो जाता है। जब 4: 2: 0 पर स्विच किया जाता है, तो समानता की डिग्री 4 गुना बढ़ जाती है, क्योंकि अब 16x16 ब्लॉक को एकल इकाई माना जाता है, इसलिए इस मोड में गति 4: 4: 4 से कम है।

प्रदर्शन मुख्य रूप से जेपीईजी डिकोडिंग चरण द्वारा निर्धारित किया जाता है, क्योंकि इस स्तर पर तस्वीर में अधिकतम रिज़ॉल्यूशन होता है, और इस प्रसंस्करण चरण की कम्प्यूटेशनल जटिलता अन्य सभी की तुलना में अधिक है।

सारांश


परीक्षण के परिणामों से पता चला कि NVIDIA टेस्ला V100 वीडियो कार्ड के लिए, 1K और 2K छवियों की प्रसंस्करण गति अधिकतम होती है जब एक ही समय में 2-4 स्ट्रीम लॉन्च की जाती हैं, और प्रति वीडियो कार्ड 800 से 1000 फ्रेम प्रति सेकंड होता है। 1K छवियों को संसाधित करना 2K से तेज है, और 4: 2: 0 छवियों के साथ काम करना हमेशा 4: 4: 4 की तुलना में धीमा होता है। प्रदर्शन पर अंतिम परिणाम प्राप्त करने के लिए, आपको कार्यक्रम के सभी मापदंडों को सटीक रूप से निर्धारित करने और वीडियो कार्ड के एक विशिष्ट मॉडल के लिए इसे अनुकूलित करने की आवश्यकता है।

एक मिलीसेकंड के आदेश की विलंबता एक अच्छा परिणाम है। जहां तक ​​हम जानते हैं, सीपीयू पर समान आकार के कार्य के लिए इस तरह की विलंबता प्राप्त नहीं की जा सकती है (भले ही जीप को एन्कोड और डिकोड करने की कोई आवश्यकता नहीं है), इसलिए उच्च प्रदर्शन छवि समाधान में वीडियो कार्ड का उपयोग करने के पक्ष में यह एक और महत्वपूर्ण तर्क है।

16 NVIDIA टेस्ला V100 ग्राफिक्स कार्ड के लिए 1K या 2K संकल्प के साथ प्रति दिन एक बिलियन जीप को संसाधित करने की आवश्यकता हो सकती है। हमारे कुछ ग्राहक पहले ही इस समाधान का उपयोग करते हैं, जबकि अन्य अपने कार्यों में इसका परीक्षण करते हैं।

एक वीडियो कार्ड पर जीप का आकार बदलना न केवल वेब सेवाओं के लिए बहुत उपयोगी हो सकता है। उच्च-प्रदर्शन छवि प्रसंस्करण अनुप्रयोगों की एक बड़ी संख्या है जहां ऐसी कार्यक्षमता मांग में हो सकती है। उदाहरण के लिए, मॉनिटर पर चित्र प्रदर्शित करने से पहले कैमरों से प्राप्त छवियों के लिए लगभग किसी भी प्रसंस्करण योजना के लिए एक त्वरित आकार आवश्यक है। यह समाधान किसी भी NVIDIA ग्राफिक्स कार्ड पर विंडोज / लिनक्स के लिए काम कर सकता है: Tegra K1 / X1 / X2 / Xavier, GeForce GT / GTX / RTX, Quadro, Tesla।

एक ग्राफिक्स कार्ड पर त्वरित आकार समाधान का लाभ


  • स्रोत छवियों के लिए भंडारण आकार में महत्वपूर्ण कमी
  • बुनियादी सुविधाओं की लागत (हार्डवेयर और सॉफ्टवेयर) के लिए प्राथमिक लागत को कम करना
  • कम प्रतिक्रिया समय के कारण सेवा की गुणवत्ता में सुधार
  • आउटगोइंग ट्रैफिक में कमी
  • उपयोगकर्ता उपकरणों पर कम बिजली की खपत
  • प्रस्तुत समाधान की विश्वसनीयता और गति, जो पहले ही विशाल डेटा सेट पर परीक्षण कर चुकी है
  • लिनक्स और विंडोज के लिए इस तरह के अनुप्रयोगों को बाजार में लाने के लिए कम विकास समय
  • एक समाधान की स्केलेबिलिटी जो एकल वीडियो कार्ड और क्लस्टर के हिस्से के रूप में दोनों पर काम कर सकती है
  • ऐसी परियोजनाओं के लिए निवेश पर त्वरित वापसी

किसकी रुचि हो सकती है


जीपों के त्वरित आकार के लिए पुस्तकालय का उपयोग लगभग किसी भी बड़े उद्यम प्रबंधन सॉफ्टवेयर में अत्यधिक भरी हुई वेब सेवाओं, बड़े ऑनलाइन स्टोर, सामाजिक नेटवर्क, ऑनलाइन फोटो प्रबंधन प्रणाली, ई-कॉमर्स में किया जा सकता है।

सॉफ्टवेयर डेवलपर्स इस लाइब्रेरी का उपयोग कर सकते हैं, जो वीडियो कार्ड पर 1K, 2K और 4K के रिज़ॉल्यूशन के साथ जीप को आकार देने के लिए कई मिलीसेकंड के ऑर्डर की विलंबता प्रदान करता है।

जाहिरा तौर पर, यह दृष्टिकोण डीप लर्निंग के लिए तंत्रिका नेटवर्क के प्रशिक्षण चरण के दौरान जीपों के तेजी से डिकोडिंग, आकार बदलने और छवि तैयार करने के लिए NVIDIA DALI समाधान की तुलना में तेज़ हो सकता है।

और क्या किया जा सकता है


  • आकार बदलने और तेज करने के अलावा, आप मौजूदा एल्गोरिथम में फसल जोड़ सकते हैं, 90/180/270 घुमा सकते हैं, वॉटरमार्क लागू कर सकते हैं, चमक और कंट्रास्ट को नियंत्रित कर सकते हैं।
  • NVIDIA Tesla P40 और V100 वीडियो कार्ड के लिए समाधान का अनुकूलन।
  • अतिरिक्त अनुकूलन प्रदर्शन JPEG डिकोडर।
  • वीडियो कार्ड पर जीप को डिकोड करने के लिए बर्स्ट मोड।

Source: https://habr.com/ru/post/hi424575/


All Articles