ملخص
كلف تلوين الأفلام قبل هذا العام مئات الآلاف من الدولارات ، وتطلب مشاركة عدد كبير من المتخصصين واستغرق الكثير من الوقت. الآن كل شيء قد تغير. وصل تطوير مشروع Deoldify إلى هذه الحالة بحيث يمكن مراقبة نتائج أعماله بشكل مريح من خلال الاسترخاء على الوجه. من النص سوف تجد تفاصيل تجربة ناجحة في تلوين فيلم دون تكلفة ، يكملها شخص واحد في غضون بضعة أسابيع.

10 تبدأ
بدأت هذه القصة تماما مثل أي قصة أخرى مماثلة. أنتجت خوارزمية توصية youtube باهظة شيئًا لفت انتباهي وكان له عواقب أخرى غير متوقعة. في الوقت قبل الأخير أدى ذلك إلى التمسك بقناة الأسلحة المنسية. من الصعب أن نفهم لماذا تلقيت عرضًا كهذا ، لكن على الأرجح كان مثل هذا:
1. يشاهد user_id مقاطع الفيديو على RDR2.
2. هناك مسدس بركاني في RDR2.
3. على قناة الأسلحة المنسية ، يوجد استعراض للمسدس البركاني.
4. الأشخاص المهتمين بـ RDR2 غالباً ما يريدون التعرف على المسدس البركاني.
5. ألف شياطين ، لكن الأسلحة المنسية ستأتي إليه!
بعد أقل من يومين ، درست بالفعل الأدب الحزبي حول تصنيع أنواع مختلفة من الأسلحة النارية ، ونظرت في صور كارامولتوك من بلدان ثالثة ، ونظرت في مدى سهولة قطع صندوق المنزل. مزقتها بين الخيارات: شراء لعبة شبه وجعلها في الحالة الصحيحة أو تجميع مجموعة من الأجزاء في متجر لاجهزة الكمبيوتر. في النهاية ، فاز السحب من المتجر لأسباب قانونية. لحسن الحظ ، لم يكن هناك إجابة على السؤال "لماذا" ، ولم تفلح الإجراءات النشطة في هذا الاتجاه.
والتفاف ....
هذه المرة ، لم يكن هناك سبب واضح لتقديم نظرة على تشارلي شابلن الملونة. مسارات استجابة الشبكة العصبية غامضة. مشهد مرصود تسبب في الارتباك والأسئلة الأولى ، ثم اللعاب العقلي العنيف. على عكس المحاولات السابقة المؤسفة للتلوين التلقائي ، تم اعتبار تسلسل الفيديو هذا بمثابة مشهد يمكن تصديقه تمامًا. للحفر ، بالطبع ، كان ما ، ولكن:
أ. لم يكن هناك انزعاج من الغرابة
ب. حقًا كان هناك شعور بعمق الصورة ، مما أدى إلى إزالة تعقيد إدراك الصور الحديثة ب / ث بواسطة الدماغ الحديث
استمر الفضول على طول ، يدرس بالفعل مشروع على جيثب. بعد اختبار الإصدار السحابي على صورتين ، وبعد النظر إلى مقاطع الفيديو ، بدأت بوضوح في رؤية بعض الرغبة في نفسي. إن القدرة على العودة إلى سياق الوسائط الحالية هي الدليل الحقيقي للماضي ، دون استثمار مئات الآلاف من المال ، فهناك شيء مثير حول هذا الموضوع ، وهو شيء كافٍ لتنشيط العقل البارد.
"هيا نحاول" ، هذه العبارة المقدسة ، التي يتم نطقها بشكل خجول ، ولكن في مكان ما في أعماق الروح هناك بالفعل نواة لفهم أن قصة جيدة بدأت الآن.
تتراوح
حسنًا ، لنفترض أن المحرك يعمل. نحن نأخذ تسلسل الفيديو الأول لمدة 4 دقائق. ما الأول؟ قم بإزالة الاهتزاز الخاطئ للكاميرا والأفلام ، والتي تكون دائمًا في مثل هذه المواد افتراضيًا. يبحث عن الخيارات المتاحة مع مجموعة واسعة من التحكم ، وخارج محرري الفيديو. نظرًا لأنه كان من الضروري استخدام سلسلة كاملة من أدوات البرامج المختلفة ، فقد اختفى على الفور استخدام أي حزم تحرير فيديو قياسية. إطارات واحدة فقط مع الملفات ، المتشددين فقط. وبالطبع ، من الضروري ليس فقط تحقيق الاستقرار بطريقة ما ، ولكن لتحقيق الاستقرار السينمائي ، وتقليد الحركات المحدودة والسلسة لكاميرا الأفلام. على الأقل بعض الثقة كان سببها وحدة واحدة للثعبان. حسنًا ، حسنًا ، هذا يعني أن الشفرة ستذهب على الفور.
استقرت. طويل قليلا ، حسنا. واو ، بارد ، اتضح ، نعم ، ما تحتاجه ، بالطبع ، تحتاج إلى الانتهاء من ملف ، ولكن وإلا لماذا نحن هنا؟ مزيد من الازدهار الذاتي. وضعناها ، وضعناها ، وضعنا صراعا آخر ، مرة أخرى ، ما زلنا نضعه ، على القمة ، على الجانب ، لا تستسلم ، ربما القراءة اليدوية ، على ما يبدو ، ذهبت ، لا ، حذف دير ، مرة أخرى ، أوه ، هذا كل شيء ، جيد ، أخيرًا. تشغيل. لعنة ، شيء طويل جدا. لكن الألوان والألوان تبهر بخير ، ولكن في كل هذا ، يكون الأمر منطقيًا ويستحق المتابعة.
ماذا الان ربما ، في عام 2019 ، لا يعد الاستكمال الداخلي للإطار أمرًا رائعًا ، ويمكنك حفر مشروع للاستخدام المهني المشروط. ومع ذلك ، نعم ، النجاح مرة أخرى ، مثل هذا المشروع متاح مجانًا. نضعها ، نضعها ... إطلاق. اللعنة ، شيء ليس سريعًا مرة أخرى. ولكن كيف بسلاسة ، وكيف بسلاسة الإطارات استبدال بعضها البعض ، معجزة ، كما لو أن 24 لقطة المعتادة.
لذلك ، هذا هو ما يخرج ، كل شيء يعمل بها؟ الناقل بأكمله هنا جاهز للاستخدام ، ما عليك سوى رمي شيء فيه والحصول على النتيجة؟
:: حل ::
صعوبات مؤقتة
في كل مرحلة من مراحل المعالجة ، تم تسجيل الوقت المستغرق. أنا استقراء لمدة 90 دقيقة: هجمات اليأس ، على أقل تقدير. لقد راجعت القياسات والحسابات عدة مرات ، لأن الأرقام التي تم الحصول عليها حولت الفكرة الأصلية من "مجرد سهولة سريعة" إلى "مجرد فترة طويلة سهلة". على الرغم من أن كلمتين أخريين في هذه الصيغة ستتغيران إلى الأسوأ ، ولكن كان هناك بالفعل شيء للتفكير فيه بجدية.
لذلك ، سيستغرق الفيلم المحدد 4 ساعات من الاستقرار و 420 ساعة من الإزهار و 30 ساعة من الاستكمال الداخلي للإطار. نعم ... حسنًا ، شكرًا لك ، تشارلي.
تشو لفعل شيء ما؟ ماك ميني 2012 ذو ثمانية النواة هو الشيء الوحيد الذي يمكنك تسخيره. أمام عينيي وقفت فيديو مع لينكس يعمل على PS4. صعدت الأسنان في غضب عاجز لعدم القدرة على استعادة تحديثات البرامج الثابتة ، والتي تم تثبيتها مع اقتناع فخور بأنه لم يكن هناك حاجة لكسر الحماية. would كيف ستعمل جميع مشاريع الثعبان هناك؟ ould هل سيكون هناك الوصول إلى العمليات الحسابية على GPU؟ لم أكن مقدرة لدراسة هذه الأسئلة.
بقي إما الاستسلام ، أو إطلاق بتواضع والانتظار. الاستسلام ليس خيارًا. انتظر بضعة أسابيع أيضًا. ولكن لم يكن هناك خيار آخر.
استقرارها
حول أداة التثبيترابط إلى مشروع تثبيت الفيديو:
pypi.org/project/vidstabالوصف: يستخدم المشروع وظائف opencv لتحديد إزاحة الإطار من القيمة المتوقعة ، ويحسب تعويض الإزاحة اللازم ويؤدي الاقتصاص لإخفاء حواف القفز ، وخلق صورة تتحرك بسلاسة. نظرًا لإمكانية اختيار طريقة للبحث عن الاختلافات بين الإطارات ، فإنه يسمح بالحصول على درجة مختلفة من نسبة الاستقرار / الخسارة بكسل. لديه وظيفة تصحيح مفيدة للغاية لعرض الرسومات والقيم المحسوبة بيانياً.
أخيرًا ، تبدأ الحقيقة القاسية في اقتحام عالم مريح. بالإضافة إلى مشاكل في الأجهزة ، تظهر مشاكل البرامج. ما نجح في اختبار افتراضي على مقطع فيديو اختبار يبدأ بالفشل هنا وهناك في فيلم كامل. (بشكل غير متوقع ، هاه؟)
يجب أن أعترف لنفسي بأن الوقت قد حان لتبديل النعال للأحذية المطاطية ، ومن الأفضل أن نشمر عن سواعد ، لأنني لا أرغب في ذلك ، لكن لا يمكن تجنب الانغماس في الأجزاء الداخلية من الوحدة.
الصعوبة الرئيسية هي تغيير المشاهد. تم تصميم المشروع لمعالجة الأجزاء القصيرة فقط التي لا يتغير فيها السياق. بعد دراسة ما يحدث وكيف يحدث ، هناك مكان لإصلاح تقريبي ، ومعنى ذلك هو إيقاف الاستقرار عند القيم العالية لإزاحة الإطار. بدون هذا التصحيح ، ظهر التأثير السلبي نفسه كزحف سلس للمشهد التالي من مكان بعيد عن الحافة إلى حقل أسود.
بدلاً من تشغيل البرنامج النصي النهائي ، ظهر برنامج نصي في النهاية ، يكمن جوهره في اقتصاص الإطار مسبقًا وتحديد القيم المثلى. الكود المحدد ليس له قيمة ، لأنه يكرر بشكل أساسي مثال مؤلف الوحدة ، لكنك تحتاج إلى تخفيف النص بشيء ما.

كان الاكتشاف المثير للاهتمام واحدًا تمامًا: لبضعة مشاهد ، تم إنتاج محصول مستدق خطيًا ، مما يخلق تأثيرًا تقريبيًا ، ولكن في الحقيقة يخفي تقفز الإطار الجامح تمامًا في المشهد. إذا قمت على الفور بإعداد محصول ضيق ، يتم فقد الكثير من المعلومات ، في الإصدار النهائي لا يلاحظ العارض أي شيء مشبوه ، حيث يتم الجمع بين "التكبير" وإيقاع دراماتيكي.
عزيزي طويل
حول أداة للازهاررابط إلى المشروع:
github.com/jantic/DeOldifyالوصف: يصنع المشروع صورًا ملونة من الأسود والأبيض. لديها ثلاثة أوضاع للعمل: الصور الفوتوغرافية ، الصور الفنية ، الفيديو. لكل وضع ، تحتاج إلى تحميل حالة النموذج الخاص بك. من الممكن تدريب النموذج بواسطة المستخدم. استخدم مؤلف المشروع نهجًا غير قياسي لبنية الشبكة العصبية ، بسبب تأثير ثابت تم الحصول عليه يختلف عن التطبيقات الأخرى.

يتم نقل الكمبيوتر بعيدًا إلى المطبخ ، لأن جهاز mac mini الذي عادةً ما يكون هادئًا للغاية يُحدث ضوضاء عالية باستمرار. قلة من أصحاب هذه الأدوات تمكنوا من سماع هذا الصوت ، لأن ما يعتبرونه ضوضاء المشجعين (والتي يمكن سماعها في عبء خطير) هو نصف سرعة الممكن فقط. يبدأ المزهرة.
كان لا بد من تصحيح ملفات المشروع قليلاً من أجل معرفة كيفية العمل مع البيانات الواردة الخاصة بي ، ووضعها في الشكل الصحيح والترتيب والعرض. رغم أننا اضطررنا إلى كتابة نص صغير لتشغيله ، إلا أننا نفترض أن المشروع يعمل بدون ملف. يمكن أن تنشأ الأسئلة فقط على المعلمة render_factor.
التأثير على النتيجة كالتالي:
0-7 عصيدة كاملة
8-12 لونًا مشبعًا ، تلوينًا تقريبيًا (للمشاهد المعترف بها بشكل سيء ، مما يعطي بعض التأثير على الأقل)
13-18 مناسب لك ، للمشاهد غير المعترف بها تستحق تجربة هذا النطاق أولاً
19-20 للتجارب (سنقوم بتوصيل الكابلات بسبار من لحاء البتولا)
21 هو العدد الأمثل
> = 22 يبدأ التشبع في الضياع ، ويقل معنى الاستخدام
أصغر هذا الرقم ، وانخفاض استهلاك الذاكرة وأسرع الحساب.

M دا. في اليوم التالي ، تنبثق الذكريات في رأسي أن معالج i7 لديه وضع تيربو ، وحتى بطريقة ما تم فحص عمله. تم العثور على معلومات حول كيفية تنشيطه في نظام Windows ، وبدأت أدوات الاختبار المساعدة في إظهار قيم تردد أكثر قوة. تنتقل درجة حرارة المعالج في نطاق 85-99 درجة مئوية. يوضع وعاء من الماء في الأعلى لإزالة الحرارة. من أسفل ضربات برودة من الكمبيوتر المحمول. إذا تمت معالجة 5٪ من الإطارات في اليوم ، فستصبح هذه القيمة في الوضع المتسارع 7٪. على الأقل بعض الفرح.

مغامرة تنتظرنا
قد يسقط أي برنامج. بالطبع ، سقطت المزهرة. سقطت جيدا ، إعادة تشغيل. ثم جاء "أوه". في بعض الأحيان تندرج إصدارات التجارب في الاختبار ، كما تعلمون ، لذلك عندما قمت بتصحيح وحدات المشروع ، كنت مشتتًا ونسي إلقاء نظرة على السلسلة بأكملها ومعنى كل تعليمة واعتبرت عملية الترقيع كاملة. يقوم المشروع في البداية بحذف المجلد المؤقت ، وإنشاء مجلد جديد ، وإضافة الإطارات التي تم سحبها من الفيديو هناك ... بشكل عام ، لقد خمنت بالفعل أن المجلد الذي يحمل نتائج اليوم قد تم تفجيره لي.
ثم كان هناك R.saver ، لعدة ساعات بدلاً من الإزهار نقوم بمسح القرص ، وهذا ناقص من وقت العرض. نمرر إلى كمبيوتر آخر مع حفظها. علاوة على ذلك ، بالطبع ، اتضح أنه نظرًا لعدم ملاحظة المشكلة على الفور ، فإن مجموعة من الملفات لا تحتوي على محتوى كامل. يتعين علينا كتابة مدقق من أجل ، أولاً ، تقدير الخسائر ، وثانياً ، تجميع قائمة الإطارات لإعادة الإزهار.
يضيف Smaku أن الإزهار يحذف الإطارات الأصلية ، ومن الطبيعي ألا تشعر بالارتباك عند إعادة تشغيل ما يلزم معالجته وما هو ليس كذلك. ليس من الطبيعي أن يكون لديك مجلد واحد من الإطارات المستقرة ، وليس "جيدًا ، ما هو الخطأ" و "إذا كان ذلك ، فيمكنك دائمًا الاستقرار مرة أخرى". حسنًا ، نعم ، كل شيء ممكن من خلال قضاء الوقت.
الشؤون والمخاوف
حسنًا ، يبدو أن الحياة قد تحسنت بطريقة أو بأخرى ، وكان minicut ينبض بهدوء ، يمكنك بالفعل التخطيط لمزيد من العمل وكتابة البرامج النصية للمعالجة اللاحقة.
عرض المواد المزهرة ، إلى جانب الفرح ، تسبب أيضا في الانزعاج. كان هناك شيئين غير سارة. أولاً ، ركزت نغمة اللون بين الإطارات ، على الأرجح بسبب سطوع غير متساوٍ للمصدر.

ثانيا ، ظهرت مجموعة من الإطارات المكررة. يبدو أن السبب ، ولكن ، على ما يبدو ، أن مشغلات الفيديو المنزلية لم يجنون بشيء أقل من 24 إطار / ثانية.
هناك مشاكل ويجب حلها بطريقة أو بأخرى. يصبح من الواضح أن دفق الإطار يحتاج إلى تقسيمه إلى مشاهد. لضبط النغمة / السطوع ، يجب أن يكون لديك حدود. ومن أجل عدم حذف النصوص مع الإطارات المكررة ، من الضروري تقسيم الإطارات إلى نصوص وغير نصية.
تبدأ التجارب الطويلة في تحديد تشابه الموظفين. حسناً ، مرحباً ، ماذا أنت؟
دعنا نتخطى القذف (ستكون مرئية بواسطة الكود) ، وعدد الإصدارات ، والطرق المجربة (مرئية من خلال عدد الوظائف الإضافية).

سأحاول شرح الإصدار النهائي.

نحن تحميل اثنين من الإطارات بالتتابع. نقوم بعمل تمويه طفيف ، والشيطان يعرف السبب ، ولكن إذا كان الأمر كذلك ، فقد أظهرت التجارب تحسنا في النتائج (ربما تم القضاء على تأثير الضوضاء). ابحث عن النقاط الرئيسية في الإطارات وقارنها.

شرح لأولئك غير المألوفين مع opencv:
ابحث عن النقاط الرئيسية (نقاط المفاتيح ، kp) - تسليط الضوء على الميزات المميزة التي تبقى دون تغيير عندما تتغير الصورة. وقح للغاية ، لكنه بسيط ، ويمكن تخيله كمجموعة من التجزئة الصغيرة.
ORB هي واحدة من العديد من الطرق الرئيسية لتسليط الضوء على النقاط.
des - أوصاف ، أوصاف حدودي من النقاط الرئيسية.
BFMatcher - الفجل لمقارنة النقاط الرئيسية باستخدام des. وتتمثل مهمتها في تحديد نفس النقطة في صفيفين وحساب مقدار رحيل كل نقطة متعرج من موقعها الأصلي. آسف بلدي الألغام inglezh.
اتضح أنه كلما كانت المسافة الإجمالية لإزاحة النقاط أصغر ، كلما كانت الإطارات متطابقة.

إذا كانت النتيجة أكبر من الرقم السحري ، فمن المفيد إجراء عمليات فحص إضافية ، فربما يكون هذا بالفعل مشهدًا مختلفًا؟ أولاً ، دعونا نتحقق مما إذا كان هناك أي إطار من نصين ، أولاً ، نحن بحاجة إلى هذه الميزة ، وثانياً ، إذا كان نوع الإطار قد تغير (text -> not_text) ، فإن المشهد تغير بالتأكيد. تقليل الصورة الملونة إلى رتابة وإرسال الشخص غير الصحي إلى الكشف عن النص (على الرغم من أن النص هو أكثر جمالا).

إذا حاولت وصف الجوهر ، فهناك بحث عن ملامح مغلقة ، وإذا تبين أن لدينا العديد من المخططات التي تقع في حجم توقعاتنا السحرية ، فمن المحتمل جدًا أن يكون هذا نصًا. كما قد تظن ، فإن هذا الكود الذي تم استبداله is_text ، يمكن اعتباره ناجحًا ، على الرغم من أنه يوجد فشل في الأحرف الكبيرة والمشاهد مثل الوهج على الماء الأسود. بالكلمات ، سيكون من الصعب توصيل كل عملية رمي بين الخيارات المختلفة "بسيطة ، ولكنها تعمل" و "تعمل بالتأكيد ، ولكن مبالغة". نوع من الهندسة المتخلفة لم تسمح لنا بالابتعاد عن الحل "خطوط سوداء على جميع الحواف = نص".

إذا لم يكن هناك رائحة للنص هنا ، فإننا نحاول مقارنة الرسوم البيانية بالأبيض والأسود ، إذا اشتدت الشكوك ، ثم قارنا تلك بالألوان ، إذا كانت مريبة جدًا بشكل مباشر ، فسنقارنها في إطار واحد ، لذلك بالتأكيد.

هنا ، إجراءات عملية بحتة: إذا أراد البرنامج النصي إنشاء مشهد قصير ، فربما يبدو أنه من الأفضل له إضافة هذا المشهد إلى المشهد السابق. وإذا كان هناك أكثر من 90 إطارًا في المشهد ، فسيؤدي ذلك إلى زيادة وقت المعالجة الإضافية للمشهد.
العثور على شيء للتعويض عن لهجة لم يكن سهلا. مقالة علمية واحدة فقط والمشروع ذي الصلة هي بوضوح جوجل.
هناك مشكلة صغيرة. هذا ماتلاب. لسبب ما ، لم أكن أريد حقًا وضع هذا الوحش على الفور وجرني نحو جنو أوكتاف. الكود ، بالطبع ، لم يكن متوافقًا تمامًا ، كان عليّ أن أتعرف على كيفية قراءة الصور وكتابتها ، وإرضاء توقع تلك الوظائف التي تعمل بشكل مختلف في Octave ، بشكل عام ، اللغة ليست متوافقة تمامًا مع التيار الرئيسي ، بالإضافة إلى أنه يجب علي الخوض في الفروق الدقيقة في Matanov ، وهذا يوم خسر.
عندما عملت أخيرا ، سرعة المعالجة ليقول أقل اضطراب. 20 ثانية لكل إطار. حتى على المعالج القديم ، هذا مبالغة. حسنًا ، دعنا نرى كيف يكون ماتلاب. "اختيار حزمة". إيه ، ولكن XS ماذا أحتاج ، حسناً ، دعنا مع DSP. وإطلاق! "حزمة معالجة الصور غير مثبتة في نسختك." حسنا ، حسنا ، لا يزال لدي عناوين مجانية للتسجيل.
بدأت أخيرًا وعملت بشكل أسرع كثيرًا مما كانت عليه في أوكتاف ، لكنها لا تزال طويلة جدًا ، مقارنةً بالازدهار ، وهذه المرة ، وثانياً ، لم تحقق نتائج التصحيحات التي تلقيتها توقعاتي العالية.
إذا كنت تريد القيام بشيء ما ، فافعل ذلك بنفسك. لا أشعر بأنني أفعل ذلك بنفسي ، لكن علي أن أفعل ذلك. ساعد غوغل مع الإدمان أخيرًا في إيجاد شيء على الأقل في opencv يمكن أن يساعدني. تم العثور على مجموعة من الفصول لدمج الصور البانورامية ، من بينها آلية لتصحيح الاختلافات في الضوء واللون. ليس ما تحتاجه تمامًا ، لكنه على الأقل خيار.
بعد تجارب طويلة مع فقط (نعم!) مثال على استخدام هذا الشيء ، وأخيراً حصلت على رمز مفيد.

كان كل السحر هو إنشاء فئة مناسبة لأغراضي بشكل تجريبي ، ومعرفة شكل القناع. من الواضح بعد ذلك: قم بإطعام المعوض بالصور لحساب متوسط قيمة إجمالي التعرض ومستوى كل قناة ملونة ، ثم استرجع مصدر التحويل.
النتيجة الأولى لم تناسبني مرة أخرى. , . , , . - . , .
.

, . « , ». , , , .
, , , , . small_wb , run, , , , - - . , . , .
. , , , . . .
, , . , - . , . , . , , .
github.com/sniklaus/3d-ken-burns
, , . ولكن. . «». «», , , . .
opencv.

, . , .

, , , , , .

, , -, . , -. , , . , , , , . - . : . , , , . , , , , (, ) mac mini .
, , , .
. , - . , , .
, , . - , . , , . , , , / . , « , ».
, , (, , ?), / . , . «». , , 2014. « ». - , . , «», « ?», - . و؟ ? ? . ! !
. , «», ? , .
3 , . - . , , . , . «---» - . .
,
GPU- . . , .
, , . . . , . , , , 720 400 . , . . , Pentium 133 ( Cyrix 100, ). , . . , , , . ? . , , .
2 , , . , , 12 , .
, , ssd . , , - , .
, . ! ? , - GPU. , , , «if APU available», APU , , ? لا.

نحن لا نتردد في رفع تردد التشغيل والحصول على 1 جيجا هرتز مجانًا ، وهو خيار طويل من البرودة وقد كلفته ثماره. نضع اللون. نبدأ. بوم! كودا نفاد الذاكرة. رائع ، رائع ، سنكتشفه في الصباح.
في الصباح ، لم تكن هناك ذاكرة. ذكرت Google أن هذا الخطأ يعني أن حجم ذاكرة الفيديو المتاحة أقل من اللازم. أنا حقا لا أريد أن أؤمن بها ، لأن هذا لا ينبغي أن يكون صحيحا. بعد كل شيء ، لا يمكن أن أكون مخطئًا ، فقد اشتريت نسخة من بطاقة الفيديو بذاكرة مجردة ، لا لم أستطع ذلك ، لكنني لم أكن مخطئًا أبدًا.
بدأت التجارب بالتنظيف القسري للذاكرة ، وتغيير المعلمات ، وتم إعطاء الأمل بحقيقة أن الهبوط لم يحدث على الفور ، وأن العديد من الإطارات كان لديه وقت لتظهر على الإخراج. كان من الممكن بدء إعادة الإزهار في دورة ، بالطبع ، ولكن كان وقت الإعداد للإطلاق حوالي دقيقتين ، وهذا غير منطقي.
فجأة ، بدأ برنامج تصحيح الأخطاء يعمل بشكل صحيح ، وحلقت المعالجة ، ليس لدي أي فكرة عما قمت به هناك ، وقررت أن أتطرق إلى شيء ، وحصلت على إطارات الألوان الخاصة بي بالفعل. انتهت 60 ٪ المتبقية من الإطارات بعد 5 ساعات. بحلول هذا اليوم ، لن تبدأ المعالجة على سيارة صغيرة إلا في نهايتها ، يا سيارة صغيرة سيئة.
لا يزال مجرد بداية
قم بتشغيل البرنامج النصي للبحث عن المشهد واملأ الأدلة. نذهب إلى هناك ، ونتحقق مما إذا كان هناك شيء ما بطريقة خاطئة ، ونصلحه. بشكل عام ، كل شيء على ما يرام. بعد ذلك ، تحتاج إلى تنظيف الإطارات المكررة لاستبعاد مضيعة للوقت في مزيد من التلاعب. عقبة واحدة ، كيفية التأكد من أن البرنامج النصي سوف يحذف فقط الضروري ولن يفوتك أي شيء. إذا كنت تفكر بشكل منطقي ، فلا ينبغي أن تكون إضافة إطارات إضافية فوضوية ، ولكن يجب أن تحتوي على نوع من الخوارزمية. بالطبع ، يجب أن لا تكون مرفقة به ، ولكن يجب أن تؤخذ بعين الاعتبار. نقوم بهذا: نسخ جميع المشاهد بدون إطارات مكررة إلى مجلد آخر ، ثم قارن كل مجلد بالملف الأصلي ، باستخدام مقارنة دلائل مدير الملفات. إذا تمت ملاحظة الإيقاع المتكرر في الملفات المحذوفة بصريًا ، فإننا نعتبر أن كل شيء طبيعي. عملت للوهلة الأولى.
فقط نصف ساعة ويمكنك الذهاب أبعد من ذلك. نبدأ التعويض لهجة. بعد بضع ساعات ، نحاول الاستمتاع بالنتيجة ، لكن نصف الفرح. جزء صغير من المشاهد ذو لون سيئ. لا يزال جزء صغير من الكواليس من تعويض لهجة ذهب بعيدا. إذا كان ذلك ممكنًا مع الثانية ، أو ببساطة خذ ما كان قبل التعويض ، أو حاول إخراج النغمة دون استخدام توازن اللون الأبيض. كان ذلك مع إعادة الإزهار أكثر صعوبة. تحسنت بعض المشاهد من تقليل المعلمة render_factor ، أما الباقي فلم يستسلم. الخوارزمية ببساطة لم تجد شيئًا مماثلاً في النموذج المدرّب وأسفرت عن نتائج غريبة. اضطررت إلى تلوين كل مشهد من هذا القبيل عدة مرات باستخدام render_factor مختلف ، ثم اختر أفضل إطار بحيث يشبه الحقيقة على الأقل بطريقة ما. من الصعب نقل مقدار استنفاد هذا النشاط للمخ. اضطررت إلى كتابة البرامج النصية التي تجمع الخيارات لكل إطار في مجلد منفصل ، مما أدى إلى زيادة الإنتاجية وتقليل تدفق سوء المعاملة.
قبل الانتقال ، تحتاج إلى قطع نصوص إضافية وإعادة ترتيب العديد من المشاهد في الأماكن. استغرق الأمر بعض الوسائل البسيطة لتحرير الفيديو. نقوم بتحميل بنية المجلد بإطارات مباشرة في المحرر الحالي.

نقوم بحذف المشاهد ومبادلتها وإلغاء تحميل الهيكل المحدّث على القرص في مجلد جديد.

الآن يمكنك تحويل 12 إطارًا في الثانية إلى 24 إطارًا في الثانية.
أداة تباطؤ الفيديورابط للمشروع:
github.com/avinashpaliwal/Super-SloMoالوصف: يحسب المشروع الإطارات المتوسطة باستخدام نموذج مدرّب. يمكنك تنزيل الإعدادات الجاهزة. يمكنك تعليم نفسك. مع الاختيار الصحيح لبيانات التدريب ، تكون النتيجة جميلة بشكل ساحر.
نقوم بتصحيح المشروع للعمل مع إطارات فردية ، وإلا فإنه يعمل فقط. نبدأ ، انظر إلى النتيجة. جنبا إلى جنب مع "نجاح باهر" تنشأ مشكلة جديدة ، تمتلئ بعض المشاهد مع القطع الأثرية ، لأنه للحصول على 12 لقطة من 24 تحتاج إلى تدريب النموذج خصيصا.
هناك خياران. وكلاكما لن يحب. إما حذف الإطارات الفاشلة يدويًا ، أو الانخراط في التدريب النموذجي. هذا هو ، أو قضاء الكثير من الوقت ، أو قضاء وقت غير معروف من الوقت مع نتائج غير متوقعة. ساد الوضوح.
حسنا ، مشاهدة أكثر من 200،000 الإطارات. ما هي الصعوبة؟ حقيقة أنه لا يمكنك حذف جميع الإطارات السيئة. من الضروري إزالة تلك التي تضرب العينين بالضبط ، وترك تلك التي تكون غير مرئية. وهذا هو ، حاول ، كرر ، القوة الغاشمة الجمع الصحيح. في مكان ما في النصف الثاني من الإطارات ، تعلمت أيضًا الشبكة العصبية العضوية ، وأصبحت بديهية في لحظات الانتظار لحدوث العيوب ، وأي الإطارات يجب حذفها وأي الإطارات يجب عدم لمسها. فقط 4 أيام ولدينا نسخة سلسة.
نحن نجمع ملف الفيديو. نحن ننظر. يبدو جيد. ولكن يبدو أن هناك شيء من التشويش. ما هذا؟ نجاح باهر ، واو ، واو لقطات مكررة ، ولكن كيف ، أين ، لماذا؟ يصبح من الواضح أن هذه الطفرة حلقت من الماضي. الاستقرار ، ومعالجة الإطارات المكررة للغاية ، ودخلت كل منها على حدة في قوس الحركة ، إضافة تعويض فريد لكل منهما. وخوارزمية البحث المكررة ، التي تعتبر بشكل معقول أن هذه إطارات مختلفة ، نظرًا لأنها يتم تبديلها ، كل شيء منطقي.
عظيم ، سوبر. ولكن لا تقم بمراجعة جميع الإطارات مرة أخرى دون محاولة كتابة رمز صغير على الأقل؟
بدأت التجارب باستخدام خوارزميات لمقارنة الصور المشابهة. كانت الصعوبة هي أن معظمهم يسمحون لك بالإبلاغ عن اختلاف الصور تمامًا أو متشابه نسبيًا. بالنسبة لي ، كانت الإطارات المختلفة في مشهد واحد متشابهة تقريبًا ، وكان من الضروري التقاط الصور التي يتم نسخ إزاحة. جميع خوارزميات مجربة ومختبرة تتداخل في كومة واحدة ، وكلاهما.
يمكن أن تحقق Compare_ssim من المقشود بعض الفوائد. لن أدعي أنني أتذكر ما هو عليه ، فقد أعطيت النتائج الصحيحة في بعض الأحيان على الأقل وسمحت لي بتحديد بعض التكرارات على الفور. كان علي أن أبحث عن الباقي بعيني. في اليوم الثاني ، تم تدريب شبكتي العصبية الطبيعية لملاحظة غير واضحة. في هذه المرحلة ، تعثرت بالفعل من تشوه احترافي: تم اعتبار الصور بالأبيض والأسود التي لفتت انتباهي على أنها عمل غير مكتمل ، وتم سماع أي ارتعاش لمحتوى فيديو تابع لجهة خارجية على أنه "مكرر مرة أخرى!"
وضع الإصدار التالي من الفيديو ، ومشاهدة. يتعلق الأمر بفهم أن بعض المشاهد لها تشبع حامضي. وهذه مرة أخرى مشكلة ، لأنه لا يمكنك فقط التقاط وخفض تشبع جميع المشاهد إلى القيمة العامة ، بعضها على العكس من ذلك ، ليست مشرقة للغاية.
يبدأ تشبع التحدي. يعد تغيير هذه المعلمة أمرًا سهلاً ، ولكن يصعب قياسه بشكلٍ لا يصدق. كان هذا مفهوما من الناحية النظرية ؛ في الممارسة العملية ، تم تأكيده فقط. ظهرت أي طريقة ساذجة لمقارنة تشبع الإطارات أثناء الاختبار على المشاهد التي كانت مشرقة ، ولكن كان معدلها طبيعيًا أو باهتًا ، ولكن كان معدلها مرتفعًا للغاية.
بحلول نهاية اليوم ، على الأقل بطريقة ما وُلد حل فعال.

إلى متوسط انتشار تشبع البكسل ، نضيف الانحراف المعياري للتشبع ، ونحصل على أقصى تشبع مشروط للإطار. هذا غير كامل ، ولكن مع طريقة القياس هذه ، بدأت معادلة التشبع في العمل. بقي فقط لتحل محل كثير الحدود correction_value = f (meas_value) . نضع اللوحة على بيانات الاختبار بأيدينا "تجمدت" -> "قيمة التصحيح التي أعطت نتيجة جيدة" ، نحن ندفع اللوحة إلى أي أداة يمكن أن تقارب.
إجمالي وظيفة تصحيح التشبع:

نمر من BGR الفضاء (العرض الافتراضي من opencv) إلى HSV. نحن نميز مصفوفة التشبع برقم واحد. نحسب كسب / توهين التشبع. لقد قطعنا المغادرين للنطاق. دمج مصفوفة التشبع المعدلة مع السطوع والنغمة الأصلي ، والعودة إلى مساحة BGR.
متى يتم الإصدار بالفعل؟
حسنًا ، يبدو أن الفيديو جاهز أخيرًا. يمكنك صنع الموسيقى.
بما أن أيا من المرافقات الموسيقية الموجودة بدت مناسبة لي ، لم يكن هناك شيء آخر أقوم به سوى فعل شيء بنفسي.
نشأت مشكلة غبية من البداية: تم انسداد نصف القرص بنسخ احتياطية من حالة مختلفة من الفيلم. والبرنامج ، الذي كان من المفترض أن يصنع الموسيقى ، تطلب عشرات الجيجابايت لمكتبة المقطوعات الموسيقية. اعتقدت: "ما الذي يمكن أن يحدث الخطأ؟" وحذف النسخ الاحتياطية لما قبل النهائية ، لأن لدي نسخ احتياطية سابقة على قرصين ، ولا أفقد أي شيء مهم ، ومن غير المرجح أن تتم إعادة صياغة شيء ما.
في اليوم الثالث من العمل مع الموسيقى ، لم يعد بالإمكان تجاهل عدد المشاهد التي فقدت التشبع. أصبحت بعض الإطارات بالأسود والأبيض تمامًا ، وقبل ذلك كانت هذه الإطارات هي الأذكى. ومن المثير للاهتمام ، ماذا يمكن أن يكون؟ هل الحدود متعددة الحدود خارج الجدول الأصلي تحلق فجأة في الفضاء؟ هذه مفاجأة ، أليس كذلك؟ تجدر الإشارة إلى أنني مرة أخرى لم أرغب في مراجعة الفيلم بأكمله بعد تصحيح التشبع ، قصرت نفسي على مشاهدة إطار واحد من كل مشهد ، مما أعطى شعورًا وهميًا بكفاية النتيجة.
لم تكن هناك مشاكل في إضافة شروط الحدود إلى رمز تصحيح التشبع. كانت المشكلة هي عدم وجود مصدر يمكنك من خلاله الحصول على نفس تسلسل الإطارات الذي تم بالفعل تزامن الصوت معه.
هناك خياران: إطلاق صورة منحنية في العالم بصوت رائع أو العودة إلى خطوتين. من المؤسف أن نفقد المزامنة المثالية المثالية عن طريق الخطأ ، لكن النقطة الكاملة للعمل كانت ملونة.
نكرر تنظيف التكرارات ، إعادة العد التنازلي ، ضبط التشبع ، بالطبع ، نحصل على تصميم قوي في الصوت ، نبدأ في تجاوز النقاط الرئيسية للمسارات ، نحن منزعجون من أن التزامن السحري قد انتهى تقريبًا. لقد مر أسبوع آخر.
عن الموسيقى
إن كتابة موسيقى جديدة مجانًا ليس خيارًا على الإطلاق ، ولكن إلغاء شيء من خيارات المرافقة المتاحة (على الرغم من وجود 5 منها على الأقل) يفتقر أيضًا إلى الصدق. في عملية البحث عن المسارات المجانية ، صادفت شيئًا مثيرًا للاهتمام.
filmstro.com
يتضح من الوصف أنه يتيح لك القيام بشيء ما بين استبدال مسارات الآخرين وتكوينها من نقطة الصفر. يحتوي على مكتبة واسعة من المؤلفات ، يمكن تمثيل كل منها كمشروع من حلقات Fruity Loop المشروطة. يتم تجميع جميع المسارات من تكوين واحد في ثلاثة أقسام: الكثافة ، العمق ، الجهد. عن طريق تغيير "قوة" القسم ، يمكنك تغيير عدد المسارات التي تم تنشيطها. المجموع: يحتوي تكوين واحد في المتوسط على 11 خيارًا صوتيًا ، والتي يتم تشكيلها نتيجة للتأثير المتبادل للأقسام. بمساعدة ترتيب النقاط الرئيسية على طول تسلسل الفيديو ، يرتبط التغيير في صوت التكوين بما يحدث على الشاشة. مثل هذا doshirak. لذيذ ، إذا كنت لا تعرف كيف حدث ذلك.

حول يوتيوب
أخيرًا ، يمكنك إنشاء قناة وتحميل الفيديو. يبدو أن كل شيء ، النهاية ، يمكنك الاسترخاء. لكن الواقع لم يترك ، وإذا كان يمكن اعتبار الفيديو الأصلي HD بشكل تعسفي ، ثم بعد تحميله اتضح أن جودة مثير للاشمئزاز. وفقًا لجميع المؤشرات والآراء ، اتضح من الإنترنت أن Google تستخدم معدل بت منخفض جدًا لجميع القنوات الجديدة. لحسن الحظ ، تراجعت النصيحة الجيدة في مكان ما: تملأ بمعدل 1440 بكسل ، كما لو أن ذلك يجعل youtube أكثر حذراً بشأن التثبيت. لقد ساعد المجلس حقًا ، فقد أصبح مشهوراً على الأقل.
بعد التنزيل ، ظهرت على الفور شكاوى حول استخدام مقاطع الفيديو الخاصة بالأشخاص الآخرين. من المثير للاهتمام للغاية ، اتضح أن Youtube الكبير لا يزال لا يملك قاعدة بيانات عاملة عن الأعمال في المجال العام ، وسنساعده في ذلك عن طريق إرسال اعتراضات.
النتيجة: www.youtube.com/watch؟v=r3NQyCInZiQ
تنزيل الرابط بالجودة الأصلية: drive.google.com/uc؟id=1dEPcjKbjNowxsfaNcbV6DsbAr3kbACKH&export=download
الخاتمة
على العموم ، أنا أحب ما حدث. سيقوم فريق من المتخصصين بأجر جعل الحلوى. في هذه الحالة: 70٪ من الإطارات العادية ، 20٪ من الفقراء ، 10٪ ملحمة. مجانا ، تلقائيا. جميع المشاكل التي كان علي إصلاحها بيدي ترجع فقط إلى حقيقة أن هذا تم لأول مرة. سيكون الفيلم التالي للون أكثر سهولة. لا أعرف ما سيكون عليه الأمر ، في عصر السينما الصامتة ، لم أجد حتى الآن أعمالًا أخرى تطلب منهم نقلها إلى حدثنا الفوقية. من المحتمل أن يكون الأمر شيئًا من فيلم صوت مبكر ، مما يعني أنه من الضروري استعادة الصوت ، وجعله على 20-20 كيلوهرتز ، وتحويله إلى ستيريو. يمكنك لمس الكثير من الشبكات العصبية المختلفة =) اليوم ، تعتمد جودة الإزهار اعتمادًا كبيرًا على المادة المصدر ، فكلما تم الحفاظ على ظلال رمادية أكثر ، كلما كانت الوضوح أعلى ، كانت النتيجة أفضل. على الأرجح ، سيقوم الجيل التالي من هذه الأدوات بتجميع صور جديدة عالية الجودة ، ولن تتناسب مع الألوان القديمة ، وستكون مماثلة للمشروعات التي تقوم بتقليد الصور الفوتوغرافية من خلال الرسم. في غضون ذلك ، من أجل الحصول على نتيجة ممتازة ، تحتاج إلى مد الصورة بالأبيض والأسود وتدريب محدد الألوان بشكل فردي على مواد الفيديو المطابقة للفيلم المستهدف.
حياتنا تتغير بشكل أسرع وأسرع ، والإطار الزمني الذي نتحرك به إلى واقع آخر آخذ في التقلص. نكتب الشبكات العصبية من أجل متابعة كل ما يحدث في الشبكات العصبية. ولكن لدينا وقت أقل وأقل. قبل نصف عام فقط ، سألوني ما إذا كان من الممكن تلقائيًا التقاط صورة تعسفية ذات لون أصلي ، كان جوابي: "لا ، إنها لا تزال رائعة".