الشارع مقارنة الترميز السحري. كشف الأسرار



يصادف هذا العام الذكرى السنوية - بعد 16 عامًا من إطلاق موقع الويب compression.ru ، حيث ينظم المؤلف ورفاقه مقارنات بين برامج ترميز الفيديو وأجهزة تشفير الصور. خلال هذا الوقت ، أجريت عشرات المقارنات بتقارير من 23 إلى 550 صفحة ، وتجاوز عدد الرسوم البيانية في المقارنة الأخيرة 7000 ، وتجاوز عدد الحالات الساحرة المختلفة خلال هذا الوقت جميع الحدود المعقولة. نظرًا لأن موعد الجولة القادمة (32 عامًا) سيأتي قريبًا ، فهناك رغبة في أن تخبرنا قليلاً بالسحر تكريما للذكرى السنوية.

إذا تحدثنا عن برامج الترميز ، فليس سراً أن معظم المقارنات والرسوم البيانية التي يراها الجمهور الأكثر احتراما هي نتاج قسم التسويق. في أفضل الأحوال ، قام المهندسون بالرسومات بكفاءة ، ولم يعط التسويق إلا الضوء الأخضر للنشر. في أسوأ الحالات ، لم يشارك المهندسون في تحضيرهم على الإطلاق. لماذا إضاعة الوقت على هؤلاء الناس مشغول!

في الوقت نفسه ، يعد موضوع الضغط شائعًا للغاية. في سلسلة Silicon Valley ، طورت الشركة الناشئة للبطل الخوارزمي خوارزمية مبتكرة أظهرت في الحلقة الأخيرة من الموسم الأول ضغط فيديو ثلاثي الأبعاد لا يصدق ، ونتيجة لذلك ، أصبح الملايين من الشركات الناشئة (والمستثمرين) في العالم يعرفون أن الشيء الرئيسي هو الحصول على معامل Weissman أكبر وأكثر يجب العثور على عبقرية ، والباقي هراء. سوف تكون المعجزة! هذا يزيد بشكل طبيعي من توقع المعجزات ، وبطبيعة الحال (بالطبع!) هذه المعجزات مبتهجة من قبل الشركات! بما في ذلك استخدام أحدث إنجازات سحر الشارع.

تنويه: أي صدفة لأسماء الشركات أدناه مع أسماء حقيقية هو عشوائي تماما.

اجلس! نحن نعدك أنه بنهاية القصة سوف تكون قادرًا على إظهار مثل هذه الحيل بنفسك ، وكشف الكثير منها. دعنا نذهب!


المستوى 1 ، الحيل للمبتدئين


دعنا نبدأ بأبسط الطرق ، لأنه من الغريب أن هذه الأساليب تدحرجت في وادي السيليكون الحديث (وليس المسلسل ، ولكن الحقيقي!).

لذا ، تبدأ الحيل الأكثر احتراما مع مظاهرة ضغط قوي عظمى!



بالتأكيد ، شهد الكثير منهم مقارنات ديناميكية مماثلة مع القطط غير واضحة على أساس JS على الصفحات. إذا تمت مقارنة الضغط ، فمن المعقول أن تكون الجودة متساوية قدر الإمكان (من الناحية المثالية بالضبط نفس الشيء) ، وعلى الجانب الأيمن سيتم ضغطها مرتين أفضل ، على سبيل المثال.

لم يقل قال من القيام به!

تدعي الشركة ضغط أفضل بنسبة 30 ٪ (جميع المباريات عشوائية!). والصور تبدو هي نفسها بالضبط! حتى نظرة المدربين تدريبا مهنيا لا تجد الاختلافات. هناك رغبة للنظر في مزيد من التفاصيل. نحن نتسلق إلى رمز الصفحة ونرى أن شريط تمرير الصورتين الأولى والثانية يأخذ البيانات من ملف واحد! نحصل على مزايا بعدة طرق في وقت واحد: أولاً ، يتم عرض أفضل النتائج بشكل مثالي ، وثانياً ، لم يصرف المهندس عن العمل ، وأخيراً ، يتم تحميل هذا المكان على صفحة الموقع مرتين بسرعة. ربح قوي !!!

القضية ، لا أصدق ذلك ، هو حقيقي. الآن أنت تعرف أن ننظر فيها!

في مكان آخر - أيضا شريط التمرير ومرة ​​أخرى نتيجة رائعة. نحن ننظر إلى رمز شريط التمرير - يتم تحميل ملفات مختلفة. يتم تدريسها من خلال تجربة مريرة ، قم بتنزيلها - فهي لا تصل إلى مجرد بايت من نفس الحجم ، إنها تتطابق قليلاً معًا! بشكل عام ، كل مزايا الطريقة السابقة ، ولكن التركيز أكثر تعقيدًا قليلاً ، على الرغم من التباطؤ في تحميل الصفحة (عليك أن تدفع مقابل كل شيء ...). والأهم من ذلك ، أنك لست بحاجة إلى جذب متخصصين باهظين في مجال الضغط.

ومع ذلك ، المسوقين أكثر تقدما في هذا المستوى تذهب أبعد من ذلك. تم وضع شريط التمرير - تبدو - الصور مختلفة ، لكن الجودة متشابهة جدًا. حسنا حسنا. مزيد من أكثر! يتضح الانفتاح الرائع - حتى أن هناك روابط لملفات الفيديو. يُعد التنزيل ميزة جيدة جدًا لطريقتهم ، فليس من الواضح كيف قاموا بذلك. من المفيد أننا هنا جميعًا متسللون روسيون تمامًا (بالفعل علامة تجارية في الغرب). نحن ننظر إلى bitstream ونرى صورة رائعة:


هذا هو ، حتى العديد من الخبراء ، إذا لم يجرؤوا على إجراء أبحاث عميقة وفحص مزدوج ، فسوف يؤكدون أن للناس نتيجة ممتازة تصل إلى ضعف حجم زعيم اليوم بجودة قابلة للمقارنة. لن تعتقد أن هذه الأساليب تستخدم لأنفسهم وحتى في بعض الحالات تسمح لك بالحصول على عشرات الملايين من الدولارات من الاستثمار.

أتذكر لقاءًا مع شركة روسية ناشئة منذ 6 سنوات. قال مديرهم مباشرة من الباب: "يجب أن نبذل قصارى جهدنا لنا. لدينا مستثمرون من Severstal ، وإذا كان هناك أي شيء ، فإن الرياضات التي تحلق الرجال بحلقات لحام ستأتي إليك. "كما تعلمون ، في مثل هذه الظروف القاسية ، تزداد جودة البحوث بشكل سحري ، وينخفض ​​عدد الحيل من مختلف المستويات ... العمل مع مثل هذه الحالات في وطننا من الفيلة ، هناك شعور لا يرحم من المؤسف للمستثمرين الغربيين. صحيح ، ليس كل مستثمرينا محددين تمامًا ، والساحرة هم أيضًا في فلسطينينا. و بانتظام. ولكن عن ذلك وقت آخر ...

المستوى 7 الرنين


هذه القصة لا تدور حول برنامج ترميز الفيديو ، ولكن حول ضغط الصور ، ولكن كان هناك الكثير وفقًا لجميع قوانين هذا النوع من "الحيل الصادقة".

بطريقة ما ، قررت شركة M معروفة إلى حد ما أنها تحتاج إلى إضافة Windows Media Photo (WMP) إلى تنسيقات Windows Media Video (WMV) و Windows Media Audio (WMA). تنظيف للمجموعة ، كما فهمت.

الشاب في المعرض! حسنًا ، لا تصرخ بصوت عالٍ ، فلم تشرق عليك وحدك! الأشخاص المثقفون (انظر الصف الأول) كحد أقصى - ابتسم ابتسامة عريضة في شارب ...

لم يقل قال من القيام به!

بعد ذلك ، راقب الأيدي بعناية:


أي يحتوي WMP على تفاصيل أكثر من JPEG و JPEG 2000 في نفس مستوى الضغط (JPEG و JPEG 2000 متساويان بلطف ويتم ضبط المستوى 24 مرة) ، وفي الفقرة التالية :


أي عادة فقط 6 مرات الضغط ، وكان 24. نجاح باهر ، تنبعث منه رائحة ثلاث مرات! بشكل عام ، نحن أفضل 2 مرات بالتأكيد. نقلت وسائل الإعلام الأخبار السارة إلى الجماهير (كتب البعض أنها كانت أفضل مرتين من JPEG 2000) ، حتى على Habré كرّروا هذا الخبر .

بعد ذلك بقليل ، ظهر مخطط من هذا العرض التقديمي:


كيفية تفسير هذه الرسوم البيانية؟

عادةً ما تكون الجودة رأسية (بعض المقاييس تعتمد على الوضع في هذه المرحلة الزمنية) ، أفقية - بطريقة أو بأخرى - بالحجم. عادة ، مع زيادة الحجم ، تزداد الجودة (على الرغم من أن أي شيء يحدث في الممارسة). على خط من نفس النوعية (أحمر أفقي) ، يمكن تقدير أن برنامج الترميز "الأرجواني" يفقد حوالي ضعف حجم "الأزرق" بنفس الجودة في هذا النطاق من البتات.


كانت ميزة الإصدار JPEG 2000 صغيرة ، على الرغم من أنه من الواضح أنهم اختاروا أفضل صورة مع صبي ودلافين رائعين. كنا نتطلع إلى اللعب مع هذا التشفير. بعد حوالي ستة أشهر ، وضعت الأداة المساعدة للضغط.

بحلول ذلك الوقت ، كان لدينا قبل عام واحد مقارنة بين 9 تطبيقات لـ JPEG 2000

نعم نعم نعم! بما أنه ليس كل الزبادي مفيدون بنفس القدر ، فليست كل تطبيقات المعيار جيدة بنفس القدر. ينص المعيار فقط على دفق بت ، والذي يمكن وضعه في البيانات (وبالمناسبة ، يتم إخراجها!) بطرق مختلفة جدًا ، يؤدي هذا إلى إنشاء سوق ترميز منفصل مع منافسة شرسة لعشرات المعلمات الجيدة. لا يعرف هذا الشخص البسيط ، كقاعدة عامة ، ما يسمح له بالركوب على أذنيه مع الإفلات من العقاب بشكل عملي على بلدوزر ("يدعم DVR لدينا أحدث H.265 / HEVC ، لا أحد لديه!"). ولا أحد (لا أحد!) محتمل جدًا من الإعداد.

لحسن الحظ قمنا بإدراج 3 أسطر لـ WMP في التقرير السابق. اتضح بطريقة ما مثل هذا:

يمكن ملاحظة أن سطور تطبيقات JPEG 2000 مزدحمة للغاية والأزرق الغامق (أفضل تنفيذ WMP) له نتائج في مكان ما ، أي تشغيل JPEG 2000. إذا كنت تأخذ JASPER صفرًا وتظهر لك كل شيء رأسيًا ، فيمكنك أن ترى أن WMP مع أسوأ معلمة يفقدها كل شيء تقريبًا باستثناء الأخيرين (أحدهما هو KDU ، تذكر ذلك) ، وأفضل واحد هو في مكان ما تتمحور حوله ، ويخسر العديد من التطبيقات:

نظرًا لأن المقارنة قد تم نشرها على الملأ وتسببت في ضجة في دوائر ضيقة ، فقد أجاب المطور عنها في المدونة الرسمية . كانت الملاحظة مهذبة: لقد تمت الإشادة بها وانتقدتها ، ثم إذا قرأت النص ، فقد اعترف الرجل بصراحة أنهم استخدموا أسوأ تطبيق لـ JPEG 2000 لمقارنتنا (نُشر قبل ستة أشهر) في مقارنتهم ، على الرغم من "مصادفة تمامًا". بالطبع ، سوف نصدقهم. شركة محترمة وكل ذلك.

علاوة على ذلك ، تم تغيير اسم التكنولوجيا من WMP إلى HD Photo ، ومع ذلك ، ظل الحكم التالي على الشبكة:

ككرز على كعكة. ذهب زملاؤنا إلى أبعد من ذلك: التقط المزيد من الصور وأظهر أن صور HD لا تلعب فقط JPEG 2000 ، ولكن أيضًا تنفيذ JPEG جيد ( في 7 حالات من 14 ). ويفقد على وجه التحديد. هناك سبب للاعتقاد بأنهم التقطوا الصور ، لكنهم دفنوا بصراحة HDPhoto ، لأن من يحتاج إلى تنسيق يقوم بتنسيق JPEG القديم في نصف الوقت - ليس واضحًا:


مجموع أسرار هذه الخدعة:
  • نحن نأخذ أسوأ تنفيذ للمنافس الرئيسي ، مقارنة به.
  • نقوم بإنشاء الضجيج الإعلاني (على غرار "لقد تجاوزنا الجميع").
  • عندما تتلاشى هذه الضجة إلى الخلفية ، فإننا نطلق سراحنا ونأمل ألا يتحقق أي شخص مما حدث حقًا.

الأطفال! لا تفعل هذا ولا تخدع الآخرين! قد تفقد شركتك ملايين الدولارات وثقة المتخصصين.

المستوى 10 ، طازجة! مع الشبكات العصبية!


بشكل عام ، هناك الكثير من هذه الحالات. حتى في روسيا ، واجهت مواقف مماثلة حول بضع مرات في السنة (تدفق المعلومات إلينا ، كما هو الحال بالنسبة لأصحاب compression.ru). تربى المستثمرين في الغرب حوالي مرة واحدة في الشهر. والآن ، ترتبط الصين أيضا بهذا الترفيه. قوة أجهزة الكمبيوتر تنمو ، وتعقيد وقدرات الخوارزميات - أيضا. فهم هذا أصبح أكثر صعوبة. نتيجة لذلك ، يستمر المرح العنيف!

في الآونة الأخيرة ، أصبحت الشبكات العصبية ذات شعبية كبيرة. بالتأكيد كل شيء يلمسون يحسن بطريقة سحرية. ولكن لا تطبقها على ضغط الفيديو؟

لم يقل قال من القيام به!

في تشرين الثاني (نوفمبر) الماضي ، طغت أخبار العالم من صحيفة وول ستريت جورنال نفسها . إنشاء برنامج ترميز فيديو يستند إلى التعلم الآلي الذي مزق الجميع! هنا هو الدليل:

بشكل عام ، أنا شخصياً أشك بشدة في كل الأخبار مع ذكر الشبكات العصبية. وأنصحك (خاصة إذا كنت مستثمرا). يتم ترتيب الشبكات العصبية بحيث يمكن بشكل صحيح اختيار عينة تدريب للاختبار لإظهار أي (نتيجة ممل - أي!) النتيجة المرجوة. الشبكات العصبية هي أداة مثالية لإطلاق مجموعة من عجائب التسويق. واحد هو أكثر من رائع من الآخر!

بشكل عام ، هناك جدول زمني ، وهناك صور. توافق - بشكل مقنع. خاصة بالنسبة للمتشككين ، قام السادة بإحضار المزيد من الرسوم البيانية على مجموعات اختبار معروفة:


ومع ذلك ، إذا كان الرسم البياني السابق الذي يحتوي على صور يمكن تفسيره شخصيًا لي (من الممكن دائمًا توضيح مقطع فيديو واحد وحتى مع الشبكات العصبية العميقة) ، فقد جعلني هذان الرسمان في حالة تأهب كبير.

لا شيء يزعجك فيهم؟
الجواب
ويترتب على ذلك أنه لمدة عشر سنوات من اعتماد معيار H.264 إلى اعتماد H.265 ، لم يحدث أي تطور خاص في برامج الترميز! هؤلاء الباحثون الأغبياء كانوا يتجولون لمدة 10 سنوات ويصنعون برامج ترميز أبطأ تضغط على نفسها !!! الفرق هو 20 ٪ كحد أقصى ، أو حتى أقل! 8- \

حتى أنها تضع القاعدة أسفلها ، مثل برامج الترميز الكلاسيكية التي تقع على الحد الأقصى ولا تتطور بشكل خاص (وهنا يذهبون إلى المسرح ، كلهم ​​باللون الأبيض). وكما تعلمون ، فإن مثل هذه الكذبة الصارخة تعمل بشكل رائع! حسناً ، "وول ستريت جورنال" - فهم (أود أن أصدق) فهمهم فقط للأمور المالية ، حسناً "مراجعة تقنية معهد ماساتشوستس للتكنولوجيا" - هؤلاء السادة يأخذون الكلمة إلى السادة في وادي السيليكون ، لكن مثل هذا المورد الذي يحظى بالاحترام مثل هابر أخذوا الأخبار بلا مبالاة - سوف اجعله! ماذا يمكنني أن أقول عن إعادة طبع الأخبار على نطاق واسع ...

في الواقع ، صورة تطوير برامج الترميز ، لحسن الحظ ، مختلفة بشكل ملحوظ. أولاً ، في الرسم البياني أدناه ، الذي قمنا ببنائه على نفس مجموعة مقاطع الفيديو xiph ، يمكننا أن نرى أن H.265 أفضل بنسبة 25 إلى 31٪ من H.264. أي 10 سنوات من تطوير الترميز لا تزال دون جدوى! ( Uff ، لقد انحرفت مباشرة من القلب ... ) ثانياً ، يظهر AV1 الجديد تحسّنًا تقريبًا مضاعفًا مقارنة بـ H.264 ، وبصراحة ، تعتبر خطوة مصلحته ملحوظة للغاية:


وفقًا لذلك ، يمكن للمرء أن يرى بالعين المجردة أنه إذا قمت بتراكب مخطط AV1 بنسبة 45٪ على يسار H.264 على الرسم البياني للمؤلفين ، فسيغطي هذا البرنامج الترميز الجديد ... [يتم قطعه عن طريق الرقابة]. يغطي جيدا ، باختصار. لذلك ، "نسينا" للمقارنة معه. يبدو المحاذاة الحقيقية مثل هذا (أقل ازدحامًا بكثير ، توافق):

لتوضيح ذلك - تحتوي برامج الترميز على إعدادات مسبقة قياسية تسمح لك بتغيير السرعة ضمن نطاق كبير (غالبًا عشرات المرات) ، ولكن في نفس الوقت تحقق ضغطًا أكبر بنفس الجودة (غالبًا أكثر من مرتين). في x265 (تطبيق مفتوح المصدر جيد جدًا لمعيار HEVC) يطلق عليهم: فائق السرعة ، فائق السرعة ، سريع للغاية ، أسرع ، سريع ، متوسط ​​، بطيء ، أبطأ ، ضعيف جدًا ، وهمي. إذا أخذنا المتوسطة ل 1 ، ثم في السرعة وحجم الملف بنفس الجودة ، يمكن أن تكون موجودة لملف معين ، على سبيل المثال ، كما في الرسم البياني أدناه. يمكننا القول أن هذه الوسيلة متوسطة نسبيًا ، يمكنك جعل الملف أكبر أو أصغر بنسبة 40٪ ، مع تغيير السرعة بمقدار 10 مرات:
لاحظ أنه بالنسبة لبعض مقاطع الفيديو ، لا يتم بالضرورة تجاوز الخيارات القياسية (في هذه الحالة ، في الجودة). أيضًا ، في بعض الأحيان ، يمكن للخيارات "غير القياسية" أن تحقق مكسبًا كبيرًا في الحجم ، على وجه الخصوص ، باستخدام المثال أعلاه ، بعد أن فقدت 20٪ في السرعة مقارنة بالوسيط ، يمكنك لعب 30٪ في الحجم - مثل التبديل إلى المعيار التالي تقريبًا ، ولكن مع التعقيد المنخفض السابق فك. ولكن هذا بالفعل مستوى أكثر تعقيدًا ، حوله وقت آخر.

كما ترون بسهولة أعلاه ، فقد اتخذ السادة للمقارنة "أبطأ". من الجيد أنها ليست "سريعة جدًا" ، لأنه يمكنك الحصول عليها! ) ولا يهم أن يكون برنامج الترميز الخاص بهم بطيئًا بشكل ساحر. بالنسبة للجزء الأكبر ، لا يتذكر الأشخاص الذين ينظرون إلى الرسم البياني أن سرعة برنامج الترميز يمكن أن تختلف باختلاف الطلبات بناءً على المعلمات. لذلك ، هذه التقنية لفات تماما. على الرغم من أنه على الرسم البياني أعلاه ("معدل البت / الجودة ...") كانت حزمة الخطوط في المنطقة الحمراء (وهي الأسوأ). في الوقت نفسه يبرر الدوس على الفور في تطوير برامج الترميز. نعم نعم

هناك معالجة أكثر دقة ، على سبيل المثال ، يكتب السادة: "لإزالة الإطارات B ، نستخدم H.264 / 5 مع الخيار bframes = 0 ، VP9 مع -auto-alt-ref 0 -lag-in-frames 0 ، و استخدام ملف تعريف HM encoder lowdelay P main.cfg. " أي أنهم لم يتمكنوا من التغلب على برامج الترميز المعتادة في منافسة عادلة واختاروا وضع زمن الاستجابة المنخفض زمن الوصول المنخفض ، والذي يستخدم عادةً في الوقت الفعلي ، على سبيل المثال ، لعقد مؤتمرات الفيديو. نتائج برنامج الترميز فيه أسوأ ، بالطبع. في الوقت نفسه ، تعمل وحدة فك الترميز الخاصة بها (الصامتة حول المشفر) لمدة ثانيتين لكل إطار ، أي أنه لا يمكنك حتى التحدث عن أي زمن انتقال منخفض. ولكن لعبت في المئة قليلة.

هذه ليست جميع الحيل التي استخدمتها الشركات الناشئة السادة ، ولكن الصورة واضحة بالفعل.

من الواضح أنه لكي يبدو التركيز معقولاً ، هناك حاجة إلى لمسات إضافية تعطي الواقعية. على سبيل المثال ، نشر هؤلاء السادة مقالة على https://arxiv.org/abs/1811.06981 . اليوم ، أصبح تطوير الخوارزميات سريعًا لدرجة أنه لا يُحتمل الانتظار حتى يتم نشر مقال في مجلة ، ولهذا السبب ينشر العديد من المؤلفين الأقوياء النتائج أولاً على arxiv.org. بالنسبة للسحرة في الشوارع ، هذا الموقع مناسب لأنه يمكنك وضع أي مواد على الإطلاق - على عكس المجلات والمؤتمرات التي راجعها النظراء ، لن يسأل أحد أسئلة غير سارة ويقطع المنشور (لا يوجد أي قتل يراجع الأماكن الخطيرة). لكن عامة الناس لا يعرفون حقيقة أنه ، على سبيل المثال ، في 1 أبريل ، كان من المعتاد نشر العديد من المقالات الساخرة للمقالات العلمية على arxiv.org ، بما في ذلك تسخر منه كمكان للنشر ، لذلك يبدو أن النشر هناك قوي.

المضي قدما. أطلق على مقال عنها " أول فيديو ترميز في التعلم الآلي تجاوز بشكل كبير جميع برامج الترميز الموجودة ، بما في ذلك H.265 و VP9." نكتة أخرى هي أن التعلم الآلي في الضغط لا يتم استكشافه بنشاط فحسب ، بل مسارات المؤتمرات الفردية مخصصة بالفعل (أي ، هناك العديد من المقالات ) ، ولكن يتم استخدامه أيضًا بنشاط ، على سبيل المثال ، في AV1 (أقوم بتقديم طلب Google بالتحديد). ولكن ، إذا قالوا بصراحة: "لقد أصدرنا برنامج الترميز الثاني باستخدام التعلم الآلي ، بينما فقدنا السرعة الأولى والضغط" ، ربما لم تكن صحيفة وول ستريت جورنال قد كتبت عنهم ... ولم تكن MIT TechReview قد كتبت ... وحتى هابر ... من الواضح ، عدم تحمل الأخير ، قامت الشركة بتعديل الملعب قليلاً . في الوقت نفسه ، تتمثل إحدى ميزات الإنترنت الحديثة في أن الأشخاص لا يتحققون من المعلومات ، مما يسمح للكثيرين بإعلان أنفسهم الأولين للكثيرين (بدءًا بشركات معروفة). الوقاحة ، كما تعلمون ، تأخذ المدينة! حقيقة الاختيار ليست من المألوف.

- غوغلد!
- هل هذا هو الحال؟
[مثال الطلب المذكور أعلاه)))]

وأيضا حول ML / DL. في الماضي البعيد ، عندما كانت الأقراص المرنة كبيرة ، وكانت Winchesters صغيرة ، كانت إحدى طرق "سحر الشارع للأرشيفين" هي حفظ جزء من الملف المضغوط في مكان ما بعيدًا في دليل يحتوي على ملفات مؤقتة وبالتالي إظهار سجل. منذ ذلك الحين ، تغيرت الأوقات. لقد نمت أدوات Winchesters ، واختفت الأقراص المرنة تمامًا ، وأصبح من المألوف إخفاء البيانات في أعماق عدة مئات من الميجابايت من معاملات الشبكة. يمكنك حفظ "علامة حقوق الطبع والنشر" في الشبكة ، أو يمكنك حفظ بيضة عيد الفصح ، أو يمكنك تعيين سجل ضغط مزيف. الشبكات العصبية العميقة - بالتأكيد قوة ، باختصار!

تلخيص هذا الطريق إلى النجاح:
  • نحن نتجاهل الزعيم الحديث كما لو أنه لم يكن موجودًا على الإطلاق.
  • نقوم بصياغة كل شيء بعناية بحيث يقرأ كما لو كنا أول من استخدم بعض التقنيات الجديدة (وحتى لو قام القائد أولاً ، فلن يقوم أحد بالتحقق).
  • بالنسبة للمعايير من 5 إلى 15 عامًا ، نقوم بإغلاق المقابض بحيث تعمل بشكل أسوأ منا.
  • — , , .
  • «The Wall Street Journal» …

… ( !)… ! … … ! ! ...

-!


, pikabu.

, , , , . .. , — , , , , . !

, . — , . , , , ?

«‎»‎ 480p24 x264 c "-preset superfast -x264-params «nal-hrd=cbr» -b:v 1M -minrate 1M -maxrate 1M -bufsize 2M" xvid "-preset superfast -b:v 1M -minrate 1M -maxrate 1M -bufsize 2M" ( open-source H.264 MPEG-4). .

:
avatar_x264_cbr1M_superfast.mkv — 1402 MB
avatar_xvid_cbr1M_superfast.mkv — 1401 MB

, ! !!!

, :


:

! ?


! ! !
!





, ??? …



---! ! ! !!! , !



? , 10 — ! ! , ! !!!!!!!11


, .

:

, , . , — PSNR ( , , , , xvid ):



( , ) — , , +5 dB (PSNR , , , , : 1.5 dB). , 20 dB:



, , ( )… !

, 10 MSU VQMT , 3 — , -1 -2 , , 30 . — !

MPEG-4 , .

, :

! !

-, , - - . .

, , ! , , ...


تمت مناقشة الطرق البسيطة نسبيًا لإعداد المواد التسويقية "في صالح الفرد" في مقارنات برامج الترميز والتشفير أعلاه. بطبيعة الحال ، في الحياة الحقيقية كل شيء أكثر تعقيدا. للأسف ، إذا تعمقت ، فلن يكون الأمر مثيرًا للغاية وأكثر تعقيدًا بشكل ملحوظ (أولئك الذين يرغبون في قراءة المقال والتعليقات هنا ، على سبيل المثال).

وعادة ما يهتم الناس بإجابات بسيطة. الجواب الأكثر شعبية في Answers@Mail.ru على السؤال " ما هو أفضل برنامج ترميز الفيديو؟" هو "حزمة الترميز ميجا لايت". وهذا هو حقًا الإجابة الأقصر والأكثر دقة وضوحًا للجمهور. وأنت تقول برامج الترميز والمعايير ...

ولكن كلما زاد عدد الأشخاص الموجودين هناك ، على الأقل على المستوى المتوسط ​​الذين هم على دراية بهذا الموضوع ، كلما كانت دوائر التسويق أو الشركات الناشئة الوقحة أقل صفيقًا ستفجر آذان المستثمرين. وستكون الحياة أفضل قليلاً.

شكرا لك سيداتي وسادتي! الجميع - محو الأمية التقنية!

شكر
أود أن أشكر بحرارة:
  • مختبر رسومات الحاسوب جامعة موسكو الحكومية MV Lomonosov لمساهمته في تطوير رسومات الحاسوب في روسيا وليس فقط
  • زملائنا من مجموعة الفيديو ، بما في ذلك سيرجي Zvezdakov ، أناستازيا أنتسيفيروفا ورومان كازانتسيف ، الذين تم استخدام أمثلة أعلاه ،
  • شخصيا كونستانتين كوزميياكوف ، الذي فعل الكثير لجعل هذا المقال أفضل وأكثر بصرية ،
  • وأخيراً ، شكراً جزيلاً لسيرجي لافروشكين ويغور سكلياروف وإيفان مولوديتسكي وإيفيني ليابوستن وديمتري كوليكوف وألكسندرا أنزينا وفيتالي ليودفيتشينكو وميخائيل إروفيف وجورجي أوسيبوف على الكثير من التعليقات والتصحيحات المفيدة التي جعلت هذا النص أفضل بكثير!

Source: https://habr.com/ru/post/ar451664/


All Articles