👩‍✈️ 🧔🏻 😯 Street Magic Codec Vergleich. Geheimnisse enthüllen 👨‍🚒 🚜 ☑️

Dieses Jahr jährt sich das Jubiläum - 16 Jahre nach dem Start der Website compress.ru, auf der der Autor und seine Mitarbeiter Vergleiche von Videocodecs und Bildcodierern organisieren. Während dieser Zeit wurden Dutzende von Vergleichen mit Berichten von 23 bis über 550 Seiten durchgeführt , die Anzahl der Grafiken im letzten Vergleich überstieg 7000 und die Anzahl der verschiedenen bezaubernden Fälle während dieser Zeit überschritt schließlich alle vernünftigen Grenzen. Da der nächste Runde Termin (32 Jahre) bald kommt, besteht der Wunsch, zu Ehren des Jubiläums ein wenig bezaubernd zu erzählen.

Wenn wir über Codecs sprechen, ist es kein Geheimnis, dass die meisten Vergleiche und Grafiken, die die angesehenste Öffentlichkeit sieht, Produkte der Marketingabteilung sind. Im besten Fall haben die Ingenieure die Grafiken kompetent erstellt, und das Marketing hat nur den Startschuss für die Veröffentlichung gegeben. Im schlimmsten Fall haben die Ingenieure überhaupt nicht an ihrer Vorbereitung teilgenommen. ~~Warum Zeit mit diesen vielbeschäftigten Menschen verschwenden?~~

Gleichzeitig ist das Thema Komprimierung sehr beliebt. In der Silicon Valley-Serie entwickelte das Startup des Protagonisten einen ausgeklügelten Algorithmus, der in der letzten Folge der ersten Staffel eine unglaubliche 3D- Videokomprimierung zeigte. Infolgedessen wissen jetzt Millionen von Startups (und Investoren) auf der Welt, dass die Hauptsache darin besteht, einen größeren Weissman-Koeffizienten und mehr zu haben Genie muss gefunden werden, und der Rest ist Bullshit. Das Wunder wird sein! Dies erhöht natürlich die Erwartung von Wundern und natürlich (natürlich!) Werden diese Wunder von Unternehmen freudig demonstriert! Einschließlich der neuesten Errungenschaften der Straßenmagie.

HAFTUNGSAUSSCHLUSS: Jede Übereinstimmung der Namen der unten aufgeführten Unternehmen mit echten Namen ist absolut zufällig.

Lehnen Sie sich zurück! Wir versprechen, dass Sie am Ende der Geschichte solche Tricks selbst zeigen und viele davon enthüllen können. Lass uns gehen!

Level 1, Tricks für Anfänger

Beginnen wir mit dem Einfachsten, denn seltsamerweise werden diese Methoden in einem modernen (nicht seriellen, aber echten!) Silicon Valley eingesetzt.

Also, die angesehenste Öffentlichkeit, beginnen Tricks mit einer Demonstration der superstarken Komprimierung!

Sicherlich haben viele ähnliche dynamische Vergleiche ~~mit unauffälligen Katzen gesehen,~~ die auf JS auf den Seiten basieren. Wenn die Komprimierung verglichen wird, ist es vernünftig, dass die Qualität so gleich wie möglich ist (im Idealfall genau gleich), und rechts würde sie beispielsweise zweimal besser komprimiert.

Kaum gesagt als getan!

Das Unternehmen behauptet, 30% bessere Komprimierung (alle Übereinstimmungen sind zufällig!). Und die Bilder sehen genauso aus! Auch ein professionell ausgebildeter Look findet keine Unterschiede. Es besteht der Wunsch, genauer hinzuschauen. Wir klettern in den Seitencode und sehen, dass der Schieberegler für das erste und zweite Bild Daten aus einer Datei übernimmt! Wir erhalten auf mehrere Arten gleichzeitig Vorteile: Erstens wird das beste Ergebnis idealerweise demonstriert, zweitens wurde der Ingenieur nicht von der Arbeit abgelenkt, und schließlich wird dieser Platz auf der Seite der Website doppelt so schnell geladen. Solider Gewinn !!!

Der Fall, glaube es nicht, ist real. Jetzt wissen Sie, wo Sie suchen müssen!

An einem anderen Ort - auch ein Slider und wieder ein wunderbares Ergebnis. Wir schauen uns den Slider-Code an - verschiedene Dateien werden geladen. Durch bittere Erfahrung unterrichtet, laden Sie sie herunter - sie sind nicht nur bis zu einem Byte derselben Größe, sie passen Stück für Stück zusammen! Im Allgemeinen sind alle Vorteile der vorherigen Methode, aber der Fokus ist etwas komplizierter, allerdings aufgrund der Verlangsamung beim Laden von Seiten (Sie müssen für alles bezahlen ...). Und vor allem müssen Sie keine teuren Komprimierungsspezialisten gewinnen.

Fortgeschrittenere Vermarkter auf diesem Niveau gehen jedoch noch weiter. Der Schieberegler ist angelegt - Sie sehen - die Bilder sind unterschiedlich, aber die Qualität ist sehr ähnlich. Na gut. Weiter mehr! Es zeigt sich eine fantastische Offenheit - es gibt sogar Links zu Videodateien. Das Herunterladen ist ein sehr guter Vorteil ihrer Methode, es ist nicht einmal klar, wie sie es gemacht haben. Es hilft, dass wir hier alle komplett russische Hacker sind (bereits eine Marke im Westen). Wir schauen auf den Bitstrom und sehen ein wundervolles Bild:

Das heißt, selbst viele Experten werden bestätigen, dass die Menschen tatsächlich ein hervorragendes Ergebnis erzielen, das ungefähr doppelt so groß ist wie das des heutigen Marktführers bei vergleichbarer Qualität, wenn sie nicht tief graben und es noch einmal überprüfen. Sie werden nicht glauben, dass solche Methoden an sich selbst gewöhnt sind, und sogar in einigen Fällen können Sie Investitionen in zweistelliger Millionenhöhe tätigen.

Ich erinnere mich an ein Treffen mit einem russischen Startup vor 6 Jahren. Ihr Direktor sagte direkt von der Tür aus: „Sie müssen uns unser Bestes geben. Wir haben Investoren aus Severstal, und wenn überhaupt, werden sportlich rasierte Männer mit Lötkolben zu Ihnen kommen. “Wie Sie wissen, steigt unter solch rauen Bedingungen die Qualität der Forschungsarbeit auf magische Weise und die Anzahl der Tricks auf verschiedenen Ebenen nimmt ab ... Bei der Arbeit mit solchen Fällen in unserer Heimat der Elefanten herrscht für westliche Investoren ein unwiderstehliches Mitleid. Es stimmt, nicht alle unsere Investoren sind so rein spezifisch, und ihre Zauberer sind auch in unseren Palästinensern. Und regelmäßig. Aber darüber ein anderes Mal ...

Stufe 7 Resonanz

In dieser Geschichte geht es nicht um einen Video-Codec, sondern um Bildkomprimierung, aber nach allen Gesetzen des Genres der „ehrlichen Tricks“ war viel drin.

Irgendwie entschied ein ziemlich bekanntes Unternehmen M, dass es Windows Media Photo (WMP) zu seinen Formaten Windows Media Video (WMV) und Windows Media Audio (WMA) hinzufügen muss. Reinigen Sie das Kit, wie Sie verstehen.

Junger Mann in der Galerie! Nun, schreie nicht so laut, es ist dir nicht allein aufgefallen! Kultivierte Menschen (siehe erste Reihe) maximal - wissentlich in einem Schnurrbart grinsen ...

Kaum gesagt als getan!

Als nächstes überwachen Sie sorgfältig die Hände:

Das heißt, WMP enthält mehr Details als JPEG und JPEG 2000 bei gleicher Komprimierungsstufe (JPEG und JPEG 2000 werden sanft ausgeglichen und die Stufe wird 24-mal eingestellt) und im folgenden Absatz :

Das heißt, normalerweise nur 6 mal drücken und es war 24. Wow, es riecht dreimal! Im Allgemeinen sind wir mit Sicherheit zweimal besser. Die Medien brachten die guten Nachrichten zu den Massen (einige schrieben, dass es zweimal besser als JPEG 2000 war), sogar auf Habré wiederholten sie diese Nachrichten .

Wenig später erschien eine Tabelle aus dieser Präsentation:

Wie interpretiere ich solche Diagramme?

Vertikal ist normalerweise die Qualität (einige der Metriken hängen vom Modus zu diesem Zeitpunkt ab), horizontal - auf die eine oder andere Weise - Größe. Normalerweise nimmt die Qualität mit zunehmender Größe zu (obwohl in der Praxis alles passiert). Auf der Linie mit der gleichen Qualität (rot horizontal) kann geschätzt werden, dass der "lila" Codec etwa die doppelte Größe des "blauen" Codec mit der gleichen Qualität in diesem Bereich von Bitraten verliert.

Der Vorteil gegenüber JPEG 2000 war gering, obwohl sie offensichtlich das beste Bild mit einem wunderbaren Jungen und Delfinen ausgewählt hatten. Wir haben uns darauf gefreut, mit diesem Encoder zu spielen. Nach etwa sechs Monaten wurde das Dienstprogramm zur Komprimierung ausgelegt.

Zu diesem Zeitpunkt hatten wir noch vor einem Jahr einen Vergleich von 9 Implementierungen von JPEG 2000

Ja Ja Ja! Da nicht alle Joghurts gleich nützlich sind, sind nicht alle Implementierungen des Standards gleich gut. Der Standard spezifiziert nur einen Bitstrom, der in Daten eingefügt (und übrigens herausgenommen!) Werden kann. Auf sehr unterschiedliche Weise entsteht ein separater Codec- Markt mit einem harten Wettbewerb um ein gutes Dutzend Parameter. Ein einfaches Volk weiß das in der Regel nicht, was es ihm ermöglicht, praktisch ungestraft auf einem Bulldozer auf den Ohren zu fahren („Unser DVR unterstützt den neuesten H.265 / HEVC, niemand sonst hat ihn!“). Und niemand (niemand!) Ist SEHR wahrscheinlich für ein Setup.

Wir haben im vorherigen Bericht gerne 3 Zeilen für WMP eingefügt. Es stellte sich irgendwie so heraus:

Es ist ersichtlich, dass die Zeilen von JPEG 2000-Implementierungen ziemlich überfüllt sind und Fettblau (die beste WMP-Implementierung) irgendwo dazwischen Ergebnisse hat, d. H. JPEG 2000-SPIELE. Wenn Sie JASPER als Null nehmen und alles vertikal relativ dazu anzeigen, können Sie sehen, dass WMP mit dem schlechtesten Parameter gegen fast alles außer den letzten beiden verliert (einer davon ist KDU, denken Sie daran), und mit dem besten irgendwo zentriert, verliert gegen viele Implementierungen:

Da der Vergleich öffentlich veröffentlicht wurde und in engen Kreisen für Aufsehen sorgte, beantwortete der Entwickler ihn sogar im offiziellen Blog . Die Notiz war höflich: Sie wurde gelobt, kritisiert, und wenn Sie den Text durchblättern, gab der Mann offen zu, dass sie die schlechteste Implementierung von JPEG 2000 unseres Vergleichs (sechs Monate zuvor veröffentlicht) in ihrem Vergleich verwendet haben, wenn auch "völlig zufällig". Natürlich werden wir ihnen glauben. Ein angesehenes Unternehmen und all das.

Ferner wurde der Name der Technologie von WMP in HD Photo geändert, das folgende Urteil blieb jedoch im Netzwerk:

Als Kirsche auf einem Kuchen. Unsere Kollegen gingen noch weiter: Sie machten mehr Bilder und zeigten, dass HD Photo nicht nur JPEG 2000 wiedergibt, sondern auch eine gute JPEG-Implementierung ( in 7 von 14 Fällen ). Und verliert speziell. Es gibt Grund zu der Annahme, dass sie die Bilder aufgenommen haben, aber sie haben HDPhoto offen vergraben, denn wer braucht ein Format, das in der Hälfte der Zeit das alte JPEG spielt - es ist nicht klar:

Totale Geheimnisse dieses Tricks:

Wir nehmen die schlechteste Implementierung des Hauptkonkurrenten, vergleichen Sie damit.
Wir schaffen einen Werbehype (im Stil von "Wir haben alle überholt").
Wenn der Hype in den Hintergrund tritt, veröffentlichen wir und hoffen, dass niemand überprüfen wird, was wirklich da war.

Kinder! Tu das niemals und täusche andere nicht! Ihr Unternehmen kann Millionen von Dollar und das Vertrauen von Spezialisten verlieren.

Level 10, frisch! Mit neuronalen Netzen!

Im Allgemeinen gibt es viele solcher Fälle. Selbst in Russland stoße ich ungefähr ein paar Mal im Jahr auf ähnliche Situationen (Informationen fließen zu uns wie zu den Eigentümern von compress.ru). Investoren im Westen werden ungefähr einmal im Monat gezüchtet. Und jetzt hat sich auch China mit dieser Unterhaltung verbunden. Die Leistung von Computern wächst, auch die Komplexität und die Fähigkeiten von Algorithmen. Das zu verstehen wird immer schwieriger. Infolgedessen geht der gewalttätige Spaß weiter!

In letzter Zeit sind neuronale Netze sehr beliebt geworden. Absolut alles, was sie auf magische Weise berühren, verbessert sich. Aber nicht auf Videokomprimierung anwenden?

Kaum gesagt als getan!

Im vergangenen November umkreisten weitere gute Nachrichten aus dem Wall Street Journal die Welt. Erstellt einen Video-Codec basierend auf maschinellem Lernen, der alle in Stücke reißt! Hier ist der Beweis:

Im Allgemeinen bin ich persönlich äußerst skeptisch gegenüber allen Nachrichten mit der Erwähnung neuronaler Netze. Und ich rate Ihnen (INSBESONDERE, wenn Sie ein Investor sind). Neuronale Netze sind so angeordnet, dass bei korrekter Auswahl eines Trainingsmusters für einen Test jedes gewünschte Ergebnis (für das langweilige - JEDES!) Angezeigt werden kann. Neuronale Netze sind ein ideales Werkzeug, um eine Reihe von Marketingwundern auszulösen. Einer ist schöner als der andere!

Im Allgemeinen gibt es einen Zeitplan, es gibt Bilder. Stimmen Sie zu - überzeugend. Speziell für die Skeptiker brachten die Herren noch ein paar Grafiken zu bekannten Testsätzen:

Wenn das vorherige Diagramm mit Bildern für mich persönlich irgendwie erklärbar war (es ist immer möglich, ein Video zu schärfen und sogar mit tiefen neuronalen Netzen), haben mich diese beiden Diagramme sehr aufmerksam gemacht.

Stört dich nichts daran?

Die Antwort

Daraus folgt, dass zehn Jahre lang von der Einführung des H.264-Standards bis zur Einführung von H.265 keine spezielle Entwicklung von Codecs stattgefunden hat! Diese dummen Forscher stapften 10 Jahre lang herum und stellten langsamere Codecs her, die das gleiche komprimieren !!! Die Differenz beträgt maximal 20% oder noch weniger !!! 8- \

Sie bringen sogar die Basis darunter, wie die klassischen Codecs, die am Limit ruhen und sich nicht besonders entwickeln (und hier gehen sie auf die Bühne, alle in Weiß). Und weißt du, solch eine eklatante Lüge funktioniert großartig! Und okay, "The Wall Street Journal" - sie (ich würde gerne glauben) verstehen nur Finanzen, okay "MIT Technology Review" - diese Herren nehmen das Wort für Herren aus dem Silicon Valley, aber eine so angesehene Ressource wie Habr nahm die Nachrichten unkritisch auf - Ich werde es schaffen! Was kann ich über das massive Nachdrucken der Nachrichten sagen ...

In Wirklichkeit ist das Bild der Entwicklung von Codecs glücklicherweise deutlich anders. Erstens können wir in der folgenden Grafik, die wir auf demselben Satz von xiph-Videos erstellt haben, sehen, dass H.265 25–31% besser ist als H.264. Das heißt, 10 Jahre Codec-Entwicklung waren noch nicht umsonst! ( Uff, es hat sich von Herzen gelöst ... ) Zweitens zeigt der frische AV1 eine fast zweifache Verbesserung gegenüber H.264, und der Schritt seines Vorteils ist offen gesagt sehr deutlich:

Dementsprechend kann man mit dem Auge sehen, dass, wenn Sie das AV1-Diagramm 45% links von H.264 auf dem Autorendiagramm überlagern, es den neuen Codec als ... [durch Zensur ausgeschnitten] abdeckt. Deckt gut ab, kurz gesagt. Deshalb haben sie „vergessen“, sich mit ihm zu vergleichen. Die tatsächliche Ausrichtung sieht ungefähr so aus (viel weniger überfüllt, stimme zu):

Um es klar zu machen: Die Codecs verfügen über Standardvoreinstellungen, mit denen Sie die Geschwindigkeit in einem beträchtlichen Bereich (oft zehnmal) variieren und gleichzeitig eine größere Komprimierung bei gleicher Qualität (oft mehr als zweimal) erzielen können. Bei x265 (eine sehr gute Open-Source-Implementierung des HEVC- Standards) heißen sie: ultraschnell, superschnell, sehr schnell, schneller, schnell, mittel, langsam, langsamer, sehr langsam, Placebo. Wenn wir Medium für 1 nehmen, können sie in Geschwindigkeit und Dateigröße mit derselben Qualität für eine bestimmte Datei gefunden werden, z. B. wie in der folgenden Grafik dargestellt. Wir können sagen, dass Sie die Datei relativ mittelgroß um 40% vergrößern oder verkleinern können, indem Sie die Geschwindigkeit um das Zehnfache variieren:

Beachten Sie, dass bei einigen Videos die Standardoptionen nicht unbedingt eintönig sind (in diesem Fall in der Qualität). Manchmal können auch „Nicht-Standard“ -Optionen zu einem großen Größengewinn führen , insbesondere wenn Sie das obige Beispiel verwenden und 20% an Geschwindigkeit im Vergleich zu Medium verloren haben, können Sie 30% an Größe spielen - fast wie beim Umschalten auf den Standard der nächsten Stufe, jedoch mit der vorherigen geringen Komplexität Decoder. Aber dies ist bereits eine komplexere Ebene, ein anderes Mal.

Wie Sie oben leicht sehen können, haben die Herren zum Vergleich "langsamer" genommen. Es ist gut, dass es nicht "sehr schnell" ist, weil Sie es haben könnten! ) Und es spielt keine Rolle, dass ihr Codec selbst bezaubernd langsam ist. Menschen, die sich ein Diagramm ansehen, erinnern sich größtenteils nicht daran, dass sich die Geschwindigkeit des Codecs je nach Parameter um einige Ordnungen unterscheiden kann. Daher rollt diese Technik vollständig. Obwohl in unserer obigen Tabelle ("Bitrate / Qualität ...") ihr Linienbündel im roten Bereich lag (was am schlimmsten ist). Gleichzeitig ist es gerechtfertigt, bei der Entwicklung von Codecs vor Ort zu stampfen. Ja ja

Es gibt subtilere Manipulationen, zum Beispiel schreiben die Herren: „Um B-Frames zu entfernen, verwenden wir H.264 / 5 mit der Option bframes = 0, VP9 mit -auto-alt-ref 0 -lag-in-frame 0 und Verwenden Sie das HM-Encoder-Profil mit niedriger Verzögerung P main.cfg. “ Das heißt, sie konnten die üblichen Codecs in einem fairen Wettbewerb nicht schlagen und entschieden sich für den Modus mit niedriger Latenz und niedriger Latenz, der normalerweise für Echtzeit verwendet wird, beispielsweise für Videokonferenzen. Die Ergebnisse des darin enthaltenen Codecs sind natürlich schlechter. Gleichzeitig arbeitet der Decoder (lautlos über den Encoder) 2 Sekunden pro Frame, dh Sie können nicht einmal von einer geringen Latenz sprechen. Aber ein paar Prozent spielten.

Dies sind nicht alle Tricks, die von Gentlemen-Startups verwendet wurden, aber das Bild ist bereits klar.

Es ist klar, dass zusätzliche Berührungen erforderlich sind, um den Fokus glaubwürdig erscheinen zu lassen, die Realismus verleihen. Zum Beispiel haben diese Herren einen Artikel unter https://arxiv.org/abs/1811.06981 veröffentlicht . Heutzutage ist die Entwicklung von Algorithmen so schnell, dass es unerträglich wird, zu warten, bis ein Artikel in einer Zeitschrift veröffentlicht wird, weshalb viele starke Autoren die Ergebnisse zuerst auf arxiv.org veröffentlichen. Für Straßenmagier ist diese Seite insofern praktisch, als Sie dort absolut jedes Material platzieren können - im Gegensatz zu von Experten begutachteten Magazinen und Konferenzen wird niemand unangenehme Fragen stellen und die Veröffentlichung abschneiden (es gibt keine Tötung, die ernsthafte Orte überprüft). Die breite Öffentlichkeit weiß jedoch nicht, dass es beispielsweise am 1. April üblich war, verschiedene Parodien wissenschaftlicher Artikel auf arxiv.org zu veröffentlichen, einschließlich der Veröffentlichung als Veröffentlichungsort, so dass die Veröffentlichung für die breite Öffentlichkeit sogar solide zu sein scheint.

Mach weiter. Ein Artikel über sie hieß " Der erste Video-Codec im maschinellen Lernen hat alle vorhandenen Codecs, einschließlich H.265 und VP9, dramatisch übertroffen." Ein weiterer Witz ist, dass maschinelles Lernen in der Komprimierung nicht nur aktiv erforscht wird, dem einzelne Konferenzspuren bereits gewidmet sind (dh es gibt viele Artikel ), sondern auch aktiv verwendet wird, beispielsweise in AV1 (ich stelle speziell eine Google-Anfrage). Aber wenn sie ehrlich sagten: "Wir haben den zweiten Codec durch maschinelles Lernen veröffentlicht, während wir den ersten an Geschwindigkeit und Komprimierung verloren haben", konnte das Wall Street Journal nicht über sie schreiben ... Und MIT TechReview würde nicht schreiben ... und sogar Habr ... Offensichtlich hat das Unternehmen die Tonhöhe leicht angepasst, nachdem es letzteres nicht ertragen hatte. Gleichzeitig ist ein Merkmal des modernen Internets, dass Menschen keine Informationen überprüfen, was es vielen ermöglicht, sich als erste zu vielen zu proklamieren (beginnend mit bekannten Unternehmen). Wie Sie wissen, nimmt Unverschämtheit die Stadt! Eine Faktenüberprüfung ist nicht in Mode.

- gegoogelt!
- Ist das so?
[Beispielanfrage oben)))]

Und auch über ML / DL. In der fernen Vergangenheit, als Disketten groß und Festplatten klein waren, bestand eine der Techniken der „Straßenmagie für Archivierer“ darin, einen Teil der komprimierten Datei irgendwo weit entfernt in einem Verzeichnis mit temporären Dateien zu speichern und so einen Datensatz anzuzeigen. Seitdem haben sich die Zeiten geändert.Winchester sind gewachsen, Disketten sind vollständig verschwunden, und es ist in Mode gekommen, Daten in den Tiefen von mehreren hundert Megabyte Gitterkoeffizienten zu verbergen. Sie können das "Copyright-Zeichen" im Raster speichern, das Osterei speichern oder einen gefälschten Komprimierungsdatensatz festlegen. Tiefe neuronale Netze - definitiv Macht, kurz gesagt!

Fassen Sie diesen Weg zum Erfolg zusammen:

Wir ignorieren den modernen Führer, als ob er überhaupt nicht existiert hätte.
Wir formulieren alles sorgfältig so, dass es so aussieht, als wären wir die Ersten, die eine neue Technologie einsetzen (und selbst wenn der Leiter die erste gemacht hat, wird niemand dies überprüfen).
Bei Standards vor 5 bis 15 Jahren schalten wir die Griffe aus, damit sie schlechter funktionieren als wir.
Mehr Arroganz - wir rechtfertigen die Tatsache, dass sie gehäuft hinter uns liegen, damit sie am Limit ruhen und sich nicht mehr entwickeln.
Wir sind im Wall Street Journal und auf Habr ...

Und ... (Trommelwirbel!) ... sie geben dir noch ein paar Millionen Dollar! Oder sie geben nicht ... ich würde nicht geben ... Investoren! Schlaf nicht! Und dann wirst du wieder ins Wasser blasen ...

Und jetzt die Meisterklasse!

Wie ich oben versprochen habe, können Sie am Ende dieses Textes leicht auf der Bühne des bedingten Pikabu glänzen.

Nun, oh angesehenste Öffentlichkeit, zeige ich Ihnen einen Trick, mit dem Sie alles mit irgendetwas mit einem vorgegebenen Ergebnis vergleichen können. Das heißt, Wenn Sie möchten, dass Codec A besser als Codec B ist, zeigen wir es. Wenn Sie möchten, dass B besser als A ist, können wir es zeigen. Wir werden jede Laune der Marketingabteilung ~~für Ihr Geld~~ kostenlos erfüllen !

Lassen Sie uns überprüfen, wie diese Codecs drücken. Wie sie sagen - vertraue niemandem, überprüfe es selbst. Und dann, vielleicht ist die Wahrheit, entwickeln sich diese Standards nicht und wir werden einfach getäuscht und vergeblich gezwungen, das durch Überarbeitung verdiente Geld zu bezahlen. Es ist nicht klar, wofür?

Nehmen Sie den "Avatar" im 480p24-Format und komprimieren Sie ihn mit dem x264-Codec mit den Einstellungen "-preset superfast -x264-params" nal-hrd = cbr "-b: v 1M -minrate 1M -maxrate 1M -bufsize 2M und dem xvid-Codec mit Einstellungen "-preset superfast -b: v 1M -minrate 1M -maxrate 1M -bufsize 2M" (zwei sehr gute Open-Source-Implementierungen der Standards H.264 und MPEG-4). Warum diese Codecs und Einstellungen verwendet werden, wird später erläutert.

Wir haben zwei Dateien von fast derselben Größe:
avatar_x264_cbr1M_superfast.mkv - 1402 MB
avatar_xvid_cbr1M_superfast.mkv - 1401 MB

Und jetzt, meine Damen und Herren! Pass gut auf deine Hände auf !!!

Wir schauen, hier ist der neue Standard und der alte:

Wir schauen uns einen anderen Rahmen an:

Kein Kommentar! Aber was ist, wenn schnelle Bewegung?

Stimmen Sie zu! Fortschritt ist klar und unerbittlich! Alles entwickelt sich und wird immer besser! Und das Leben ist schöner und macht mehr Spaß!

Obwohl ...

Gott, was ist das ??? Der neue Standard ist vollständig verschmolzen ... Ahhh

! Leute! Wissen Sie! !!! , !

? , 10 — ! ! , ! !!!!!!!11

, .

:

, , . , — PSNR ( , , , , xvid ):

Wenn Sie ein Diagramm von einem anderen subtrahieren (in der folgenden Abbildung eine andere Stelle in der Datei), können Sie sehen, dass der Codec des älteren Standards insgesamt verloren geht, an einigen Stellen jedoch um +5 dB verloren gehen kann (PSNR ist praktisch, da es umgekehrt logarithmisch proportional ist Standardabweichung, aufgrund derer die Regel in der Regel funktioniert: Im Bereich mittlerer und niedriger Bitraten pro Auge ist eine Differenz von 1,5 dB sichtbar. Und dann können Sie den Rahmen sehen, in dem der Unterschied 20 dB in die andere Richtung beträgt: Das Bild klickt. Jetzt verstehen Sie, warum Ihr bescheidener Diener die einzelnen Aufnahmen in den Marketingmaterialien von Unternehmen immer aufrichtig als Beweis für eine höhere Qualität im Video betrachtet (insbesondere wenn nicht) Zeitpläne) ... und schließlich machen sie das immer noch manchmal!

Um die Auswahl von Frames zu vereinfachen, haben wir vor mehr als 10 Jahren in unserem Tool MSU VQMT einen Vergleichsmodus erstellt , in dem 3 Dateien gleichzeitig verglichen wurden - das Original, Codec-1 und Codec-2 - und sofort die 30 besten Frame- Paare in einem oder in gespeichert wurden die andere Seite. Die Hauptsache ist, die Datei authentischer zu nehmen!

Ein MPEG-4 mit niedriger Bitrate wurde genommen, um das Blockieren sichtbarer zu machen.

Insgesamt der Weg zum Erfolg:

Wir wählen einen Modus aus, in dem die Qualitätsschwankung in Codecs maximal ist (normalerweise ein CBR mit einem Durchgang).
Reduzieren Sie die Auflösung der Quelle um das Zweifache (da Sie höchstwahrscheinlich die Fragmente erhöhen müssen, z. B. wurden die Fragmente um das Dreifache erhöht).
Wir nehmen einige Metriken ( PSNR , SSIM , modische VMAF in dieser Saison ).
.
, : 3 — !

! !

-, , - - . .

, , ! , , ...

Anstelle einer Schlussfolgerung

Die relativ einfachen Methoden zur Erstellung von Marketingmaterialien „zu Gunsten“ beim Vergleich von Codecs und Encodern wurden oben diskutiert. Im wirklichen Leben ist natürlich alles komplizierter. Leider wird es nicht so aufregend und merklich komplizierter, wenn Sie tiefer gehen (diejenigen, die dies wünschen, können beispielsweise den Artikel und die Kommentare hier lesen).

Und die Leute sind normalerweise an einfachen Antworten interessiert. Die beliebteste Antwort in Answers@Mail.ru auf die Frage „ Was ist der beste Video-Codec?“ Ist „K-Lite Mega Codec Pack“. Und dies ist wirklich die kürzeste, verständlichste und genaueste Antwort für das Massenpublikum. Und Sie sagen Codecs, Standards ...

Aber je mehr Leute dort sind, zumindest auf durchschnittlicher Ebene, die sich mit dem Thema auskennen, desto weniger frech werden die Marketingabteilungen oder die frechen Start-ups die Ohren der Investoren an die Ohren blasen. Und das Leben wird ein bisschen besser.

Vielen Dank, meine Damen und Herren! Jeder - technische Kompetenz!

Danksagung

Ich möchte mich herzlich bedanken bei:

Labor für Computergrafik VMK Moscow State University MV Lomonosov für seinen Beitrag zur Entwicklung der Computergrafik in Russland und nicht nur
unsere Kollegen aus der Videogruppe, darunter Sergey Zvezdakov, Anastasia Antsiferova und Roman Kazantsev, deren Beispiele oben verwendet wurden,
persönlich Konstantin Kozhemyakov, der viel getan hat, um diesen Artikel besser und visueller zu machen,
und schließlich vielen Dank an Sergey Lavrushkin, Jegor Sklyarov, Ivan Molodetsky, Evgeny Lyapustin, Dmitri Kulikov, Alexandra Anzina, Vitaly Lyudvichenko, Michail Erofeev und Georgy Osipov für viele nützliche Kommentare und Korrekturen, die diesen Text viel besser gemacht haben!

Street Magic Codec Vergleich. Geheimnisse enthüllen

Level 1, Tricks für Anfänger

Stufe 7 Resonanz

Level 10, frisch! Mit neuronalen Netzen!

Und jetzt die Meisterklasse!

Anstelle einer Schlussfolgerung

More articles: