Audiofilkin Brief: ein paar Worte zur Verteidigung von HI-RES

Unter Menschen mit einer kritischen Sicht auf die Welt wurde ein Stereotyp verwurzelt, dass hochauflösende Audioformate (mit einer Abtastfrequenz von mehr als 44,1 Hz und einer Quantisierung von mehr als 16 Bit) in Haushalts-Audiowiedergabegeräten nur ein Marketingtrick sind, der für diejenigen entwickelt wurde, die es nicht wissen über Wahrnehmungsschwellen. Ebenso gibt es Verbesserungen jenseits der Grenzen der menschlichen Wahrnehmung.



Lange Zeit neigte ich zu einer ähnlichen Meinung, bis ich in regelmäßigen Abständen bemerkte, dass mir subjektiv einige (einige der ungeklärten Gründe) mehr Aufzeichnungen gefielen. Ich kann nicht sagen, dass ich den Blindtest problemlos bestehen und mit hoher Genauigkeit feststellen kann, wo sich der Hirez befindet und wo sich der MP3 mit einer Bitrate von 320 kbps befindet. Aber als ich mir die Aufnahmen im AIFF-Format mit einer Abtastfrequenz von 192 kHz und einer Auflösung von 32 Bit anhörte, schien es mir, dass ich subtile Verbesserungen im Dynamikbereich und bei niedrigen Wiedergaben bemerke.

Ich traue meinen Ohren nicht wirklich. Ich bezweifelte meine eigenen Schlussfolgerungen und beschloss, etwas über die theoretische Möglichkeit herauszufinden, diese Unterschiede zu hören.
Zu meiner Überraschung fand ich nicht die Geschichten von Vermarktern, sondern recht maßgebliche Einschätzungen von AES-Spezialisten (Audio Engineering Society). Meine Suche gab keine eindeutige Antwort, aber ich wurde weniger kategorisch in Bezug auf Hochhäuser.

Aufgrund persönlicher Erfahrungen habe ich mehr als einmal geschrieben, dass Hi-Res nur von Menschen benötigt wird, die nicht genug zum Hören haben, aber wissen müssen, dass die Klangqualität einwandfrei ist. Nachdem ich die Ergebnisse von Audioingenieuren und psychoakustischen Spezialisten analysiert hatte, stellte ich fest, dass es immer noch eine theoretische Möglichkeit gibt, den Unterschied zu hören.

Frequenz und andere Auflösungsparameter


Die Hauptfrage, mit der Forscher in den letzten Jahrzehnten konfrontiert waren: Ist es sinnvoll, die Abtastrate von Aufzeichnungen und die Wiedergabe von Audiogeräten zu erhöhen? Die Frage wurde im Zusammenhang mit der Tatsache gestellt, dass die physiologische Hörschwelle auf einen Bereich von 16 Hz bis 21 kHz begrenzt ist.

Laut einem der Pioniere der russischen Psychoakustik, Professor der Universität St. Petersburg, Doktor der technischen Wissenschaften, Mitglied des Koordinierungsrates für Akustik der Russischen Akademie der Wissenschaften, Vorsitzender der AES-Abteilung von St. Petersburg, Irina Aldoshina, hat noch niemand eine eindeutige Antwort auf die Frage gegeben.

Tatsache ist, dass es trotz des Mangels an Hinweisen auf Blindtests viele theoretische Annahmen gibt, dass eine hohe „Auflösung“ die subjektive Wahrnehmung beeinflussen kann, wenn das Subjekt die Highrese eindeutig identifiziert.

Der Professor der Universität Montreal, McGill V. Voychik, schrieb, dass eine der Möglichkeiten, den Realismus des Musiksignals zu erhöhen und den Effekt von „Präsenz“ und „Transparenz“ zu erzielen, darin besteht, die Abtastfrequenz über 44,1 kHz zu erhöhen. Dementsprechend ist die Erweiterung des oberen Bereichs reproduzierbarer Frequenzen über 20 kHz hinaus. (Nachdem ich dies gelesen hatte, bezweifelte ich seinen Expertenstatus, aber vergebens)

Er bemerkte auch, dass es zur Erzeugung eines realistischen Signals zusätzlich zur Abtastfrequenz notwendig ist, die "Auflösung der Wiedergabe- und (!) Aufzeichnungssysteme (!) Im zeitlichen, räumlichen und dynamischen Bereich zu erhöhen. Der kanadische Professor kam zu einer solchen Schlussfolgerung auf der Grundlage der Jahresberichte von AES und stützte sich auf das Wissen über die Komplexität der Physiologie des Hörens und der Neurophysiologie der auditorischen Wahrnehmung.

ADC: Abtastintervall, Filter und „Transparenz“


Es ist bekannt, dass zur Umwandlung eines analogen Audiosignals in ein digitales Abtasten, Quantisieren und Codieren durchgeführt werden muss. Diese Prozesse treten während der digitalen Aufzeichnung oder beim Digitalisieren von analogem Material auf. Hierzu wird ein ADC verwendet. Der Prozess einer solchen Transformation erfolgt nach dem Kotelnikov-Shannon-Nyquist-Theorem.

Gemäß demselben Satz ist die genaue Wiederherstellung des ursprünglichen Signals in der inversen Transformation nur möglich, wenn die Abtastfrequenz höher als die doppelte maximale Frequenz im Spektrum des ursprünglichen Signals ist.

Somit scheint es, dass die Abtastfrequenz von 44,1 kHz (CD DA-Format) theoretisch ausreichen sollte, um das gesamte hörbare Spektrum genau zu übertragen, d.h. fd> 2fv. Aber nicht alles ist so einfach, das Problem liegt in den Abtastintervallen.



AES-Experten schreiben, dass zum Zeitpunkt der Abtastung das Signal konstant sein und durch die sogenannte Niederfrequenz geleitet werden sollte Anti-Aliasing-Filter, der das Signal bei fd / 2 abschaltet, um das Auftreten von Artefakten zu verhindern. Solche Filter sind in allen ADCs enthalten. Dieses Filter bewirkt die Streuung der Impulseigenschaften des ursprünglichen Signals, die aufgrund der Ungleichmäßigkeit der AF- und AF-Eigenschaften und der Phasen-Nichtlinearität im Durchlassbereich auftritt.



Das Ergebnis dieser Nebenwirkung des Filters ist die zeitliche Streuung des Signals und das Vorhandensein von Informationselementen aus den vorherigen in jeder Stichprobe. Aufgrund der Dynamik und Komplexität des Musiksignals kann diese Streuung einen gewissen Einfluss auf die subjektive Wahrnehmung haben. Obwohl Experten sagen, dass Sie dafür ein sehr aufmerksamer und erfahrener Zuhörer mit hervorragenden „goldenen“ Ohren sein müssen.

Bei der Konvertierung mit einer Frequenz von 44,1 wird ein Abtastintervall von 22,7 μs verwendet. Voychik, Aldoshina und andere AES-Spezialisten achten auf die Probleme der zeitlichen Eigenschaften des Formats. Die dynamischen Fähigkeiten des Rohrs während der Ausführung der Festung ermöglichen es, Spitzen von 120-130 dB in 10 μs zu erreichen. Hackbretter ermöglichen einen sofortigen Anstieg von 136 dB in 7 μs.

Dementsprechend sind die Abtastzeitintervalle, die beim Aufnehmen einer CD verwendet werden, sehr weit von den dynamischen Fähigkeiten der Instrumente entfernt. In modernen Hochformaten sind diese Intervalle kürzer (von 1 bis 0,16 μs) und daher können sie auf der Ebene der Dynamik Schall genauer und realistischer übertragen.

Als wichtiges Merkmal des Realismus („Natürlichkeit“) des Klangs während der Wiedergabe betrachten AES-Experten das sogenannte "Transparenz". Dieses subjektive Timbral-Merkmal des Klangs ist dem Klang inhärent, der nach Ansicht vieler Experten dem Natürlichen näher kommt. Die Forscher stellen fest, dass dieses Merkmal auch direkt von den Aufzeichnungszeitparametern abhängt, d.h. aus dem Abtastintervall.

Ultraschall: ist es notwendig oder nicht?


Wissenschaftler und Enthusiasten bemerkten bei der Aufnahme von Live-Instrumenten mit Präzisionsinstrumenten seit den 70er Jahren das Vorhandensein von Ultraschallwellen im Spektrum dieser Instrumente.

Ein Beispiel ist das Spektrum eines Rohrs, in dem Wellenkomponenten mit einer Frequenz von 40 kHz und einem Pegel von bis zu 60 dB aufgezeichnet werden, Violine und Bratsche Ultraschallkomponenten mit bis zu 100 kHz und einem Pegel von bis zu 85-90 dB.

Trotz der Tatsache, dass das menschliche Ohr keine Wellen mit einer Frequenz über 20 kHz wahrnehmen kann (in seltenen Fällen 22 kHz - in der Regel bei Kindern), verändert das Vorhandensein ausgeprägter Hochfrequenzkomponenten die zeitliche Struktur des Signals.

Fletcher, Kuznetsov und andere Autoren, die die Klänge von Live-Instrumenten untersuchten, stellten fest, dass ein solcher vorübergehender Effekt die subjektive Wahrnehmung von Klängen erheblich beeinflussen kann, obwohl die Frequenz selbst nicht vom Ohr wahrgenommen wird.

Solche Informationen beantworten theoretisch die Frage, ob es ratsam ist, die Abtastrate zu erhöhen. Zumindest bei der Aufnahme von akustischen Live-Instrumenten.

Trockener Rückstand


Trotz der Tatsache, dass Blindtests noch keine signifikanten Unterschiede in der Wahrnehmung herkömmlicher und Hirez-Formate bestätigen, weisen sie auf theoretischer Ebene eine höhere Wiedergabetreue auf. Darüber hinaus legen Abtastintervalle, eine Abnahme des zeitlichen Dispersionsniveaus sowie die Fähigkeit zur Wiedergabe der Ultraschallkomponenten des Signals nahe, dass der Unterschied zwischen klassischen CD-DA- und hochauflösenden Formaten für die subjektive Wahrnehmung spürbar und signifikant sein kann.

Jeans
Unser Katalog enthält Mehrraumsysteme , Mediaplayer und andere Geräte, mit denen Musik in hochauflösenden Formaten abgespielt werden kann.

Source: https://habr.com/ru/post/de411983/


All Articles