Entre as pessoas com uma visão crítica do mundo, foi enraizado um estereótipo de que os formatos de áudio de alta resolução (com uma frequência de amostragem de mais de 44,1 Hz e quantização de mais de 16 bits) em equipamentos domésticos de reprodução de áudio são apenas uma jogada de marketing criada para aqueles que não conhecem sobre limites de percepção. Como, existem melhorias além dos limites da percepção humana.
Durante muito tempo, fiquei inclinado a uma opinião semelhante, até começar a observar periodicamente que gostava subjetivamente de alguns (alguns dos motivos inexplicáveis) mais dos registros. Não posso dizer que posso passar facilmente no teste cego e determinar com alta precisão onde está o hirez e onde está o mp3 com uma taxa de bits de 320 kbps. Mas ouvindo as gravações no formato AIFF com uma frequência de amostragem de 192 kHz e uma capacidade de bits de 32 bits, pareceu-me que noto melhorias sutis na faixa dinâmica e quando reproduzindo baixo.
Eu realmente não confio nos meus ouvidos. Duvidei de minhas próprias conclusões e decidi descobrir algo sobre a possibilidade teórica de ouvir essas diferenças.
Para minha surpresa, não encontrei as histórias de profissionais de marketing, mas avaliações bastante autorizadas de especialistas da AES (sociedade de engenharia de áudio). Minhas pesquisas não deram uma resposta definitiva, mas eu me tornei menos categórico em relação às altas.
Com base na experiência pessoal, escrevi mais de uma vez que o recurso de alta resolução é necessário apenas por pessoas que não são suficientes para ouvir, mas precisam saber que a qualidade do som é impecável. Depois de analisar as descobertas de engenheiros de áudio e especialistas em psicoacústica, percebi que ainda há uma possibilidade teórica de ouvir a diferença.
Frequência e outros parâmetros de "resolução"
A principal questão enfrentada pelos pesquisadores nas últimas duas décadas: faz sentido aumentar a taxa de amostragem de gravações e reproduzir equipamentos de áudio? A questão foi colocada em conexão com o fato de que o limiar fisiológico da audibilidade é limitado a uma faixa de 16 Hz a 21 kHz.
De acordo com um dos pioneiros da psicoacústica russa, professor da Universidade de São Petersburgo, doutor em ciências técnicas, membro do Conselho de Coordenação Acústica da Academia Russa de Ciências, presidente do departamento de AES de São Petersburgo, Irina Aldoshina, ninguém ainda deu uma resposta definitiva à pergunta.
O fato é que, apesar da falta de evidência de testes cegos, sempre que o sujeito identifica sem ambiguidade alta resistência, existem muitas suposições teóricas de que a alta “resolução” pode afetar a percepção subjetiva.
Assim, o professor da Universidade de Montreal McGill V. Voychik escreveu que uma das maneiras de aumentar o realismo do sinal musical e criar o efeito de "presença", aumentar a "transparência" é aumentar a frequência de amostragem acima de 44,1 kHz. Assim, a expansão da faixa superior de frequências reproduzíveis além de 20 kHz. (depois de ler isso, duvidei de seu status de especialista, mas em vão)
Ele também observou que, para criar um sinal realista, além da frequência de amostragem, é necessário aumentar a "resolução dos sistemas de reprodução e (!) Gravação (!) Nos domínios temporal, espacial e dinâmico. O professor canadense fez essa conclusão com base nos relatórios anuais da AES, além de contar com o conhecimento da complexidade da fisiologia da audição e da neurofisiologia da percepção auditiva.
ADC: intervalo de amostragem, filtros e “transparência”
Sabe-se que, para converter um sinal de áudio analógico em digital, é necessário realizar amostragem, quantização e codificação. Esses processos ocorrem durante a gravação digital ou ao digitalizar material analógico. Para isso, é utilizado um ADC. O processo dessa transformação ocorre de acordo com o teorema de Kotelnikov-Shannon-Nyquist.
De acordo com o mesmo teorema, a restauração exata do sinal original na transformação inversa só é possível quando a frequência de amostragem é superior a duas vezes a frequência máxima no espectro do sinal original.
Assim, parece que a frequência de amostragem de 44,1 kHz (formato CD DA) em teoria deve ser suficiente para transmitir com precisão todo o espectro audível, isto é, fd> 2fv. Mas nem tudo é tão simples, o problema está em intervalos de amostragem.
Os especialistas da AES escrevem que, no momento da amostragem, o sinal deve ser constante e passar pela chamada freqüência de baixa frequência. filtro anti-aliasing que corta o sinal em fd / 2 para impedir a ocorrência de artefatos. Esses filtros estão em todos os ADCs. Este filtro causa a dispersão das características de pulso do sinal original, o que ocorre devido à irregularidade das características AF e AF e à não linearidade da fase na banda passante.
O resultado desse efeito colateral do filtro é a dispersão temporal do sinal e a presença em cada amostra de elementos de informação dos anteriores. Devido ao dinamismo e complexidade do sinal musical, essa dispersão pode ter algum efeito na percepção subjetiva. Embora os especialistas digam que para isso, você precisa ser um ouvinte muito atento e experiente, com excelentes orelhas "douradas".
Ao converter com uma frequência de 44,1, é utilizado um intervalo de amostragem de 22,7 μs. Voychik, Aldoshina e outros especialistas da AES prestam atenção aos problemas das características temporais do formato. As capacidades dinâmicas do tubo durante a execução do forte tornam possível atingir picos de 120-130 dB em 10 μs, os dulcímeros permitem obter um aumento instantâneo de 136 dB em 7 μs.
Consequentemente, os intervalos de tempo de amostragem usados ao gravar um CD estão muito longe dos recursos dinâmicos dos instrumentos. Nos formatos modernos de alta resolução, esses intervalos são mais curtos (de 1 a 0,16 μs) e, portanto, no nível da dinâmica, eles são capazes de transmitir o som de maneira mais precisa e realista.
Além disso, como uma característica importante do realismo (“naturalidade”) do som durante a reprodução, os especialistas da AES consideram os chamados "Transparência". Essa característica timbral subjetiva do som é inerente ao som, que, segundo muitos especialistas, é mais próximo do natural. Os pesquisadores observam que esse recurso também depende diretamente dos parâmetros de tempo de gravação, ou seja, do intervalo de amostragem.
Ultrassom: é necessário ou não?
Cientistas e entusiastas, ao gravar instrumentos ao vivo usando instrumentos de precisão, começaram a notar a presença de ondas ultrassônicas no espectro desses instrumentos desde os anos 70.
Um exemplo é o espectro de um tubo, onde as ondas são componentes gravados com uma frequência de 40 kHz e um nível de até 60 dB, o violino e a viola possuem componentes ultrassônicos de até 100 kHz, com um nível de 85 a 90 dB.
Apesar do ouvido humano não ser capaz de perceber ondas com frequência acima de 20 kHz (em casos raros, 22 kHz - em crianças), a presença de componentes pronunciados de alta frequência altera a estrutura temporal do sinal.
Fletcher, Kuznetsov e outros autores que estudaram os sons de instrumentos ao vivo observaram que essa influência temporária pode afetar significativamente a percepção subjetiva do som, apesar do fato de a própria frequência não ser percebida pelo ouvido.
Tais informações teoricamente respondem à questão da conveniência de aumentar a taxa de amostragem. Pelo menos ao gravar tocando instrumentos acústicos ao vivo.
Resíduo seco
Apesar de os testes cegos ainda não confirmarem diferenças significativas na percepção dos formatos convencional e hirez, no nível teórico eles têm maior fidelidade de reprodução. Além disso, os intervalos de amostragem, uma diminuição no nível de dispersão temporal, bem como a capacidade de reproduzir os componentes ultrassônicos do sinal sugerem que a diferença entre o CD DA clássico e os formatos de alta resolução pode ser notável e significativa para a percepção subjetiva.
Calça jeansNosso
catálogo contém
sistemas de várias salas ,
reprodutores de mídia e outros equipamentos capazes de reproduzir música em formatos de alta resolução.