Архивы: по дате | по разделам | по авторам

Все круги "цифры"

АрхивМнения
автор : Василий Николаенко   01.12.2005

Автор убеждён, что цифровые аудиозаписи с частотой дискретизации 44,1

поколения исполнителей, записывавшихся непосредственно в цифру,
безвозвратно утерян. =+=+=+=

Сегодня, заходя в любой приличный музыкальный магазин, можно легко потеряться в стойках с компакт-дисками - яркие обложки так и манят покупателя. Кажется, что за совершенной полиграфией скрывается и совершенный звук. Однако, по мнению автора статьи, меломана и аудиофила, художественная ценность содержимого дисков не слишком велика… - К.К.

В самом распространенном цифровом формате записи без сжатия - формате компакт диска CD-DA - используется квантование по частоте (частота следования отсчетов 44,1 кГц) и по амплитуде (разрядность каждого отсчета 16 двоичных разрядов - 65536 возможных уровней). На мой взгляд, применять формулу теоремы Котельникова для расчета полосы воспроизводимых частот формата ИКМ (PCM) в данном случае некорректно: ведь дискретна не только шкала времени, но и амплитуда. В результате возникает так называемый шум квантования, когда результирующая огибающая дискретных точек не совпадает с исходным сигналом. В этом нетрудно убедиться, прослушав один и тот же отрывок записи с одинаковой частотой дискретизации, но с разной разрядностью.

С другой стороны, давно известна инвариантность частота/разрядность дискретизации. Однако расплывчатость критериев и разные подходы к этой теме в профессиональной литературе свидетельствуют о том, что еще не выработаны не только практические рекомендации, но и теория этого вопроса недостаточно изучена: "Существует два подхода в оценке взаимосвязи разрядности и частоты дискретизации. Они напоминают известный физический принцип рычага - во сколько раз выигрываем в силе, во столько раз проигрываем в расстоянии. Различие в этих подходах состоит лишь в разных оценках соотношения длины цифрового слова с частотой дискретизации"[Рекомендую прочитать эту статью полностью].

Смысл теоремы Котельникова, говоря упрощенно, в том, сколько необходимо отсчетов (точек на временной оси) для восстановления параметров любого сигнала с оговоркой по поводу ограниченности его спектра и длины, то есть значения амплитуды непосредственно в формуле не участвуют. Когда же мы оцифровываем любой звук, то у нас дискретна не только ось времени, но и амплитуда сигнала. Больше того, она еще и ограничена разрядностью оцифровки не только сверху, но и снизу. При записи это необходимо учитывать, нормируя амплитуду для получения сопоставимых с оригиналом записи результатов. Один из способов нормирования амплитуды - использование отношения динамического диапазона возможного цифрового сигнала (выраженного в разрядности) к разрядности квантования (дискретизации).

А что, если учесть и потери из-за квантования по амплитуде и компенсировать их ростом частоты?

Я предлагаю в качестве критерия оценки качества PCM[PCM (ИКМ, импульсно-кодовая модуляция)]-формата некую "граничную" частоту, которая вычисляется по формуле:

Fгр - максимально возможная частота, которую возможно восстановить без
потерь, Гц;
Fs - частота дискретизации, Гц (у CD, соответственно 44100 Гц);
m - максимальная разрядность динамического диапазона возможного сигнала (т.е. такая разрядность, которая бы на слух обеспечила "оригинальное" качество, обычно от 8 до 20 бит);
n - разрядность дискретизации (фактическая частота дискретизации, у CD - 16 бит).

В предлагаемой формуле учтен и рост шумов квантования, о которых я говорил выше, в соответствии с аналитическими материалами компании AnalogDevice для PCM-формата[К сожалению, только на английском, но статья интересна не только для специалистов] для случая, если динамический диапазон (разрядность) возможного сигнала превышает разрядность дискретизации (иначе этот коэффициент равен 1).

Анализ показывает, что если разрядность дискретизации по амплитуде меньше разрядности динамического диапазона оцифровываемого сигнала (n<m), то по формуле можно вычислить необходимую частоту дискретизации для восстановления "оригинального" качества. Например, для получения 20-битного (это соответствует 120 дБ) динамического диапазона в тракте разрядностью 16 бит частоту надо "разогнать" в 420–16=256 раз).

Для целей анализа уже записанных "в цифре" сигналов практически применим только вариант m<=n (в этом случае значение 4(m–n) мы принимаем равным единице), тогда формула примет вид:

С другой стороны, если разрядность дискретизации по амплитуде много больше разрядности динамического диапазона (n>>m), формула сводится к формуле теоремы Котельникова: Fгр=Fs/2, что свидетельствует о ее корректности в области соответствия граничным условиям.

Применяя предлагаемую формулу для оценки PCM форматов, как используемых в настоящее время, так и перспективных, можно свести результаты в таблицу, где рассчитана граничная частота (в килогерцах) для трех разных уровней динамического диапазона возможного сигнала:

1. 120 дБ - максимальный диапазон человеческого слуха[Здесь надо различать динамический диапазон и максимальный уровень звукового давления (140 дБ). Взят фоновый шум –20 дБ, получился ДД=140–20=120 дБ].

2. 108 дБ - максимальный диапазон возможного музыкального сигнала. В качестве примера можно привести Торжественную увертюру "1812 год" П. И. Чайковского с колоколами и стрельбой из пушек.

3. 96 дБ - максимальный диапазон возможного музыкального сигнала, за исключением единичных случаев из многих тысяч.
Анализ на основании этой формулы показывает, что самый распространенный на земном шаре цифровой формат CD-DA (16 бит/44,1 кГц) при заявленном (в стандарте формата Red Book) динамическом диапазоне в 96 дБ имеет "граничную" частоту всего 5,51 кГц! Естественно, процесс "гладкий" и надо отчетливо понимать, что это некая теоретическая граничная частота, поскольку в конкретной записи с индивидуальным сочетанием динамического диапазона со спектральной насыщенностью по частотам результат будет различен и зачастую вполне приемлем. Эта частота Fгр. скорее обозначает контуры максимально жестких требований к параметрам цифрового формата.

Звукорежиссеры, по разным причинам, при создании CD дисков ограничивают динамический диапазон уровнем примерно в 60 дБ, но даже при этом граничная частота, посчитанная по формуле, составляет всего примерно 10 кГц, что для современной популярной музыки может и не критично, но классика в оркестровом исполнении звучит уже неестественно.

Формат DVD-A выглядит намного более предпочтительнее, особенно на частоте дискретизации 192 кГц. Тем не менее надо помнить о том, что реально применяемые дельта-сигма АЦП в современных DVD-A-проигрывателях не обеспечивают истинной 24-битной разрядности ни по монотонности аналогово-цифрового преобразования, ни по уровню шумов. Достаточно посмотреть THD+N: для истинно 24-битного должно быть <-144 дБ [24*6].

Рассчитанная в соответствии с предлагаемой формулой граничная частота показывает, как должен быть ограничен спектр сигнала при записи/воспроизведении. Это аналогично имеющимся ограничениям теоремы Котельникова. Может, пренебрежение этим обстоятельством и является одной из причин, гм, "цифрового" звука?

Хочется отметить, что в подобных исследованиях в первую очередь должны быть заинтересованы и звукозаписывающие компании. Особенно для создания качественных цифровых архивов, поскольку до сих пор самым лучшим архивным носителем (по качеству) остается студийная аналоговая многодорожечная магнитная лента. Записи же 80-х и 90-х годов прошлого века и начала нынешнего, представленные непосредственно в цифре с частотой дискретизации 44,1 кГц даже с разрядностью 18 или 20 бит, на мой взгляд, не представляют особого художественного интереса, и архив целого поколения исполнителей фактически уже безвозвратно утерян.  

Где твои 16 бит…

Статью комментирует Александр Дмитриев из Института радиотехники и электроники РАН.

C практической точки зрения 16 бит действительно дают некоторую неточность. Ведь сигналов с идеальным ограниченным спектром не бывает (а это важное требование - ограниченность частоты 'цифруемого' сигнала некоей 'верхней частотой', относительно которой все и дискретизируется в теореме Котельникова), отрезая по определенной 'верхней' частоте (например, 22 кГц), вы, не теряя слышимые частоты, все же теряете часть энергии сигнала. Ее компенсируют, для чего и необходимо увеличивать разрядность по амплитуде относительно нормы.

Существует и обратная возможность - компенсировать недостаток разрядности частотой. Для этого применяется так называемая сигма-дельта модуляция (СДМ), когда вы всего одним битом указываете - растет у вас сигнал или падает. Если частота достаточно высокая, то такой способ вполне точно описывает исходный сигнал. Этим можно пользоваться, и такие устройства предлагает, в частности, компания SONY и Analog Devices. На полуторамегагерцовых ЦАП/АЦП музыка звучит достаточно качественно. Когда мы говорим 'достаточно качественно', то имеется в виду, что в отрасли уже давно приняты некие калиброванные сигналы, о которых договорились, что они и есть эталон качества звука. По ним, в частности, сравнивают работу АЦП, построенных на разных алгоритмах (ИКМ и СДМ).

Но что хотелось бы отметить по поводу сигма-дельта модуляции, - здесь есть некоторые сложности. Конечно, по статистике основная масса сигналов укладывается в некоторые требования по точности оцифровки. Однако результирующая статистика остаточных шумов, то есть разность между исходной кривой и аппроксимирующей после оцифровки таким АЦП, может быть не совсем обычна. Сигнал после обработки таким устройством действительно может восприниматься ухом слушателя как звук со странными 'цифровыми' искажениями. То есть мозг слушателя этот шум будет выделять как некий чуждый элемент.

В аналоговой записи у вас тоже есть какие-то щелчки и помехи, но которые воспринимаются ухом как достаточно естественные. Это и отличает их от шумов квантования цифровой записи, которые наш мозг каким-то образом явно выделяет, хотя по уровню эти помехи могут быть много меньше 'аналоговых' искажений.

Касательно пластинок или магнитной пленки, то есть аналогового звука, я бы сказал так: их динамический диапазон не хуже 16-битного звука, во многих случаях - лучше. Но у нас столько утеряно записей, сделанных до 60–70-х годов (а это были и пластинки, и ленты), хотя их пытаются как-то восстанавливать, в принципе можно сказать, что в полной мере восстановлению они уже не подлежат. Поэтому, хотя цифровые архивы тоже имеют свои недостатки, сравнивать их с аналоговыми магнитными лентами трудно, чей срок хранения мал, а подверженность различным повреждениям очень высока. Так что здесь трудно сказать, что на самом деле важнее для музыкального наследия.

- Из журнала "Компьютерра"

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.