Как звучок-с?
АрхивЖить по-настоящему - это жить, получая адекватную информацию.
Норберт Винер
Норберт Винер
Улучшить звук хочется всегда. Такова сущность меломана. Между тем, полемика вокруг парадоксов цифрового звука и таинств аналогового грозит вылиться в суровую разборку с применением всего, что под руку подвернется.
В этих обстоятельствах было бы опрометчиво не проинформировать читателей "Компьютерры" об увязнувших в тине или оставшихся за кадром нюансах, отдавая должное эрудиции, энтузиазму и опыту уважаемого Дмитрия Симаненкова ("КТ" ##242, 258-259, 260), - распахал он эту ниву основательно. Так что нюансов осталось немного, но они есть, особенно в том, что касается динамического диапазона и спектрального анализа с применением БПФ.
Не вдаваясь в философию, примем за основу следующее:
- даже если наши знания о звуке сегодня кажутся исчерпывающими, то завтра мы можем выяснить еще что-нибудь новенькое, а послезавтра - еще, и так далее до бесконечности;
- появление новых знаний о звуке неизбежно, вопрос только во времени; это же касается и внедрения новых и усовершенствования старых технологий звукозаписи и звуковоспроизведения.
Заметим, что получить адекватную информацию крайне тяжело, поскольку необходим (помимо всего прочего) кропотливый и корректный анализ различных независимых источников.
Главная житейская мудрость - не брезговать ни одним из доступных носителей звука. Неважно, компакт-диск это (он же "сидюк"), обычная компакт-кассета или винил, "запиленность" которого еще в пределах допустимого. Лишь бы качество звука, записанного на данный носитель, было приемлемым, то есть радовало слух и не вызывало головной боли, в том числе о свежепотраченных деньгах. Главные роли в деле повышения качества звука отводятся исходному материалу, с которого записываются массовые носители звука, и технологическому процессу перезаписи с оригинала. Способ записи (цифровой или аналоговый) и, соответственно, тип носителя, который доходит до нас, массовых слушателей, играет второстепенную роль. Об этом сплошь и рядом умалчивается, исключительно из скромности.
Никто не спорит, что способ записи и тип носителя крайне важны, прежде всего, степенью привнесения изменений в оригинал. Но, все относительно... Считается по умолчанию, что качество звука на носителе, с которого штампуются сидюки, непременно лучше, чем в аналоговых случаях! Та же история и с модными ныне DVD-дисками, вслед за которыми маячат SAD-диски (Super Audio Disk, 24 бита, 96 кГц). Хотя, в силу эксклюзивности-подлинности последних на российском рынке, качество записанного на них звука должно быть получше. Вот здесь собака и зарыта. Кому же выгодно "вспоминать" о такой мелочи, как качество оригинала? Гораздо приятнее убедить/вынудить нас постоянно обновлять аппаратуру и звуковые носители...
И все-таки, что же конкретно делать, чтобы не растерять по дороге драгоценное качество и при этом не остаться без штанов? Может, важен не конечный результат, а сам процесс, тем более что он - творческий? Ну, а если творить в нынешнее время, то почему бы не использовать персональный компьютер? Так ли страшен черт (цифровой звук), как его малюют? Каким образом можно объективно оценить качество звука, и где оно теряется? Наконец, чему именно уделить внимание в попытках улучшения звука, исходя из индивидуальных запросов-возможностей?
С чего начинается... звук
Для всех нас (не сочтите за одесский юмор) звук начинается с уха. Не с носителя звука и не с динамика, его излучающего, а именно с собственного уха. А человеческое ухо и все, что к нему прилагается в качестве системы слуха, - инструмент уникальный, но не идеальный, а главное - не идентичный. То есть, что уготовано слышать одному, не дано расслышать другому, как ни грустно это признать. Так что звук, дискретизированный в 24 бита с 96 кГц для многих будет неотличим от 16 бит с 44,1 кГц, а последний - от качественной записи на компакт-кассету!
Дабы не гонять уважаемых читателей по пыльным библиотекам или дебрям Интернета, позвольте привести картиночку, сосканированную без корректив из [1]. При этом в качестве ссылок умышленно буду использовать только научно-популярную литературу, чтобы каждый желающий мог легко убедиться, что подвоха нет. Данные, приводимые в специальной научной литературе, более точны и дотошны, но для нашего уровня сравнений упрощения не так критичны.
На рис. 1 уровень интенсивности звука измеряется в децибелах относительно 10-12 Вт/м2. Звук столь малой интенсивности человеческое ухо в принципе способно воспринимать, что и соответствует нулевому уровню в дБ (далее, говоря для простоты "мощность звука", буду подразумевать его интенсивность, если не уточняется иное). Например, звук удара грома можно оценить по мощности в 120 дБ. Из рисунка видно, что максимальная чувствительность уха приходится на область между 2000 и 4000 Гц. Тогда как в областях частот ниже 100 Гц и выше 10000 Гц звук должен иметь более высокую мощность, чтобы быть услышанным. Отметим, что на средних частотах динамический диапазон (размах между самым тихим слышимым звуком и предельно громким звуком, соответствующим болевому порогу) равен примерно 120 дБ. На низких частотах динамический диапазон в два с лишним раза меньше. Впрочем, на высоких частотах дела обстоят не лучше. А в районе 20 кГц и выше при любой мощности звук остается практически неслышимым.
Витает гипотеза, что ухо регистрирует звук с частотами и выше 20 кГц, но в мозге, точнее, в слуховой системе, стоит "заглушка", и такие звуки в чистом виде не воспринимаются. То есть мозг способен обрабатывать неслышимые ультразвуковые составляющие, если они являются гармониками высокого порядка слышимых звуков. Пока не ясно, потерял ли человек способность слышать чистый ультразвук в ходе эволюции, или процессы активного восприятия остаются неразвитыми в силу ненадобности.
Необходимо сказать отдельно, что глубокий инфразвук (<10 Гц), который вообще невозможно услышать даже при очень большой его мощности, воздействует на мозг посредством вибраций, возбуждаемых в теле человека, и может стать причиной серьезных психических расстройств. Например, если помещение, в котором вы находитесь в течение длительного времени, является низкочастотным резонатором (скажем, по отношению к гулу принудительной вентиляции [2]), то вам грозит целый букет неожиданностей из серии крыша поехала. Врачи, конечно, всегда готовы помочь, но в данном случае обнаружить и устранить первопричину они не в состоянии (Помещение-резонатор необязательно должно быть большим, хотя инфразвук имеет длину волны в несколько десятков метров. Определяющие факторы заключаются в соотношении всех размеров, включая окна, а так же в расположении относительно источника инфразвука. Благодаря большой длине волны инфразвук хорошо распространяется в пространстве, легко преодолевая препятствия, которые традиционно служат защитой от слышимого звука. Кстати, инфразвуковой излучатель - лучшее средство вызвать истерию (и даже чувство необъяснимого страха) у всей толпы в каком нибудь шоу.)
Возвращаясь к рис. 1, поясню, что кривая с индексом 99% соответствует наименьшей мощности звука, которую заведомо способно воспринимать большинство людей. Как видим, максимальный динамический диапазон в этом случае составляет около 50-60 дБ, и те - в области средних частот. Кривая, обозначенная индексом 1%, приведена для того, чтобы показать, каким должен быть нормальный слух человека, хотя по сравнению с этим стандартом слух большинства людей явно слабее.
Теперь еще раз подчеркну научный факт (уважаемый Дмитрий Симаненков о нем уже упоминал, но сейчас будут затронуты другие аспекты), важность которого поистине роковая: звук одной и той же мощности на разных частотах воспринимается слуховой системой человека по-разному. То есть на средних частотах он будет казаться громким, а на низких и высоких - тихим. Линии равной громкости взяты из [2] и приведены на рис. 2. С возрастом, как правило, чувствительность уха ухудшается именно на высоких частотах.
Как спектральный анализатор, слуховая система человека обладает одним очень существенным недостатком (о чем также упоминал уважаемый Дмитрий): в присутствии чистого тона определенной частоты ухо не воспринимает звуки близких частот, если их мощность меньше некоторого порога (рис. 3).
Другими словами, чтобы расслышать звуки, близкие по частоте чистому тону, они должны быть более мощными, нежели в отсутствие этого чистого тона. Это явление, называемое маскировкой, имеет место не только на чистых тонах (!), но и при любых звуках [2]. Получается, что порог слышимости (для тихих звуков) зависит от наличия близких по частоте громких звуков (особенно в высокочастотной области). Если звук состоит из основного тона и его высокочастотных гармоник, как, например, для струнных инструментов, то слабо прозвучавшие по каким-либо причинам гармоники могут быть не слышны. Что тогда говорить о других сопутствующих звуках?
Все отмеченные нюансы сугубо индивидуальны. Безусловно, у музыкантов слух близок к идеальному, а у звукорежиссеров и экспертов стремится к таковому. Скорее всего, у меломанов и остальных простых смертных разброс по чувствительности слуха на разных частотах очень большой.
Существуют еще и субъективные признаки восприятия звука, но это - черная дыра. Кто-то не мыслит кайфа без предельно упругих басов и переливающихся колокольчиками "верхушек", а кому-то жизнь не мила без аскетичной нейтральности во всем частотном диапазоне. Более того, настроение слушателя (усталость, раздражение и т. п.), а так же стиль музыки (джаз, классика, рок и т. д.) могут играть существенную роль в индивидуальном восприятии звука. Однако все существующие психофизические показатели восприятия музыки не являются объективными оценками. Например, интерпретация энцефалограмм, снимаемых с более чем десятка датчиков, размещенных на голове слушателя, пока до конца не формализована, а значит, субъективна.
Отсюда мораль: на вкус (имеется в виду звук) и цвет (характеристики и цену аппаратуры) товарища нет.
Возникает закономерный вопрос: стоит ли прислушиваться к мнению экспертов? Ответ: прислушаться разумно во всех отношениях, но не следует все сказанное даже признанным экспертом воспринимать буквально, без анализа собственными мозгами и ушами. Отдавая должное тяжкому труду эксперта (чтоб овцы были целы и волки сыты) и его таланту выдавать на-гора эпитеты "не в бровь, а в глаз", все-таки следует признать, что ощутимая доля субъективизма в даваемых им оценках неизбежна. Посудите сами: как исключить субъективизм трактовки даже объективных (корректно измеренных) характеристик, если все они, эти характеристики, как близнецы-братья - вроде бы и различаются, а вроде бы и несущественно. Причем как в цирке скучновато без хорошего клоуна, так и достойный "музыкально-популярный" журнал без пассажей эксперта может превратиться в посредственную техническую литературу. Наконец, самое полезное, чем может поделиться эксперт или специалист, профи в своем деле, это конкретный опыт. Свой, личный, выстраданный за годы труда, мучительных поисков, удач и промахов. Захотят ли другие правильно воспользоваться этим опытом - уже другой вопрос.
Итак, не будем забывать, что "время, которое мы имеем, - это деньги, которых мы не имеем". Основная масса российских любителей музыки сейчас имеет в качестве носителя звука компакт-кассету, компакт-диск либо и то и другое вместе. Что же потенциально могут дать нам эти носители, независимо от всей остальной аппаратуры?
Компакт-кассета, и что из нее можно выжать
Производители кассет иногда приводят забавную картинку под условным названием амплитудно-частотная характеристика, измеряя ее каждый по-своему. И лишь самые рисковые в исключительных случаях осмеливаются вынести на всеобщий суд графики изменения динамического диапазона (dynamic range) сигнала, в принципе записываемого на ленту, в зависимости от частоты сигнала. Тогда как именно по динамическому диапазону можно представить, что удастся записать, а что нет - без искажений и существенных шумов. Грубо говоря, если бы человек имел при себе графики персональной чувствительности слуха (как на рис. 1), он мог бы наложить их на графики динамического диапазона ленты и сразу понять что к чему.
В качестве примера на рис. 4 приведены замеры динамического диапазона, прилагаемые в виде малюсенькой картиночки к компакт-кассете с лентой "мастерского" качества. Учитывая цену, лента - хоть куда, хотя есть и получше, ну а насколько она "мастерская", оставим на совести Philips (название изготовителя привожу не для рекламы, а чтобы Philips не обижалась за копирование "картиночки" без официального разрешения). Пусть вас не смущает знак "-" перед децибелами, это обуславливается традициями измерений, здесь важен размах, а децибел - в принципе единица измерения относительно какой-то заранее выбранной величины. Если верить картинке, то динамический диапазон данной ленты в области 1 кГц тянет аж под 70 дБ.
Тип ленты (I - normal, II - chrome, IV - metal) вносит свою лепту в расширение динамического диапазона, но не так существенно, как ожидаешь, когда видишь цену кассеты (следует признать, что на высоких частотах тип II, а особенно тип IV, выигрывают заметно). В пределах одного типа не исключены как выдающиеся модели ленты, так и ленты своенравные, которые проявляют свой характер на определенных магнитофонах, вызывая заморочки с настройкой тока подмагничивания. Максимальный динамический диапазон составляет в среднем 65 дБ на частоте около 1 кГц. На частоте примерно 30 Гц динамический диапазон может сузиться до 40-50 дБ. Тогда как на частоте ~16 кГц и выше динамический диапазон некоторых магнитных лент сужается до 30 дБ. Не слабо? Причем завал максимального уровня на высоких частотах весьма ощутим. А минимальный предел однозначно задирается на высоких частотах, при этом на низких частотах чувствительность ленты тоже ухудшается, хоть и в меньшей степени.
К счастью, во-первых, высокочастотные звуки сами по себе имеют значительно меньшую амплитуду, чем среднечастотные, а во-вторых, кривая минимального предела динамического диапазона ленты стремится к линии равной громкости. Эти два обстоятельства и позволяют записывать звук на магнитную ленту с приемлемым качеством. При этом, хотя стремление к линии равной громкости и имеет место, чувствительность уха все-таки оказывается выше. Как результат, возникает проблема шумов ленты при слабых звуках и многочисленные системы шумопонижения типа Dolby, эффективность которых все же оставляет желать лучшего. Здесь следует упомянуть модификации аналоговой записи на магнитную ленту (например, частотно-модулированная запись), но в бытовой аппаратуре они не прижились, посему упоминанием и ограничимся.
Чтобы переписать с профессионального носителя (гипотетически предположим, что на нем качество звука выше всяких похвал) на бытовую ленту (даже высококачественную), приходится либо зажимать высокие частоты, либо оставить соотношение высоких и средних частот, но занизить уровень записи в целом, залезая в шумы ленты при слабых звуках. Низкие частоты в натуральном виде впихнуть в динамический диапазон ленты вообще проблематично, поскольку у них амплитуда намного больше, чем у средних. Превысить динамический диапазон ленты нельзя категорически, иначе запишутся дикие нелинейные искажения, а к ним ухо очень чувствительно. Слава богу, чувствительность слуха большинства людей оказывается если и шире динамического диапазона магнитной ленты, то не намного.
При наличии аппарата, пишущего без завалов амплитудно-частотных характеристик в диапазоне от 30 Гц до 16 кГц, можете протестировать своих знакомых, различат ли они на слух звук (без пауз тишины) с компакт-диска и с переписанной с него же кассеты. Предупреждаю, результат может быть неожиданным, могут и побить... так что лучше тестирование произвести в режиме "скрытой камеры". Результат, конечно, будет зависеть и от стоимости самого аппарата.
Компакт-диск, и куда звук девается
У компакт-диска с динамическим диапазоном дела обстоят гораздо веселее. В идеале - более 90 дБ от 20 Гц до 20 кГц! Без ощутимых сужений (навскидку ~86 дБ) во всей полосе частот! [1] Но и тут не без подводных камней. Хотя природе и свойствен корпускулярно-волновой дуализм, но нам от этого не легче, поскольку услышать-то мы можем только аналоговый звук, излучаемый аналоговыми (пока?) акустическими системами. Абсолютное большинство источников звука тоже (пока?) аналоговые. Переходы из аналога в цифру и обратно влетают нам в копеечку. Впрочем, об ухищрениях по улучшению этих переходов, в основном за счет применения передискретизации (oversampling), подробно рассказал Д. Симаненков (www.computerra.ru/1998/30-31/3.html).
Компакт-диск часто третируется за искажения слабых сигналов, ведь ступеньки дискретизации здесь проявляются значительно. Замечу, для низких и высоких частот это абсолютно не страшно, вспомните о форме кривой порога чувствительности слуха и о линиях равной громкости. При цифровой записи с оптимальным уровнем искаженные дискретизацией звуки на данных частотах вообще не могут быть услышаны, как громкость ни выкручивай. Разве что в произведениях, в которых среднечастотные компоненты напрочь отсутствуют, тогда как на остальных частотах сигнал сигает от комариного писка до ударной волны перехода звукового барьера. Да, на средних частотах шероховатость очень тихих звуков сказывается, проявляясь в нелинейных искажениях, но для сглаживания "ступенек" уже применяются достаточно эффективные методы, которые не нуждаются в дополнительной рекламе.
При цифровой записи зашкаливание по уровню несколько более критично по сравнению с аналоговой записью, поскольку цифра просто обрубает пики сигнала, тогда как аналог эти пики притупляет. Правда, перевод обрубленных цифровых пиков в аналог все же смягчает сигнал, но до определенного предела. Короче, зашкаливание дает кучу пренеприятнейших искажений как для цифры, так и для аналога.
В силу явных преимуществ в динамическом диапазоне, особенно на низких и высоких частотах, сам по себе сидюк весьма неплох, бесспорно выигрывая соревнование с компакт-кассетой по абсолютным показателям, и мог бы дать очень приличный звук даже для искушенных эстетов.
Читая технические характеристики компьютерных устройств CD-ROM, а так же CD-R и CD-RW, можно обнаружить, что сведения о звуковом тракте очень скупы. Чаще упоминается о выходе на наушники, хотя пользоваться ими врагу не пожелаешь, поскольку низов (<100 Гц) там днем с огнем не сыщешь, а соотношение сигнал/шум ниже всякой критики. С тыльной стороны этих устройств есть два более достойных выхода - цифровой и аналоговый. Как ни странно, но для аналогового выхода (line out) можно обнаружить обескураживающее значение динамического диапазона: <80 дБ при минимальном соотношении сигнал/шум <75 дБ и разделении каналов <65 дБ на частоте 1 кГц. Да, на ЦАП к компьютерным CD-устройствам ведущие мировые производители явно экономят. Получается, что основные преимущества компакт-диска сильно усыхают в компьютере, а качество воспроизводимого звука, по крайней мере на средних частотах, приближается к ленточному. Для нежелающих мириться с таким надругательством выход один - работать с цифрой напрямую.
Захват (grab) треков и запись их на жесткий диск в виде WAV-файлов дает возможность не только задействовать всю мощь цифровой обработки и монтажа (здесь фантазии нет предела, было бы программное обеспечение под рукой), но и обойтись без шибко дорогих аудиокарт с цифровым входом и крутыми АЦП/ЦАП. А стремительное удешевление CD-R-рекордеров позволяет сохранять обработанные на свой вкус и слух треки с минимальными накладными расходами. Наслаждаться новоиспеченными сидюками, спору нет, лучше на некомпьютерных аппаратах, особенно любителям динамично-взрывной музыки и тем, кто ценит пространственные эффекты, основанные на кульбитах с фазировкой звука. Тем не менее, компьютерных устройств многим меломанам будет вполне достаточно, чтобы получить греющий душу звук, правда, все-таки подразорившись на аудиокарте.
Пару слов о сладкой парочке
Здесь долг обязывает слегка пройтись по остальным компонентам: усилителю и акустическим системам (АС). Ни для кого не будет открытием, что одни и те же АС прекрасно звучат с одним усилителем и халтурят с другим. По внешним данным и та и другая пара смотрится ну очень привлекательно, а на поверку только одна оказывается "сексуально" совместимой.
На первый взгляд, выяснять динамический диапазон для "сладкой парочки" не имеет смысла, поскольку он заведомо превышает динамический диапазон носителя звука. К тому же ГОСТированного определения динамического диапазона для них, кажется, не существует. Так-то оно так, но... Недаром ведь "высоколинейные" усилители в цене, и знатоки не рекомендуют выкручивать громкость более 30-40% среднеквадратичной мощности. И недаром умудренные опытом любители негромкого, но качественного звука перезапасаются по пиковой мощности АС в несколько раз [2].
Амплитудно-частотные характеристики, приводимые в технической документации на акустические системы, говорят о том, какое создастся акустическое давление (Па) на расстоянии 1 м при подведении синусоидального сигнала мощностью 1 Вт, и так для всех рабочих частот [3]. При этом совершенно не ясно, какое создастся давление при подведении 0,1 или 10 Вт на той или иной частоте. Далеко не факт, что будет соблюдаться линейная пропорциональность. При подведении одинаковой мощности в 1 Вт на всех частотах требуется подавать сигнал с различным напряжением, так как оно зависит (в общем случае, как корень квадратный) от электрического сопротивления АС, которое различно на разных частотах и реагирует на резонансы каждого динамика данной АС. Иными словами, на малой или большой мощности акустическая система будет звучать совершенно иначе, чем при подведении сигнала мощностью 1 Вт. Более того, о фазовых искажениях на разных частотах, привносимых акустической системой, остается лишь гадать. Поведение акустической системы во времени - вообще черный ящик. Например, АС могут смять и растянуть (не без помощи усилителя) сигнал со взрывным фронтом, что выразится в гудении или завывании. Кто имел дело с 35АС2xx, пресловутыми лидерами совковых времен, или пытался сходу смастерить АС самостоятельно, тот знает, что такое настоящий гуд§ж, и что слышно из-за стенки, и почему начинают стучать по батарее соседи.
Так что при выборе сладкой парочки остается лишь уповать на собственный слух или, чтобы окончательно отделить мух от котлет, прибегнуть к спектральному анализу, например, вооружившись проверенными средствами и записав через микрофон озвучивание характерного фрагмента. При этом в помещении целесообразно минимизировать резонансы и оптимизировать реверберацию с помощью подручных средств (гардин, ковров и т. п.) и продуманного размещения АС, а хороший микрофон лучше взять на прокат. В качестве фрагментов могут выступать специальные тестовые сигналы или партии любимых инструментов, которые будут прослушиваться чаще всего.
1 (обратно к тексту) - Строго говоря, величина динамического диапазона определяется как отношение (выраженное в дБ) уровня максимального сигнала к среднеквадратичному значению шума, который имеет место в присутствии сигнала. Часто возникает путаница с понятием "отношение сигнал/шум" (SNR). В отличие от динамического диапазона, отношение сигнал/шум определяется для мощности сигнала и мощности шума в отсутствии данного сигнала. Таким образом, само определение динамического диапазона как такового не оговаривает, какую именно частоту имеет сигнал. Следовательно, когда упоминается значение динамического диапазона, было бы корректным указывать частоту сигнала. В статье понятие динамического диапазона несколько упрощено. То есть имеется в виду разница между амплитудами максимального и минимального сигналов, которые можно записать (воспроизвести) с некоторыми приемлемыми искажениями во всей рабочей полосе частот.
2 (обратно к тексту) - Кстати, использование сабвуфера в дополнение к сателлитным "пищалкам" полностью оправдывает затраченные средства для компьютерной "подзвучки", не говоря уже об автомобильной акустике, где разумной альтернативы просто нет. "Ящик" сабвуфера можно разместить в центре салона (например, между сиденьями), поэкспериментировав с установкой пищалок (в своем акустическом оформлении) в районе лобового стекла, а также в задней части салона, если наиболее вероятные пассажиры тоже из когорты меломанов.
Cписок литературы
[1] Чедд Г. "Звук". М.: "Мир", 1975.
[2] Тэйлор Р. "Шум". М.: "Мир", 1978.
[3] Иофе В. К. и Лизунков М. В. "Бытовые акустические системы". М.: "Радио и Связь", 1984.