Фобомания
АрхивКолумнистыПопулярное заблуждение о профнепригодности сжатого звука как класса родилось где-то в 1998-99 году. Со временем мнение об ущербности MP3 переросло в стереотип, который начал приниматься на веру совершенно бездумно.
Недавно в статье "Война без победителей" ("КТ" #755) Бёрд Киви рассказывал о новом альбоме группы Metallica "Death Magnetic", который вызвал волну возмущения в фанатских кругах. Претензии фанов, напомню, относились вовсе не к недостаточной тонкости исполнения или искушенности композиционного замысла, а к качеству мастеринга, намеренно ухудшенного в угоду требованиям рынка. Камнем преткновения стал искусственно сжатый динамический диапазон. В таком виде музыка благосклоннее воспринимается основным пластом неискушенных покупателей, которые и составляют "контрольный" массив целевой аудитории издателей.
Статью я прочитал как раз через пару дней после того, как сам послушал "Death Magnetic" и отправил файлы в корзину. Тогда я не придал этому особого значения, поскольку, стараясь держаться в курсе творческих поисков мэтров музыкальной индустрии, постоянно прослушиваю и стираю часы не особо интересных нотных сочетаний. Однако, прочитав Бёрда, я понял, что медведь, судя по всему, обошел мое ухо стороной, и мысленно вернулся к еще свежим ощущениям от альбома. Вспомнил, как, разбираясь, почему именно альбом "не качает", раз за разом прослушивал композиции, пока, наконец, сдавшись, не нажал Shift+Delete, так и не найдя рационального объяснения чувству неудовлетворенности. Мелькнула мысль, что вместо честного релиза был подсунут "апконверт" из MP3, ведь хулители "сжатого" звука часто описывают похожие ощущения от "этого ужасного формата". И тут в памяти воскрес давнишний спор на форуме знакомой рок-группы, в котором я боролся с фанатичным и невежественно-безапелляционным неприятием MP3, по иронии судьбы опираясь на другой альбом той же "Металлики" как на эталон качественного звука. Ремастеринг "Master Of Puppets" от Стива Хофмана (Steve Hoffman) с первого прослушивания произвел на меня, вовсе не любителя металла, очень глубокое впечатление, породив устойчивые приятные ассоциации с лейблом DCC Compact Classic, да и с самой группой. В споре же моя центральная мысль сводилась к тому, что при современном положении дел определяющую роль для конечного потребителя играет качество издания самого диска, нехватка же качества оказывает на музыку гораздо более губительный эффект, нежели может создать разумная MP3-компрессия.
Вообще, у музыкантов весьма своеобразное отношение к цифрам. Так, например, один мой знакомый композитор однажды выложил на FTP музыку к ролику, который я монтировал, в неархивированном wav-файле. Поскольку проверить целостность неархивированных данных в одностороннем порядке невозможно, остается надеяться только на надежность самого протокола FTP, которая, как показывает практика, может и подвести. Подкрепив этими соображениями просьбу в будущем выкладывать файлы в архиве, я получил от композитора таинственный ответ: "Никогда не сжимай звук!"
Я многократно пытался выяснить, на каком битрейте смогу услышать "сжатие" звука. Для этого устраивал слепые самотесты, в которых в случайном порядке запускались оригинальные и сжатые с разным битрейтом файлы. Битрейт, при котором число правильных догадок сводилось к 50%, я и считал граничным для комбинации своих ушей и оборудования. В последний раз я удовлетворял любопытство с помощью Creative SB X-Fi Platinum и наушников Beyerdynamic DT770, что, конечно, страсть как далеко от аудиофильских изысков, но на общем фоне вполне прилично. Музыка сжималась с помощью стандартных пресетов кодера Lame 3.98 через командную строку с постоянным битрейтом (CBR), после чего таким же образом разжималась обратно в wav (чтобы исключить возможное влияние MP3-декодера). Foobar 2000 был настроен на Kernel Output (то есть на вывод звука в обход встроенного в Windows микшера). Я сжимал композиции самых разных жанров, от насыщенного металла до утонченных симфонических концертов. Кроме того, еще два произведения я выделил особо. Во-первых, по некоторым данным, одну из самых "труднокодируемых", полностью синтетическую композицию "Camera Obscura" Карла Бартоса (Karl Bartos). В ней нет ни единого натурального звука, поэтому компрессоры, рассчитанные все же на некоторую "реальность" кодируемой музыки, отлично чувствуют, что в "Обскуре" все поставлено с ног на голову. Во-вторых, не менее любопытна "Увертюра 1812 года" Петра Ильича Чайковского. Тут задействованы не совсем традиционные инструменты - церковные колокола и пушки (в сиквелах последние часто заменяются барабанами, но я использую микс оригинальной задумки Петра Ильича, с пушками), что приводит к широчайшему динамическому диапазону - более 106 дБ. Этому произведению, вообще говоря, "тесно" в рамках динамического диапазона стандартного CD (96 дБ), что уж говорить "об ущербном MP3".
Cжатый звук стабильно отличим от оригинала только при битрейтах до 128 kbps. Качество на 128 kbps сильно зависит от источника, но уже встречаются композиции, которые легко перепутать с оригиналом. На 160 kbps уже невозможно "случайно" услышать компрессию, необходимо вслушиваться в артефакты и специально сравнивать варианты, чтобы научиться (!) различать качество. На 192 kbps намек на некоторое статистическое преимущество "некомпресса" наблюдался только для "Камеры Обскуры", для всех остальных произведений мои муки выбора оказались столь же результативны, сколь простая случайная выборка. Кстати, "Камера Обскура" действительно заметно более эффективная "убийца MP3", чем все другие произведения; а вот широчайший динамический диапазон "Увертюры" Lame-кодер не особо обескуражил.
Совершенно очевидно, что (возьмем с запасом) битрейта 256 kbps в подавляющем большинстве случаев должно быть более чем достаточно для комфортного восприятия музыки с CDA-источника (44 kHz/16 bit/stereo). Это очевидно не только из моего доморощенного теста, но и по анализу профессиональных слепых тестов (например, германского издания "c’t", июнь 2000 г.): даже в них экспертам не всегда удается "угадать" сжатый до 256 kbps звук, причем тестирование проходит в специально подготовленных помещениях и на дорогом оборудовании, а эксперт знает, что надо "слушать", чтобы почувствовать сжатие.
Откуда же возник устойчивый миф об ужасах сжатого звука? Думается, как гиперкомпенсационная реакция на не менее мифическую формулу: "MP3 128 kbps = CD-качество". В 1995–97 годах, когда в России начали распространяться CD-приводы, пираты выпускали диски с музыкой в 128 kbps и без зазрения совести писали на этих дисках: "CD-качество". Мало того что использовался скудный битрейт, так еще и алгоритм зачастую выбирался самый неудачный - Xing MP3. Дело в том, что кодирование звука было непростой задачей для тогдашних процессоров. Кодирование одной какой-нибудь десятичасовой дискографии по качественному алгоритму легко могло занять у пиратов несколько компьютеро-дней. Ничего удивительного, что ради экономии они использовали самые быстрые, но и самые низкокачественные вариации MP3-компрессоров. Ко всему прочему добавлялась низкая культура рипанья дисков (современные релизы энтузиастов в файлообменных сетях на порядок профессиональнее). Сохранившиеся у меня с тех пор диски звучат не просто плохо, а очень-очень плохо, много хуже, чем можно было бы ожидать от 128 "правильных" kbps. Впрочем, халатное отношение к качеству звука в то время более-менее оправданно, так как воспроизводить MP3-диски можно было только на компьютерах, где зачастую стояли 8-битные карточки да пластмассовые колоночки за 5–10 долларов.
Популярное же заблуждение о профнепригодности сжатого звука как класса родилось чуть позже, года через два. Тогда появились первые приличные звуковые карты (SB AWE64, Turtle Beach Daytona, SB Live!), и - вот новость! - люди заметили, что качество накопленных за два года дисков далеко не равно CD. Стало модно ругать MP3 за неестественность, плоскость, потерю глубины или напористости, излишнюю крикливость и сухость, недостаточную динамику, бубнение, непрозрачность и ухудшение тембрального баланса, да и вообще - обвинять его во всех грехах. Еще бы: упомянешь презрительно MP3, и все знакомые поймут - вот он, настоящий ценитель звука! Со временем мнение об ущербности MP3 переросло в стереотип, который начал приниматься на веру совершенно бездумно.
С одной стороны, несмотря на историю с "Death Magnetic", мой слух, а также воспроизводящее оборудование, очень далеки от идеала. С другой - формату MP3 (или, по-правильному, MPEG-1 Layer 3) уже больше тринадцати лет, и последние годы улучшение его алгоритмов компрессии напоминает подкрашивание седин глубокого старика. Ясно, что честь сжатого звука будет отстаивать молодое поколение компрессоров в лице OGG и AAC, развивающееся гораздо активнее.
Из еженедельника "Компьютерра" № 45