Архивы: по дате | по разделам | по авторам

Сжатие музыки 1:20. Мифы и реальность

АрхивДосуг
автор : Тарас Бризицкий   04.04.2003

Насколько соответствуют действительности заявления о возможности получения файлов "качества CD" с битрейтом 64 Кб/с? Независимый тест

Цель тестирования

Целью проведения данного тестирования было желание оценить результаты работы нескольких современных аудиокодеков в режимах кодирования с низкими битрейтами, нередко используемыми на практике. Мнение о возможности достижения качества, аналогичному компакт-диску на битрейтах 64Кб/с и ниже стало достаточно распространенным, в немалой степени из-за ничем не подтвержденных заявлений отдельных компаний и организаций (например, см. материал по формату WMA на сайте Micrоsоft. Данное тестирование было проведено с целью проверки возможности достижения качества, аналогичному «качеству CD» тремя современными кодеками.

Тестирование проводилось в условиях, приближенных к тем, в которых находится среднестатистический пользователь: использовалась аппаратура среднего качества, а прослушивание тестовых фрагментов проводилось на персональном компьютере.

Как проводилось тестирование:

Используемая техника:

- Персональный компьютер на базе процессора Celeron 333MHz, 196Mb RAM с установленной ОС Windows 2000 professional (SP 3).
 - Звуковая карта A-trend HArmony 3DS724A на базе чипа Yamaha YMF 724 - карта начального уровня. Использовался драйвер, установленный по умолчанию.
 - Наушники AIWA HP-X225 (наушники закрытого типа, ценовая категория ~$15). Тестирование проходило по методике ABX (подробная информация на http://www.pcabx.com) при помощи программы WinABX.

Использовались следующие кодировщики и параметры сжатия:
 - WMA8: Db Music Converter, кодек WMA8 64Кб/с, 44KHz, stereo
 - WMA9: Db Music Converter; кодек WMA9, финальная версия. 64Кб/с, 44KHz, stereo VBR Quality 50, 44Khz, stereo
 - MP3: lame 2.90.2. –alt-preset 80 –b64 –alt-preset 96 –alt-preset 128
 - OGG Vorbis: oggenc/oggdec –q0

В качестве эталонных использовались необработанные сэмплы формата 44KHz, 16 bit, stereo PCM wave.

О выборе форматов:

WMA8 является наиболее распростаненной на данный момент версией кодека WMA, нередко используемой для кодирования музыки дома. Значительным преимуществом по сравнению с остальными форматами является тот факт, что зачастую кодеки WMA уже установлены в системе. WMA9 – последняя имеющаяся на данный момент версия кодека, имеющая ряд улучшений, например, режим кодирования с переменным битрейтом. MP3 на данный момент является наиболее распространенным форматом аудиосжатия. Несмотря на то, что существует достаточно большое количество кодировщиков MP3, мною был выбран именно lame из-за более высокого, по сравнению с остальными программами, уровня качества. Относительно молодой формат OGG призван, по мнению разработчиков, заменить собой все ныне существующие форматы сжатия звука. В качестве кодировщика и декодировщика использовались консольные программы Oggenc и Oggdec с сайта разработчика, основанные на финальной версии Xiph.Org libVorbis I.

Тестовые сэмплы

Для тестирования я решил использовать фрагменты некоторых музыкальных записей из своей фонотеки. Мне хотелось проверить работу кодировщиков на случайно выбранных произведениях, т.е. на условиях, максимально приближенных к реальным. Я намеренно отказался от использования тестовых фрагментов, используемых при тестировании кодеков в режимах высокого качества, так как в этом случае разница между кодированным и эталонным фрагментами была бы значительно большей.

Для тестирования были выбраны следующие звуковые фрагменты:

- Nightwish – Wishmaster – с одноименного диска, фрагмент 1:30-1:40. Прекрасный пример хорошо записанной рок музыки с чистым женским вокалом и мощными гитарными партиями.
Depeche Mode – Dream On с диска Exciter, фрагмент 0:10-0:18.
- Dead Can Dance – Shadow Magnet с альбома Duality. Фрагмент 5:00-5:20.
- Этническая музыка с чистым женским вокалом и четкой перкуссией.
- Бетховен – Эгмонт Увертюра. Фрагмент взят с диска-приложения к журналу Stereo&Video 3/99, фрагмент 7:31-7:45.

Все тестовые файлы были получены с оригинальных дисков и скопированы при помощи программы EAC во избежание ошибок. Никакая дополнительная обработка файлов не проводилась.

К сожалению, я не имею возможности выложить тестовые фрагменты в сеть из-за слишком большого их объема (более 100 МБ). Тем не менее, тест полностью воспроизводим, так как приведенных выше данных вполне достаточно, для того чтобы повторить проделанную мною работу (сразу предупреждаю, что на это уйдет не один час). Вы также можете провести собственные тесты с использованием имеющихся в наличии компакт дисков.

Результаты

Lame MP3

Режим –b64 откровенно разочаровал. Звук получался абсолютно неестественным и для того, чтобы отличить подобный файл от оригинала даже не требовалось проводить тестирование. В качестве альтернативы было решено использовать кодирование с параметрами --alt-preset 80, что позволило создавать файлы более высокого качества со средним битрейтом 80Кб/с в режиме ABR (переменный битрейт). Несмотря на все усилия, даже подобное улучшение не позволило добиться значительного субъективного повышения качества: сжатые файлы без малейшего труда можно было отличить от оригинала уже после прослушивания одной-двух секунд записи.

Фрагмент классической музыки стал абсолютно непохож на оригинал: все инструменты сбились в кучу и утратили индивидуальность. Перкуссия в композициях Dead Can Dance и Depeche Mode смазалась, а четкий отрывок композиции Nightwish стал представлять из себя мешанину звуков, в которой с трудом можно было разобрать что-либо. Добиться более-менее приличного звука от MP3 удалось лишь при использовании пресета --alt-preset 96, на котором он продемонстрировал достаточно неплохие результаты: значительно повысилась чистота звука и качество передачи высоких частот.

WMA 8/9

Результаты работы кодека WMA оказались немногим лучше, чем в случае использования MP3 с битрейтом 64Кб/с. Для меня остается загадкой, что же именно подразумевалось разработчиками Microsoft, под «качеством компакт диска». Смею вас заверить, что ничего подобного нет и в помине: без особого труда я определял в десяти из десяти случаев кодированные файлы, а различные артефакты WMA файлов откровенно раздражали.

Фрагмент из произведения Бетховена отличить от оригинала было несложно: неестественное звучание духовых инструментов и смазанные звуки струнных не оставляли сомнений в том, что файл сжат lossy кодеком. Музыке Лизы Геррард и Depeche Mode пришлось не легче: ужасные смазанные звуки перкуссии, неестественное звучание гитар... Вообще при прослушивании данных сэмплов мне показалось, что звук воспроизводится в гудящей металлической бочке. Музыка Nightwish также стала звучать заметно хуже: относительно четкая звуковая картина после преобразования в формат WMA существенно изменилась в худшую сторону.

Меня совершенно разочаровал режим кодирования VBR (сжатие с переменным битрейтом). Несмотря на то, что обычно использование переменного битрейта позволяет значительно увеличить качество, мне показалось (при ABX сравнении файлов сжатых в режиме CBR и VBR), что VBR файлы звучат хуже.

Вообще, на слух разница между фрагментами, кодированными при помощи восьмой и девятой версиями кодека не ощущается совершенно. Звук остается все таким же неестественным и со значительными искажениями.

OGG Vorbis

Честно говоря, я даже не ожидал подобных результатов от OGG. После полного разочарования в WMA я был крайне удивлен качеством передачи музыки данным кодировщиком. Я так и не смог с полной уверенностью отличить кодированный фрагмент классической музыки от оригинала, закончив тест с результатом 5/10. Разница проявлялась лишь в деталях (небольшая окраска духовых инструментов) и была очень незначительной. Результаты остальных тестов были более предсказуемыми: несмотря на то, что я в десяти из десяти случаев безошибочно определял сжатый фрагмент, для того, чтобы обнаружить разницу, приходилось сосредотачивать внимание на отдельных моментах записи. В основном это касалось четких звуков: например, перкуссия и гитары в композиции Depeche Mode. Результат работы кодека с композицией Nightwish был несколько похуже, но все-таки не разочаровывал, как в случае с WMA или MP3. Кодированный фрагмент угадывался без труда, но звук был относительно четким и не раздражал.

Общий тест

Для проведения общего теста мне пришлось воспользоваться программой abc/hidden reference с сайта http://ff123.net. Она позволила провести «слепое» тестирование и получить итоговый результат работы кодировщиков. Возможно, при проведении вами собственных тестов он будет иметь несколько иной вид, но общая зависимость должна сохраниться.

Качество звучания OGG Vorbis файла было очень близко к результату lame со средним битрейтом 128 Кб\с, а WMA8 с битрейтом 64 лишь немногим уступал тому же lame со средним битрейтом 96, хотя существенно проигрывал MP3 файлам с битрейтом 128 из-за сильных артефактов. Меня несколько смутили результаты кодека WMA9. Он оказался даже слабее своего предшественника, несмотря на обещанные разработчиком улучшения. Результаты можно образно представить в следующем виде:

L128>OGG64>L96>W864>W964>W964V

Где
L128 - MP3 файл, кодированный при помощи lame с использованием пресета alt-preset 128 OGG64 - OGG Vorbis файл, полученный при использовании финальной версии кодировщика и параметра –q0 (quality 0)
L96 - MP3 файл, полученный при помощи пресета lame alt-preset 96
W864 – WMA8 файл с битрейтом 64 Кб/с
W964 - соответствует WMA9 файлу с битрейтом 64 Кб/с
W964V – WMA9 файл с переменным битрейтом, полученный при использовании параметра кодирования quality 50

Иллюстрации:

Я вообще противник сравнения различных картинок АЧХ или сонограмм с последующими выводами о качестве работы того или иного кодека. В конце концов все lossy (т.е. использующие сжатие с потерями) форматы созданы для того, чтобы максимально приблизить к оригиналу звучание файла, а не внешний вид его АЧХ. Тем не менее, в качестве небольшой демонстрации я приведу серию графиков, собрав их воедино на одной фигуре.

На этой иллюстрации приведены сонограммы одного из тестовых сэмплов. Горизонтальной чертой отмечена граница частот 16 килогерц. Дело в том, что многие люди не очень хорошо воспринимают звуки, находящиеся выше данной границы, потому для увеличения степени компрессии многие кодировщики просто удаляют все верхние частоты. С другой стороны, при удалении из записи частот 14-16 килогерц уже ощущается дискомфорт, так как в этом случае заметно страдает звук хайхэтов, цимбал, акустических гитар и т.д.

Из графиков прекрасно видно, что исходный файл содержал звуки и выше 16 килогерц, которые OGG Vorbis аккуратно обрезал, а WMA же, напротив, удалил все выше 14 килогерц, из-за чего качество пострадало.

Выводы:

Можно с уверенностью сказать, что ни один из кодеков на битрейте 64Кб/с так и не смог добиться качества звука, идентичного оригиналу ни на одном из протестированных фрагментов. Разница была наименее заметна при кодировании фрагмента классической музыки и увеличивалась при работе с музыкой, содержащей короткие высокочастотные звуки. Наиболее правдоподобной мне показалась передача музыки кодировщиком OGG Vorbis, который сжимал тестовые фрагменты с наименьшими потерями. Если вы вынуждены по каким-либо причинам использовать кодирование с низким битрейтом, то выбор данного формата позволит сохранить качество на максимально возможном при данном битрейте уровне.

WMA показал более низкие, чем OGG результаты, а заявления о возможности получения файлов, неотличимых от оригинала при использовании битрейта 64Кб/с с данным форматом, мягко говоря, преувеличены.

Использование MP3 при сжатии музыки с низким битрейтом крайне нежелательно, так как результат окажется заведомо хуже, чем в случае использования более совершенных кодеков. Минимальный битрейт, при котором следует сжимать музыку в данный формат – 96 Кб/с, но и в этом случае звучание будет далеко от хорошего.

Даже несмотря на то, что обычные компьютерные колонки и дешевые звуковые карты вносят немалые искажения в полученный сигнал, разница между звучанием несжатого wave файла и файла, кодированного в формат MP3, WMA или OGG на 64Кб/с прекрасна слышна даже без прямого A-B сравнения.

Дополнительная информация:

Множество полезной и интересной информации можно найти на следующих Интернет сайтах: http://ff123.net - Прекрасный источник информации о различных музыкальных форматах. Содержит тесты большого количества кодировщиков на битрейтах 128 и 64 Кб/с.
http://websound.ru/ - Один из лучших сайтов на русском языке, посвященных обработке звука и музыки с помощью компьютера. Содержит неплохую подборку статей.
http://websound.ru/articles/technol/formats.htm - Моя статья, посвященная различным современным аудиокодекам.

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.