Архивы: по дате | по разделам | по авторам

Битва форматов

АрхивТехнологии
автор : Михаил Михин   15.07.2004

Формату MP3 уже десяток лет, а достойной альтернативы ему до сих пор не видно. Или она существует, но пока не получила достойного распространения?

=+=+=+=

Количество интересной музыки со временем не уменьшается, и хранить аудиодиски в порядке становится всё сложнее - они занимают слишком много места. Обычный для многих выход - коллекционирование звука в mp3 -пока что спасал. Однако слегка настораживает тот простой факт, что формату MP3 уже десяток лет, а достойной альтернативы ему до сих пор не видно. Или она существует, но пока не получила достойного распространения?

Кодируем звук

Для того, чтобы добавить к своей музыкальной коллекции очередной компакт-диск, потребуется пара специальных программ - граббер и кодек. Граббер целиком и полностью несёт ответственность за корректное извлечение музыкального файла с компакт-диска на винчестер компьютера, а кодек отвечает за компрессию уже извлечённого файла. Если ситуация с граббером более-менее однозначна (ведь его задача всего лишь максимально точно извлечь поток цифровых данных с аудиодиска), то процесс выбора кодека способен довести до истерики любого меломанствующего любителя. 

Прежде всего стоит обратить внимание на тот факт, что компрессия звука - это ВСЕГДА сжатие с потерями (lossless кодеки не рассматриваем). При компрессии звука мы в каких-то пределах жертвуем качеством звука, выгадывая что-то в размере файла. Фронт работ для компрессии музыки открывается при условии, что потребитель желает добиться полного или почти полного субъективного сохранения качества исходного звука при экономии места, занимаемого этим самым звуком. Чем выше степень сжатия, тем значительнее потери в качестве.

Но и здесь есть возможность добиться неких результатов, способных утешить любителей качественного кодированного звука. Дело в том, что человеческий слух можно в некотором смысле "одурачить", используя хорошую психоакустическую модель кодека, в таком случае, при правильной настройке программ (граббер+кодек) можно производить звуковые файлы небольшого размера, но на слух неотличимые от исходника даже натренированным ухом.

Lame. Не для ламеров

Рекомендуется для составления своей музыкальной коллекции воспользоваться бесплатным кодеком LAME. Готовые, свежескомпилированный версии Lame можно раздобыть здесь. Кодек Lame написан группой энтузиастов, которые придерживались принципов открытых исходных кодов, а за основу был взят свободно распространяемый демонстрационный код от ISO. Кодек привлекателен возможностью тонкой настройки всего, что только может быть настроено, поддерживает VBR и по итогам множества тестов частенько признаётся лучшим кодеком для высоких битрейтов (192 и выше).

Lame отлично работает в режиме VBR. Variable Bit Rate - это переменный битрейт со своей психоакустической моделью. Он позволяет задать необходимый уровень качества, возложив на программу задачу подогнать под указанный уровень минимально возможные значения ширины кодируемого потока. VBR позволяет сжимать звуковой ряд с переменным потоком, обеспечивая максимально возможное качество и здорово экономя дисковое пространство. Режим VBR - одно из самых сильных мест кодека Lame.

Большой плюс Lame заключается в том, что в качестве оболочки для него удобно использовать наиболее удобный граббер - ExactAudioCopy. Граббер бесплатный, последнюю версию можно скачать на официальном сайте, (размер дистрибутива 1748 кб). Кодируя музыку с помощью Lame можно выбрать несколько различных режимов стереосигнала: stereo, dual channel и joint stereo.

В режиме stereo оба канала кодируются отдельно, а кодер выделяет для каждого из них разные значения потока, занимаясь при необходимости коррекцией величины распределения потока одного из каналов за счет другого. В dual channel для каждого канала выделяется ровно половина потока, т.е. сигнал кодируется как 2 отдельных моно-сигнала. Наиболее же часто используемый режим для обычного пользователя - joint stereo, принцип работы которого предусматривает разложение стереосигнала на основную составляющую и разностную. В итоге получаем выигрыш в размере файла при сохранении достойного уровня качества.

Пресеты

Lame последних версий рассчитан на работу с пресетами - заранее определёнными схемами настроек параметров. При использовании LAME совместно с EAC, в настройках последнего можно указать необходимый пресет и получить требуемый файл без колдовства с командной строкой, а просто ориентируясь на привычное "удовлетворительно-хорошо-отлично". Каждый такой пресет был тщательно протестирован и пользователи могут вполне положиться на его настройки. Подробное описание пресетов можно получить, запустив кодек с параметром "--preset longhelp", нас же в данный момент интересуют так называемые альтернативные пресеты, настроенные при помощи прослушиваний для получения максимального качества. Всего таких пресетов три:

--alt-preset standard (в среднем 180-190 kbps, отличное качество)
--alt-preset extreme (в среднем 220-240 kbps, суперотличное качество)
--alt-preset insane (320 kbps, максимально возможное качество)

Первые два пресета годятся для кодирования звука с VBR и по качеству между собой отличаются не сильно. Я рекомендую для своей музыкальной коллекции использовать именно два первых пресета, подключая второй лишь в случае, когда нужна максимально тщательная проработка кодируемого музыкального материала.

Ogg Vorbis - убийца mp3?

В последнее время люди, пристально следящие за развитием дел в области компрессии звука всё чаще обращают своё внимание на новый формат сжатия звука - Ogg Vorbis, призванный заменить собой все платные патентованные аудиоформаты и создать полностью открытую систему мультимедиа-систем. Кодек Ogg Vorbis вышел в свет в июне 2000, а относительно недавно было объявлено о появлении  окончательной версии формата - 1.0.

Это непатентованный и не нуждающийся в лицензировании аудиоформат с открытым кодом, обеспечивающий скорость от 16 до 512Kpbs и частоту сэмплинга от 8 до 48 KHz. Ogg Vorbis принципиально близок к формату mp3, однако есть и отличия. Например, Ogg Vorbis - sample accurate, т.е. кодек не допускает наличия смещений или потери сэмплов относительно друг друга. Формат Ogg Vorbis не ограничен двумя аудио каналами (стерео) и способен поддержать до 225 отдельных каналов. Алгоритм Ogg Vorbis рассчитан на кодирование с переменным битрейтом (VBR), в заголовке файла может размещаться информация о песне, исполнителе и т.д., в описание можно вставить даже изображения, но при этом файл с расширением .ogg  прежде всего аудиоконтейнер.
 
Качество кодирования Ogg Vorbis, который использует переменный битрейт, измеряется обычно при помощи шкалы "Quality", с параметрами от 1 до 10. Для сравнения: quality 0 сопоставимо с качеством mp3 64kbps, 5 - приблизительно 160kbps, и 10 дает приблизительно около 400kbps. Из сравнения становится ясно, что для большинства пользователей будет вполне достаточно установок quality 5-6. Новый кодек так же просто "прикрутить" к грабберу EAC. Формат позволяет сохранить тэги с русскими буквами в кодировке UTF-8, что однозначно решает проблему с использованием ОС, отличных от Windows.

При примерно равных битрейтах размер файлов .OGG и .MP3 отличается в пользу .ogg. Для сравнения был закодирован трек Apache - Scripture с диска Cafe del Mar-Volumen Ocho размер которого составил в несжатом состоянии 49 мегабайт. С помощью Lame получился mp3-файл со средним VBR-битрейтом 211 kbps и размером 7.32 Mb, а Ogg Vorbis при битрейте 175 kbps выдал файл размером 6.06 Mb, звучащий субъективно приятнее, чем mp3. Если вам необходима наглядная демонстрация  - загляните на эту страницу и убедитесь в том, что время mp3 начинает уходить.

Похоже, что у формата ogg vorbis большое и светлое будущее, особенно если разработчики не сбавят темпа. Новый формат поддерживается рядом популярных программных плееров, со всем софтом, поддерживающим этот формат можно познакомиться здесь. Радиостанция BBC ещё в 2002 году начала интернет-вещание, передавая потоковое аудио в формате OGG Vorbis. Мой портативный CD-MP3 плеер iRiver с новой прошивкой уже поддерживает новый аудиоформат. Медиа-индустрия всё пристальнее поглядывает в сторону ogg, помня, что стоимость лицензии на использование mp3-кодека составляет около 8 долларов за каждое устройство, в котором он применен, а ogg совершенно бесплатен. Не повод ли это подумать о надвигающихся помпезных торжествах по поводу появления нового лидера среди аудиоформатов?

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.