Архивы: по дате | по разделам | по авторам

Цифра и звук

Архив
автор : ДМИТРИЙ СИМАНЕНКОВ    10.08.1998

Практически все звуки не природного происхождения, окружающие нас в повседневной жизни, в той или иной мере подверглись цифровой обработке. Например, если вы говорите по телефону, то весьма вероятно, что ваш телефон или телефон вашего собеседника подключен к цифровой АТС. В этом случае звуки ваших голосов могут преобразовываться в цифровые данные, компрессироваться, передаваться по цифровым каналам и снова превращаться в аналоговые сигналы. Если же вы ведете международный телефонный разговор или используете сотовый телефон, то цифровая обработка звука присутствует наверняка. Если вы решили послушать УКВ-радиоприемник, то знайте, что практически все радиостанции буквально нашпигованы цифровой звуковоспроизводящей техникой и компьютерами. Очень часто музыкальные произведения на радиостанциях хранятся либо на компакт-дисках, либо на жестком диске компьютера, сжатые по стандарту MPEG. Звуковое сопровождение многих телевизионных программ и фильмов создается с применением компьютеров, так что, включив телевизор, вы тоже, скорее всего, услышите в той или иной степени "цифровой звук". Да и на рок-концерте с как бы "живым" звуком вы, скорее всего, увидите на сцене электронные клавишные и гитарные процессоры, являющиеся, по сути, мощными цифровыми устройствами обработки звука.

Давайте рассмотрим основные операции, выполняемые со звуковыми сигналами. Это - запись, хранение, сжатие, возможно - шифрование, передача через системы телекоммуникаций и воспроизведение. Возможно, также синтез музыкальных звуков. Запись и воспроизведение нецифровых аналоговых сигналов можно еще как-то оправдать дешевизной (но не качеством) кассетных магнитофонов. А вот сжатие аналоговых сигналов, их шифрование (например, с целью соблюдения конфиденциальности переговоров), передачу десятков и сотен телефонных разговоров по одной паре проводов, аналоговый синтез голоса и музыки современный человек уже может представить себе с очень большим трудом. Именно в этих областях цифровая техника превосходит аналоговую практически по всем параметрам, и по цене, и по качеству, и по размерам и надежности аппаратуры. Особенно заметно преимущество цифровой технологии при копировании, распространении и хранении оцифрованного звука. Копирование цифровых данных, например, с компакт-диска на жесткий диск персонального компьютера, осуществляется байт в байт. Ссылки на несколько известных программ-копировщиков такого рода можно посмотреть на сервере www.geocities.com/SiliconValley/Pines/7899. Если в процессе копирования произойдет ошибка, то операционная система Windows известит вас и предоставит возможность повторить операцию. Таким образом, легко добиться того, чтобы копия полностью совпадала с оригиналом. Для аналоговой техники это просто невозможно! При любом копировании аналогового сигнала неизбежно ухудшается качество звука (в том числе отношение сигнал/шум) и увеличиваются нелинейные искажения. Очень ярко преимущество цифровой техники проявилось в связи с развитием Интернета. Конечно, только "цифровой звук" можно хранить в неограниченном количестве на бесплатных серверах типа www.geocities.com или www.fortunecities.com. Сегодня через Интернет можно скопировать тысячи часов музыкальных произведений практически всех направлений и стилей от классики до рэйва, причем с великолепным качеством, значительно превосходящим звук, который может воспроизвести магнитофон с аналоговых кассет. С помощью специальных поисковых программ в Интернете можно мгновенно найти цифровые записи практически любого исполнителя. Перспективным и интересным экономически представляется использование цифрового звука в Интернет-телефонии. Современные методы цифровой обработки сигналов позволяют передавать через Интернет голос человека с весьма хорошим качеством на скорости 4800 бит/с, а достаточно разборчивую речь на 2400 бит/с и даже 1200 бит/с. Такие скорости передачи информации обеспечивают даже самые плохие модемы на самых плохих линиях связи. Кроме того, Интернет-телефония и цифровой звук - это очень привлекательное направление деятельности для российского малого бизнеса, работающего в области высоких технологий. Для разработки алгоритмов и программного обеспечения для цифрового сжатия речи не требуется огромных инвестиций и суперкомпьютеров - достаточно 486-го компьютера, черно-белого монитора, примитивного модема и - светлой головы. Почти все "голосовые" алгоритмы опубликованы в общедоступной печати, а в Интернете при минимальной настойчивости можно найти и исходные тексты на Си. Разработка аппаратуры переходников телефон-компьютер представляется почти тривиальной задачей и их себестоимость должна быть в районе 50 долларов. Например, в качестве такого устройства с успехом можно использовать любой модем с голосовыми функциями. А рыночная цена "специальных устройств" в настоящее время достигает шестнадцати тысяч долларов за один переходник (Computer World, 21.04.98, стр. 45)! Вот где можно легально получать колоссальную прибыль!

 

Не знаю, как вам, а мне всегда ужасно интересно было, как все происходит в звуковых картах, CD-плейерах, MIDI-синтезаторах и тому подобных железках. Уже года два я искал человека, который, с одной стороны, хорошо в этом разбирается, с другой - умеет писать.

Дмитрий Симаненков из Санкт-Петербурга, на мой вкус, обладает и тем достоинством, и другим, да еще и третьим: он давно и много сам, головой и руками, занимается предметом, о котором пишет. То есть он не только теоретик цифрового звука, но и практик.

Я уже поместил несколько его статей в "Компьютерре": про сравнительный анализ некоторых звуковых карт, например, или про трехмерный звук 1, но предмет, чем внимательнее на него смотришь - тем неисчерпаемее кажется. Тогда я предложил Дмитрию попробовать сделать тему номера целиком, в одиночку. По-моему, единственной неудачей в этом дебюте оказалось неумение уместить хоть сколько-нибудь внятное и систематическое изложение предмета в отпущенные теме номера двенадцать полос журнала. Но, получив от автора на это полную carte blanche, я обнаружил, что сам тоже попросту не могу найти, чего бы безболезненно вырезать.

Пришлось идти на не слишком мною любимый, но время от времени встречающийся в практике "Компьютерры" прием - разбивать тему на два выпуска.

Вступительную статью Дмитрия "Цифра и звук" я помещаю полностью в этом, давая, таким образом, план-проспект на оба выпуска.

Предыдущие "звуковые" статьи Дмитрия вызывали письма-несогласия, письма-поправки (см., например, рубрику "Хвосты" 2), - посему я попросил ознакомиться с материалами экспертов. В результате стали понятными причины несогласий: нигде не отступая от истины, Дмитрий на многие аспекты проблемы имеет собственный взгляд, порою отличающийся от общепринятого. Мне это представляется не недостатком, а, напротив, достоинством, - мотивированные же доводы оппонентов, буде оппоненты появятся, мы с удовольствием (и уж, конечно, с ответами) приведем на наших страницах.

И, возможно, начнем (когда с журнальным местом будет полегче) с уже готовой переписки звукорежиссера Дениса Жалнина (чью статью "Звукочистка" кто-то, надеюсь, помнит по теме "Музыка" в номере 223), рассуждающего о неизбежных потерях в качестве цифрового звука перед звуком аналоговым, и Дмитрия Симаненкова, имеющего прямо противоположную точку зрения, которую он доказывает с формулами в руках и пылом буквально личной заинтересованности.

Евгений Козловский

Подведем итоги всему вышесказанному. Цифровая обработка звука и основанная на этой технологии Интернет- и IP-телефония - это направление, сулящее большие выгоды для конечных пользователей и провайдеров этих услуг. Это потенциально хорошее поле приложения сил для малого бизнеса, приносящее очень высокую прибыль и не требующее значительных долгосрочных инвестиций. Однако российские бизнесмены, легко сделавшие огромные состояния на банальных торговых спекуляциях, "прихватизации" металлургической, нефтяной и газовой промышленности и банковских махинациях, никогда не будут инвестировать в недоступные их пониманию высокие технологии. Парадоксально, но российские высокие технологии погибнут из-за наличия в стране огромных природных богатств. Чтобы подкупить или запугать директора угольной шахты и заставить его продать уголь по дешевке, а потом перепродать по удвоенной цене, ни особого ума, ни высоких технологий не надо!

В следующих статьях будут рассмотрены теоретические и практические аспекты применения цифровой обработки звука. В статье "Из аналога в цифру и обратно: немного теории…" по возможности простым языком с минимумом формул рассказывается о принципах работы современных аналогово-цифровых и цифро-аналоговых преобразователей, использующих цифровую фильтрацию, оверсэмплинг (oversampling), дизеринг (dithering) и нойз-шейпинг (noise shaping). В начале статьи максимально доступно, но математически корректно объясняется процесс оцифровки аналогового сигнала, состоящий из двух последовательных операций - дискретизации по времени и квантования амплитуды. Далее детально обсуждается теорема Найквиста и ее следствия. Убедительно и наглядно показана принципиальная возможность сколь угодно точного восстановления исходного аналогового сигнала с помощью степенной интерполяции и других методов по дискретным отсчетам сигнала, удовлетворяющих теореме Найквиста. Затем рассказывается о методе oversampling и обосновывается необходимость его применения. В статье обсуждаются малоизвестные, но очень важные проблемы дискретизации, например, дискретизация сигналов с частотными компонентами, лежащими выше частоты дискретизации и не удовлетворяющими условиям теоремы Найквиста, а также "размножение" и "свертка" спектра исходного аналогового сигнала при дискретизации и применение цифровых фильтров. В статье уделено внимание проблеме джиттера, возникающего в устройствах на основе интерфейсов типа S/PDIF. В конце статьи рассказывается о принципах современных методов цифровой подготовки сигнала к записи на компакт-диск в формате 44,1 кГц, 16 бит с применением дизеринга и нойз-шейпинга.

В статье "Цифровая звукозапись музыкальных компакт-дисков" рассматриваются потенциальные возможности и принципиальные ограничения на качество звука для стандартного метода записи компакт-дисков с частотой дискретизации 44,1 кГц, 16 бит с применением дизеринга и нойз-шейпинга. Приводится обзор программного обеспечения (и его возможностей) для обработки звука на ПК и создания музыкальных компакт-дисков в домашних условиях. В статье также обсуждаются вопросы естественности звучания компакт-дисков, транзисторных, ламповых и цифровых искажений звука, методы борьбы с ними при записи (с применением моделирующих аналоговые системы процессоров) и при воспроизведении с использованием широко применяемых в аппаратуре класса high-end методов цифровой фильтрации и интерполяции. В статье есть раздел, посвященный проблемам перезаписи старых аудиокассет на компакт-диски. В заключении рассматриваются современные тенденции в развитии проигрывателей компакт-дисков класса high-end и их постепенное превращение в нечто, очень напоминающее персональный компьютер с приводом CD-ROM и высококачественной звуковой картой.

В статье "Цифровые синтезаторы музыкальных звуков" подробно рассматривается структура музыкальных сигналов в частотной и временной областях. Иллюстрируются понятия амплитудной огибающей, атаки, поддержки и затухания. В статье также рассмотрены современные представления о фундаментальной частоте музыкальных сигналов и "негармоничности" гармоник и ее влияние на естественность звучания. Детально обсуждаются методы (и их свойства) анализа звуковых сигналов с использованием БПФ и алгоритма сверхвысокого частотного разрешения, разработанных Б. Прони. В статье освещаются некоторые "темные стороны" БПФ, в частности гармоничность "БПФ спектра" белого шума. Далее в статье рассматриваются все основные методы и проблемы (решенные и нерешенные) синтеза музыкальных звуков на основе волновой таблицы (wavetable) с применением интерполяции, pitch-shifter и time-stretch, частотной модуляции, суммирования гармоник, "физического" моделирования и имитаторы аналоговых синтезаторов на примере программ ReBirth и Smorphi.

В статье "Компрессия звуковых данных" рассматриваются методы сокращение объема цифровых данных, необходимых для представления звукового сигнала с заданным качеством с потерями и без потери информации. Обсуждаются алгоритмы, основанные на объективных характеристиках реальных музыкальных и голосовых сигналов, на моделировании физиологического устройства звукоизвлекающего аппарата человека и психоакустических свойствах человеческого слуха. В статье излагаются принципы, положенные в основу алгоритмов адаптивной разностной компрессии, моделирования голосового аппарата человека. Программы на основе этих алгоритмов широко используются в компьютерной и Интернет-телефонии. В статье доходчиво раскрываются психоакустические эффекты маскирования в частотной и временной области, положенные в основу наиболее совершенных методов компрессии музыкальных данных MPEG Audio и Dolby AC-3; обсуждается качество звука, обработанного MPEG, недостатки современных shareware-кодеров и пути их устранения. В заключение статьи анализируется выгодность и перспективность инвестиций в разработку алгоритмов и программных систем компрессии музыкальных сигналов применительно к Интернет-дистрибуции музыкальных произведений.


1 Д. Симаненков: "Объемный звук" (#235); "Проблемы полезности Интернета с точки зрения рядового пользователя (#241); "Частное мнение о звуковых картах" (#242).

2 "Хвосты" ##19 (247) и 24-25 (252-253).

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.