Цифра и звук
АрхивПрактически все звуки не природного происхождения, окружающие нас в повседневной жизни, в той или иной мере подверглись цифровой обработке. Например, если вы говорите по телефону, то весьма вероятно, что ваш телефон или телефон вашего собеседника подключен к цифровой АТС. В этом случае звуки ваших голосов могут преобразовываться в цифровые данные, компрессироваться, передаваться по цифровым каналам и снова превращаться в аналоговые сигналы. Если же вы ведете международный телефонный разговор или используете сотовый телефон, то цифровая обработка звука присутствует наверняка. Если вы решили послушать УКВ-радиоприемник, то знайте, что практически все радиостанции буквально нашпигованы цифровой звуковоспроизводящей техникой и компьютерами. Очень часто музыкальные произведения на радиостанциях хранятся либо на компакт-дисках, либо на жестком диске компьютера, сжатые по стандарту MPEG. Звуковое сопровождение многих телевизионных программ и фильмов создается с применением компьютеров, так что, включив телевизор, вы тоже, скорее всего, услышите в той или иной степени "цифровой звук". Да и на рок-концерте с как бы "живым" звуком вы, скорее всего, увидите на сцене электронные клавишные и гитарные процессоры, являющиеся, по сути, мощными цифровыми устройствами обработки звука.
Давайте рассмотрим основные операции, выполняемые со звуковыми сигналами. Это - запись, хранение, сжатие, возможно - шифрование, передача через системы телекоммуникаций и воспроизведение. Возможно, также синтез музыкальных звуков. Запись и воспроизведение нецифровых аналоговых сигналов можно еще как-то оправдать дешевизной (но не качеством) кассетных магнитофонов. А вот сжатие аналоговых сигналов, их шифрование (например, с целью соблюдения конфиденциальности переговоров), передачу десятков и сотен телефонных разговоров по одной паре проводов, аналоговый синтез голоса и музыки современный человек уже может представить себе с очень большим трудом. Именно в этих областях цифровая техника превосходит аналоговую практически по всем параметрам, и по цене, и по качеству, и по размерам и надежности аппаратуры. Особенно заметно преимущество цифровой технологии при копировании, распространении и хранении оцифрованного звука. Копирование цифровых данных, например, с компакт-диска на жесткий диск персонального компьютера, осуществляется байт в байт. Ссылки на несколько известных программ-копировщиков такого рода можно посмотреть на сервере www.geocities.com/SiliconValley/Pines/7899. Если в процессе копирования произойдет ошибка, то операционная система Windows известит вас и предоставит возможность повторить операцию. Таким образом, легко добиться того, чтобы копия полностью совпадала с оригиналом. Для аналоговой техники это просто невозможно! При любом копировании аналогового сигнала неизбежно ухудшается качество звука (в том числе отношение сигнал/шум) и увеличиваются нелинейные искажения. Очень ярко преимущество цифровой техники проявилось в связи с развитием Интернета. Конечно, только "цифровой звук" можно хранить в неограниченном количестве на бесплатных серверах типа www.geocities.com или www.fortunecities.com. Сегодня через Интернет можно скопировать тысячи часов музыкальных произведений практически всех направлений и стилей от классики до рэйва, причем с великолепным качеством, значительно превосходящим звук, который может воспроизвести магнитофон с аналоговых кассет. С помощью специальных поисковых программ в Интернете можно мгновенно найти цифровые записи практически любого исполнителя. Перспективным и интересным экономически представляется использование цифрового звука в Интернет-телефонии. Современные методы цифровой обработки сигналов позволяют передавать через Интернет голос человека с весьма хорошим качеством на скорости 4800 бит/с, а достаточно разборчивую речь на 2400 бит/с и даже 1200 бит/с. Такие скорости передачи информации обеспечивают даже самые плохие модемы на самых плохих линиях связи. Кроме того, Интернет-телефония и цифровой звук - это очень привлекательное направление деятельности для российского малого бизнеса, работающего в области высоких технологий. Для разработки алгоритмов и программного обеспечения для цифрового сжатия речи не требуется огромных инвестиций и суперкомпьютеров - достаточно 486-го компьютера, черно-белого монитора, примитивного модема и - светлой головы. Почти все "голосовые" алгоритмы опубликованы в общедоступной печати, а в Интернете при минимальной настойчивости можно найти и исходные тексты на Си. Разработка аппаратуры переходников телефон-компьютер представляется почти тривиальной задачей и их себестоимость должна быть в районе 50 долларов. Например, в качестве такого устройства с успехом можно использовать любой модем с голосовыми функциями. А рыночная цена "специальных устройств" в настоящее время достигает шестнадцати тысяч долларов за один переходник (Computer World, 21.04.98, стр. 45)! Вот где можно легально получать колоссальную прибыль!
|
Подведем итоги всему вышесказанному. Цифровая обработка звука и основанная на этой технологии Интернет- и IP-телефония - это направление, сулящее большие выгоды для конечных пользователей и провайдеров этих услуг. Это потенциально хорошее поле приложения сил для малого бизнеса, приносящее очень высокую прибыль и не требующее значительных долгосрочных инвестиций. Однако российские бизнесмены, легко сделавшие огромные состояния на банальных торговых спекуляциях, "прихватизации" металлургической, нефтяной и газовой промышленности и банковских махинациях, никогда не будут инвестировать в недоступные их пониманию высокие технологии. Парадоксально, но российские высокие технологии погибнут из-за наличия в стране огромных природных богатств. Чтобы подкупить или запугать директора угольной шахты и заставить его продать уголь по дешевке, а потом перепродать по удвоенной цене, ни особого ума, ни высоких технологий не надо!
В следующих статьях будут рассмотрены теоретические и практические аспекты применения цифровой обработки звука. В статье "Из аналога в цифру и обратно: немного теории…" по возможности простым языком с минимумом формул рассказывается о принципах работы современных аналогово-цифровых и цифро-аналоговых преобразователей, использующих цифровую фильтрацию, оверсэмплинг (oversampling), дизеринг (dithering) и нойз-шейпинг (noise shaping). В начале статьи максимально доступно, но математически корректно объясняется процесс оцифровки аналогового сигнала, состоящий из двух последовательных операций - дискретизации по времени и квантования амплитуды. Далее детально обсуждается теорема Найквиста и ее следствия. Убедительно и наглядно показана принципиальная возможность сколь угодно точного восстановления исходного аналогового сигнала с помощью степенной интерполяции и других методов по дискретным отсчетам сигнала, удовлетворяющих теореме Найквиста. Затем рассказывается о методе oversampling и обосновывается необходимость его применения. В статье обсуждаются малоизвестные, но очень важные проблемы дискретизации, например, дискретизация сигналов с частотными компонентами, лежащими выше частоты дискретизации и не удовлетворяющими условиям теоремы Найквиста, а также "размножение" и "свертка" спектра исходного аналогового сигнала при дискретизации и применение цифровых фильтров. В статье уделено внимание проблеме джиттера, возникающего в устройствах на основе интерфейсов типа S/PDIF. В конце статьи рассказывается о принципах современных методов цифровой подготовки сигнала к записи на компакт-диск в формате 44,1 кГц, 16 бит с применением дизеринга и нойз-шейпинга.
В статье "Цифровая звукозапись музыкальных компакт-дисков" рассматриваются потенциальные возможности и принципиальные ограничения на качество звука для стандартного метода записи компакт-дисков с частотой дискретизации 44,1 кГц, 16 бит с применением дизеринга и нойз-шейпинга. Приводится обзор программного обеспечения (и его возможностей) для обработки звука на ПК и создания музыкальных компакт-дисков в домашних условиях. В статье также обсуждаются вопросы естественности звучания компакт-дисков, транзисторных, ламповых и цифровых искажений звука, методы борьбы с ними при записи (с применением моделирующих аналоговые системы процессоров) и при воспроизведении с использованием широко применяемых в аппаратуре класса high-end методов цифровой фильтрации и интерполяции. В статье есть раздел, посвященный проблемам перезаписи старых аудиокассет на компакт-диски. В заключении рассматриваются современные тенденции в развитии проигрывателей компакт-дисков класса high-end и их постепенное превращение в нечто, очень напоминающее персональный компьютер с приводом CD-ROM и высококачественной звуковой картой.
В статье "Цифровые синтезаторы музыкальных звуков" подробно рассматривается структура музыкальных сигналов в частотной и временной областях. Иллюстрируются понятия амплитудной огибающей, атаки, поддержки и затухания. В статье также рассмотрены современные представления о фундаментальной частоте музыкальных сигналов и "негармоничности" гармоник и ее влияние на естественность звучания. Детально обсуждаются методы (и их свойства) анализа звуковых сигналов с использованием БПФ и алгоритма сверхвысокого частотного разрешения, разработанных Б. Прони. В статье освещаются некоторые "темные стороны" БПФ, в частности гармоничность "БПФ спектра" белого шума. Далее в статье рассматриваются все основные методы и проблемы (решенные и нерешенные) синтеза музыкальных звуков на основе волновой таблицы (wavetable) с применением интерполяции, pitch-shifter и time-stretch, частотной модуляции, суммирования гармоник, "физического" моделирования и имитаторы аналоговых синтезаторов на примере программ ReBirth и Smorphi.
В статье "Компрессия звуковых данных" рассматриваются методы сокращение объема цифровых данных, необходимых для представления звукового сигнала с заданным качеством с потерями и без потери информации. Обсуждаются алгоритмы, основанные на объективных характеристиках реальных музыкальных и голосовых сигналов, на моделировании физиологического устройства звукоизвлекающего аппарата человека и психоакустических свойствах человеческого слуха. В статье излагаются принципы, положенные в основу алгоритмов адаптивной разностной компрессии, моделирования голосового аппарата человека. Программы на основе этих алгоритмов широко используются в компьютерной и Интернет-телефонии. В статье доходчиво раскрываются психоакустические эффекты маскирования в частотной и временной области, положенные в основу наиболее совершенных методов компрессии музыкальных данных MPEG Audio и Dolby AC-3; обсуждается качество звука, обработанного MPEG, недостатки современных shareware-кодеров и пути их устранения. В заключение статьи анализируется выгодность и перспективность инвестиций в разработку алгоритмов и программных систем компрессии музыкальных сигналов применительно к Интернет-дистрибуции музыкальных произведений.
1 Д. Симаненков: "Объемный звук" (#235); "Проблемы полезности Интернета с точки зрения рядового пользователя (#241); "Частное мнение о звуковых картах" (#242).
2 "Хвосты" ##19 (247) и 24-25 (252-253).