Архивы: по дате | по разделам | по авторам

Трехмерный звук

Архив
автор : ДМИТРИЙ СИМАНЕНКОВ    20.10.1998

Что должно быть 3D?
Симфонический оркестр?
Гребенщиков?
Представляете: сижу как бы во чреве Гребенщикова, а голос его обнимает меня со всех направлений.
Е. Козловский, КТ #32 (260), стр. 46

Для чего нужен и где применяется трехмерный звук

В повседневной жизни мы слышим звуки, приходящие со всех сторон - сверху, снизу, слева и справа. Наш слуховой аппарат может более или менее точно определять направление на источник звука и расстояние до него. Поэтому вполне разумно желание, чтобы радиоприемники, телевизоры, магнитофоны, музыкальные центры, компьютеры и другие воспроизводящие звук аппараты максимально воссоздавали реальное (или похожее на реальное) трехмерное звуковое поле. Представьте себе такую картину. Вы смотрите по телевизору фильм ужасов. Главный герой, "окруженный" таинственными звуками, пробирается через заброшенное кладбище. Однако отождествлять себя с героем, сопереживать с ним сильно мешает то обстоятельство, что таинственные звуки не окружают вас, а исходят из одной точки - телевизора. Из-за этого мгновенно разрушается вся аура таинственности, "настрашниться" в полной мере будет проблематично. С другой стороны, оправданность применения объемного звука в музыкальной звукозаписи не столь очевидна. Дотошное воспроизведение трехмерных шумов концертного зала действительно впечатляет. Меня, например, потрясло сверхреалистичное, заставляющее недовольно оборачиваться с целью сделать замечание, сморкание соседа сзади на одной из 3D-звуковых демонстрационных записей, найденных в Интернете. Но все это больше курьезы, чем серьезные музыкальные произведения, изготовленные по технологии объемного звука. А вот компьютерные игры значительно оживляются трехмерным звуком. Потребители-геймеры и разработчики компьютерных игр однозначно проголосовали за объемный звук. Сегодня программное обеспечение поддержки игровых приложений Microsoft DirectX позволяет разработчику создавать объемное звуковое сопровождение с использованием (или без использования) аппаратных ускорителей обработки звука, таких как Monster Sound 3D, Turtle Beach Montego A3DXStream или SoundBlaster Live!. В принципе использование DirectX/DirectSound-совместимых звуковых карт должно позволять расставлять виртуальные источники звука в любой точке пространства, например, вокруг рабочего места журналиста, программиста или верстальщика. Причем в минимальной, но полнофункциональной конфигурации требуется всего два реальных (колонки или стереотелефоны) источника звука. Таким образом, можно улучшить обычный стереозвук от близко стоящих друг к другу колонок (обычно слева и справа от дисплея), виртуально разместив их на оптимальном для проявления стереоэффекта расстоянии от слушателя. Заметьте, что при этом реальные колонки вообще не надо передвигать, все сделает 3D-звуковой процессор.

Рис. 1. Пользовательский интерфейс процессора трехмерного звука (Monster Sound 3D).

Развитие методов воспроизведения и записи объемного звука

Первым шагом к объемному звуку была стереозапись. Но качество звучания, реализуемое обычной стереофонической системой или головными стереотелефонами, не полностью удовлетворяет взыскательных слушателей. Хотя стереосистемы и создают эффект пространственного звучания за счет синтеза панорамы мнимых источников звука между двумя громкоговорителями, все же стереозвучание имеет существенный недостаток. Стереопанорама получается плоской и ограничена углом между направлениями на громкоговорители. Такое звучание в значительной степени лишено естественности, свойственной тому, что достигается в реальном звуковом поле. Головные стереотелефоны также не позволяют получить естественное звучание воспроизводимой фонограммы. Дело в том, что возникающее при этом впечатление бесконечной ширины стереобазы и четкая локализация звукового изображения внутри головы слушателя не могут удовлетворить требовательных меломанов.

Следующим шагом стала квадрофония. Было разработано несколько несовместимых друг с другом систем - JVC CD-4, CBS SQ и Sansui QS. Мнения экспертов о звуковых возможностях квадрофонических систем не были восторженными. Большинство слушателей отмечало, что квадрофонические системы не обеспечивают полную имитацию реального звукового поля. Во-первых, при квадрофонии не образуется круговая стереопанорама: слушатель ощущает обычную стереопанораму перед собой и позади себя. Во-вторых, все мнимые источники звука располагаются в одной плоскости и на линии между динамиками, то есть нет глубины и нет собственно третьего измерения и объемного трехмерного звучания. После неудач с квадрофонией разработчики, видимо, решили, что все дело в недостаточном числе каналов воспроизведения, и на свет появились очень многоканальные монстры.

Рис. 2. Система звуковоспроизведения "домашнего театра" Dolby.

Лидерство в создании многоканальных систем звуковоспроизведения захватила фирма Dolby. Ее система под названием Multichannel Surround Sound установлена (по сведениям с www.dolby.com) более чем в 14 тыс. кинотеатров. Вскоре бум на супермногоканальность прошел, и Dolby разработала менее сложную систему Dolby Digital Surround, состоящую всего из шести громкоговорителей (левого, центрального, правого, сабвуфера, левого и правого "surround") и предназначенную для домашнего применения.

Самое смешное, что Dolby Digital удивительно похожа на разработанную в России в 70-х годах систему звуковоспроизведения ABC, основной, по-видимому, незапатентованный должным образом признак (и отличие от квадрофонии) которой заключается в размещении тыловых громкоговорителей не за слушателем, а точно слева и справа от него. Именно такое размещение динамиков позволяет создавать круговую звуковую панораму, и именно на таком расположении динамиков настаивает Dolby. Совпадение?! Естественно, эти системы звуковоспроизведения не имеют третьего измерения.

 

Рис. 3. Искусственная голова и 3D-микрофон.

Наиболее совершенный метод имитации реального трехмерного звукового поля - это бинауральная звукозапись. Бинауральный метод состоит в том, что звуковая информация воспринимается микрофонами, размещенными в ушных раковинах человека или искусственной головы - модели, симулирующей слуховое восприятие человека.

Сигналы, записанные каждым микрофоном, усиливаются и воспроизводятся стереотелефонами. В идеале такая система позволяет создать полную иллюзию естественного звучания. Она как бы переносит слушателя из помещения прослушивания в помещение, откуда ведется передача. Однако полноценно прослушивать ее можно только с помощью стереотелефонов и при условии, что в качестве образца для создания искусственной головы использовалась именно ваша голова. Поэтому для получения максимально возможного эффекта рекомендуется использовать для записи специальные микрофоны, помещаемые в ваши собственные уши (см. рис. 4).

 

Рис. 4. Специальные микрофоны для записи звука с головы человека.

Следует отметить, что записи, сделанные с помощью микрофонов, помещенных в ваши собственные уши, будут иметь ценность в основном только для вас. При прослушивании таких записей другими людьми в структуре воображаемого звукового поля могут ощущаться значительные отклонения от оригинала.

При воспроизведении бинаурального сигнала через акустическую систему из-за попадания сигнала правого канала в левое ухо слушателя и наоборот возникают перекрестные искажения, в конечном счете сводящие на нет все преимущества бинаурального звуковоспроизведения. Указанные недостатки в значительной мере удается устранить с помощью специальных устройств обработки звуковых сигналов, позволяющих получить бинауральный эффект при прослушивании бинауральной записи через акустическую систему. Такие устройства получили название бифонических процессоров. Запись производится с микрофонов, расположенных в искусственной голове, а воспроизводится после обработки бифоническим процессором, в котором точно рассчитанная величина сфазированного, задержанного и скорректированного по частоте сигнала левого канала вычитается из сигнала правого канала и наоборот. После обработки бифоническим процессором сигналы, приходящие из колонок в уши слушателя, суммируются так, что левое ухо слышит только сигналы левого канала, а правое - правого. Таким образом можно сказать, что бифонический эффект подобен бинауральному и отличается от него только способом воспроизведения бинауральной записи. И хотя площадь, где он отчетливо проявляется, невелика, зато, находясь в ее пределах, слушатель может иметь представление о расстоянии до источников звука и их взаимном расположении в пространстве в момент записи. Этого не удается достигнуть при стереофоническом звуковоспроизведении, дающем представление только о расположении источников звука на линии между звуковыми колонками. Другое интересное свойство бифонического процессора - это возможность расширения с его помощью стереобазы обычных стереофонических записей. Конечно, бифонический процессор может быть реализован чисто программными методами с использованием методов цифровой обработки сигналов в реальном времени.

Теоретические основы трехмерного звука

Реальные источники звука (поющая птичка, работающий трактор и т. д.) довольно часто можно приближенно считать точечными. То есть это - моноисточники. Стереоэффект возникает при восприятии звука левым и правым ухом. В зависимости от расположения источника звука в пространстве изменяются частотные характеристики человеческих ушей. Причем изменяются они не синхронно, по-разному. То есть усредненные частотные характеристики ушей одинаковы только при расположении источника звука точно в плоскости симметрии головы. На рис. 5 хорошо видна разница в форме импульсных реакций и амплитудно-частотных характеристик, полученных с помощью помещенных внутрь ушей микрофонов и смещенного относительно плоскости симметрии головы в пространстве источника звука.

Рис. 5. Частотные характеристики человеческих ушей при несимметричном расположении источника звука.

Многочисленные измерения показывают значительные изменения частотных характеристик в зависимости от расстояния и направления на источник звука. Наиболее очевидна разная задержка сигналов и разница в амплитудах. Видимо, наш мозг анализирует эти изменения и разницу характеристик и делает вывод о расположении источника звука в трехмерном пространстве. Таким образом, ощущение местоположения источника звука в пространстве тесно связано с характеристиками звуковоспринимающего аппарата человека (амплитудно-частотной характеристикой и относительной задержкой сигнала). Для имитации такого ощущения можно измерить усредненные характеристики нашего слухового аппарата и построить на их основе цифровые фильтры. Чем детальнее моделируется пространственная частотная характеристика слухового аппарата, тем сложнее получаются фильтры. После этого создание искусственного объемного звукового поля будет заключаться в обработке сигналов от моноисточников парами (для левого и правого уха) цифровых фильтров с параметрами, соответствующими желаемому направлению на источники звука.

Трехмерный звук и персональные компьютеры

В последние несколько лет на рынке появились дешевые и очень мощные процессоры обработки сигналов (Digital Signal Processor, DSP). Фирма Analog Devices (www.analog.com) выпускает один из самых интересных на сегодня процессоров AD21160 SHARC. Это 32-разрядное устройство с производительностью 1000 MIPS (миллионов инструкций в секунду), способное обрабатывать целые числа и числа с плавающей точкой. Система команд этого DSP весьма совершенна, очень удобна для программистов и позволяет легко решать как системные, так и специфические вычислительные задачи типа цифровых адаптивных рекурсивных и нерекурсивных фильтров для трехмерного звука, БПФ и операций с матрицами. На кристалле размещается быстрая RAM объемом от 250 Кбайт до 2 Мбайт и масочное ПЗУ, процессоры ввода/вывода, DMA-контроллеры и быстрые последовательные порты. Возможна организация многопроцессорной системы. SHARC имеет небольшие габариты (27х27 мм) и потребляет всего 2 ватт. Столь малая потребляемая мощность позволяет устанавливать несколько таких DSP на малогабаритные PCI-карты. Менее совершенные предшественники AD21160 широко используются в звуковых картах Monster Sound 3D. SHARC в настоящее время, по моим данным, применяется в основном в мощной современной студийной аппаратуре (например, DSP/FX cards).

 

Рис. 6. Процессор обработки сигналов SHARC.

Приборы обработки звуковых сигналов более узкого назначения выпускаются фирмами Aureal (Vortex 2, Aureal AU8820, 330 MIPS) и E-mu (EMU10k, 1000 MIPS). Первый из них используется в звуковой карте Turtle Beach Montego A3DXStream, второй в SoundBlaster Live от Creative Labs. Система команд AU8820 и EMU10k значительно проще набора инструкций AD21160 и ориентирована на табличный синтез музыкальных звуков, электронные эффекты реверберации, флэнжера, хоруса, разнообразной фильтрации и трехмерного звука.

Микросхема Vortex 2 ориентирована на поддержку собственной, запатентованной Aureal, технологии A3D. Vortex 2 обрабатывает до 32 статических источников звука в трехмерном пространстве на частоте дискретизации до 48 кГц. Для создания эффектов реверберации применяется технология Aureal Wavetracing. Однако, судя по картинке на Web-сервере Aureal, реверберация двухмерная, плоская и ничем не отличается от доступных программных средств типа продуктов фирмы Waves (www.waves.com). Vortex 2 поддерживает DirectSound3D.

Микросхема EMU10k представляется мне более мощной. Она поддерживает до 148 каналов источников трехмерного звука по спецификации DirectSound3D и до 32 источников трехмерного звука по технологии A3D с частотой дискретизации 48 кГц. EMU10k позволяет обрабатывать сигнал эффектами реверберации, хоруса, эквалайзерами и различными фильтрами. В противовес фирме Aureal, компания Creative Labs запатентовала собственную технологию трехмерного звука Environmental Audio. Однако основная ставка, похоже, сделана на поддержку Microsoft DirectSound 3D.

Между компаниями Creative Labs и Aureal завязалась интересная конкурентная борьба. Впервые у Creative Labs появился достойный конкурент на рынке дешевых звуковых карт с качественной поддержкой трехмерного звука. Компании Aureal непостижимым образом даже удалось потеснить монстра Microsoft - DirectSound3D. По уверениям самой Aueral, все ведущие производители компьютерных игр (более ста компаний) встраивают в свои продукты поддержку технологии A3D, функционально, на мой взгляд, ничем не отличающуюся от DirectSound3D.

DSP, способные обрабатывать сигналы алгоритмами трехмерного звука, производятся также фирмами Motorola и Texas Instruments и по своим характеристикам незначительно уступают перечисленным выше устройствам. Наличие на рынке столь совершенных устройств позволило создавать относительно недорогие звуковые карты, оснащенные DSP и способные в реальном времени реализовывать бифонические процессоры и цифровые фильтры, необходимые для качественного моделирования человеческого слухового аппарата. Таким образом, трехмерный звук из экзотики превращается в стандартную функцию практически любой современной звуковой карты среднего ценового диапазона. В дополнение к цифровым имитирующим фильтрам такие звуковые карты позволяют реализовать эффект Доплера (смещение высоты звука движущегося источника), придающий еще большую реалистичность компьютерным играм. Любители домашней компьютерной звукозаписи также имеют возможность поэкспериментировать с трехмерным звуком. Практически для всех популярных программ редактирования звуковых файлов существуют дополнительные модули (plug-ins), поддерживающие создание объемно звучащих произведений (см. www.qsound.com).

© ООО "Компьютерра-Онлайн", 1997-2021
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.