Архивы: по дате | по разделам | по авторам

Системы распознавания музыки

АрхивСофтерра
автор : Андрей Крупин   15.09.2009

Поговорим о программах и онлайновых инструментах, позволяющих узнавать исполнителя, название музыкального произведения и другие сведения по короткому отрывку композиции, записанному, например, с радио.

Сегодня в рамках рубрики "Софтерра" мы поговорим о программах и онлайновых инструментах, позволяющих узнавать исполнителя, название музыкального произведения и другие сведения по короткому отрывку композиции, записанному, например, с радио. Первой нечто подобное запустила несколько лет назад компания Sony Ericsson, внедрив в телефоны серии Walkman функцию TrackID, однако монополия японско-шведского концерна уже многократно нарушена, и теперь воспользоваться услугами решающих задачу распознавания музыки сервисов может любой желающий с любого компьютера, подключённого к Сети.

Перед тем как перейти непосредственно к обзору, скажем, что в основе рассматриваемых систем лежит достаточно сложный механизм идентификации композиций, объединяющий технологию аудиоотпечатков и внушительных размеров базу данных, хранящую сведения о музыкальных треках самых разных жанров. При загрузке пользователем файла специальные алгоритмы обрабатывают его, формируют аудиоотпечаток и затем сверяют его с представленной в БД информацией, демонстрируя в окне браузера или программы результат распознавания.

AudioTag.info. Отечественный сервис распознавания музыки, в базе данных которого представлено более миллиона треков. Используемые в системе механизмы умеют обрабатывать аудиофайлы наиболее востребованных форматов, таких как wav, mp3, ogg, flv, amr, mp4 и так далее. Интересной особенностью службы является поддержка YouTube. Согласно опубликованному на сайте описанию инструмента, оптимальная продолжительность треков в загружаемых файлах варьируется в пределах 15-45 секунд. При этом ограничений на продолжительность композиций почти нет - более короткие и длинные фрагменты будут также обработаны. Интерфейс системы представлен на русском и английском языках, регистрироваться в AudioTag.info не нужно.

Для оценки возможностей онлайновой программы в деле мы подготовили два тестовых аудиофрагмента в формате MP3 продолжительностью по 30 секунд: один из песни Владимира Высоцкого "Москва-Одесса" (помните строчки "в который раз лечу Москва-Одесса - опять не выпускают самолет"?), а второй из известной всем композиции Yesterday группы The Beatles. Результат сканирования файлов оказался двояким: песню Владимира Семеновича сервис опознал, а вот творение британской рок-группы из Ливерпуля почему-то не идентифицировал. Вероятно, виной всему является бета-версия службы.

Tunatic. Миниатюрная утилита (530 Кб), которая перехватывает звуковой поток с аудиокарты и, взаимодействуя с онлайновой базой данных, предоставляет сведения о проигрываемой на компьютере композиции. Знаменитую песню ансамбля "Битлз" программа определила в два счёта, а вот с опознанием работы отечественного исполнителя утилита, увы, не справилась. Приложение Tunatic распространяется бесплатно и доступно для операционных систем Windows и Mac OS X.

PicardTagger. Написанная на межплатформенном языке Python программа с многоязычным интерфейсом, использующая помимо аудиоотпечатков собственные технологии распознавания песен и данные открытой музыкальной энциклопедии MusicBrainz, насчитывающей более восьми миллионов треков. В нашем случае на скормленные отрывки композиций утилита ответила молчанием, а вот на полноразмерных файлах механизм идентификации сработал без осечек, определив оба тестовых произведения. С помощью PicardTagger можно наводить порядок в хранящихся на компьютере медиабиблиотеках, добавлять тэги в файлы, создавать обложки для дисков и пополнять базу аудиоданных. Программа поддерживает более двух десятков форматов файлов и распространяется совершенно бесплатно. Кому PicardTagger не придется по вкусу, тот может обратить внимание на альтернативные приложения Jaikoz Tag Editor и Magic MP3 Tagger, ссылки на которые можно найти на главной странице проекта MusicBrainz.

"Музыкальный эксперт". Коммерческий сервис, воспользоваться которым могут абоненты "Мегафона". Для определения проигрываемого музыкального произведения достаточно позвонить на номер 0665 и поднести телефон к источнику звука на 15 секунд. Система обработает полученную информацию, спишет со счета 25 рублей за минуту звонка на короткий номер и вышлет владельцу портативного устройства SMS с именем исполнителя и названием песни. Если обнаружится, что мелодия присутствует в фонотеке "Мегафона", пользователю сервиса будет дополнительно отправлена ссылка на сайт, где её можно скачать. О том, насколько хорошо "Музыкальный эксперт" справляется со своими обязанностями, мы сказать не можем, поскольку протестировать сервис не удалось по причине отсутствия под рукой мобильника, подключенного к сотовой сети упомянутого оператора. Читатели "КТ-Онлайн", являющиеся абонентами "Мегафона", могут лично проверить качество работы системы и отписаться нам о результатах.

Программное обеспечение, упомянутое в этом материале, протестировано на мобильном компьютере Packard Bell EasyNote TN65.

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.