Кто сказал мяу?
АрхивДостиженияЧем больше аудиоинформации накапливается в цифровом формате, тем труднее найти файл с нужным звуковым фрагментом. Что же делать?
Чем больше аудиоинформации накапливается в цифровом формате, тем труднее найти файл с нужным звуковым фрагментом. Для музыки, скажем, эта задача уже решена более или менее эффективно — например фирмой Philips, где создана программа, с помощью криптографической технологии хеширования опознающая музыкальное произведение по нескольким секундам записи (см. «КТ» #424). А вот для быстрого поиска слов или фраз в архивах с записями человеческой речи столь заманчивая технология не годится, поэтому приходится использовать куда более трудоемкие операции обработки, такие как автоматическое распознавание речевой информации с последующим переводом ее в текстовый формат и стандартным индексированием. Понятно, что это не самый удачный и безошибочный способ.
Американская фирма-стартап Fast-Talk Communications (www.fast-talk.com), отпочковавшаяся от лабораторий Технологического института Джорджии, разработала существенно иную технологию быстрого поиска в аудиофайлах. Здесь все построено на разложении искомого фрагмента в последовательность фонем («строительных звуковых кирпичиков», из которых фонетически складывается речь на любом языке), а затем без всякого распознавания и вникания в смысл программа очень быстро просматривает архивы на предмет наличия нужной цепочки фонем. По свидетельству разработчиков, созданная ими система за секунду перелопачивает около тридцати часов аудиозаписей. В систему встроена возможность самообучения, позволяющая настраиваться для работы с речью на языках с характерным национальным акцентом. Но и тут есть, конечно, свои недостатки. Например, поскольку поиск ведется в принципе без какого-либо вникания в смысл, программа не способна различать близкие по звучанию слова.
По свидетельству специалистов, даже со своими слабыми сторонами новая технология поиска дает серьезные преимущества в ряде важных приложений. Например, она очень пригодится теле- и радиосетям, которые держат в своих архивах многие тысячи часов записей собственных программ, однако зачастую не располагают эффективными способами поиска в этих массивах. Впрочем, «новой» технологию Fast-Talk можно назвать лишь условно, поскольку, по словам тех же экспертов, в спецслужбах, занимающихся перехватом и анализом телефонных переговоров, подобные системы используются давным-давно.