Дайджест вэйвлет-анализа, в двух формулах и 22 рисунках.
АрхивВведение
Предположим, что мы хотим изучить какой-то сигнал, например, временной ряд. Идея многомасштабного анализа (относящиеся сюда английские слова - multiscale и multiresolution), состоит в том, чтобы взглянуть на сигнал сначала под микроскопом, потом - через лупу, потом отойти на пару шагов, потом посмотреть совсем издалека.
Эта идея реализуется разными способами, но все они сводятся к последовательному огрублению той информации, которая дана изначально. Иногда действуют наоборот - сначала сильно огрубляют сигнал, смотрят на те особенности, которые еще сохранились, и начинают уточнять их положение.
Что это нам дает? Во-первых, мы можем выявлять локальные особенности сигнала и классифицировать их по интенсивности. Например, в обработке изображений широко распространена многомасштабная локализация резких границ (multiscale edge detection). Очень резкие перепады яркости заметны и на малых, и на больших масштабах. В некоторых задачах можно считать их наиболее информативной частью изображения, и вычислять с большой точностью, пренебрегая всем остальным. Вообще, подход последовательного уточнения чего-либо при переходе от крупного масштаба к мелкому возникает в самых разных областях обработки информации и прикладной математики. Хороший пример - многосеточные схемы в вычислительной физике.
Во-вторых, таким образом визуализируется динамика изменения сигнала вдоль "оси масштабов". Если резкие скачки во многих случаях можно заметить невооруженным глазом, то взаимодействие событий на мелких масштабах, перерастающее в крупномасштабные явления, увидеть очень сложно. Например, фрактальная структура каких-либо графиков или поверхностей бывает связана с (статистической) однородностью их строения на различных пространственных масштабах. Многомасштабный анализ помогает количественно охарактеризовать эту однородность. Скачки динамики по "масштабной переменной" могут нести не менее важную информацию, чем резкие изменения по времени или по пространству. Так, при анализе космических снимков земной поверхности выяснилось, что имеется несколько характерных масштабов, на которых фрактальные параметры меняются скачком. Также, и в экологии, и в экономике очень полезно выявлять ситуации, когда мелкомасштабная активность начинает влиять на крупномасштабную картину.
Часто в задачах обоих этих типов важнее найти не сами разномасштабные версии сигнала, а различия между ними, детали, которые исчезают при переходе от более тонкого масштаба к более грубому.
Вейвлет-анализ возник при обработке записей сейсмодатчиков в нефтеразведке и с самого начала был ориентирован как раз на локализацию разномасштабных деталей. Выросшую из этих идей технику теперь обычно называют непрерывным вейвлет-анализом. Ее основные приложения: локализация и классификация особых точек сигнала, вычисление его различных фрактальных характеристик, частотно-временной анализ нестационарных сигналов. Например, у таких сигналов, как музыка и речь, спектр радикально меняется во времени, а характер этих изменений - очень важная информация. Основным идеям непрерывного вейвлет-анализа и его приложений посвящен раздел 2.
Другая ветвь вейвлет-анализа - ортогональный вейвлет-анализ. О нем подробно рассказывается в разделе 3. Именно ортогональному вейвлет-анализу обязана своей популярностью вся эта тематика, с ним связана "вейвлет-революция" конца восьмидесятых годов. Главные применения - сжатие данных и подавление шумов.
Кроме этих двух важнейших частей вейвлет-анализа, имеется еще множество вариаций, которые очень кратко обрисованы в разделе 4. Там же приведен список важнейшей литературы, и электронные адреса, по которым можно найти много информации и полезные программы. А теперь перейдем, наконец, к изложению предмета статьи.
Непрерывный вейвлет-анализ.
Главными действующими лицами этого раздела будут две функции, изображенные на рис. 1. Это - два самых, пожалуй, популярных вейвлета: "сомбреро" (Mexican hat) и вейвлет Морле (Morlet wavelet). График любого вейвлета выглядит примерно так же (заметим, что вейвлет Морле - комплекснозначный, на рисунке изображены его вещественная и мнимая части). Более точно, для того, чтобы функция могла называться вейвлетом, должны выполняться два условия.
- Ее среднее значение (т.е. интеграл по всей прямой) равно нулю.
- Функция быстро убывает при .
Теперь возьмем произвольный сигнал - некоторую функцию f(x) (переменную x будем называть временем), и произведем ее вейвлет-анализ при помощи вейвлета .
Результатом вейвлет-анализа этого сигнала будет функция Wf(x,a), которая зависит уже от двух переменных - от времени x и от масштаба a. Для каждой пары x и a (a>0) рецепт вычисления значения Wf(x,a) следующий:
- Растянуть вейвлет в a раз по горизонтали и в 1/a раз по вертикали.
- Сдвинуть его в точку x. Полученный вейвлет обозначим .
- "Усреднить" значения сигнала в окрестности точки a при помощи .
На рис. 2 показано, что надо сделать. В нижней части изображен график функции f(x), в верхней - условными цветами - распределение значений Wf(x,a) (по горизонтали - переменная x, по вертикали - ось a в логарифмическом масштабе, на которой маленькие масштабы расположены ниже больших. Самый маленький масштаб соответствует шагу сетки, на которой задана исходная функция). Синими столбиками изображены графики при разных значениях a и x. Выделенные участки графика исходной функции поточечно умножаются на значения оказавшихся над ними синих столбиков, потом все это суммируется. Абсолютная величина суммы определяет, какого цвета будет точка (x,a) на верхней картинке (на рисунке эти точки обведены красными кружочками). Это делается для всех пар (x,a).
Строгое определение выглядит так (это первая из двух обещанных формул).
(1)
На математическом языке можно сказать, что при фиксированном значении a Wf(x,a) есть свертка исходной функции с растянутым в a раз вейвлетом.
Посмотрим, какую информацию о сигнале можно получить из таких картинок. На рисунке 3 показано вейвлет-преобразование (с помощью "сомбреро") гладкой функции с единственной особенностью. Яркий конус точно указывает своей вершиной расположение этой особенности. Почему так происходит? На каждом уровне a = const стоит свертка f(x) с растянутой версией . В каждой точке это разность средних значений f по тем участкам, где положительна, и по тем, где она отрицательна. Так как среднее значение самой равно нулю, свертка напоминает "размазанную" производную данной функции. На малых масштабах размазывания почти нет, так как быстро убывает при удалении от x, и мы видим скачок вейвлет-преобразования (на картинке это более яркий цвет) вблизи самой особенности. На больших же масштабах растянутый вейвлет "задевает" особую точку, даже если он "приложен" к графику далеко от нее. Чем лучше вейвлет "сконцентрирован" во времени, тем точнее будет локализация особенностей.
А почему бы просто не вычислить производную или, скажем, вторые разности? В данном случае результат будет тот же - скачок в особой точке. Но давайте вернемся к рис. 2. Там тоже видны характерные яркие конусы, вырастающие из аналогичных особенностей функции. Но они соответствуют только самым сильным особенностям, имеющим большую амплитуду. Функция, которую мы изучаем, фрактальна, она не имеет производной нигде. Поэтому вторые разности дали бы совершенно хаотическую картину. Чтобы в ней разобраться, пришлось бы все сглаживать и перемасштабировать - что мы и делаем, проводя вейвлет-анализ! Мы пришли бы к аналогичной процедуре, но с плохим вейвлетом - плохим для другой важной задачи: выявления динамики локальных частот. Сейчас станет ясно, почему вейвлеты с рисунка 1 для этой задачи хороши.
Обратимся к рис. 4. В верхней части изображено вейвлет-преобразование (на этот раз с помощью функции Морле, она лучше приспособлена к частотно-временному анализу) суммы двух чистых гармоник. В нижней - вещественная часть самой этой суммы. Четко выделяются две яркие горизонтальные полосы вида и . Частоты гармоник легко определить по этим значениям; они пропорциональны и .
.