Архивы: по дате | по разделам | по авторам

Искусство узнавания

Архив
автор : ВЛАДИМИР АНДРИАНОВ    25.07.2000

Получить изображение земной поверхности с помощью аппаратуры дистанционного зондирования - еще полдела. Картинка - не более чем дорогое развлечение. А вот информация, которая может быть извлечена из снимка в результате обработки, и обеспечивает его ценность и постоянный рост интереса к дистанционному зондированию.


С момента получения методами ДЗ самых первых данных возникла задача их дешифрирования. Из матрицы пикселов, образующих снимок, мы должны извлечь некоторую содержательную информацию, получить ответы на вопросы: какие объекты изображены на снимке, каковы их свойства, каково их положение в известной системе координат? Эта задача всегда решается на стыке науки и искусства. Снимки не несут полной информации об объектах, поэтому заключение о том, чем, например, является некий серый прямоугольник, имеет ограниченную достоверность. Это может быть и ангар для самолета, и производственное здание, и просто сарай. И правильное решение в большой степени зависит от опыта и интуиции оператора. С другой стороны, коррекция геометрических искажений, улучшающие преобразования, фильтрация и другие манипуляции с изображениями имеют точную математическую природу. Здесь применяются методы математической статистики, тригонометрии, неэвклидовой геометрии, кластерного анализа, спектрального анализа и других разделов математики. Используется также множество эмпирических методов, сочетающих точность математики с интуитивной догадкой и знаниями, накопленными специалистами по ДЗ.

В первом приближении задачи обработки данных ДЗ можно разделить на несколько уже ставших традиционными групп: визуализация, улучшающие преобразования, геометрическая коррекция, управление данными, классификация и моделирование.

Посмотрели пристально

Визуализация двумерных растровых изображений, в общем-то, особой сложности не представляет - пока размеры изображения невелики. А в ДЗ вполне возможны файлы объемом в несколько гигабайт. Представляете, сколько времени потребуется на одну лишь отрисовку такой картинки? А ведь в работе нужно постоянно перемещать ее на экране, изменять масштаб отображения.

Решение есть, и очень простое. Это так называемые пирамидные слои. Исходная картинка записывается в нескольких копиях. Каждая следующая копия имеет вдвое меньшее разрешение. И когда картинку нужно показать в заданном масштабе, выбирается копия ближайшего подходящего разрешения.

Другая интересная особенность визуализации данных ДЗ - цветовой синтез. Пользователь может выбрать, какие спектральные зоны будут назначены основным цветам (цветовым компонентам) - красному, зеленому и синему. Более того, разным цветовым компонентам можно назначить спектральные зоны разных снимков. Это позволяет совмещать возможности нескольких сенсоров, работающих в разных участках спектра или вообще на разных принципах (например, данные видимого диапазона и радарные).

Наконец, немалый интерес представляет возможность трехмерной визуализации поверхностей. Строго говоря, это не истинная трехмерная, а так называемая 2,5-мерная визуализация, в которой каждой точке поверхности с координатами (x, y) сопоставляется некоторое значение высоты z. Это может быть как высота в обычном понимании этого слова, так и значение некоего параметра, такого как объем осадков, содержание полезного вещества в породе, плотность населения и т. д. Мы еще вернемся к этому типу визуализации при обсуждении моделей рельефа.

Причесали ласково

Улучшающие преобразования и фильтрация используются главным образом для облегчения восприятия снимка человеком. Дело в том, что очень часто снимки получаются с малыми яркостью и контрастностью в пределах возможных значений. Конечно, управлять яркостью и контрастностью изображения позволяют даже простые графические редакторы, но в случае снимков управление основывается на статистике изображения, что позволяет точно соотносить изменения контраста и возможные при этом потери в различении пикселов на краях яркостного диапазона. Например, увеличив контраст в пределах двух стандартных отклонений от средней яркости, мы получим высококонтрастное изображение, на котором только 5% пикселов оказались за границами диапазона отображения (то есть стали совсем черными или совсем белыми). Иногда полезны гамма-коррекция или выравнивание яркостной гистограммы. Наконец, часто бывает нужна возможность изменить контраст только в пределах некоторой окрестности. Например, водная поверхность обычно получается очень темной по сравнению с сушей, и общее изменение контраста ухудшит читаемость изображения либо на суше, либо на воде. В таких случаях используется кусочно-линейное преобразование контраста. Для тех же целей может использоваться и адаптивный фильтр, меняющий контраст в зависимости от того, какую среднюю яркость имеют пикселы в пределах "скользящего" по снимку окна.

Если съемка ведется в нескольких зонах спектра, то для получения большего динамического диапазона может применяться преобразование главных компонентов. Вполне очевидно, что между спектральными зонами может иметься некоторая корреляция. Тогда значения пикселов в каждой зоне можно представить как линейные комбинации некоторых других, некоррелирующих виртуальных зон. Преобразование главных компонентов, заимствованное из факторного анализа, и вычисляет эти некоррелирующие переменные. Главные компоненты не соответствуют ни одной зоне спектра, это искусственные переменные, первая из которых несет максимум яркостной информации, вторая - максимум после удаления первого компонента и т. д. Не теряя информацию и не увеличивая ее избыточность, можно создать столько компонентов, сколько есть спектральных зон. На практике в последних компонентах обычно оказывается только шум, а вся полезная информация - в нескольких первых. Таким образом, это преобразование позволяет уменьшить число отдельных каналов в изображении, то есть, по сути, сжать его.



Многозональная съемка ведется уже многие годы, и исследователи накопили большой объем эмпирических знаний. Уже хорошо известно, какие соотношения яркости в различных зонах спектра соответствуют растительности, обнаженной почве, водным поверхностям, урбанизированным территориям и другим распространенным типам ландшафта. Выразив эти соотношения в виде линейных комбинаций различных зон, мы получим так называемые индексы. Так, например, имея зону видимой красной (К) и ближней инфракрасной части спектра, мы можем построить нормализованный вегетационный индекс (NDVI), показывающий наличие растительности и "состояние ее здоровья". Нужно взять для каждого пиксела снимка отношение разности значений в этих зонах к их сумме: NDVI = (ИК-К)/(ИК+К). Для растительности значение NDVI обычно находится в интервале 0,1-0,6 (чем больше значение, тем лучше здоровье растительности). Облака, снег и водные поверхности дают отрицательное значение индекса. Они отражают больше излучения в видимой красной части спектра, чем в инфракрасной. Камни, обнаженная почва и антропогенные объекты дают значение индекса около нуля. Подобные индексы можно построить и для определения влажности почвы и растительности, типов почв, содержания некоторых минералов и т. д. (фото 1).

Привязали намертво

Одной из важнейших характеристик данных ДЗ является их географическая привязка. Это значит, что для каждого пиксела привязанного снимка мы можем определить его географические координаты. Для того чтобы такое было возможно, нужно выполнить несколько этапов геометрической коррекции изображения: устранить искажения, обусловленные центральной проекцией, используемой при съемке, и внутренней геометрией сенсора; устранить искажения, обусловленные рельефом; "переложить" исходные пикселы растра на сетку проекции, используемой при анализе (например, в проекцию карты, анализируемой совместно со снимком).

Для каждого типа сенсора известна математическая модель присущих ему искажений. Например, для фотокамеры это радиальная дисторсия объектива и деформация фотопленки. А для сенсоров, использующих линейки ПЗС, искажения имеют не центральную, а осевую симметрию. Искажения из-за рельефа местности (при центральном проецировании) можно представить на примере предельного случая - высоких зданий. Смотря на них не строго вертикально, мы можем увидеть не только крыши, но и стены, причем чем дальше здание от центра изображения, тем большую площадь на снимке будут занимать стены. Карты же и фотопланы строятся так, будто в каждой точке мы смотрим строго вертикально. В этом случае все вертикальные поверхности должны превратиться в линии, и такое изображение будет уже не в центральной, а в ортогональной проекции. В меньшей степени такие искажения присущи любому снимку с более или менее выраженным рельефом, а для горных районов они могут быть очень велики. Чтобы их устранить, нам нужно в каждой точке поверхности знать не только горизонтальные координаты, но и высоту, иными словами, нам нужна цифровая модель рельефа (ЦМР). Соответственно геометрическая коррекция с использованием ЦМР называется ортотрансформированием.

Получить ЦМР можно разными путями, например, проведя топографическую съемку на местности или взяв горизонтали с имеющихся топографических карт. Но эти пути так или иначе используют традиционные ручные средства получения ЦМР, в то время как источником данных для построения ЦМР могут служить сами снимки. Человеческое зрение обладает стереоэффектом, то есть по очень небольшим различиям двухмерных картинок, воспринимаемых левым и правым глазом, наш мозг может оценивать расстояние до объектов, находящихся в поле зрения. Такие пары изображений называются стереопарами, а явление, обуславливающее различия между ними, - параллаксом.

Подобную ситуацию можно воспроизвести и при съемке. Если снять одну и ту же территорию с двух недалеко отстоящих друг от друга точек, мы также получим стереопару. И в области перекрытия изображений сможем получить третью координату. Таким образом, по двум плоским изображениям можно получить одно объемное.

Этот способ известен давно. Именно так создавались традиционные топографические карты на основе аэрофотоснимков. Дисциплина, занимающаяся этими вопросами, называется фотограмметрией. Сейчас, с ростом мощности компьютеров, интенсивно развивается цифровая фотограмметрия. Теперь уже можно обойтись без аналоговых (механических) устройств и носителей: изображение может получаться цифровым сенсором, обрабатываться целиком на компьютере, с цифровой моделью рельефа и с картами в цифровом представлении на выходе. Опять же, отпадает надобность в сканировании и оцифровке с присущими им искажениями и дороговизной.



Тем не менее, и на компьютерах не забыт стереорежим. Для его организации на экран одновременно выводятся особым образом смешанные картинки стереопары и с помощью специальных очков разделяются для левого и правого глаза. Это позволяет дешифрировать снимки в стереорежиме, а также создавать целые виртуальные миры. Хотя последние сегодня ассоциируются главным образом с компьютерными играми, эффективность представления информации в них ценна и для многих пространственных задач в географии, геологии, строительстве, военном деле и других областях (фото 2а: в планировании лесопосадки; 2б: в организации полетов).

по классам разобрали

При одном и том же масштабе карта и снимок местности выглядят по-разному. Снимок, конечно, содержит гораздо больше деталей, но понять, что есть что на нем, может только специалист. Карты же являются некоторым условным, упрощенным изображением местности. Их может понять практически каждый. То есть и карты, и снимки обладают своими преимуществами. По снимкам можно обновлять старые и составлять новые карты. Это можно делать как ручным дешифрированием (обводкой контуров объектов), так и автоматическим или полуавтоматическим (классификацией). Понятно, что рисовать контуры вручную долго и дорого. Но такой подход позволяет сразу отбирать то, что должно быть показано на карте, максимально использовать знание местности и опыт специалистов по дешифрированию для получения наиболее точных результатов. С другой стороны, классификация, выполняемая компьютером, гораздо быстрее и дешевле, кроме того, она позволяет накапливать и использовать формализованные знания по дешифрированию. Они могут представляться в качестве так называемых эталонов, которые содержат соотношения яркостей в различных зонах спектра, соответствующие различным объектам и типам ландшафта, таким как растительность, открытый грунт, водоемы и т. д. В результате классификации получаются тематические растровые карты, которые могут быть использованы сами по себе или автоматически преобразованы в векторную форму (фото 3а: исходное изображение; 3б: растровая карта растительности).



Классификация может выполняться автономно и с обучением. В первом случае программа пытается самостоятельно выявить классы объектов на изображении, ничего не зная о том, что эти классы представляют собой в действительности. Подобно тому, как наш зрительный аппарат выделяет на изображении более или менее однородные области, проводя воображаемые границы между ними, так и программа, используя методы кластерного анализа, выявляет такие области, и от пользователя требуется лишь указать количество желаемых классов. Такая классификация часто используется для первичной оценки данных.

Поскольку автономная классификация основывается исключительно на статистическом распределении пикселов в спектральном пространстве, получаемые результаты редко бывают пригодны для дальнейшего анализа. Например, если на снимке присутствуют объекты, занимающие очень малую часть его площади, то представляющие их пикселы с большой вероятностью будут поглощены другими, более "населенными" классами пикселов. Чтобы выделить все интересующие нас классы, нужно научить программу отличать их друг от друга. Это делается в процессе создания эталонов. Оператор выделяет на снимке объекты, относящиеся к определенному классу, а программа определяет и запоминает области спектрального пространства, занимаемые пикселами этих объектов. Создав набор эталонов, его можно сохранить и использовать в дальнейшем для автоматической классификация всего снимка, а также классификации других подобных снимков. Имея дело с гиперспектральными данными, можно создавать эталоны на основе спектрограмм, собираемых в библиотеки, распространяемые, например, Геологической службой США или другими организациями. Вы можете также собирать собственные библиотеки эталонов - современные системы обработки данных ДЗ имеют для этого соответствующие средства.

В настоящее время развиваются новые методы классификации, основанные на нейронных сетях и статистическом моделировании.

 
Новый век изобразительной информации
Вадим Иванченко, Марина Ермошкина

Лори Э. Джордан

(Lawrie E. Jordan), Президент компании ERDAS (Earth Resources Data Analysis System), которая, по некоторым оценкам, удерживает 60% рынка программного обеспечения обработки данных дистанционного зондирования.


Г-н Джордан, на фоне стремительного роста численности спутников дистанционного зондирования можно ли сказать, что мир информационных технологий сегодня переживает страстное увлечение данными космической съемки, особенно высокодетальной? Как вы считаете, это скоротечный флирт или всерьез и надолго?

- Снимки высокого разрешения были доступны правительственным чиновникам в течение многих лет и продолжают служить им в качестве основного источника информации для осуществления государственной политики, различных программ и укрепления национальной безопасности. Доступность изображений такого же качества для мира коммерции очень впечатляет. Они обладают огромным потенциалом для коренного преобразования индустрии географических информационных систем - ГИС. Экономическая безопасность государства все больше и больше приравнивается к безопасности национальной, поэтому возможности, предоставляемые коммерческими снимками высокого разрешения для решения задач в сфере экономики, могут значительно упрочить национальную безопасность многих стран. Россия и США имеют счастье быть лидерами в этой области.

Почти за тридцать лет коммерческого применения методов дистанционного зондирования Земли качество изображений увеличилось в сотни раз. Какие возможности открывает новинка прошлого года - изображения метрового разрешения? Каковы, на ваш взгляд, предельные значения разрешения снимков, которые могут быть востребованы рынком, и каковы возможные применения таких данных?

- Недостаточная разрешающая способность снимков не является проблемой с того времени, как была разработана аппаратура, позволяющая получать изображения с разрешением меньше одного метра. Использование снимков высокого разрешения диктуется практическими соображениями и финансовыми возможностями. Реальная же потребность в этих данных определяется конкретными задачами и не должна диктоваться исключительно стремлением к наиболее детальным данным, поскольку избыточный объем данных затрудняет их передачу и хранение. Наш опыт показывает, что для создания большинства ГИС и широкого спектра картографических приложений вполне достаточно разрешения в один метр. Однако, для решения многих инженерных приложений, таких, например, как строительные и земляные работы, требуются снимки с разрешением 0,3 метра и лучше. В некоторых военных задачах, для которых необходима точная идентификация конкретного типа транспортного средства или системы вооружения, требуется более высокое разрешение снимка, но для очень небольшой области или объекта наблюдения. Для изучения процессов в глобальных масштабах во многих случаях оказывается достаточным разрешение в один километр, но при больших площадях съемки.

В ближайшей перспективе - использование гиперспектральных датчиков изображения. Что они дадут пользователю, есть ли трудности в обработке таких данных и каков будет ответ ERDAS?

- Гиперспектральные данные обладают огромным потенциалом для решения очень сложных проблем. Чтобы правильно, легко и быстро извлечь полезную информацию из гиперспектральных изображений требуется совершенно новое программное обеспечение. Есть два подхода к решению этой проблемы, которые, как мы считаем, будут наиболее уместными при работе с гиперспектральными данными. Первый подход заключается в том, что пользователь выбирает объект на изображении и запрашивает библиотеку гиперспектральных эталонов для поиска соответствующего эталона. Второй подход состоит в том, что пользователь выбирает эталон или группу эталонов, затем просматривает изображение с тем, чтобы определить присутствие на нем выбранных материалов. Для реализации этих возможностей ERDAS планирует сотрудничать со своими стратегическими бизнес-партнерами в России, а именно с компанией "Дата+" и "НПО Машиностроения".

Каковы пути интеграции программного обеспечения ГИС и обработки данных дистанционного зондирования?

- В 1978 году компания ERDAS создала первую недорогую коммерческую компьютерную систему, которая объединяла в себе ГИС и обработку данных дистанционного зондирования. Это и была наша точка зрения на то, что дистанционное зондирование является одним из компонентов ГИС или того, что мы называем системой географических изображений - Geographic Imaging System. К примеру, наш основной продукт ERDAS Imagine включает в себя модель данных ГИС ArcInfo, встроенную в архитектуру нашего программного обеспечения. Мы считаем, что и в будущем каждая ГИС должна содержать в себе необходимый компонент - данные дистанционного зондирования, и верим, что в новом веке изобразительной информации карта будет являться "интеллектуальным" изображением.

Как вы думаете, станет ли когда-нибудь возможным применение данных и методов дистанционного зондирования массовым потребителем, например для обработки данных бытовыми фото- и видеокамерами?

- В будущем ERDAS ориентируется на потребителей, не являющихся техническими специалистами. В настоящее время мы работаем над созданием целого семейства новых продуктов, интегрирующих преимущества WWW, простой и ясный пользовательский интерфейс, а также поддержку широкого спектра "земных" стационарных и ручных видео- и фотокамер. Мы также считаем, что новые космические снимки высокого разрешения из таких источников, как "Совинформспутник", Space Imaging, и других компаний создают новый "персональный масштаб" изображения, который в дальнейшем расширит рынок для непрофессионального массового потребителя.


смоделировали

Последний вопрос обработки - моделирование. На самом деле он больше касается даже не обработки собственно данных ДЗ, а использования их и информационных продуктов на их основе в предметных областях. В качестве классического примера можно привести задачу выбора оптимального места для некоторого объекта, скажем, электростанции. Мы должны задать некоторые критерии, по которым программа выберет все подходящие места и покажет их на карте. Такими критериями может быть близость к водоемам (скажем, не далее 500 м), линиям электропередачи (до 2 км), ограничения по типу почвы (не песок), уклону (до 10%) и т. д. То есть, задавая эти ограничения, мы моделируем приемлемую для нас ситуацию. Подобного рода моделирование удобнее выполнять на растровых картах и, поскольку развитые программы обработки данных ДЗ имеют все необходимые для поддержки таких операций функции, вполне естественно использовать их на всем маршруте от первичной обработки полученных данных ДЗ до прикладного моделирования и подготовки графических результатов моделирования. Так, для приведенного здесь примера из исходной многозональной стереопары можно было бы получить цифровую модель рельефа, а из нее - карту уклонов. В результате классификации можно создать карту почв и карту гидрографии. Добавив сюда оцифрованные с обычной карты линии электропередачи, мы получим всю необходимую информацию для поиска места.



Рассмотрев моделирование, мы подошли к последнему вопросу обработки данных ДЗ - результатам этой обработки и их использованию. Как было показано выше, можно получить разнообразные информационные продукты - всевозможные тематические карты (как растровые, так и векторные), цифровые модели рельефа. ЦМР могут использоваться и в самом процессе обработки (при ортокоррекции), и в качестве самостоятельного продукта. Интересным и визуально привлекательным использованием ЦМР является создание реалистичных трехмерных изображений. Делается это "натягиванием" снимка или тематического растра на показываемый в перспективе рельеф. А такой продукт, как VirtualGIS компании ERDAS, позволяет задавать маршрут и различные параметры "пролета" над местностью, размещать на поверхности дополнительные объекты и даже записывать видеоролик с полученным "пролетом", который можно в дальнейшем воспроизводить на стандартном мультимедийном проигрывателе (фото 4).

В заключение можно отметить, что программные средства для работы с данными ДЗ прошли путь от узкоспециализированных программ до многомодульных систем, способных решать и многие смежные задачи. Для описания возможностей современных систем обработки данных ДЗ в статье в качестве примера рассматриваются функции программных продуктов компании ERDAS. Конечно, есть и другие продукты, реализующие многие из описанных здесь функций, такие как ER Mapper, ENVI, PCI, но я предпочитаю говорить о том, что знаю лучше всего. Да и недостаточно одной статьи для описания всех возможностей даже одной такой системы, и если они вас заинтересовали, обращайтесь к автору.



© ООО "Компьютерра-Онлайн", 1997-2021
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.