«Кафедра информационно-измерительных систем А.О. Потатуркин Исследование эффективности пространственных признаков при ландшафтной классификации по многоспектральным ...»
МИНОБРНАУКИ РОССИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«НОВОСИБИРСКИЙ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ» (НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ
УНИВЕРСИТЕТ, НГУ) Кафедра информационно-измерительных систем А.О. Потатуркин Исследование эффективности пространственных признаков при ландшафтной классификации по многоспектральным космическим изображениям
МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ
по направлению высшего профессионального образования 230100.68 ИНФОРМАТИКА И ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКАФАКУЛЬТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ
Тема диссертации утверждена распоряжением по НГУ № 8 от «11» января 2012г.Руководитель Борзов С.М.
кандидат технических наук Новосибирск, 2013г.
Содержание Введение
1 Анализ предметной области
1.1 Общие принципы теории классификации (критерии эффективности систем признаков при классификации)
1.1.1. Система признаков, классы, расстояние между классами
1.1.2 Спектральные и пространственные признаки, понятие текстуры
1.2 Классические методы сегментации
1.3 Пространственные признаки, используемые при обработке данных ДЗЗ
2 Программное обеспечение
2.1 Обзор
2.2 Методика обработки данных
2.2.1 Оценка эффективности признаков на основе обучающей выборки фрагментов. 2.2.2 Оценка эффективности признаков на основе бинароной маски изображения..... 2.3 Реализация методов оценки эффективности признаков
2.3.1 Характеристика программного пакета ENVI, его возможности и ограничения при проведении исследований
2.3.2 Программная реализация метода на основе обучающей выборки фрагментов.... 2.3.3 Реализация метода на основе бинароной маски изображения
3 Исследования эффективности признаков
3.1 Исследование на основе фрагментов изображения
3.2 Исследование на основе бинарной маски изображения
4 Метод комбинированной сегментации
4.1 Описание метода
4.2 Применение метода комбинированной сегментации
Заключение
Литература
ВВЕДЕНИЕ
Дистанционное зондирование Земли (ДЗЗ) в последние годы стало основным источником первичных данных определенной территории. ДЗЗ применимо при планировании градостроительства, исследовании протекания природных явлений и чрезвычайных ситуаций (лесные пожары, наводнения и т.д.), а также во многих других видах деятельности.С запуском в 1999 г. Искусственного спутника Земли (ИСЗ) IKONOS-2 стали доступны данные высокого разрешения. Обработка таких изображений является приоритетной задачей на сегодняшний день, т.к. стала возможной классификация гораздо более мелких объектов. Представителями ИСЗ с получаемыми данными высокого разрешения являются QuickBird, OrbView-3, Cartosat, WorldView, GeoEye-1. Наиболее распространенным из них является QuickBird [1]. Изображения, получаемые при помощи этого спутника, имеют пространственное разрешение до 2,4 м. Для сравнения, изображения, получаемые при помощи такого распространенного ИСЗ, как Landsat, имеют пространственное разрешение до 30 м.
Рисунок 1. Фрагменты снимков QuickBird (а) и Landsat (б) При ландшафтной классификации (разделении различных типов ландшафтов) спутниковых изображений перед исследователем встает вопрос: какие методы использовать для получения наилучшего результата на изображениях различного масштаба?
Основой обработки космических данных со времён запусков первых спутников являются попиксельные спектральные технологии. Традиционно, при попиксельном подходе в качестве признаков используются отсчеты изображений различных спектральных каналов. При этом наиболее простой (и достаточно распространенный) метод классификации заключается в сравнении соотношений данных каналов (индексов) для конкретного типа ландшафтов.
Однако применение только попиксельных спектральных признаков для решения задач ландшафтной классификации недостаточно эффективно и возникает необходимость использовать дополнительно пространственные признаки изображений (форму объектов, текстурные характеристики и т. п.).
Для просмотра и анализа спутниковых изображений используется ряд пакетов, одним из которых является ENVI. Данный пакет предоставляет возможность введения пользовательских функций при помощи встроенного языка IDL.
Целью данной работы является исследование эффективности применения пространственных признаков при ландшафтной классификации спутниковых изображений высокого разрешения.
Для достижения поставленной цели необходимо решить следующие задачи:
1) Провести анализ пространственных (статистических и структурных) признаков и выделить наиболее представительные группы для разделения природных и антропогенных ландшафтов 2) Разработать архитектуру ПО, оценивающего эффективность признаков и 3) Провести исследование эффективности признаков в зависимости от масштаба спутниковых изображений Работа состоит из четырех глав. В первой главе представлены общие принципы сегментации изображений и анализ пространственных признаков. Вторая глава посвящена разработке и реализации ПО, предназначенного для исследования эффективности признаков. В третьей главе приводятся результаты исследования эффективности пространственных признаков при разделении антропогенных и естественных территорий.
В четвертой главе предложен метод локально-адаптивной сегментации спутниковых изображений высокого пространственного разрешения, основанный на предварительном выделении антропогенных территорий с использованием структурных признаков.
1.1 Общие принципы теории классификации (критерии эффективности систем 1.1.1. Система признаков, классы, расстояние между классами Существенным препятствием на пути широкого применения данных ДЗЗ высокого разрешения является отсутствие подходящего инструментария для автоматизированного анализа и интерпретации. В частности, одним из принципиальных этапов при обработке данных ДЗЗ является их сегментация. Сегментация проводится с целью разделения изображения на сегменты, содержащие однотипные по своим визуальным характеристикам пиксели и в своей совокупности покрывающие все изображение.
Каждому пикселю присваивается некоторая метка (номер сегмента, к которому он отнесен) с формированием так называемой картосхемы изображения. Как правило, предполагается, что пиксели одного сегмента относятся к одинаковым типам поверхности и последующий анализ существенно упрощается.
Опишем общие признаки теории классификации. Будем предполагать, что существует известное множество С = {Ci}, состоящее из k взаимно исключающих классов (образов) объектов. Каждый объект представляем набором результатов измерений выбранных признаков (x1i, x2,..., xm)t = х, называемых его описанием. Таким образом, описание объекта это точка (вектор) х в m-мерном пространстве признаков Rm.
Процедурой классификации объектов является процедура, относящая объект к классу Ci тогда и только тогда, когда его описание х попадает в область R i пространства Rm, соответствующую этому классу. Такая процедура классификации корректна, если объект и в самом деле относится к классу Ci. Таким образом, процесс распознавания объектов включает процедуру классификации объектов (правило отнесения объектов к тому или иному классу) и процедуру распознавания образов (формирование классов объектов).
Пусть границы определяются, например, разделяющими функциями d 1(х), d2(x),..., dk(x). Если di(x) dj(x) для всех j i, то объект х принадлежит классу Ci.
Если кластеры, соответствующие различным классам, разнесены достаточно далеко друг от друга, то с успехом можно воспользоваться простыми схемами распознавания, например такими, как классификация объекта по расстоянию от центра тяжести кластеров или по «среднему расстоянию» до всех элементов обучающей выборки соответствующих им образов и т. п.
В целом проблема классификации данных ДЗЗ состоит из двух частей: обучения и сегментации. Обучение осуществляется путем показа отдельных объектов с указанием их принадлежности тому или другому классу. В результате обучения распознающая система должна приобрести способность реагировать одинаковыми реакциями на все объекты одного класса и различными — на все объекты различных классов. Процесс обучения должен основываться исключительно на использовании ограниченного числа объектов без каких-либо дополнительных данных. В качестве объектов обучения в данной работе используются фрагменты спутниковых изображений. Важно, что в процессе обучения указываются только сами объекты и их принадлежность классу. За обучением следует процесс сегментации, который характеризует действия уже обученной системы.
Автоматизация этих процедур и составляет проблему классификации данных ДЗЗ.
1.1.2 Спектральные и пространственные признаки, понятие текстуры Человек использует для интерпретации изображений как спектральную, так и текстурную информацию. Спектральные признаки описывают изменение тона серых изображений, в то время как пространственные отражают пространственное распределение этой информации, содержащей два вида пространственных отношений.
Одно отношение это изменение тона на объекте интереса, оно представляет его структуру, в то время как другое измеряет широкомасштабное соотношение между анализируемым объектом и остальной сценой. Обычно, слова текстура и контекст используются для представления этих двух форм пространственного отношения.
Спектральные и текстурные (пространственные) признаки взаимозависимы.
«Текстура и тон неотделимы друг от друга. Тон и текстура всегда представлены в изображении, хотя свойства одного могут доминировать над другим иногда» [2] в зависимости от тонкости или грубости поверхности объекта и разрешения изображения относительно поверхностной шероховатости объекта. Если изменение тона внутри ограниченного диапазона относительно мало, спектральная информация будет доминировать. Например, изображение может включать области относительно постоянного тона, такие как водные объекты или бетонные площадки. Наоборот, если изменение тона большое и имеется выразительная структура, тогда текстура будет доминировать, как на изображении каменистой зоны, территориях поселений и некоторых видах облаков.
Основой обработки космических данных со времён запусков первых спутников являются попиксельные спектральные технологии. Анализ спектрального отклика различных участков земной поверхности в сочетании с данными наземных измерений, землепользования, контроля пожарной опасности, прогноза урожаев и т.п.
Традиционно, при попиксельном подходе в качестве признаков используются отсчеты изображений различных спектральных каналов. Однако применение только попиксельных спектральных признаков для решения задач ландшафтной классификации недостаточно эффективно и возникает необходимость использовать дополнительно пространственные признаки изображений (форму объектов, текстурные характеристики и т.п.). Существует подход к формированию систем пространственных признаков на основе оценки параметров локальной окрестности каждого пикселя скользящим окном с помощью стандартных преобразований (анализ пространственных частот, гистограмм пространственной разности яркостей, матриц смежности и т.п.) [3-5].