五讲遥感影像分类

资源描述

遥感数字图像的计算机分类遥感数字图像的计算机分类遥感数字图像的分类方法分类执行方式：监督分类、非监督分类分类模型或分类器：统计分类、模糊分类、邻域分类、神经网络分类等、混合像元分解。监督分类，又称训练分类法，即用被确认类别的样本像元去识别其他未知类别像元的过程。已被确认类别的样本像元是指那些位于训练区的像元。在这种分类中，分析者在图像上对每一种类别选取一定数量的训练区，计算机计算每种训练样区的统计或其他信息每个像元和训练样本作比较，按照不同规则将其划分到和其最相似的样本类。非监督分类，也称为聚类分析或点群分析。即在多光谱图像中搜寻、定义其自然相似光谱集群组的过程。非监督分类不需要人工选择训练样本，仅需极少的人工输入计算机按一定规则自动地根据像无光谱或空间等特征组成集群组，然后分析者将每个组和参考数据比较，将其划分到某一类别中去。模糊分类模糊分类：前面讲到的各种分类方法都是假设每个像元只能被归入一个类型中像元和类型之间只能是一对一的关系。但在事实上，由于遥感图像分辨率及其他因素的影响，图像中的像元所对应的地面实体并不只是一个类别，面是二个或二个以上类别的混合体。模糊分类就是允许根据其混合类型的百分比将一个像元归到几个类型。如果一个像元50是草地、20是房屋、30是道路则在模糊分类中，这个像元属于这三种类型的成分分别为0.5、0.2和0.3。算法包括两个主要步骤:对来自模糊训练数据的模糊参数的估计;对光谱空间的模糊划分。这可以鉴别混合象元中各组分覆盖类型的不完全隶属性以及产生更精确的统计参数,从而达到更高的分类精度。空间结构纹理分类空间结构纹理分类：单纯的光谱分类器只考虑图像的光谱特征，但在实际景观中，由于地物是具有一定空间结构特征的，如城市的居住区多是由树木、草地、道路、房屋顶、停车地等组成的。因此在分类中，利用其空间特征纹理的差异可以比较容易地区分不同类型，而单纯的亮度信息则不一定能很好地区分不同类型。空间结构分类器主要是利用一些测量空间纹理结构的函数得到新的层。一般这些函数都是利用一定的窗口测量像元和其周边像元之间的关系，比如说在5x 5窗口内像元之间的方差、空间相关系数等，将这些层加到原始图像的光谱层中从而对混合图像进行分类。纹纹理特征：中值理特征：中值(Mean),协方差协方差(Variance),同质性（或称为逆差同质性（或称为逆差距）距）(Homogeneity),反差反差(Contrast),差异性差异性(Dissimilarity),熵熵(Entropy),二阶距二阶距(Angular Second Moment),自相关自相关(Correlation)。用于分类的辅助数据用于分类的辅助数据：辅助数据是指用于帮助因像分析和分类的非图像信息，包括航空像片、地图、备类专题图、野外考察、报告等。在数字化图像分析中，辅助数据通常是被转化成数字化的格式，如GIs中的各种地形图、土壤图、植被图等。数字化的辅助数据一般有两种使用方式，一是将辅助层简单地加到图像现有的光谱数据中、将辅助层看成是另一个单一的图像波段，并将这种复合的图像进行监督或非监督分类；二是使用分层分类策略，将光谱图像先进行分类，然后利用辅助数据将其分成几个层将每个层按照一定的规则重新分类或者精确化初始的分类结果。这种方法可以根据辅助数据将所研究的重点类别或者难以分类的类别孤立出来，允许复杂的分类算法有效地运用于这些类别中，从而提高分类精度。用于分类的辅助数据用于分类的辅助数据：利用辅助数据的一个主要障碍是辅助数据和遥感数据之间的不匹配。由于多数辅助数据并不是用来为遥感数据应用服务的，因此其数字化辅助数据对应的比例尺、分辨率、时间、精度以及记录格式很少和遥感图像相匹配。当其应用于遥感图像分类时，有时必须对其进行预处理，以保证其和图像之间的物理匹配。另外，哪种辅助数据也成为一个重要的决策问题。比如对于山区的植物分类，其地形高度、坡度和坡向是一些有用的辅助信息，帮助确定植被的类型。但在其他分类中，地形也许就不是一个关键的因素。虽然有人提倡尽可能多的利用所有相关辅助数据，但考虑到其中的时间和其他代价，这种提议显然并不是最好的。仔细地选择和决定重要的辅助数据应该是必需的。分类精度评价分类精度评价方法精度评价最好是比较两幅图像中每个像元之间的一致性。但在多数情况下，我们很难取得一整幅精确的参考图，因此大多数精度评价都是对图像采样的一部分像元进行评价，其参考类别可以通过野外考察、更详细的航空像片，或者其他来源的分类图上得到。通常把训练样本分为两部分，一部分用于分类，另一部分用于精度评价。1 采样方法采样设计应当采用概率采样以确保样本的代表性和有效性，使利用样本估计总体参数建立在可靠的基础之上。精度评价中有不同的采样方法，常用的概率采样方法包括简单随机采样、分层采样、聚点式集群采样以及系统采样等。不同的采样方法所采用的参数估计的具体形式和计算公式不同，它们各具有一定的优缺点。具体采用哪种方法，应考虑分类系统相应用目的的影响，依据精度评价的目的而定。1 采样方法 1)简单随机采样即在分类图上随机地选择一定数量的像元，然后比较这些像元的类别和其标准(或实际)类别之间的一致性。应用此设计，所有样本空间中的单元被选中的概率都是相同的。在此基础上所计算出的有关总体的参数估计也是无偏的。如果所研究区域内各种类型分布均匀，且面积差异不大，则简单随机采样应予以优先考虑。相反，如果地域内类型的空间分布不均匀，或出现空间上稀少并群集的类型，采用简单随机采样就有可能遗漏这些类型，或抽取不到足够数量的样本。2)分层采样当图像中某些类别占的数量很小时，随机采样往往会丢掉这些类别。为了保证每个类别都能在采样中出现，可以用分层采样即分别对每个类别进行随机采样。分层采样往往是为保证在采样空间或类型选取上的均匀性及代表性所采用的方法。如没有特殊需要，随机采样可取得较好的样本。但在野外调查或采样时有可能遇到一些困难，如是否能到达采样地点等；如在层内采用系统采样往往也可获得区域中具代表性的样本，且较容易进行野外作。1 采样方法 3)聚点采样聚点采样也是一种经常采用的较为经济的采样方法。聚点采样往往先在样本空间内抽取一定数量的主样本(每个主样本可以是一个多边形、一平方公里范围或一张航空像片等)，然后在每一个主样本内再抽取若干个二级样本作为地面实地考察的对象。比如在每个多边形或每张航片之内抽取一定数量的样本。这种采样方式能够在有限的空间范围内取得更多的样本，以利于野外调查和样本数据的收集。采样数量：用于精度评价的像无数量通常难以统一决定。但是对每个类别应有一定的数量保证，建议精度评价的每个类别至少有50个像元；当区域很大或者分类类别较多时，每类的最小数量应增加到75一100个；当然这个数量需要根据每个类别各占多少而有所调整。2 误差矩阵与精度估计量 2 误差矩阵与精度估计量 2 误差矩阵与精度估计量线性光谱混合模型几何光学模型随机几何模型概率模型模糊模型神经网络模型优点优点缺点缺点概率模型概率模型方法简单方法简单对于地形复杂区域不适用对于地形复杂区域不适用线性混合线性混合模型模型构模简单，物理含义明构模简单，物理含义明确，对解决像元内混合确，对解决像元内混合现象有一定效果现象有一定效果当端元选取不精确时会带来当端元选取不精确时会带来较大误差较大误差模糊分析模糊分析模型模型可操作性好，计算简单可操作性好，计算简单必须有高分便率数据为基础必须有高分便率数据为基础表表1 1 三种混合像元分解模型比较三种混合像元分解模型比较这些模型中，除几何光学模型和随机几何模型不适合于土地覆盖类型的混合像元分解，其他模型均可用于土地覆盖研究。比较而言，线性光谱混合线性光谱混合模型模型是建立在像元内相同地物都有同样的光谱特征以及植被指数线性可加性基础上的，其物理含义明确，理论上有较好的科学性，对于解决像元内的混合现象有一定的效果，且操作运算较简单、便利，因而被广泛应用。定义：定义：像元的光谱亮度值是由构成像元的基本组分或称为端元（像元的光谱亮度值是由构成像元的基本组分或称为端元（endmemberendmember）的光谱亮度值以其所占像元面积比例为系数的线性组合，可用下式表达：的光谱亮度值以其所占像元面积比例为系数的线性组合，可用下式表达：ikNkkiiCfR 111Nkkif2/112/)(iiNRMSiRkCiRMSkif：第第i i像元在像元在波段上的光谱反射值波段上的光谱反射值：第第k k个基本组分在个基本组分在波段的光谱反射值。波段的光谱反射值。：第：第波段第波段第i i像元对应的误差值。像元对应的误差值。：i i像元中第像元中第k k个组分所占的分量个组分所占的分量：均方根误差图像均方根误差图像（1）1 1、线性混合光谱模型定义线性混合光谱模型定义（1 1）Endmember Endmember 类型的确定类型的确定（2 2）EndmemberEndmember的代表值的代表值（3 3）最佳波段选择）最佳波段选择2 2、关键问题关键问题通道光谱范围119nm通道，2036m通道信噪比NET主要用途分辨率(m)1620670128陆地、云边界25028418762012503459479243陆地、云特征5004545565228500512301250745006162816522755007210521351105008405420880海洋水色、浮游植物、生物地理、化学同上1000943844883801000104834938021000115265367541000125465567501000136626729101000146736831087100015743753586100016862877516100017890920167大气水汽100018931941571000199159652501000203.6603.8400.05地球表面和云顶温度1000213.9293.9892.001000223.9293.9890.071000234.0204.0800.07同上1000244.4434.4980.25大气温度1000254.4824.5490.251000261.3601.3901504卷云、水气1000276.5356.8950.251000287.1757.4750.251000298.4008.7000.051000309.5809.8800.25臭氧10003110.78011.2800.05地球表面和云顶温度10003211.77012.2700.0510003313.18513.4850.25云顶高度10003413.48513.7850.2510003513.78514.0850.2510003614.08514.3850.351000MODIS是当前世界上新一代“图谱合一”的光学遥感仪器，具有36个光谱通道，分布在0.414m的电磁波谱范围内，波谱范围和主要用途如表4.1所示。MODIS的空间分辨率分别为250m，500m和1000m，扫描宽度为2330km，在对地观测过程中，每秒可同时获得6.1Mb的来自大气、海洋和陆地表面信息。多波段数据可以同时提供反映陆地、云边界、云特性、海洋水色、浮游植物、生物地理、化学、大气水汽、地表温度、云顶温度、大气温度、臭氧和云顶高度等特征信息，用于地表、生物圈、固体地球、大气和海洋进行长期观测表表2 2 各种端元提取算法比较各种端元提取算法比较1.1 1.1 提取端元方法提取端元方法：1 1、提取端元提取端元：PPI分析是目前应用比较广泛，而且比较成功的方法，主要缺点是具有监督性，需要操作人员具备丰富的先验知识，类别确定困难。PPIPPI认为图像数据集合是在认为图像数据集合是在N N维空间维空间中形成的一个凸集，像素向量是在中形成的一个凸集，像素向量是在N N维维空间上的矢量。首先通过最小化噪声的空间上的矢量。首先通过最小化噪声的方法（方法（MNF)MNF)对数据进行降维，接着生成对数据进行降维，接着生成大量穿过数据集合内部的随机的测试向大量穿过数据集合内部的随机的测试向量量,然后将光谱点分别往各个测试向量然后将光谱点分别往各个测试向量上投影上投影,投影的结果投影的结果,用一个确定门限用一个确定门限选出在这个方向上的极值点选出在这个方向上的极值点,如图如图 (在在这里举的是二维空间的例子这里举的是二维空间的例子)。随着向。随着向量方向的不断变化量方向的不断变化,记录下图像中每个记录下图像中每个像素作为极值点的次数像素作为极值点的次数,最后认定出现最后认定出现频率最高的点就是我们要找的纯点。频率最高的点就是我们要找的纯点。图图2 PPI2 PPI示意图示意图1.1 1.1 提取端元方法提取端元方法：MNF(MNF(最小噪声分离最小噪声分离)变换对数变换对数据进行降维，它是同主分量变换相据进行降维，它是同主分量变换相似的一种方法，它被用来分离数据似的一种方法，它被用来分离数据中的噪声，确定数据内在的维数，中的噪声，确定数据内在的维数，减少随后处理的计算量。减少随后处理的计算量。图图3 MNF3 MNF变换图变换图从波段能量变化直方图，也可从波段能量变化直方图，也可以看出，以看出，1 1波段到波段到2 2波段能量变化波段能量变化是最快的，是最快的，2 2到到3 3、3 3到到4 4次之，次之，4 4到到5 5到到6 6，能量变化最缓，而后面几，能量变化最缓，而后面几个波段的能量值也很小，所能利个波段的能量值也很小，所能利用的信息较少，噪声较多。用的信息较少，噪声较多。1.2 MNF1.2 MNF变换变换：图图5 端元反射光谱曲线图端元反射光谱曲线图图图4 端元散点图端元散点图1.3 PPI1.3 PPI提取端元提取端元：同时，在积雪分量图沿东西方向同时，在积雪分量图沿东西方向做一剖面，见积雪分量图中的东西向做一剖面，见积雪分量图中的东西向的红线，得到积雪盖度剖面图，该图的红线，得到积雪盖度剖面图，该图中显示左侧积雪盖度小，右侧积雪盖中显示左侧积雪盖度小，右侧积雪盖度大，约在度大，约在90%90%以上。以上。2 2 应用线性光谱模型计算雪盖系数（应用线性光谱模型计算雪盖系数（FRFR）：图图6 积雪分量图积雪分量图图图7 假彩色合成图假彩色合成图图图8 水平剖面图水平剖面图归一化差分积雪指数归一化差分积雪指数(NDSI)(NDSI)是基于雪对可见光与短是基于雪对可见光与短波红外波段的反射特性和反射差的相对大小的一种测量波红外波段的反射特性和反射差的相对大小的一种测量方法。方法。NDSINDSI类似于归一化植被指数类似于归一化植被指数(NDVI)(NDVI)，对大范围的，对大范围的光照条件不敏感，对大气作用可使其局地归一化并且不光照条件不敏感，对大气作用可使其局地归一化并且不依赖于单通道的反射，依赖于单通道的反射，是目前是目前MODISMODIS监测积雪通用的方监测积雪通用的方法，法，其基本运算如下其基本运算如下:NDSI=NDSI=（CH4-CH6CH4-CH6）/（CH4+CH6CH4+CH6）判断：判断：NDSI0.4 CH4NDSI0.4 CH4反射率反射率10%10%3 3、雪盖指数介绍、雪盖指数介绍：混合像元分解法与混合像元分解法与NDSINDSI相比，计算过程非常复杂，相比，计算过程非常复杂，需要大量的时间。需要大量的时间。可将雪盖指数法与混合像元分解法结可将雪盖指数法与混合像元分解法结合起来，合起来，探讨雪盖系数探讨雪盖系数(snow fractional)(snow fractional)与雪盖指数的与雪盖指数的关系，进一步探索雪盖指数是否能作为关系，进一步探索雪盖指数是否能作为MODIS 250mMODIS 250m的一的一个像元中积雪比例的标准，也就是个像元中积雪比例的标准，也就是用雪盖指数的值的大用雪盖指数的值的大小来判断一个像元中积雪所占比例，提高雪盖指数监测小来判断一个像元中积雪所占比例，提高雪盖指数监测积雪的精度。积雪的精度。4 4、雪盖指数（雪盖指数（NDSINDSI）与雪盖系数（）与雪盖系数（SF)SF)的关系的关系：SF=0.94 SF=0.94*NDSI+0.21 NDSI+0.21 R=0.97 R=0.97 图图9 9 雪盖指数与雪盖系数散点图雪盖指数与雪盖系数散点图 4 4、雪盖指数（雪盖指数（NDSINDSI）与雪盖系数（）与雪盖系数（SF)SF)的关系的关系：20052005年年1111月至月至20062006年年3 3月期间，在研究区选取了月期间，在研究区选取了2020处靶区，处靶区，进行了精确的进行了精确的GPSGPS定位，测量了积雪覆盖度，计算出对应点的雪定位，测量了积雪覆盖度，计算出对应点的雪盖指数，并带入公式中计算出雪盖系数，将二者进行对比，遥感盖指数，并带入公式中计算出雪盖系数，将二者进行对比，遥感计算所得的结果与地面实测数据的符合情况见下表：计算所得的结果与地面实测数据的符合情况见下表：图图10 10 野外实测点分布示意图野外实测点分布示意图 5 5、模型精度验证模型精度验证：NNDSI计算值计算值实测值实测值绝对误差绝对误差相对误差相对误差(%)10.6620.830.90.07820.6350.810.90.091030.530.710.70.01140.680.8510.151550.6160.790.80.01160.6230.80.80070.4640.650.60.05880.690.860.950.09990.6880.8610.1414100.6290.80.850.056110.420.60.600120.070.280.20.0840130.270.460.50.048140.360.550.50.0510150.4390.620.650.035160.6980.870.950.088170.320.510.50.012180.4560.640.70.069190.5560.730.70.034200.4940.670.70.034210.8821100220.5230.70.60.117230.6440.820.850.034240.7030.870.950.088250.420.60.50.120均值均值0.540.720.740.068.6表表3 3 雪盖系数误差分析表雪盖系数误差分析表 25个点的绝对误差的平均值是0.06，从上图中也可以看出，雪盖指数在0.40.8之间的实测值与计算值吻合情况较好，而当雪盖指数大于和小于这两个值时，会出现一些误差，但误差均值可以符合计算要求。v 因此，混合像元因此，混合像元的精确的精确分解是分解是提高大尺度提高大尺度农作物种农作物种植植面积面积遥感测量遥感测量精度精度的关键所在的关键所在以TM数据为样本，研究MODIS影像上终端像元提取技术，并进行精度分析。提取研究区MODIS影像的植被指数时序数据，采用线性光谱混合模型，分别进行混合像元分解。对冬小麦混合像元分解结果进行精度分析。技术路线图像预处理辐射校正和配准提取不同植被指数终端像元提终端像元提取技术研究取技术研究RED时序数据NIR时序数据DVI时序数据NDVI时序数据终端像元及类别端元精度评价混合像元分解混合像元分解冬小麦空间分布信息和面积精度验证精度验证线性光谱线性光谱混合模型混合模型Landsat TM 样本MODIS 影像从遥感影像上直接提取从遥感影像上直接提取对线性光谱分解模型来说，终端像元的确定起着关键性的作用。从遥感影像上直接提取终端像元 PPI分析是目前应用比较广泛，而且比较成功的方法，主要缺点是具有监督性，需要操作人员具备丰富的先验知识，类别确定困难。v 考虑以更高分辨率的考虑以更高分辨率的Landsat TMLandsat TM数据为数据为样本数据，结合样本数据，结合MODISMODIS影像数据影像数据PPIPPI分析结果以及其时间序列数据自身的特点来分析结果以及其时间序列数据自身的特点来解决单一解决单一MODISMODIS尺度上获取终端像元困难的问题尺度上获取终端像元困难的问题。PPI 分析示意图终端像元提取技术流程监督分类植被指数时序曲线象素积聚物候特征光谱特征终端像元范围2初始终端像元及其类别初始终端像元及其类别N维可视化维可视化终端像元结果Landsat TM 样本MODIS 影像终端像元范围1PPI分析MNF变换交集21EEE初其中，为基于PPI分析的终端像元范围1，为基于TM样本数据分类结果的终端像元范围2，为MODIS图像上的初始终端像元，其类别属性直接从TM样本分类结果继承。1E2E初E 基于PPI分析的终端像元范围E1MNF变换：判定图像数据内在的维数，分离数据中存在的噪声PPI分析：记录下图像中每个像素作为极值点的次数基于TM分类的终端像元范围E2TM图像分类：监督分类，提取地物类型象素积聚：将分类结果的空间分辨率从30米转换到250米，提取比率为100的像元，将其映射到相应的MODIS像元象素积聚示意图（a）为基于TM数据提取的终端像元的N维可视化散点图；（b）为基于MODIS影像PPI分析后提取的终端像元的N维可视化散点图；野外测量验证可分离性分析应用Jeffries-Matusita 距离和转换分离度对终端像元进行可分离性分析。混合像元分解结果反演验证混合像元分解结果反演验证研究区地理位置图 TM数据：选取的时相为2004年12月4日，该时相上草地、树木等植被均处于枯萎状态，光谱信息近似于裸地状态，影像上的绿色植被主要为冬小麦和极少量的菜类作物（包括蔬菜、油菜等），适合冬小麦提取。MODIS为2004年11月-2005年6月数据。根据影像质量，采用通道合成方法，将4，5，6，7四个时间通道的图像合成一个质量较好的、可代表这个时段的冬小麦生长状况的图像。RNIRRNIRNDVIRNIRDVI输入因子红光波段近红波段归一化植被指数差值植被指数简称REDNIRNDVIDVI计算公式物理意义对绿色植物强吸收对绿色植物高反射、透射植被生长状态及植被覆盖度的最佳指示因子适用于低中覆盖度的植被检测v其中其中NDVINDVI为非线性植被指数，为非线性植被指数，DVIDVI为线性植被指数为线性植被指数序号地物类型详细地物类型1目标作物冬小麦2非目标作物油菜大蒜其他菜地3建筑用地城镇用地居民点交通用地4裸地休耕地沙化地未利用地5水体水体6林地林地园地终端像元的类型PPI分析结果基于PPI分析的终端像元范围 v RED和NIR纯度指数图像在农作物区域被判定为纯像元的像素较少，而DVI和NDVI纯度指数图像上判定为纯像元的像素较多，说明DVI和NDVI突出了植被信息。v 四种纯度指数图像在居民建筑用地区域判定为纯像元的像素很少，这说明PPI分析会把建筑用地端元忽略掉，这种类型的端元需要直接从下面的TM分类结果得到。基于TM分类的终端像元范围基于TM影像的分类图和终端像元范围 v 对TM图像分类结果需进行野外调查精度验证，以确定结果的可用性。v 将两种终端像元范围进行叠加，取其交集作为初始终端像元，其类型属性继承自TM分类结果。其中建筑用地类型直接由TM得到。以四种MODIS时间序列影像数据作为混合像元分解因子，分别输入线性光谱混合模型中，进行混和像元分解。RMS图像小麦林地水体菜地建筑用地裸地NDVI终端像元组分图不同不同MODISMODIS时序数据冬小麦覆盖度图时序数据冬小麦覆盖度图数据类型冬小麦面积（平方公里）基于TM冬小麦面积（平方公里）总量精度像元精度RED时间序列数据13813.692880.6367.6%75.6%23639.882880.6373.7%77.5%32522.552880.6387.6%75.6%NIR时间序列数据13488.702880.6378.9%78.4%22642.932880.6391.8%81.5%33155.072880.6390.5%81.3%DVI时间序列数据13209.282880.6380.7%其中1 基于PPI分析2 基于TM样本3 基于本文应用的技术方法总量精度对比图一、概念一、概念决策树(Decision Tree),顾名思义就是一个类似于流程图的树型结构。一个决策树由一个根节点、一系列内部节点和分支以及若干个叶节点组成,每个内部节点只有一个父节点和两个或多个子节点。其中树的每个内部节点代表一个决策过程中所要测试的属性;每个分支代表测试的一个结果,不同属性值形成不同分支;而每个叶节点就代表一个类别,即图像的分类结果。树的最高层节点称为根节点,是整个决策树的开始。图1 就是一棵用于遥感影像分类的二叉决策分类器的简单示意图。从中可以看到决策树的基本组成部分:根节点、节点、分支和叶节点。一、概念一、概念决策树以其直观、清晰、计算效率高等特点受到遥感专家们的青睐。特别是,它在处理多维属性时,较传统的遥感分类方法有了一定的提高,它能利用除光谱特性以外的其他属性(包括相关的几何、纹理特性以及数字地形模型等背景信息),在图像处理的过程中确定各属性的重要程度,从而可以提取必要的属性进行分类。输入遥感图像输入遥感图像,确定图像待分区域中的主要地物类型确定图像待分区域中的主要地物类型;统计训练区内各地物类型的特征统计训练区内各地物类型的特征,包括光谱特征包括光谱特征,每个地类信每个地类信息各个波段的统计分析息各个波段的统计分析(均值、方差、协方差等均值、方差、协方差等)以及波段间各个地类以及波段间各个地类之间的可分性之间的可分性;还包括非光谱特征还包括非光谱特征:各个地类的几何信息各个地类的几何信息(形状、大小形状、大小等等)、高程信息、纹理信息等、高程信息、纹理信息等;根据根据步的统计分析步的统计分析,确定可分性最大的特征及波段确定可分性最大的特征及波段(或波段组或波段组合合)作为根节点作为根节点,选择分类器开始进行分类选择分类器开始进行分类;对上一步得到的每一个类别分别选择可分性相对较大的特征对上一步得到的每一个类别分别选择可分性相对较大的特征及波段及波段(或波段组合或波段组合)建立决策树的一个内部节点建立决策树的一个内部节点,依据不同属性值进依据不同属性值进行分类行分类;重复重复步的过程步的过程,递规的形成每个划分上的样本子决策树递规的形成每个划分上的样本子决策树,直直到出现下列情况之一到出现下列情况之一,停止递规停止递规:该节点上的所有像元属性值相同或没该节点上的所有像元属性值相同或没有剩余的属性能进行下一步的划分或分支中没有样本有剩余的属性能进行下一步的划分或分支中没有样本;检查分类结果是否满足确定的地物类型检查分类结果是否满足确定的地物类型,如果不能满足要求如果不能满足要求,需要对决策树进行调整需要对决策树进行调整,如剪枝或增加节点如剪枝或增加节点,直到建立一棵正确的决策直到建立一棵正确的决策树。树。应用一、基于应用一、基于TMTM数据及决策树的地物分类数据及决策树的地物分类实验选用的数据是徐州市1994 年卫星影像的截取图像,大小为338 列332 行,波段1 为94TM 图像中的BAND5、波段2 为BAND4、波段3为BAND3。具体步骤为:1)在图像中,根据地物、地貌色彩的差异选择4个感兴趣区。通过对感兴趣区可分性的计算(表1),可以看出这4 个区域之间的可分性系数Jeffried Matusita和Transformed Divergence都大于1.19,满足对感兴趣区的选择要求。因此,可以将这些区域作为分类的样本。应用一、基于应用一、基于TMTM数据及决策树的地物分类数据及决策树的地物分类确定分确定分类系统类系统分类方分类方法法分类特分类特征分析征分析与筛选与筛选最优波最优波段组合段组合选取训选取训练样本练样本初始分初始分类结果类结果波谱特波谱特征分析征分析基于决策树的基于决策树的分类后处理分类后处理应用二、基于应用二、基于SPOTSPOT数据及决策树的吐鲁番绿数据及决策树的吐鲁番绿洲土地利用分类洲土地利用分类分类流程分类流程土地利用现状调查技术规程土地利用现状调查技术规程将土地利用类型分为八大类将土地利用类型分为八大类别：耕地、园地、林地、牧草地、居民点及工矿用地、交通别：耕地、园地、林地、牧草地、居民点及工矿用地、交通用地、水域、未利用土地用地、水域、未利用土地。分类系统分类系统全国荒漠化普查地类划分表全国荒漠化普查地类划分表分类系统分类系统 SPOTSPOT原始波段、原始波段、K-L-1K-L-1、K-L-2K-L-2、DEMDEM、SLOPESLOPE、NDVINDVI、TC1TC1、TCTC2 2、TC3TC3、NDMINDMI、MNF-1MNF-1共共1414个波段作为分类特征个波段作为分类特征.土壤湿度特征选择湿度指数（土壤湿度特征选择湿度指数（NDMI）来表达，湿度指数）来表达，湿度指数NDMI 已成功地应用到生态环境中对土壤湿度的监测中。该已成功地应用到生态环境中对土壤湿度的监测中。该指数根据短波红外波段指数根据短波红外波段(相当于相当于SPOT的的Band4波段波段)受水吸收受水吸收带的影响，对湿度、含水量信息非常敏感，且绿波段带的影响，对湿度、含水量信息非常敏感，且绿波段(相当于相当于SPOT的的Bandl波段波段1对水体发射较高的特点，选用这两个波对水体发射较高的特点，选用这两个波段经标准化处理构建而成，表达式为：段经标准化处理构建而成，表达式为：NDMI=(Band1-Band4)/(Band1+Band4)分类特征分类特征最小噪声分离变换（最小噪声分离变换（MNF变换）变换）MNF(最小噪声分离)变换是同主分量变换相似的一种方法，它被用来分离数据中的噪声，确定数据内在的维数，减少随后处理的计算量。MNF实质上是两次层叠的主成份变换。第一次变换（基于估计的噪声协方差矩阵）用于分离和重新调节数据中的噪声。第一步操作使变换后的噪声数据只有最小的方差并且没有波段间的相关。第二步是对噪声白化数据(noise-whitened)的标准主成分变换。因此，它将数据空间分为两部分：一部分为大的特征值和相干特征影像；另一部分为近似为1的特征值和噪声占主导地位的影像。最后，经过MNF变换的数据，按最感兴趣到最不感兴趣的顺序排列出变换后的波段，感兴趣的信息处于前几个光谱波段中。分类特征分类特征最小噪音分离变换基于类间可分性的分类波段优化基于类间可分性的分类波段优化随着参与分类的像元矢量特征维度的增加，分类的代价也会相应的增加。因此，那些对光谱类别可分性贡献很小因而无助于分类识别的特征在进行分类的前应该被抛弃，这实际就是分类波段优化子集的确定问题。目前，有多种分类特征筛选及优化方法，如波段间相关性比较、最佳指数法（OIF）、各波段数据的信息熵和联合熵、协方差矩阵特征值法、波段指数法等。进行分类波段选优通常可以根据类间可分性来进行考量。基于类间可分性的方法首先选择各类的样本，然后通过样本的光谱值统计波段组合的地类光谱距离，最后计算所有地类间距离的平均值，并进行比较，平均距离值最大者，从总体说，地类间的可区别性越好，则波段组合最佳。所以从这里可以看出，同一研究区，相同的波段组合，由于不同的研究者选取的训练区不同，计算出的平均可分性会不同。常用的方法主要有Euclidean距离、离散度(Divergence)、转置离散度(Transformed Divergence)、Jeffries一Matusita(JM)距离等。基于类间可分性的分类波段优化基于类间可分性的分类波段优化在具体应用中应依据分类器的不同选择不同方法。如最大似然法分类器，在分类时不但考虑了变量协方差矩阵，而且要求地类光谱显正态分布，因此，选择Jeffries一Matusia(JM)法和转置离散度法进行特征影像组合的选择。如采用的分类器为最小距离法，则应采用Euclidean距离法。SPOTSPOT遥感影像原始波段、遥感影像原始波段、K-L-1K-L-1、T-C-1T-C-1、T-C-2T-C-2、T-C-3T-C-3和和DEMDEM组成的组成的9 9层组层组合分类效果最好合分类效果最好。基于类间可分性的分类波段优化基于类间可分性的分类波段优化表3.4 不同特征组合类别可分性（1 1）耕地、园林地、盐漠、水体、白板地、沙漠六种地物）耕地、园林地、盐漠、水体、白板地、沙漠六种地物分类效果很好，未与其它地物发生混淆；分类效果很好，未与其它地物发生混淆；（2 2）城镇居民地与砾石、裸岩发生混淆；）城镇居民地与砾石、裸岩发生混淆；（3 3）盐碱地与荒地发生较严重混淆，特别是轻度盐碱地与）盐碱地与荒地发生较严重混淆，特别是轻度盐碱地与荒地较难区分；荒地较难区分；（4 4）草地由于植被盖度不同与荒地发生混淆。）草地由于植被盖度不同与荒地发生混淆。初始分类结果初始分类结果地物光谱特征曲线地物光谱特征曲线决策树模型决策树模型地物 ndvi k-l tc1 tc2 tc3 NDMI MI Spot1 1 Spot2 2 Spot3 3 Spot4 4 DEM Slope MNF 最大-0.08 195.193.9.00 8.00 0.2878 135 109 103 150.5.26 -41.23 最小-0.382 134.126.-17.00 -10.00 0.0736 84 61 56 -95.01 0.14 -59.32 荒地均值-0.20 159.156.-4.43 -0.19 0.2055 105 87 80 29.12.20 -54.98 最大 0.02 168.167.-6.00 -18.00 0.18116 106 87 94 320.4.61 -55.32 最小-0.17 108.125.-20.00 -68.00 -0.07 72 67 63 48 -96.80 1.29 -42.32 草地均值-0.06 135.136.-8.59 -13.88 0.0460 85 75 52 101.2.27 -47.24 最大-0.191 129.81 127.00 3.00 4.00 0.311 50 89 77 51 590.72 5.54 -37.24 最小-0.43 76.23 85.00-12.00-2.00 0.04 21 49 48 31 528.24 3.01 -40.10 裸岩均值-0.26 100.68 102.41-4.47 0.91 0.204 35 66 59 39 551.72 4.63 -38.27 最大-0.213 204.57 199.00-5.00 2.00 0.283 76 142 113 78 459.01 2.73 -51.22 最小-0.382 123.87 123.00-22.00-6.00 0.112 44 78 76 45 0.00 0.74 -55.05 砾石均值-0.309 162.70 163.03-10.30-0.63 0.203 57 114 94 62 270.61 2.04 -52.83 最大-0.008 168.19 165.00 1.00 1.00 0.398 67 115 101 72 140.38 0.85 -40.01 最小-0.31 75.90 76.00-18.00-26.00 0.036 30 51 43 36-38.91 0.31 -47.61 城镇均值-0.21 120.86 124.44-8.41-8.27 0.227 51 79 71 45 28.26 0.62 -43.42 最大-0.19 188.60 191.00-4.00 8.00 0.324 65 133 110 81-11.29 2.44 -26.97 最小-0.38 156.09 155.00-18.00-7.00 0.049 52 108 90 61-150.00 0.10 -38.54 盐碱均值-0.28 168.08 165.09-9.61 2.67 0.193 57 108 97 72-115.51 0.79 -30.22 城镇居民地与砾石和裸岩在DEM特征波段具有明显的差异。城镇居民地主要分布于绿洲内部，地势较低。而砾石和裸岩主要分布于绿洲边缘及外围，地势相对较高。从表3.5可以看出，裸岩最大高程为590.72m，最小高程为551.72m，砾石最大高程459.01m，最小高程0m；而城镇居民地高程介于-38.91140.38m之间，因而通过设定阈值，将初次分类结果中裸岩和砾石高程小于140.38m的地物分离出来，将其定义为城镇居民地，即可完成城镇居民地提取。缨帽变换的前三个分量分别反映土壤的亮度、绿度和湿度特征。从表3.5可以看出，湿度分量tc3可以很好的将草地与荒地区相分离。草地在tc3特征波段上的值非常低，位于-18-68m之间，而荒地和盐碱地的特征值均高于-18，将初始分类的荒地和盐碱地中tc3-18的像元提取出来，将其划分为草地。最后一步就是荒地和盐碱地的划分。荒地和盐碱在最小噪声分离指数MNF上差异较大，从表3.5可以看出，荒地在MNF特征波段分布范围为-59.32-41.23，而盐碱地分布范围为-38.54-26.97，以-40为阈值，可以将两种地物分离开来。初始分类结果初始分类结果决策树模型决策树模型最小距离分类最小距离分类盐盐漠漠水水体体沙漠（重度风蚀荒漠化）沙漠（重度风蚀荒漠化）草草地地荒荒地地盐盐碱碱地地白白板板地地园园林林地地耕耕地地裸裸岩岩砾砾石石城镇居民地城镇居民地城城镇镇居居民民地地中度风蚀荒漠化中度风蚀荒漠化否否是是SPOT特征组合特征组合DEM140.38tc3-40是是否否盐碱地盐碱地荒地荒地（轻度风蚀荒漠化）（轻度风蚀荒漠化）最小距离分类最小距离分类盐盐漠漠水水体体沙漠（重度风蚀荒漠化）沙漠（重度风蚀荒漠化）草草地地荒荒地地盐盐碱碱地地白白板板地地园园林林地地耕耕地地裸裸岩岩砾砾石石城镇居民地城镇居民地城城镇镇居居民民地地中度风蚀荒漠化中度风蚀荒漠化否否是是SPOT特征组合特征组合DEM140.38tc3-40是是否否盐碱地盐碱地荒地荒地（轻度风蚀荒漠化）（轻度风蚀荒漠化）分类结果分类结果盐碱地城镇居民地轻度风蚀中度风蚀重度风蚀水体盐漠园林地耕地草地生产者精度用户精度盐碱地 71 3 4 8 3 0 0 2 1 6 0.86 0.72 城镇居民地 2 69 3 1 2 1 0 3 3 2 0.80 0.80 轻度风蚀 3 4 79 4 0 0 0 0 0 3 0.85 0.85 中度风蚀 2 1 1 166 5 0 2 0 0 5 0.91 0.91 重度风蚀 1 1 1 1 58 0 0 1 0 0 0.85 0.92 水体 0 2 0 0 0 50 0 3 0 0 0.98 0.91 盐漠 0 0 0 0 0 0 36 0 0 0 0.95 1.00 园林地 0 2 0 0 0 0 0 111 7 1 0.87 0.92 耕地 1 0 3 1 0 0 0 5 148 1 0.91 0.93 草地 3 4 2 2 0 0 0 2 3 91 0.83 0.85 合计 83 86 93 183 68 51 38 127 162 109 分类总精度 87.9%kappa系数0.86 盐碱地城镇居民地轻度风蚀中度风蚀重度风蚀水体盐漠园林地耕地草地生产者精度用户精度盐碱地 60 8 3 7 2 0 0 4 4 9 0.8 0.61 城镇居民地 2 56 2 6 3 3 0 1 6 5 0.68 0.66 轻度风蚀 3 4 98 4 0 0 0 0 1 4 0.88 0.85 中度风蚀 2 3 1 138 4 1 1 0 0 10 0.85 0.86 重度风蚀 1 4 3 3 46 0 0 2 0 0 0.82 0.77 水体 0 2 0 0 0 57 0 1 0 0 0.91 0.95 盐漠 0 0 0 0 0 1 40 0 0 0 0.97 0.97 园林地 2 1 0 0 0 0 0 86 9 3 0.83 0.85 耕地 1 0 2 3 0 0 0 8 158 2 0.84 0.91 草地 4 4 2 1 1 0 0 1 8 89 0.72 0.80 合计 75 82 111 162 56 62 41 103 186 122 分类总精度 82.8%kappa系数0.81 盐碱地城镇居民地轻度风蚀中度风蚀重度风蚀水体盐漠园林地耕地草地生产者精度用户精度盐碱地 41 6 5 10 5 0 0 2 4 7 0.69 0.51 城镇居民地 2 61 5 4 4 4 0 1 5 8 0.69 0.65 轻度风蚀 5 4 82 3 2 0 0 0 1 4 0.80 0.81 中度风蚀 2 3 2 100 3 1 0 0 0 3 0.77 0.88 重度风蚀 1 4 3 4 66 0 0 4 0 0 0.80 0.80 水体 0 3 0 0 0 65 0 1 0 0 0.92 0.94 盐漠 0 0 0 0 0 1 50 0 0 0 1.00 0.98 园林地 2 3 0 2 0 0 0 100 6 2 0.87 0.87 耕地 2 1 3 4 0 0 0 5 148 2 0.88 0.90 草地 4 3 2 3 2 0 0 2 5 108 0.81 0.84 合计 59 88 102 130 82 71 50 115 169 134 分类总精度 82.1%kappa系数0.807 SPOT 特征组合影像最小距离分类剩余影像未混淆地物建立决策树分类模型最终分类结果掩膜

展开阅读全文

五讲遥感影像分类

最新文档