资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第十章 地统计分析,主要内容,10.1,地统计基础,10.2,探索性数据分析,10.3,空间确定性插值,10.4,地统计插值,10.5,地统计图层管理,10.6,练习:,GDP,区域分布图的生成与对比,10.1,地统计基础,10.1.1,基本原理,10.1.2,克里格插值,10.1.3 ArcGIS,地统计分析,10.1.1,基本原理,地统计(,Geostatistics,)又称地质统计,它是以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或空间相关性和依赖性的自然现象的一门科学。凡是与空间数据的结构性和随机性,或空间相关性和依赖性,或空间格局与变异有关的研究,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性时,皆可应用地统计学的理论与方法。,地统计分析理论基础包括,:,前提假设,区域化变量,变异分析,空间估值,前提假设,:,前提假设,与经典统计学相同的是,地统计学也是在大量样本的基础上,通过分析样本间的规律,探索其分布规律,并进行预测。,平稳性,均值平稳,即假设均值是不变的并且与位置无关。二阶平稳,是假设具有相同的距离和方向的任意两点的协方差是相同的,协方差只与这两点的值相关而与它们的位置无关。,正态分布,在获得数据后首先应对数据进行分析,若不符合正态分布的假设,应对数据进行变换,转为符合正态分布的形式,并尽量选取可逆的变换形式。,区域化变量,当一个变量呈现一定的空间分布时,称之为区域化变量,它反映了区域内的某种特征或现象。 区域化变量具有两个显著特征:即随机性和结构性。首先,区域化变量是一个随机变量,它具有局部的、随机的、异常的特征;其次,区域化变量具有一定的结构特点,除此之外,区域化变量还具有空间局限性、不同程度的连续性和不同程度的各向异性等特征。,变异分析,1.,协方差函数,协方差又称半方差,表示两随机变量之间的差异。在概率论中,随机变量,X,与,Y,的协方差定义为:,其中,,Z(x,),为区域化随机变量,并满足二阶平稳假设,即随机变量,Z(x,),的空间分布规律不因位移而改变;,h,为两样本点空间分隔距离; 为,Z(x,),在空间点处的样本值;,是,Z(x,),在处距离偏离,h,的样本值,i=1,2,N(h,),;,N(h,),是分隔距离为,h,时的样本点对总数。,借鉴上式,地统计学中的协方差函数可表示为:,变异分析,2.,半变异函数,半变异函数又称半变差函数、半变异矩,是地统计分析的特有函数。区域化变量,Z(x,),在点,x,和,x+h,处的值,Z(x,),与,Z(x+h,),差的方差的一半称为区域化变量,Z(x,),的半变异函数,记为,r(h,),,,2r(h),称为变异函数。,根据定义有:,区域化变量,Z(x,),满足二阶平稳假设,因此对于任意的,h,有:,因此,半变异函数可改写为:,变异分析,半变异值的变化随着距离的加大而增加,协方差随着距离的加大而减小。这主要是由于半变异函数和协方差函数都是事物空间相关系数的表现,当两事物彼此距离较小时,它们应该是相似的,因此协方差值较大,而半变异值较小;反之,协方差值较小,而半变异值较大。,c(h,),图,10.2,协方差函数图,r(h,),图,10.1,半变异函数图,偏基台值,(Partial Sill),块金,(Nugget),基台值,(Sill),变程,(Range),距离(,h,),距离(,h,),偏基台值,(Partial Sill),块金,(Nugget),变程,(Range),基台值,(Partial Sill),),3.,变异分析,变异分析,4.,上图参数含义:,块金值(,Nugget,):理论上,当采样点间的距离为,0,时,半变异函数值应为,0,,但由于存在测量误差和空间变异,使得两采样点非常接近时,它们的半变异函数值不为,0,,即存在块金值。,变程(,Range,):当半变异函数的取值由初始的块金值达到基台值时,采样点的间隔距离称为变程。变程表示了在某种观测尺度下,空间相关性的作用范围,其大小受观测尺度的限定。在变程范围内,样点间的距离越小,其相似性,即空间相关性越大。当,hR,时,区域化变量,Z(x,),的空间相关性不存在,即当某点与已知点的距离大于变程时,该点数据不能用于内插或外推。,偏基台值(,Partial Sill,):基台值与块金值的差值。,基台值(,Sill,):当采样点间的距离,h,增大时,半变异函数,r(h,),从初始的块金值达到一个相对稳定的常数时,该常数值称为基台值。当半变异函数值超过基台值时,即函数值不随采样点间隔距离而改变时,空间相关性不存在。,空间估值:,空间估值过程,一般为:首先是获取原始数据,检查、分析数据,然后选择合适的模型进行表面预测,最后检验模型是否合理或几种模型进行对比。(如图所示),数据显示,数据检查,模型拟合,模型诊断,模型比较,1,3,2,4,5,图,10.3,空间估值流程图,克里格插值,克里格插值(,Kriging,)又称空间局部插值法,是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法,是地统计学的主要内容之一。,插值方法,插值方法按其实现的数学原理可以分为两类:一是确定性插值方法,另一类是地统计插值,也就是克里格插值。(如右图),空间插值,确定性插值,全局性插值:,全局多项式插值,局部性插值,径向基插值,地统计插值,反距离权插值,局部多项式插值,普通克里格插值,概率克里格插值,简单克里格插值,泛克里格插值,析取克里格插值,协同克里格插值,图,10.4,空间插值分类体系(数学原理),插值方法,空间插值方法根据是否能保证创建的表面经过所有的采样点,又可以分为精确性插值和非精确性插值。(如右图),空间插值,精确性插值,非精确性插值,反距离权插值,全局多项式插值,局部多项式插值,克里格插值,径向基插值,普通克里格插值,概率克里格插值,简单克里格插值,泛克里格插值,析取克里格插值,协同克里格插值,图,10.5,空间插值分类体系(表面是否经过所有的采样点),ArcGIS,地统计分析,探索性数据分析(,Explore Data,),地统计分析向导(,Geostatistical,Wizard,),生成数据子集(,Create Subsets,),探索性数据分析(,Explore Data,),数据分析工具可以让用户更全面地了解所使用的数据,以便于选取合适的参数及方法。如数据是否服从正态分布,是否存在某种趋势等,.,地统计分析向导(,Geostatistical,Wizard,),地统计分析模块提供了一系列利用已知样点进行内插生成研究对象表面图的内插技术。地统计分析向导通过完善的图形用户界面,引导用户逐步了解数据、选择内插模型、评估内插精度,完成表面预测(模拟)和误差建模。,生成数据子集(,Create Subsets,),就是将原始数据分割成两部分,一部分用来空间结构建模及生成表面,另一部分用来比较和验证预测的质量。,图,10.6,生成数据子集操作步骤,10.2,探索性数据分析,10.2.1,数据分析工具,10.2.2,检验数据分布,10.2.3,寻找数据离群值,10.2.4,全局趋势分析,10.2.5,空间自相关及方向变异,10.2.6,多数据集协变分析,数据分析工具,刷光(,Brushing,)与链接(,Linking,),直方图,Voronoi,地图,QQPlot,分布图,趋势分析,方差变异分析,刷光(,Brushing,)与链接(,Linking,),刷光指在,ArcMap,数据视图或某个,ESDA,工具中选取对象,被选择的对象高亮度显示。,链接指在,ArcMap,数据视图或某个,ESDA,视图中的进行选取对象操作,则在所有视图中被选取对象均会执行刷光操作。,直方图,直方图指对采样数据按一定的分级方案(等间隔分级、标准差分,等等)进行分级,统计采样点落入各个级别中的个数或占总采样数的百分比,并通过条带图或柱状图表现出来。,图,10.7,直方图示例,Voronoi,地图,Voronoi,地图是由在样点周围形成的一系列多边形组成的。某一样点的,Voronoi,多边形按下述方法生成:多边形内任何位置距这一样点的距离都比该多边形到其它样点的距离要将要近。,图,10.8,Voronoi,地图示例,QQPlot,分布图,QQ,图提供了另外一种度量数据正态分布的方法,利用,QQ,图,可以将现有数据的分布与标准正态分布对比,如果数据越接近一条直线,则越接近于服从正态分布。,QQ,图可分为以下两种:,1.,正态,QQPlot,(,Normal,QQPlot,)分布图,2.,普通,QQPlot(General,QQPlot,),分布图,正态,QQPlot,分布图,图,10.9,正态,QQPlot,图,普通,QQPlot,分布图,图,10.10,普通,QQPlot,图,趋势分析,空间趋势反映了空间物体在空间区域上变化的主体特征,它主要揭示了空间物体的总体规律,而忽略局部的变异。趋势面分析是根据空间抽样数据,拟合一个数学曲面,用该数学曲面来反映空间分布的变化情况。,图,10.11,趋势分析操作对话框,方差变异分析,1.,半变异协方差函数云,半变异协方差函数云表示的是数据集中所有样点对的理论半变异值和协方差,并把它们用两点间距离的函数来表示,用此函数作图来表示。,图,10.12,协方差变异分析操作对话框,方差变异分析,2.,正交协方差函数云,正交协方差函数云表示的是两个数据集中所有样点对的理论正交协方差,并把它们用两点间距离的函数来表示。,图,10.13,正交方差变异分析操作对话框,检验数据分布,在地统计分析中,克里格方法是建立在平稳假设的基础上,这种假设在一定程度上要求所有数据值具有相同的变异性。另外,一些克里格插值都假设数据服从正态分布。如果数据不服从正态分布,需要进行一定的数据变换,从而使其服从正态分布。因此,检验数据分布特征,了解和认识数据具有非常重要的意义。,寻找数据离群值,数据离群值分为全局离群值和局部离群值两大类。全局离群值是指对于数据集中所有点来讲,具有很高或很低的值的观测样点。局部离群值值对于整个数据集来讲,观测样点的值处于正常范围,但与其相邻测量点比较,它又偏高或偏低。,用直方图查找离群值,离群值在直方图上表现为孤立存在或被一群显著不同的值包围,直方图上最右边被选中的一个柱状条即是该数据的离群值,相应地,数据点层面上对应的样点也被刷光。但需注意的是,在直方图中孤立存在或被一群显著不同的值包围的样点不一定是离群值。,图,10.14,离群值的直方图查找和图面显示,用半变异,/,协方差函数云识别离群值,如果数据集中有一个异常高值的离群值,则与这个离群值形成的样点对,无论距离远近,在半变异,/,协方差函数云图中都具有很高的值。如下图所示,这些点可大致分为上下两层,对于上层的点,无论位于横坐标的左端或右端(即无论距离远近)都具有较高的值。刷光上层的一些点,右图是对应刷光的样点对。可以看到,这些高值都是由同一个离群值的样点对引起的,因此,需要对该点进行剔除或改正。,图,10.15,离群值的半变异,/,协方差函数云查找和图面显示,用,Voronoi,图查找局部离群值,用聚类和熵的方法生成的,Voronoi,图可用来帮助识别可能的离群值。熵值是量度相邻单元相异性的指标。通常,距离近的事物比距离远的事物具有更大的相似性。因此,局部离群值可以通过高熵值的区域识别出来。同样的原理,聚类方法也可将那些与它们周围单元不相同的单元识别出来。,图,10.16,离群值的,Voronoi,图查找,全局趋势分析,空间趋势反映了空间物体在空间区域上变化的主体特征,它主要揭示了空间物体的总体规律,而忽略局部的变异。趋势面分析是根据空间抽样数据,拟合一个数学曲面,用该数学曲面来反映空间分布的变化情况。,全局趋势分析,对比分析可以发现,左图显示采样数据在东西方向和南北方向具有微弱的,U,型趋势;右图显示采样数据在东南,-,西北方向具有明显的,U,型趋势,而在南北方向基本不具有任何趋势。,图,10.17,全局趋势分析对比图,全局趋势分析,趋势分析过程中,透视面的选择应尽可能采样数据在透视面上的投影点分布比较集中,通过投影点拟合的趋势方程才具有代表性,才能有效反映采样数据集全局趋势。左图反映的趋势显然要比右图要更为准确。,图,10.18,不同透视面选择的全局趋势分析对比图,空间自相关及方向变异,左图所示,,jsJDP2,中,GDP,采样值在空间基本不具有空间相关性,虽然在左侧有一个明显的突变局势,但它反映的采样点(右图中线段相连接的数据点)的连线距离过于短小,不具有实际意义。,图,10.19,空间自相关及方向变异分析和图面显示,空间自相关及方向变异,空间相关性也可能仅仅与两点间距离有关,这时称为各项同性。在实际应用中,各项异性现象更为普遍,也就是说,当考虑方向影响时,有可能在某个方向距离更远的事物具有更大的相似性,这种现象在半变异和协方差分析中成为方向效应。,图,10.20,空间自相关的各项同性(,a,)和各项异性(,b,),a,b,多数据集协变分析,下图是某地区,GDP,与人口的正交协方差云图。从图中可以看出,该地区人口数量和,GDP,的交叉相关性似乎并不对称,具有明显的西北,-,东南方向性。,图,10.21,多数据集协变分析,10.3,空间确定性插值,10.3.1,反距离加权插值,10.3.2,全局多项式插值,10.3.3,局部多项式插值,10.3.4,径向基函数插值,反距离加权插值,反距离权(,IDW Inverse Distance Weighted,)插值法是基于相近相似的原理:即两个物体离得近,它们的性质就越相似,反之,离得越远则相似性越小。它以插值点与样本点间的距离为权重进行加权平均,离插值点越近的样本点赋予的权重越大。,图,10.22,反距离权插值得到的表面图,全局多项式插值,整体插值方用研究区所有采样点的数据用一个多项式进行全区特征拟合。全局多项式插值法适用的情况有:,1.,当一个研究区域的表面变化平缓。,2.,检验长期变化的、全局性趋势的影响时一般采用全局多项式插值法。,图,10.23,全局多项式插值得到的表面图,局部多项式插值,局部多项式插值则采用多个多项式,每个多项式都处在特定重叠的邻近区域内。局部多项式插值法产生的表面更多地用来解释局部变异。,图,10.24,局部多项式插值得到的表面图,径向基函数插值,径向基函数插值法包括一系列精确的插值方法,所谓精确的插值方法就是指表面必须经过每一个已知样点。径向基函数包括五种不同的基本函数:平面样条函数,张力样条函数,规则样条函数,高次曲面函数和反高次曲面样条函数。,图,10.25,径向基函数插值得到的表面图,10.4,地统计插值,10.4.1,克里格插值基础,10.4.2,普通克立格插值,10.4.3,简单克立格插值,10.4.4,范克立格插值,10.4.5,指示克立格插值,10.4.6,概率克立格插值,10.4.7,析取克立格插值,10.4.8,协同克里格插值,克里格插值基础,1.,克里格方法概述,克里格方法(,Kriging,)又称空间局部插值法,是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法,是地统计学的主要内容之一。其实质是利用区域化变量的原始数据和变异函数的结构特点,对未知样点进行线性无偏、最优估计。无偏是指偏差的数学期望为,0,,最优是指估计值与实际值之差的平方和最小。,克里格插值基础,2.,克里格方法的具体步骤,导入数据,数据分析,是否服从正态分布,是,否,是否存,在趋势,否,是,数据变换,泛克里格方法,根据数据选择合适的方法,计算样点间的距离矩阵,计算样点间的属性方差,按距离分组,按组统计平均距离及对应的平均方差,绘制方差变异云图,绘制经验半变异函数图,拟合理论半变异函数图,计算克里格系数,进行预测,图,10.26,克里格方法流程图,克里格插值基础,3.,在克里格插值过程中,需注意以下几点:,(1),数据应符合前提假设,(2),数据应尽量充分,样本数尽量大于,80,,每一种距离间隔分类中的样本对数尽量多于,10,对,(3),在具体建模过程中,很多参数是可调的,且每个参数对结果的影响不同。如:块金值:误差随块金值的增大而增大;基台值:对结果影响不大;变程:存在最佳变程值;拟合函数:存在最佳拟合函数,(4),当数据足够多时,各种插值方法的效果相差不大。,克里格插值基础,4.,克里格方法的分类,目前,克里格方法主要有以下几种类型:普通克里格(,Ordinary,Kriging,);简单克里格(,Simple,Kriging,);泛克里格(,Universal,Kriging,);协同克里格(,Co-,Kriging,);对数正态克里格(,Logistic Normal,Kriging,);指示克里格(,Indicator,Kriging,);概率克里格(,Probability,Kriging,);析取克里格(,Disjunctive,Kriging,)等。,普通克里格插值,普通克里格(,Ordinary,Kriging,)是区域化变量的线性估计,它假设数据变化成正态分布,认为区域化变量,Z,的期望值是未知的。插值过程类似于加权滑动平均,权重值的确定来自于空间数据分析。,ArcGIS,中普通克里格插值包括,4,部分功能:创建预测图(,Prediction Map,)、创建分位数图(,Quantile Map,)、创建概率图(,Probability Map,)、创建标准误差预测图(,Prediction Standard Error Map,)。,普通克里格插值,预测图(,Prediction Map,),图,10.27,普通克里格插值预测图,普通克里格插值,分位数图(,Quantile Map,),图,10.28,普通克里格插值分位数图,普通克里格插值,概率图(,Probability Map,),图,10.29,普通克里格插值概率图,普通克里格插值,标准误差预测图(,Prediction Standard Error Map,),图,10.30,普通克里格插值标准误差预测图,简单克里格插值,简单克里格是区域化变量的线性估计,它假设数据变化成正态分布,认为区域化变量,Z,的期望值为已知的某一常数。,ArcGIS,中普通克里格插值包括,4,部分功能:创建预测图(,Prediction Map,)、创建分位数图(,Quantile Map,)、创建概率图(,Probability Map,)、创建标准误差预测图(,Prediction Standard Error Map,)。,简单克里格插值,预测图(,Prediction Map,),图,10.31,简单克里格插值预测图,简单克里格插值,分位数图(,Quantile Map,),图,10.32,简单克里格插值分位数图,简单克里格插值,概率图(,Probability Map,),图,10.33,简单克里格插值概率图,简单克里格插值,标准误差预测图(,Prediction Standard Error Map,),图,10.34,简单克里格插值标准误差预测图,泛克里格插值,泛克里格假设数据中存在主导趋势,且该趋势可以用一个确定的函数或多项式来拟合。在进行泛克里格分析时,首先分析数据中存在的变化趋势,获得拟合模型;其次,对残差数据(即原始数据减去趋势数据)进行克里格分析;最后,将趋势面分析和残差分析的克里格结果加和,得到最终结果。由此可见,克里格方法明显优于趋势面分析,泛克里格的结果也要优于普通克里格的结果。,ArcGIS,中普通克里格插值包括,4,部分功能:创建预测图(,Prediction Map,)、创建分位数图(,Quantile Map,)、创建概率图(,Probability Map,)、创建标准误差预测图(,Prediction Standard Error Map,)。,泛克里格插值,预测图(,Prediction Map,),图,10.35,泛克里格插值预测图,泛克里格插值,分位数图(,Quantile Map,),图,10.36,泛克里格插值分位数图,泛克里格插值,概率图(,Probability Map,),图,10.37,泛克里格插值概率图,泛克里格插值,标准误差预测图(,Prediction Standard Error Map,),图,10.38,泛克里格插值标准误差预测图,指示克里格插值,在很多情况下,并不需要了解区域内每一个点的属性值,而只需了解属性值是否超过某一阈值,则可将原始数据转换为(,0,,,1,)值,选用指示克里格法(,Indicator,Kriging,)进行分析。,ArcGIS,中普通克里格插值包括,2,部分功能:创建概率图(,Probability Map,)和创建标准误差指示图(,Standard Error of Indicator Map,)。,指示克里格插值,概率图(,Probability Map,),图,10.39,指示克里格插值概率图,指示克里格插值,标准误差指示图(,Standard Error of Indicators,),图,10.40,指示克里格插值标准误差指示图,概率克里格插值,ArcGIS,中普通克里格插值包括,2,部分功能:创建概率图(,Probability Map,)和创建标准误差指示图(,Standard Error of Indicator Map,)。,概率克里格插值,概率图(,Probability Map,),图,10.41,概率克里格插值概率图,概率克里格插值,标准误差指示图(,Standard Error of Indicators,),图,10.42,概率克里格插值标准误差指示图,析取克里格插值,如果原始数据不服从简单的分布(高斯或对数正态等),则可选用析取克里格法(,Disjunctive,Kriging,),它可以提供非线性估值方法。,ArcGIS,中普通克里格插值包括,4,部分功能:创建预测图(,Prediction Map,)、创建概率图(,Probability Map,)、创建标准误差预测图(,Prediction Standard Error Map,)和创建标准误差指示图(,Standard Error of Indicator Map,)。,析取克里格插值,预测图(,Prediction Map,),图,10.43,析取克里格插值预测图,析取克里格插值,概率图(,Probability Map,),图,10.44,析取克里格插值概率图,析取克里格插值,标准误差预测图(,Prediction Standard Error Map,),图,10.45,析取克里格插值标准误差预测图,析取克里格插值,标准误差指示图(,Standard Error of Indicators,),图,10.46,析取克里格插值标准误差指示图,协同克里格插值,当同一空间位置样点的多个属性之间存在某个属性的空间分布与其它属性密切相关,且某些属性获得不易,而另一些属性则易于获取时,如果两种属性空间相关,可以考虑选用协同克里格法。协同克里格法把区域化变量的最佳估值方法从单一属性发展到二个以上的协同区域化属性。但它在计算中要用到两属性各自的半方差函数和交叉半方差函数,比较复杂。,协同克里格插值,预测图(,Prediction Map,),图,10.47,协同克里格插值预测图,
展开阅读全文