空间计量经济分析教程.ppt - 统计学

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,地图分析与应用,Map Analysis and Applications,李飞雪,南京大学地理信息科学系,2,0,2,3,3,2,3,0,3,3,0,3,2,0,3,2,3,0,3,3,2,2,0,3,3,2,3,3,0,3,3,2,0,3,0,2,3,3,3,0,2,3,2,0,3,3,2,3,0,数据概括相同，空间模式不同,3,数据分析的缺点,以经典统计理论为基础,标准正态分布,缺失位置信息,4,空间数据很少符合正态分布,位置信息非常重要,依赖（,Dependence,）是一种规律（,rule,）,空间相互作用、空间外部性、空间溢出等,空间尺度非常重要,5,空间依赖性（,Spatial Dependence,）,变量,Y,在第,i,个空间单元上的观测值由该空间系统中其他空间单元上的观测值通过函数,f,表达，,i,S,，,S,是所有空间单元的集合。,6,空间依赖性的产生原因,空间相互作用,测量误差,7,空间异质性（,Spatial Heterogeneity,）,i,代表空间观测单元，,f,i,表示因变量,y,i,与自变量,x,i,、参数向量,i,和误差项,i,之间具体的函数关系。,8,（,A,）,（,B,）,（,C,）,（,D,）,（,E,）,I,=-1.000,I,=-0.393,I,=0.000,I,=+0.857,I,=+0.393,空间模式的量化,9,专题三空间统计分析,空间统计分析，即空间数据（,spatial data,）的统计分析，是现代计量地理学中一个快速发展的方向和领域。,空间统计分析，其核心是认识与,地理位置相关,的数据间的,空间依赖、空间关联或空间自相关,，通过空间位置建立数据间的统计关系。,空间统计分析,地球表面上的事物或现象之间存在着某种联系，并以相似或差异的方式表现出来。,Tobler,（,1970,）,“地理学第一定律”,描述了这样性质：“所有的事物或现象在空间上都是有联系的，但相距近的事物或现象之间的联系一般较相距远的事物或现象间的联系要紧密”。,在空间统计学中，相似事物或现象在空间上集聚（集中）的性质称之为,空间自相关（,Spatial autocorrelation,）,。空间上的相关性或关联性（,Spatial,associatiaon,）是自然界存在秩序与格局的原因之一,（,Goodchild,1986,）,。,地理学第一定律,在地理学中，每一个空间位置上的事物（现象）都具有区别于其他位置上的事物（现象）的特点，这种差异性被称为,空间异质性（,Spatial heterogeneity,）,（,Anselin,1988,）。,与地理学第一定律所描述的空间依赖性相对应，,Goodchild,（,2003,）将空间异质性总结为,“地理学第二定律”,。,Goodchild,在,2003,年的,UCGIS,年会上做了一场题为“地理信息科学基本定律（,The Fundamental Laws of,GIScience,）”的报告。在该报告中，,Goodchild,将“空间异质性”概括为地理学第二定律（,the Second Law of Geography,）。,地理学第一定律,13,基本分析方法,/,分析指标,空间权重矩阵,空间权重矩阵是对空间邻接关系的定义，是空间统计分析运算的基础之一。,全局空间自相关,局部空间自相关,14,15,空间权重矩阵（,spatial weight matrix,）,对空间邻居（,spatial neighborhood,）或邻接关系的描述，通常定义一个二元对称空间权重矩阵,W,，来表达,n,个位置的空间区域的邻近关系。,目前对于空间权重指标的构建，主要基于两类特征：,连通性（,Continuity,）,和,距离（,Distance,）,。此外，还可以通过面积、可达度等方式对空间权重指标进行构建。,空间权重矩阵,16,空间权重矩阵（,spatial weight matrix,）,基于连通性特征,的空间权重指标,，,又可以称为,空间邻接指标。,三种基本的空间邻接定义方式：考虑横纵方向邻接关系的,“,卒,”,型、考虑对角线方向邻接关系的,“,象,”,型以及综合考虑上述方向的,“,后,”,型。,空间邻接影响不仅仅局限于两个单元的相邻，一个空间单元还可通过相邻单元对外围非相邻单元产生影响，对于这类影响可以通过设定空间二阶乃至高阶邻接指标进行表达。,17,空间权重矩阵（,spatial weight matrix,）,基于距离特征,的空间权重指标，又可以称为,空间距离指标。,空间距离指标选择空间对象间的距离（如反距离、反距离平方值、距离负指数等）定义权重矩阵。,如,Cliff,和,Ord,曾提出的,Cliff-,Ord,空间权重指标，即是将距离作为指标定义的一部分。,，,i = 1,2,n,；,j = 1,2,n,其中，,d,ij,为空间对象间的距离，,ij,为空间对象共享边界的长度，,a,、,b,为两类距离的权重调整系数。,18,空间权重矩阵（,spatial weight matrix,）,空间数据集中不同实体单元间存在不同程度的空间关系，在实际使用中，一般通过矩阵形式给出空间逐点的空间权重指标，称为,空间权重矩阵。,W,是一个,n,n,的正定矩阵，矩阵的每一行指定了一个空间单元的,“,邻居集合,”,。,一般地，面状观测值用连通性指标：若面状单元,i,和,j,相邻，则,w,ij,=1,；否则，,w,ij,=0,。,点状观测值用距离指标：若点,i,和,j,之间的距离在阈值,d,以内，则,w,ij,=1,；否则，,w,ij,0,。,通常约定，一个空间单元与其自身不属于邻居关系，即,矩阵中主对角线上元素值为,0,。,19,在实际应用中，一般根据以下两种规则定义邻居：,公共边界,如果第,i,和第,j,个空间单元具有公共边界，则认为它们是邻居，空间权重矩阵中的元素为,1,；否则，不是邻居，元素为,0,。,距离,如果第,i,和第,j,个空间单元之间的距离位于给定的临界距离,d,之内，则认为它们是邻居，空间权重矩阵中的元素为,1,；否则，不是邻居，元素为,0,。,Cliff-,Ord,广义空间权重矩阵,其中,d,ij,是,i,和,j,之间的距离，,b,ij,是,i,和,j,之间的公共边界占,i,周长的比例。,20,21,空间自相关度量的意义发现空间分布模式,如何度量？,全局空间自相关统计指数,(a),空间集聚,(,空间相似,),(b),空间间隔,(,空间相异,),(c),空间随机,22,主要描述整个研究区域上空间对象之间的关联程度，以表明空间对象之间是否存在显著的空间分布模式。,（,Cliff and,Ord,，,1981,）,全局空间自相关分析主要采用全局空间自相关统计量（如,Moran,s I,、,Geary,s C,、,General G,）进行度量。,全局空间自相关,（,global spatial autocorrelation,）,23,Moran,s I,统计量是一种应用非常广泛的空间自相关统计量，它的具体形式如下,（,Cliff and,Ord,，,1981,）,：,Moran,s I,其中，,x,i,表示第,i,个空间位置上的观测值，，,w,ij,是空间权重矩阵,W,（,n,n,）的元素，表示了空间单元之间的拓扑关系，,S,0,是空间权重矩阵,W,的所有元素之和。,反映的是空间邻接或空间邻近的区域单元属性值的相似程度。,全局空间自相关统计指数,24,用矩阵形式表示如下：,其中，,X,是,x,i,与其均值的离差向量（,n,1,），,W,是（,n,n,）的空间权重矩阵，,S,0,含义同上。,25,+4.55,+5.54,+2.24,-5.15,+9.02,+3.10,-4.39,-2.09,+0.46,-3.06,x,y,z,1,2,4.55,1,3,5.54,2,1,2.24,2,2,5.15,2,3,9.02,3,1,3.1,3,2,4.39,3,3,2.09,4,2,0.46,4,3,3.06,Tabulated lattice data,Adjacency matrix, W,I,=0.0317. If this value is close to 0 there is very little spatial autocorrelation, which is what we have found in this example,26,对观测值在空间上不存在空间自相关（或独立、随机分布）这一原假设进行检验时，一般根据标准化以后的,Moran,s I,值或,z,值，即：,Moran,s I,的检验,在统计推断的过程中，通常需要对变量,x,的分布做出假设。,一般分两种情况：,一是假设变量,x,服从正态分布；二是在分布未知的情况下，用随机化方法得到,x,的近似分布。,通过在正态或随机两种分布假设下得到,I,的期望值和方差来分别进行假设检验。,27,在,正态分布假设,下，,Moran,s I,的期望值和方差分别为：,式中,和,分别是空间权重矩阵,W,的第,i,行和第,i,列元素之和,28,在,随机分布假设,下，,Moran,s I,的期望值和方差分别表示为：,式中,其他符号同上。,29,通常将,Moran,s I,解释为一个相关系数，取值范围从,-1,到,+1,。,0 I 1,表示正的空间自相关，,I = 0,表示不存在空间自相关，,-1 I 0,表示负的空间自相关,。,当,Moran,s I,显著为正时，存在显著的正相关，相似的观测值,(,高值或低值,),趋于空间集聚。,当,Moran,s I,为显著的负值时，存在显著的负相关，相似的观测值趋于分散分布。,当,Moran,s I,接近期望值（,-1/,（,n-1,），随着样本数量的增大，该值趋于,0,）时，表明不存在空间自相关，观测值在空间上随机排列，满足经典统计分析所要求的独立、随机分布假设。,30,随机检验（,Permutation test,）,在不存在空间自相关的假设下，观测值,x,1,x,n,可被认为是观测值被随机分配到,n,个空间位置上的一次随机过程。当观测值为,n,时，可能的空间组合次数为,n!,，这,n!,次随机排列构成观测值在原假设条件下的分布。根据这一分布，可以得到统计量的期望值和方差。,蒙特卡罗检验（,Monte Carlo test,）,当,n,比较大时，这些观测值的随机排列的组合数非常大。通常情况下是利用,k,个随机数生成方法来构建一个经验的原始分布。当,k=99,时，可以满足,5%,显著性水平下的检验；当,k=999,次，可以满足,1%,显著性水平的检验。,k,值越大，经验分布越接近原假设下的分布状态。可以根据这种经验分布来检验一个观测值的出现是否为,“,小概率事件,”,，从而判断是拒绝还是接受原假设。,31,Geary,s C,Geary,s C,也是一种较常用的空间自相关统计量，其结果解释类似于,Moran,s I,（,Cliff and Ord 1981,）。其形式为：,对该统计量的统计推断也是根据相应的标准化,Z,值。,32,在正态分布假设下，,Geary,s C,的期望值和方差分别为：,在随机分布假设下，,Geary,s C,的期望值和方差分别表示如下：,式中符号同,Moran,s I,的期望和方差公式。,33,Geary,s C,总是正值，取值范围一般为,0,到,2,之间，且服从渐近正态分布,。,当,Geary,s C,小于,1,时，表明存在正的空间自相关。,当,Geary,s C,大于,1,时，表明存在负的空间自相关。,当,Geary,s C,值为,1,时，表明不存在空间自相关，即观测值在空间上随机排列。,34,General G,统计量,Moran,s I,和,Geary C,统计量均可以用来表明属性值之间的相似程度以及在空间上的分布模式，但它们,并不能区分是高值的空间集聚,（高值簇或热点（,hot spots,）,还是低值的空间集聚,（低值簇或冷点（,cold spots,），,有可能掩盖不同的空间集聚类型,。,Getis-Ord General G,统计量则可以识别这两种不同情形的空间集聚,（,Getis and Ord,，,1992,；,O,Sullivan and Unwin,，,2003,）,。,式中，,w,ij,(,d,),是根据距离规则定义的空间权重；,x,i,和,x,j,含义同上。,对,General G,的统计检验采用下式：,35,在空间不集聚的原假设下，,General G,的期望值和方差分别是：,其中，,36,当,General G,值高于,E(G),，且,Z,值显著时，观测值之间呈现高值集聚。当,General G,值低于,E(G),，且,Z,值显著时，观测值之间呈现低值集聚。当,General G,趋近于,E(G),时，观测值在空间上随机分布。,37,Gamma,（,）统计量,Gamma,（,）统计量由空间相似性矩阵（,W,）和属性相似性矩阵（,Y,）对应元素的交叉积构造而成,（,Hubert et al., 1981,）,，是大多数空间自相关检验统计量的一般形式,（,Florax et al., 2004,）,。该统计量的表达式为：,其中，空间相似性矩阵可以采用空间权重矩阵形式，其元素,w,ij,表达位置,i,和,j,之间的空间相似性（,spatial similarity,）或空间关系。,而属性相似性矩阵,Y,及其元素,y,ij,可以采用不同的形式（如欧几里德距离、曼哈顿距离等）。,38,当在属性相似性矩阵,Y,中采用不同的方式度量观测值之间的空间关联时，可以得到不同的空间自相关统计量。,例如，当矩阵,Y,中的元素为两个观测值的乘积，即,时，可以得到类似,Moran,s I,的统计量。,时，可以得到类似,Geary,s C,的统计量。,当矩阵,Y,中的元素为两个观测值的差的平方和，即,39,局部空间自相关（,Local spatial autocorrelation,）,全局空间自相关统计量建立在,空间平稳性,这一假设基础之上，即所有位置上的观测值的期望值和方差是常数。然而，空间过程很可能是不平稳的，特别是当数据量非常庞大时，空间平稳性的假设就变得非常不现实,（,Ord and Getis,，,1992,，,Anselin,，,1995,）,。,局部空间自相关统计量可以用来识别不同空间位置上可能存在的不同空间关联模式（或空间集聚模式），从而允许我们观察不同空间位置上的,局部不平稳性,，发现数据之间的空间异质性，为分类或区划提供依据,（,Getis and Ord,，,1992 1996,；,Ord and Getis,，,1995,；,Anselin,，,1994,，,1995,）,。,40,Getis,和,Ord,（,1992,）提出了度量每一个观测值与周围邻居之间是否存在局部空间关联的,G,统计量。,该统计量是某一给定距离范围内邻居位置上的观测值之和与所有位置上的观测值之和的比值，能够用来识别位置,i,和周围邻居之间是高值还是低值的集聚。,若不包括,i,位置上的观测值，则为,G,i,统计量；若包括,i,位置上的观测值，则为,G,i,*,统计量。,G,统计量,G,i,和,G,i,*,统计量的具体形式分别为：,41,在不存在空间依赖性的原假设下，即位置,i,上的观测值与周围邻居的观测值,x,j,之间在空间上是独立的，,G,i,和,G,i,*,的期望值分别为：,G,i,和,G,i,*,的方差分别为：,其中，,42,在不存在空间自相关的原假设（即,G,i,= 0,或,G,i,* = 0,）下，,G,i,和,G,i,*,服从渐近正态分布,（,Ord and Getis,，,1992,）,。,因此，这两个统计量的统计检验可以根据相应的标准化形式：,，,其中，,（,j i,）,（所有,j,）,43,如果,Z,值为正，且非常显著，则表明位置,i,周围的值相对较大（高于均值），高值空间集聚。,如果,Z,值为负，且非常显著，则表明位置,i,周围的值相对较小（低于均值），低值空间集聚。,因此，,G,统计量可以用来识别高值或低值的空间集聚模式。,44,Moran,s I,等空间自相关指数反映的是空间整体的自相关，一般,“,侧重于研究区域空间对象某一属性取值的空间分布状态,”,。,在一个存在全局空间自相关的样本中，可能存在局部的随机性，或是在全局随机分布的样本中，也可能存在局部的空间关联。,因此，需要能够识别局部不平稳的局部空间空间自相关统计量。,局部空间自相关统计指数,45,Moran,s I,等空间自相关指数反映的是空间整体的自相关，一般,“,侧重于研究区域空间对象某一属性取值的空间分布状态,”,。,实际研究中，空间自相关的分布是不均匀的，个别局域对象的属性取值对全局分析对象的影响非常显著。,因此，有必要进行局域空间自相关指数计算，分析某一空间对象取值的邻近空间聚类关系、空间不稳定性及空间结构框架。,特别是，当全局自相关分析不能够检测区域内部的空间分布模式时，局域空间自相关分析能够有效检测由于空间自相关引起的空间差异，判断空间对象属性取值的空间热点区域或高发区域等，弥补全局空间自相关分析的不足。,局部空间自相关统计指数,46,LISA,统计量,局部空间关联指标（,Local Indicators of Spatial Association,，,LISA,）并不是特指某一个统计量，所有同时满足下面两个条件的统计量都可以认为是局部空间关联指标,（,Anselin,，,1995,）,。,每一个观测值的,LISA,表示该值周围相似观测值在空间上的集聚程度。,所有观测值的,LISA,之和与全局空间关联度量指标之间成比例。,47,其中，,L,i,表示位置,i,上的统计量，,f,是一个函数形式，,y,i,是位置,i,上的观测值，,J,i,表示位置,i,周围的所有邻居集合，,y,Ji,是邻居,J,i,上的观测值。,位置,i,上的所有邻居通过空间权重矩阵（,W,）表示，如,W,中第,i,行上所有非,0,元素对应的列，即构成位置,i,的邻居集合,J,i,。,这样，,LISA,可以表达某个位置,i,上的观测值与周围邻居观测值之间的关系。具体表示如下：,48,LISA,主要有两个目的：,识别局部的空间集聚（,spatial clusters,）或热点（,hot spot,）。,识别局部的非平稳性。,若某个位置上的,LISA,非常显著，则可将该位置看作热点。若某个位置上的,LISA,与均值之间的差距非常大，即该位置对全局统计量的贡献超过了它的预期份额，则可将该位置看作是异常点或强影响点（如与均值之差超过,2,个标准差）,（,Anselin,，,1995,）,。,49,局部,Gamma,（,）,其中，,a,ij,和,b,ij,的含义同,统计量，分别表示空间相似性和属性相似性。,空间相似性可以通过空间权重矩阵（,W,）度量；属性相似性可有不同的度量方式，分别对应不同的局部空间关联统计量。,当,b,ij,= z,i,z,j,时，则对应局部,Moran,s I,统计量；当,b,ij,=,（,z,i,- z,j,）,2,时，则是局部,Geary,s C,统计量。,50,每一个观测值,i,的局部,Moran,s,I,i,统计量的定义如下：,其中，,z,i,和,z,j,是观测值的均值标准化，即,式中空间权重矩阵元素,w,ij,采用行标准化形式，即,局部,Moran,s,I,i,51,I,i,表示位置,i,上的观测值与周围邻居观测平均值的乘积。这样，全局,Moran,s,I,和局部,Moran,s,I,i,统计量之间的关系是：,局部,Moran,s,I,i,统计量的精确分布形式一般未知，对其检验通常采用条件随机化（,conditional randomization,）或随机排列（,permutation,）方法,（,Anselin 1995,）,。,条件随机化是指将位置,i,的观测值固定，其他观测值在整个空间位置上随机排列。这样可以得到,I,i,的经验分布函数，为观测到的,I,i,的显著性检验提供依据。,52,局部,Moran,s,I,i,统计量的解释类似于,G,统计量。,若伪显著性水平,p,值非常小（如,p 0.95,），则表明位置,i,周围的观测值相对较低。,53,空间位置,i,的局部,Geary,s,C,i,统计量定义如下：,其中，,z,i,和,z,j,是观测值的标准化形式，空间权重矩阵中的元素,w,ij,采用行标准化。,全局,Geary,s,C,和局部,Geary,s,C,i,统计量之间的关系是：,局部,Geary,s,C,i,54,局部,Geary,s,C,i,统计量的伪显著水平,p,值的计算与局部,Moran,s,I,i,统计量类似。,若,p,值较大（如,p 0.95,），表明,C,i,值异常小，说明位置,i,的观测值与周围邻居的观测值之间是正的空间联系（即相似）；,若,p,值较小（如,p 0.05,），表明,C,i,值异常大，说明位置,i,的观测值与周围邻居的观测值之间是负的空间联系（即不相似或差异大）。,55,空间关联特征的可视化,在格网数据的可视化过程中，空间权重矩阵和空间滞后（,spatial lag,）是两个非常重要的概念（,Anselin and Bao 1997,，,Anselin 1999,）。,空间权重矩阵第,i,行的非,0,元素，定义了该空间单元的所有邻居。,将第,i,行所有邻居的观测值进行加权平均，即得到变量在位置,i,上的空间滞后。若空间位置,i,上的观测值为,y,i,，则相应的空间滞后是,j,w,ij,y,j,。,通过采用饼状图、柱状图或散点图等形式，将每个位置上的观测值和其空间滞后之间的关系表示在地图上，,以便进行直观的分析,。,若用矩阵表示，则变量的空间滞后是空间权重矩阵（,W,）与观测值向量（,y,）的乘积（,W,y,）。,56,柱状图,柱状图是专题地图中用来表示事物和现象内部结构组成的一种表示方法。,变量在某个位置上的观测值和其空间滞后之间的关联程度也可以用柱状图加以表示,（,Anselin,，,1994,，,Anselin and Bao,，,1997,）,。,57,将每个位置上观测值（,y,i,）和空间滞后（,(,Wy,),i,）的大小用长方形表示，则构成柱状图。,若,y,i,= (,Wy,),i,，两个柱状图形的面积大小相等。,如果某一位置上的观测值较大，而空间滞后较小，两个图形的高度悬殊较大，表明该位置可能存在负的空间自相关。,如果该位置上的观测值和空间滞后的高度相差不大，表明该位置可能存在正的空间自相关。,柱状图一般仅适用于观测值为正的情况。,58,饼状图一般仅适用于观测值为正的情况。,在饼状图中，将一个圆一切为二，划分为两个大小相等或不等的扇形。,其中，一个扇形表示该位置上观测值（,y,i,）的比例大小，数值为,y,i,/,y,i,+(,Wy,),i,，另一个扇形表示该位置上观测值的空间滞后（,(,Wy,),i,）所占的比例大小，数值为,(,Wy,),i,/,y,i,+(,Wy,),i,。,若,y,i,= (,Wy,),i,，两个扇形面积大小相等，均为整个圆的一半。,如果该位置上的观测值比重大，则空间滞后的比重将变小，两个扇形的面积大小悬殊较大，表明该位置可能存在负的空间自相关；如果该位置上的观测值和空间滞后的比例相差不大，表明该位置可能存在正的空间自相关。,59,Moran,散点图,散点图是数据分析中用来表示二个变量之间相关关系的一种常见的方法。,表示一个变量的空间自相关关系，可以采用,Moran,散点图（,Moran scatterplot,）。,Moran,散点图可以用来探索空间关联的全局模式、识别空间异常和局部不平稳性等,（,Anselin,，,1994,，,1996,）,。将变量在每个位置上的观测值表示在横轴上，其空间滞后（标准化的局部空间自相关指标,Moran,s,I,i,）表示在纵轴上，则二者之间的相关关系就可以用坐标系中的散点形象地表现出来。,60,由于变量观测值和其空间滞后之间的拟合程度（即直线的斜率）恰好是,Moran,s I,系数。,61,Moran,散点图分为四个象限，分别对应四种不同类型的局部空间关联模式：,右上象限（,H-H,）：观测值,z,i,大于均值（,high,），其空间滞后也大于均值（,high,）。,左下象限（,L-L,）：观测值,z,i,小于均值（,low,），其空间滞后也小于均值（,low,）。,左上象限（,L-H,）：观测值,z,i,小于均值（,low,），但其空间滞后大于均值（,high,）。,右下象限（,H-L,）：观测值,z,i,大于均值（,high,），但其空间滞后小于均值（,low,）。,62,右上象限（,H-H,）和左下象限（,L-L,）对应正的空间自相关，表示该位置上的观测值和周围邻居的观测值之间相似。其中，右上象限（,H-H,）对应高,-,高相似，左下象限（,L-L,）对应低,-,低相似。,左上象限（,L-H,）和右下象限（,H-L,）对应负的空间自相关，表示该位置上的观测值和周围邻居的观测值之间相异。其中，左上象限（,L-H,）对应低,-,高相异，右下象限（,H-L,）是高,-,低相异，即低值被周围的高值所围绕，和高值被周围的低值所围绕。,63,右上和左下两个象限分别对应,G,统计量中的正的空间关联（高,-,高）和负的空间关联（低,-,低）。观察右上和左下两个象限的相对密度，可以了解全局空间关联模式在多大程度上是由高值还是低值之间的关联决定的。,观察左上和右下两个象限的相对密度，可以了解哪种形式的负的空间关联占主导地位。,此外，观察,Moran,散点图的左上和右下两个象限，还可以发现潜在的空间异常。以散点图的象限中心点为圆心，做一个半径为,2,的圆，可以认为圆以外的观测点是异常值。,这是因为，,Moran,散点图是用标准化的变量和其空间滞后构造的，图上,2,个单位的距离意味着偏离均值两个标准差，可以看作是异常值（,Anselin and Bao 1997,）。,64,Moran,派生图,Moran,散点地图,65,当在,Moran,散点地图中仅显示那些显著高或显著低的观测值时，得到,Moran,显著性地图（,Moran significance map,）。,如果显著观测值属于散点图中的第一象限或第三象限，则认为存在显著空间聚集；如果属于第二或第四象限，则认为存在显著的空间差异。,Moran,显著性地图,66,江苏省区域经济空间差异分析,ESDA (Exploratory Spatial Data Analysis,，探索性空间数据分析,),是一系列空间数据分析方法和技术的集合，以空间关联测度为核心，通过对事物或现象空间分布格局的描述与可视化，发现空间集聚和空间异常，揭示研究对象之间的空间相互作用机制。,改革开放以来江苏省县域经济差异在空间上的变化状况，影响江苏省区域经济差异扩大或缩小的空间机制。,应用案例,67,研究区域与数据来源,江苏五十年,(19491999),和,江苏省统计年鉴,(20002003),。,空间分析尺度为江苏省,77,个县,(,市、区,),，包括,13,个省辖市区和,64,个县,(,市,),，时间序列为,19782002,年，分析变量为县级年人均,GDP (,现价,),。,68,研究方法,全局空间自相关分析,局部空间自相关分析,Moran,散点图，横轴对应变量,z,的所有观测值，纵轴对应空间滞后向量,(,W,z,),的所有取值。每个区域观测值的空间滞后就是该区域周围邻居观测值的加权平均，具体通过标准化的空间权重矩阵来加以定义。,右,上,象限,(HH),：区域自身和周边地区的经济水平均较高，二者空间差异程度较小。,左上象限,(LH),：区域自身经济水平较低，周边地区较高，二者空间差异程度较大。,左下象限,(LL),：区域自身和周边地区的经济水平均较低，二者空间差异程度较小。,右下象限,(HL),：区域自身经济水平较高，周边地区较低，二者空间差异程度较大。,69,整个研究期间, Global Moran,s I,估计值全部为正，且总体趋势在不断增加。,这表明，改革开放以来，江苏省县域经济发展水平相似,(,高高或低低,),的地区在空间上集中分布，随着时间的推移，这种趋势还在不断加强。,江苏省区域经济发展的基本格局是发达地区集中在苏南，欠发达地区集中在苏北。正是苏南和苏北地区内部空间差异的缩小，才使得县域总体空间差异不断缩小。,70,改革开放以来，江苏省县域经济发展较快，县域之间的总体空间差异有了较大程度的缩小。,2002,年，位于,HH,象限的县,(,市、区,),个数由,1978,年的,10,个增加到,28,个，超过江苏省区域总数的,1/3,；相反，位于,LH,和,HL,象限的数量却分别由,1978,年的,12,和,14,个减少为,2002,年的,6,个。,位于,HH,象限的县,(,市,),个数越多，县域经济的总体空间差异就越小。,71,那些原先经济基础比较薄弱，其周围地区也相对比较落后的县域,(LL,象限,),，经过,20,多年的发展，依然没有摆脱相对滞后的局面。,截止,2002,年，江苏省仍有接近一半,(37,个,),的县域属于,LL,象限，仅比,1978,年减少,4,个。,这一事实表明，江苏省区域经济协调发展的路子还很长。,72,改革开放初期，江苏省县域经济已表现出较为明显的空间分异格局。,与周边地区相比，全省县域可具体划分为以下四种类型：,空间差异较小、区域自身和周边水平均较高的县域,(HH),，全部坐落在苏南地区；,空间差异较小，但区域自身和周边水平均较低的县域,(LL),，绝大多数分布在苏北地区；,空间差异较大，区域自身水平较高，但周边较低的县域,(HL),，多为苏中和苏北省辖市区；,空间差异较大，区域自身水平较低，但周边较高的县域,(LH),，主要位于苏中省辖市的周边。,73,在,5%,显著性水平下，所有县域的,I,i,值均不显著。这表明，江苏省县域经济虽然在改革开放初期呈现出一定的地带性分布格局，但并不显著。这与表,1,中江苏省,1978,年县域人均,GDP,的,Global Moran,s I,估计结果在,5%,的水平上也不显著相吻合。,74,经过,20,多年的发展，江苏省县域经济空间差异分布格局发生了以下变化：,HH,区域从苏州、无锡地区向西北方向延伸至常州、镇江、扬州和南京等地。那些初期属于,HH,区域的吴县,(,现苏州吴中区,),、常熟和锡山,(,现无锡锡山区,),等地，则逐渐演变为显著,HH,区域。,LL,区域数量稍有减少，但其集中分布在苏北的基本格局并没有发生变化。苏中、苏南部分,LL,区域发生了较大变化，其中溧阳、金坛、溧水、靖江等转为,HH,区域，高淳、泰兴等转为,LH,区域。在苏北地区内部，出现了显著,LL,区域,(,宿豫和沭阳,),。,HL,区域数量有了大幅度减少，南京、镇江、扬州、泰州和常州等省辖市区和周边丹阳、扬中和江阴等县市转变为,HH,区域，苏北淮阴市,(,现淮安市,),和金湖转变为,LL,区域，表现出和周围县域趋同的迹象。值得注意的是，盐城、大丰和海门分别由,LL,、,LL,和,LH,进入,HL,区域。,LH,区域数量减少了一半，但位于苏中的分布格局并没有发生大的变化。与苏南、苏北相比，苏中依然是江苏省县域之间存在较大发展差距的地域。,中国大陆,30,个省级行政区人均,GDP,的空间关联分析,根据各省（直辖市、自治区）之间的邻接关系，采用二进制邻接权重矩阵，选取各省（直辖市、自治区）,1998-2002,年人均,GDP,的自然对数，依照公式计算全局,Moran,指数,I,，计算其检验的标准化统计量,Z,（,I,）。,年份,I,Z,P,1998,0.5001,4.5035,0.0000,1999,0.5069,4.5551,0.0000,2000,0.5112,4.5978,0.0000,2001,0.5059,4.5532,0.0000,2002,0.5013,4.5326,0.0000,应用案例,从表中可以看出，在,1998,-,2002,年期间，中国大陆,30,个省级行政区人均,GDP,的全局,Moran,指数均为正值；在正态分布假设之上，对,Moran,指数检验的结果也高度显著。,在,1998,-,2002,年期间，中国大陆,30,个省级行政区人均,GDP,存在着显著的、正的空间自相关，也就是说各省级行政区人均,GDP,水平的空间分布并非表现出完全的随机性，而是表现出相似值之间的空间集聚。,其空间联系的特征是：较高人均,GDP,水平的省级行政区相对地趋于和较高人均,GDP,水平的省级行政区相邻，或者较低人均,GDP,水平的省级行政区相对地趋于和较低人均,GDP,水平的省级行政区相邻。,选取,2001,年我国,30,个省级行政区人均,GDP,数据，计算局部,G,i,统计量和局部,G,i,统计量的检验值,Z(G,i,),，并绘制统计地图。,检验结果表明,贵州、四川、云南西部,3,省的,Z,值在,0.05,的显著性水平下显著，重庆的,Z,值在,0.1,的显著性水平下显著，该,4,省市在空间上相连成片分布，其人均,GDP,趋于为同样是人均,GDP,低值的省区所包围。,由此形成人均,GDP,低值与低值的空间集聚，据此可认识到西部落后省区趋于空间集聚的分布特征。,东部的江苏、上海、浙江三省市的,Z,值在,0.05,的显著性水平下显著，天津的,Z,值在,0.1,的显著性水平下显著。,东部上海、江浙等发达省市趋于为一些相邻经济发展水平相对较高的省份所包围，东部发达地区的空间集聚分布特征也显现出来。,以（,Wz,z,）为坐标，进一步绘制,Moran,散点图,多数省（直辖市、自治区）位于第,1,和第,3,象限内，为正的空间联系，属于低低集聚和高高集聚类型，而且位于第,3,象限内的低低集聚类型的省（直辖市、自治区）比位于第,1,象限内的高高集聚类型的省（直辖市、自治区）更多一些。,可以看出，从人均,GDP,水平相对地来看：,高值被高值包围的高高集聚省（直辖市）有：北京、天津、河南、安徽、湖北、江西、海南、广东、福建、浙江、山东、上海、江苏。,低值被低值包围的低低集聚省（自治区）有：黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、贵州。,被低值包围的高值省（直辖市）有：重庆、广西、河北；被高值包围的低值省份只有湖南。,81,空间统计分析软件,GeoDA,GS+,GRASS,82,BB,统计量主要用来度量二值型数据（,0,，,1,）之间的空间关联程度。,BB,统计量（,Black-Black Joint Counts Statistic,）,其中，,Z(,s,i,),表示第,i,个空间位置上的观测值,(0,1),，,w,ij,是空间权重矩阵,W,（,n,n,）的元素。若第,i,个空间位置为黑颜色，则,Z(,s,i,)=1,，也可理解为该位置上发生了某一事件。,对观测值在空间上不存在空间自相关（或独立、随机分布）这一原假设进行检验时，一般根据标准化以后的,BB,值，即：,83,BW,统计量（,Black-White Join Counts Statistic,）,对,BW,进行检验时，一般也根据标准化以后的,BW,值，即：,在二项分布假设下，均值和方差的表达式如下：,84,

展开阅读全文

空间计量经济分析教程.ppt - 统计学

最新文档