资源描述
第二章 地理信息系统的数据结构,1,1 地理空间及其表达 2 地理空间数据及其特征 3 空间数据结构的类型 4 空间数据结构的建立,2,上至大气电离层,下至地幔莫霍面,有着广阔的范围。 但在GIS中地理空间一般指的是地球表层,其基准是陆地表面和大洋表面,它是人类活动频繁发生的区域,是人地关系最为复杂、紧密的区域。,一、地理空间(geo-spatial),3,一般包括地理空间定位框架及其所连接的空间对象; 定位框架即大地测量控制系统,由平面控制网和高程控制网组成; 目前,我国采用的大地坐标系为1980年中国国家大地坐标系,现在规定的高程起算基准面为1985国家高程基准。,4,地球模型,地球表面,大地水准面,5,地理坐标系,6,平面坐标系,直接建立在球体上的地理坐标,用经度和纬度表达地理对象位置,建立在平面上的直角坐标系统,用(x,y)表达地理对象位置,投影,7,坐标系统高程系统,8,9,地图投影:投影实质,建立地球椭球面上各点的大地坐标,按照一定的数学法则,变换为平面上相应点的平面直角坐标。,10,我国常用地图投影,1:100万:兰勃投影(正轴等积割圆锥投影) 大部分分省图、大多数同级比例尺也 采用兰勃投影 1:50万、1:25万、1:10万、1:5万、1:2.5万、1:1万、1:5000:高斯克吕格投影。,11,二、地理空间现象分类,自然现象 可采样测定的自然现象:河流边界、地形起伏、土壤厚度 难以采样测定的自然现象:云团、潮汐 受定义限制的自然现象:植被覆盖率的大小和范围 偶然发生的自然现象:地震、滑坡等,12,人文现象 可精确测定的人文现象:如建筑物边界、道路中线等; 可测定的不规则的人文现象:如行政边界 个体和种群相互作用复杂的人文现象:人的迁徙、疾病的传播等,13,三、空间认知与表达,空间实体: 对复杂地理事物和现象进行简化、抽象得到不可再分的同类对象,即为地理空间实体。,14,15,16,17,场模型,对象模型,网络模型,四、概念模型,18,对象模型/要素模型,将研究的整个地理空间看成一个空域,地理现象和空间实体作为独立的对象分布在该空域中,对象模型强调地理空间中的单个地理现象。 按照其空间特征分为点、线、面、体四种基本对象; 对象也可能由其他对象构成复杂对象,并且与其他分离的对象保持特定的关系,如点、线、面、体之间的拓扑关系; 每个对象对应着一组相关属性以区分各个不同的对象;,19,对象模型把地理现象当作空间要素或空间实体,一个空间要素必须同时符合三个条件: 可被标识; 在观察中的重要程度; 有明确的特征且可被描述 传统的地图是以对象模型进行地理空间抽象和建模的实例。,20,场/域模型,把地理空间中的现象作为连续的变量或体来看待,如大气污染程度、地表温度、土壤湿度、地形高度以及大面积空气和水域的流速和方向等; 根据不同的应用,场可以表现为二维或三维; 一个二维场就是在二维空间中任意给定的一个空间位置上,都有一个表现某现象的属性值,即 A=f(x,y),21,一个三维场是在三维空间中任意给定一个空间位置上都对应一个属性值,即 A=f(x,y,z),22,二维空间场一般采用6种具体的场模型来描述: 规则分布的点 不规则分布的点 规则矩形区 不规则多边形区 不规则三角形区 等值线,23,网络模型,网络是由欧式空间中的若干点及它们之间相互连接的线(段)构成。 网络是由一系列节点和环链组成的,在本质上,网络模型可看成对象模型的一个特例,它是由点对象和线对象之间的拓扑空间关系构成的。,24,2 地理空间数据及其特征,空间数据类型:,25,空间实体基本特征,空间特征(位置、空间关系) 属 性 特 征 时 间 特 征,26,空间特征是指空间对象的位置及与相邻对象的空间关系或拓扑关系,一般用经纬度、坐标、拓扑关系表达,27,属性特征是指空间对象的专题属性,28,时间特征是指空间对象随着时间演变而引起的空间和属性特征的变化。,29,空间数据关系,拓扑空间关系:用来描述实体间的相邻、连通、包含和相交等关系; 顺序空间关系:用于描述实体在地理空间上的排列顺序,如实体之间前后、上下、左右和东、南、西、北等方位关系; 度量空间关系:用于描述空间实体之间的距离远近等关系。,30,空间数据的拓扑关系,什么叫拓扑? Topology一词来自希腊文,它的原意是“形状的研究”。拓扑学是几何学的一个分支,它研究在拓扑变换下能保持不变的几何属性拓扑属性。,31,拓扑邻接: 元素之间的拓扑关系。 拓扑关联: 元素之间的拓扑关系。 拓扑包含: 元素之间的拓扑关系。,拓扑关系的类型,不 同 类,同 类,同类不同级,32,拓扑邻接:N1/N2 ,N1/N3 ,N1/N4 ;P1/P3 ;P2/P3 拓扑关联:N1/1、3 、6 ;P1/1、5 、6 拓扑包含:P3与P4,33,空间拓扑关系表达关系表,多边形与弧段的拓扑关系 多边形 弧 段 P1 a, b, c, -g P2 b, d, f P3 c, f, e P4 g,节点与弧段的拓扑关系 节 点 弧 段 A a, c, e B a, d, b C d, e, f D b, f, c E g,弧段与节点的拓扑关系 弧 段 节 点 a A , B b B , D c D , A d B , C e C , A f C , D g E , E,弧段与多边形的拓扑关系 弧段 左多边形 右多边形 a P0 P1 b P2 P1 c P3 P1 d P0 P2 e P0 P3 f P3 P2 g P1,34,空间数据的拓扑关系,对数据处理和空间分析具有重要的意义: 拓扑关系能清楚地反映实体之间的逻辑结构关系,它比几何坐标关系有更大的稳定性,不随投影变换而变化; 利用拓扑关系有利于空间要素的查询; 可以根据拓扑关系重建地理实体。例如根据弧段构建多边形,实现道路的选取,进行最佳路径的选择等。,35,X,Y,i,j,x1 y1,x2 y2,xi yi,xn yn,数据结构即指数据组织的形式,是适合于计算机存储、管理和处理的数据逻辑结构。对空间数据则是地理实体的空间排列方式和相互关系的抽象描述。,第三节 空间数据结构的类型,36,矢量数据模型 栅格数据模型 栅格结构与矢量结构的比较,空间数据(逻辑)模型,37,矢量结构,栅格结构,38,一、矢量数据模型,基本概念:通过记录地理实体坐标的方式精确表达点、线、面等实体的空间位置和形状。 按一定规则,系统表达以下内容: 定义地理要素的几何形状; 描述性信息与对应地物联系起来。,39,二、矢量数据结构,(一)实体数据结构 矢量数据的简单数据结构分别按点、线、面三种基本形式,用某一坐标体系中的坐标(x,y)来表示。,简单数据结构,40,实例,ArcView Shape文件: .shp 主文件 .shx 索引文件 .dbf 表文件 MapinfoTab文件,41,缺点,数据冗余、匹配误差 难以表达邻域特征 难以解决嵌套问题,42,(二)拓扑数据结构,拓扑数据结构的关键是拓扑关系的表示,而几何数据的表示可参照矢量数据的简单数据结构。在目前的GIS中,主要表示基本的拓扑关系,而且表示方法不尽相同。下面举一表示矢量数据拓扑关系的例子。,43,拓扑关系应用于数据编码 输入数据的同时输入拓扑连接关系 从一系列相互关联的链建立拓扑结构 解决多边形嵌套和邻域关系,44,数据文件的基本元素是由始末点定义的弧段,复杂曲线可由多条弧段组成。每条弧段有两个指向结点的指针,和两边多边形的编码。 查询多边形各条边的效率比较低。,45,链状双重独立式编码-拓扑数据结构,1、弧段坐标文件:,2、弧段文件:链面,链结点关系,3、面文件,4、点拓扑文件: 结点链关系,46,栅格数据结构,栅格数据:栅格数据结构就是像元阵列,每个像元的行列号确定位置,用像元值表示空间对象的类型、等级等特征。每个栅格单元只能存在一个值。 位置很容易隐含 代码代表实体的属性或属性的编码,47,点,线,面,对于栅格数据结构点:为一个像元 线:在一定方向上连接成串的相邻像元集合。 面:聚集在一起的相邻像元集合。,48,栅格数据结构:坐标系与描述参数,Y:列,X:行,西南角格网坐标 (XWS,YWS),格网分辨率,49,栅格数据单元值确定,面 积 占 优,重 要 性,中心点法,A 连续分布地理要素,C 具有特殊意义 的较小地物,A 分类较细、 地物斑块较小,为了逼近原始数据精度,除了采用这几种取值方法外,还可以采用缩小单个栅格单元的面积,增加栅格单元总数的方法,50,几何偏差,属性偏差,三角形的面积为6个平方单位,而右图中则为7个平方单位,这种误差随像元的增大而增加。,51,编码方法,直接编码方法 压缩编码方法,52,直接编码方法,将栅格数据看成一个矩阵,逐行逐列记录代码。 缺点:随着栅格尺寸的缩小,数据量也将呈几何级数递增。,53,0 0 0 0 0 0 2 0 1 0 0 0 2 0 0 0 0 0 2 0 0 2 2 2 2 0 0 0 0 0 0 0 0 0 0 0 0 3 3 0 3 0 0 3 3 3 3 3 3,54,55,压缩编码,为了能以尽可能少的数据量记录尽可能多的信息,目前有一系列栅格数据压缩编码方法,如链码、游程长度编码、块码、四叉树编码等,其类型又有无损压缩编码和有损压缩编码之分。 无损压缩编码是指编码过程中没有任何信息损失,通过解码可以恢复原来的信息。有损压缩编码是指为了提高编码效率,最大限度地压缩数据,在压缩过程中损失一部分信息。,56,栅格数据结构:压缩编码方案,起点行列号,单位矢量 R: (1,5),3,2,2,3,3,2,3,链式编码,游程长度编码,逐行编码 数据结构: 行号, 属性, 重复次数 1:A, 4; R, 5;A, 8,块状编码,正方形区域为记录单元 数据结构: 初始位置, 半径, 属性 (1,1,3,A),(1,4,1,A),(1,5,1,R),(1,6,2,A),四叉树编码,57,1.链式编码边界链码,E / 0,EN /7,N / 6,WN / 5,W / 4,WS / 3,ES / 1,S / 2,3,1,7,0,1,2,3,4,5,6,4,1,6,7,0,1,2,3,4,5,58,2.游程长度编码,所谓游程是指按行的顺序连续且属性值相同的若干栅格。 游程长度的记录方式有两种 记录每个游程起(迄)列号 记录每个游程象元数,59,2.游程长度编码, 逐行记录每个游程的迄点列号,5,5 A,2,B,5 A,1,C,4,A,5 D,1,C,3,A,5 D,2,C,3,A,5 D,2,A,5,60,2.游程长度编码,记录每个游程象元数,5,5 A,2,B,3 A,1,C,3,A,1 D,1,C,2,A,2 D,2,C,1,A,2 D,2,A,3,61,2.游程长度编码,记录每个游程象元数,5,5 2,A 3,B 1,A 3,C 1,A 1,D 2,C 2,A ,62,2.游程长度编码,这种数据结构特别适用于二值图像的表示,如下图所示,63,2.游程长度编码,游程编码能否压缩数据量,主要决定于栅格数据的性质,通常可通过事先测试,计算图的数据冗余度Re,64,3. 块式编码,块式编码是将游程扩大到两维情况,把多边形范围划分成若干具有同一属性的正方形,然后对各个正方形进行编码。 块式编码的数据结构由初始位置(行列号)、半径和属性代码组成。,65,3. 块式编码,M M R M M M M M,M M M R R M M M,1 2 3 4 5 6 7 8,1 2 3 4 5 6 7 8,M M R M M M M M,M M R R M R M M,M R R R R R R M,M R R R R R R M,M R R R R R R M,M R R R R R R M,M M R R R R R M,M M M R R M M M,M M R R R R R M,M M R R M R M M,M R R R R R R M,M R R R R R R M,M R R R R R R M,M R R R R R R M,66,3. 块式编码,1,1,2,M;1,3,1,R;1,4,1,M;1,5,1,M;1,6,1,M;1,7,2,M 2,3,2,R;2,5,1,M;2,6,1,R 3,1,1,M;3,2,1,R;3,5,3,R;3,8,1,M 4,1,1,M;4,2,2,R; 4,4,1,R ; 4,8,1,M 5,1,1,M;5,4,1,R;5,8,1,M ,M M R M M M M M,M M M R R M M M,1 2 3 4 5 6 7 8,1 2 3 4 5 6 7 8,M M R R R R R M,M M R R M R M M,M R R R R R R M,M R R R R R R M,M R R R R R R M,M R R R R R R M,67,4.四叉树编码结构,四叉树编码结构的基本思想是首先把一幅图像或一幅栅格地图(2n*2n,n1)等分成四部分,逐块检查其格网值,如果某个子区的所有格网都具有相同的值,则这个子区就不再往下分割,否则,把这个区域在分割成四个子区域,递归的分割下去,直到每个子块都只含有相同的灰度或属性值为止。这样最后结果可得到一颗四分叉的倒向树。四叉树编码正是通过这种树状结构来记录和压缩栅格数据,以此种结构实现查询,修改和量算等操作。如图4-19所示的栅格数据,经过四叉树编码得到图4-20所示。,68,4.四叉树编码结构,69,4.四叉树编码结构,在图4-20中,各个子图像的大小不同,它们是由组成该子象限的具有相同代码的栅格像元构成的子块而决定。在图4-21中最上面的结点称作根结点。它对应于整个图形区域。在此例中,共划出四层结点,每层结点对应于不同尺寸的子象限。,70,4.四叉树编码结构,在对图4-21图形的四叉树编码过程中,位于结点层次较高的子象限尺寸较大,说明其分解深度小,也即分割次数少,而低层次上的象限尺寸就较小,反映其分解深度大即分割次数多。这样编码后,可反映出整个图形区域的空间地物分布情况,在某些位置上单一地物分布较广,则采用较少的分割次数。在地物较复杂,变化较大的区域,则用加深分解深度,增加分割次数的方式编码。,71,四叉树的存储方法,常规四叉树 每个节点存储6个量:1个父节点指针 4个子节点指针 1个节点值 线性四叉树 每个节点存储3个量:莫顿码 深度 值,72,把一幅2n2n的图像压缩成线性四叉树的过程,1、按Morton码把图象读入一维数组。 2、相邻的四个象元比较,一致的合并,只记录第一个象元的Morton码。循环比较所形成的大块,相同的再合并,直到不能合并为止。 3、进一步用游程长度编码压缩。压缩时只记录第一个象元的Morton码。,右图的压缩处理过程为: 1、按Morton码读入一维数组。 Morton码:0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 象 元 值: A A A B A A B B A A A A B B B B 2、四相邻象元合并,只记录第一个象元的Morton码。 0 1 2 3 4 5 6 7 8 12 A A A B A A B B A B 3、由于不能进一步合并,则用游程长度编码压缩。 0 3 4 6 8 12 A B A B A B,73,栅格结构与矢量结构的比较,74,曲面数据结构,曲面数据结构,是指对连续分布现象的覆盖要素,如地形、降水量、温度、磁场等连续现象在任一点的内插计算。为了进行内插计算,经常采用不规则三角网来拟和连续分布现象的覆盖表面,称为TIN(Triangulated Irregular Network)数据结构。 这种在TIN中的曲面数据结构,常用于数字地形的表示。 利用TIN的曲面数据结构,可以方便的进行地形分析,如坡度和坡向信息提取,填挖方计算,阴影和地形通视分析,等高线生成。,返回,75,数据编码:把需要加工处理的信息,根据一定的数据结构和目标的特性,用特定的代码或编码字符表示,以便计算机识别。,76,树状索引编码法,点的坐标只记录一次 线记录由哪些点组成 面记录由哪些线组成 有效解决常规编码的前两个问题,77,
展开阅读全文