资源描述
First level,Second level,Third level,Slide title,*,空间数据的采集与质量控制概述,主要内容,3.1,概述,3.2,地理参照系和控制基础,3.3,空间数据的分类和编码,3.4,空间数据的采集,3.5,GIS,的数据质量,3.1,概述,现实世界,文字报告、遥感图象等,数字化仪,扫描仪,解析测图仪,键盘 等,编辑、接边、分层、图形与属性连接、加注记等,空间数据库,数据源,?,如何采集,?,质量如何,?,3.1,概述,一、数据源,地图数据,遥感数据,文本数据,统计数据,实测数据,多媒体数据,已有系统的数据,二、数据采集,将现有的上述类型数据转换成,GIS,可以处理与接收的数字形式,通常要经过验证、修改、编辑等处理。,三、数据质量控制,GIS,的数据质量是指,GIS,中空间数据,(,几何数据和属性数据,),的可靠性,通常用空间数据的误差来度量。,误差是指数据与真值的偏离。,研究,GIS,数据质量对于评定,GIS,的算法、减少,GIS,设计与开发的盲目性都具有重要意义。精度越高,代价越大。,GIS,数据质量对保证,GIS,产品的可靠性有重要意义。,3.2,地理参照系和控制基础,一、地理空间的数学建构,最自然的面,包括海洋底部、高山、高原在内的固体地球表面,起伏不定,难以用一个简洁的数学式描述。,相对抽象的面,,即大地水准面,假设一个当海水处于完全静止的平衡状态时从海平面延伸到所有大陆下部,而与地球重力方向处处正交的一个连续、闭合的水准面。,可用水准仪完成地球自然表面上任一点的高程测量。但地球,的重力方向处处不同,处处与重力方向垂直的大地水准面显然不可能是一个十分规则的表面,且不能用简单的数学公式来表达,因此,大地水准面不能作为测量成果的计算面。,椭球体模型,为了测量成果计算的需要,选用一个同大地体相近的、可以用数学方法来表达的旋转椭球来代替地球,-,三轴椭球体,。,a,b,c,3.2,地理参照系和控制基础,二、地理参照系,经纬度坐标系(地理坐标),对空间定位有利,但难以进行距离、方向、面积量算。,笛卡儿平面坐标系,便于量算和进一步的空间数据处理和分析。,高程系统,描述空间点在垂直高度上的特性,-,高程,由高程基准面起算的地面点的高度。,1956,年黄海高程系,,,1985,年国家高程基准,地图投影,椭球体模型,3.2,地理参照系和控制基础,三、,GIS,的地理基础,-,控制基础,各种,GIS,的数据源、服务目的和各自特征可以不同,,但均有自身统一的地理基础。,地理基础,是地理信息,数据表示格式,与,规范的,重要,组成部分,统一的地图投影系统,统一的地理格网坐标系统(地理参照系),统一的地理编码系统,3.2,地理参照系和控制基础,四、,GIS,与地图投影的关系,地理基础,(,地图投影,),数据输出,(具有相应投影的地图),数据获取,(不同投影的地图),数据标准化预处理,(按某一参照系数字化),数据存储,(统一的坐标基础),数据处理,(投影转换),数据应用,(检索查询、覆盖分析等),3.2,地理参照系和控制基础,五、,GIS,中地图投影设计与配置的一般原则,所配置的投影系统应与相应比例尺的国家基本图(基本比例尺地形图,基本省区图或国家大地图集)投影系统一致。,系统一般只考虑至多采用两种投影系统,一种应用于大比例尺的数据处理与输出、输入,另一种服务于小比例尺。,所用投影以等角投影为宜。,所用投影应能与网格坐标系统相适应,即所采用的网格系统(特别是一级网格)在投影带中应保持完整。,3.2,地理参照系和控制基础,六、,我国,GIS,常用的地图投影配置,我国基本比例尺地形图,(1,:,100,万、,1,:,50,万、,1,:,25,万、,1,:,10,万、,1,:,5,万、,1,:,2.5,、,1,:,1,万、,1,:,5000),除,1,:,100,万外均采用高斯,克吕格投影为地理基础;,我国,1,:,100,万地形图采用了,Lambert,投影,其分幅原则与国际地理学会规定的全球统一使用的国际百万分之一地图投影保持一致。,我国大部分省区图以及大多数这一比例尺的地图也多采用,Lambert,投影和属于同一投影系统的,Albers,投影,(,正轴等面积割圆锥投影,),;,Lambert,投影中,地球表面上两点间的最短距离,(,即大圆航线,),表现为近于直线,这有利于地理信息系统中空间分析量度的正确实施。,3.3,空间数据的分类和编码,一、空间数据的组织,分层,区域分块,空间数据库,GIS,应用,大范围 地理区域,合理组织,面向对象组织,矩形分块,经纬度分块,3.3,空间数据的分类和编码,二、地理数据的分层,空间数据可按某种属性特征形成一个数据层,通常称为图层(,Coverage,)。,1,、空间数据分层方法:,专题分层,每个图层对应一个专题,包含某一种或某一类数据。如地貌层、水系层、道路层、居民地层等。,时间序列分层,即把不同时间或不同时期的数据作为一个数据层。,地面垂直高度分层,把不同时间或不同时期的数据作为一个数据层。,Z,时间序列,专题分层,3.3,空间数据的分类和编码,三、空间数据的分类与编码,分类、编码,点、线、面,特征码,、坐标,信息世界,三、空间数据的分类与编码,1.,属性数据编码,在属性数据中,有一部分是与几何数据的表示密切有关的。例如,道路的等级、类型等,决定着道路符号的形状、色彩、尺寸等。在,GIS,中,通常把这部分属性数据用编码的形式表示,并与几何数据一起管理起来。,编码,是指确定属性数据的代码的方法和过程。,代码,是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。,编码的直接产物就是代码,而分类分级则是编码的基础。,三、空间数据的分类与编码,2.,分类编码,分类是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程。,分类是人类思维所固有的一种活动,是认识事物的一种方法。,分类的基本原则:,科学性、系统性、可扩性、实用性、,兼容性、稳定性、不受比例尺限制、灵活性,三、空间数据的分类与编码,3,、分类码和标识码,分类码示例,标识码示例,一、输入前准备,1,、,资料准备,区域标定,基础原始数据的确定,数据分类项目的确定,数据标准的准确性的确定,2,、进行三个统一:即确定投影、比例尺、分类分级编码,3,、所用软件的检查、试用菜单准备及其它辅助工作。,4,、硬件检查。,5,、精度试验。,6,、试验,样区、单项试验。,3.4,空间数据的采集,3.4,空间数据的采集,二、,几何图形数据的采集,手工数字化,数字化仪数字化,扫描数字化,解析测图法,已有数据转入,扫描转换,拼接子图块,裁剪地图,屏幕跟踪矢量化,矢量图合成、接边,矢量图编辑,纸质地图,空间,数据库,扫描数字化流程,屏幕跟踪矢量化流程,准备扫描图像,栅格图像配准,新建数字化图层,屏幕跟踪矢量化地图,选择投影和单位,输入控制点,编辑控制点,三、属性数据采集,1,、键盘,,人机对话方式,2,、程序批量输入,。,a1,a2,001,002,001,002,程序,空间,数据库,四、属性和几何数据的连接,1,、可手工输入,2,、由系统自动生成,(,如用顺序号代表标识符,),标识码,属性数据,几何数据,3.4,空间数据的采集,五、空间数据的编辑和检核,1,、空间数据输入的误差,1,)几何数据的不完整或重复。,2,)几何数据的位置不正确。,3,)比例尺不正确。,4,)变形。,5,)几何数据与属性数据的连接有误。,6,)属性数据错误、不完整。,键盘输入错误,漏输数据或属性错误分类、编码等。,2.,空间数据的检查,1,),通过图形实体与其属性的联合显示,发现数字化中的遗漏、重复、不匹配等错误;,2,),在屏幕上用地图要素对应的符号显示数字化的结果,对照原图检查错误;,3,),把数字化的结果绘图输出在透明材料上,然后与原图叠加以发现错漏;,4,),对等高线,通过确定最低和最高等高线的高程及等高距,编制软件来检查高程的赋值是否正确;,5,),对于面状要素,可在建立拓扑关系时,根据多边形是否闭合来检查,或根据多边形与多边形内点的匹配来检查等;,6,)对于属性数据,通常是在屏幕上逐表、逐行检查,也可打印出来检查;,7,)对于属性数据还可编写检核程序,如有无字符代替了数字,数字是否超出了范围,等等,8,),对于图纸变形引起的误差,应使用几何纠正来进行处理。,3.4,空间数据的采集,1,、,GIS,数据质量,1,),位置(几何)精度:如数学基础、平面精度、高程精度等,用以描述几何数据的误差。,2),属性精度:如要素分类的正确性、属性编码的正确性、注记的正确性等,用以反映属性数据的质量。,3),逻辑一致性:如多边形的闭合精度、结点匹配精度、拓扑关系的正确性等,由几何或属性误差也会引起逻辑误差。,4),完备性:如数据分类的完备性、实体类型的完备性、属性数据的完备性、注记的完整性,,数据层完整性,检验完整性,等。,5),现势性:如数据的采集时间、数据的更新时间等。,一、,GIS,的数据质量的内容,3.5,GIS,的数据质量,逻辑误差,资料来源于张超主编的,地理信息系统实习教程,所配光盘,2,、,误差产生的主要原因,具体分析,原因,一、,GIS,的数据质量的内容,3,、误差的具体来源,阶段,误差来源,数据采集,实测,误差,,地图制图,误差(制作地图的每一过程都有误差),航测,遥感数据,分析误差(获取、判读、转换、人工判读(识别要素)误差),数据输入,数字化过程,中操作员和设备造成的误差,某些地理属性,没有明显边界,引起的误差(地类界),数据存贮,数字存贮,有效位,不能满足(由计算机字长引起,单精度、双精度类型),空间精度不能满足,数据操作,类别间,的不明确、边界误差(不规则数据分类方法引起),多层数据,叠加,误差,多边形叠加产生的,裂缝,(无意义多边形),各种,内插,引起的误差,数据输出,比例尺,误差、,输出设备,误差、,媒质,不稳定(如图纸伸缩),成果使用,用户,错误理解,信息、,不正确,使用信息,一、,GIS,的数据质量的内容,4,、误差传播,误差传播可分为三类:,1,)代数(算术)关系,如差、倍数、线性关系,有一套成熟的经典测量误差理论处理。,2,)逻辑关系,a,、布尔逻辑关系:,GIS,中存在大量的逻辑运算,如,叠置分析。,b,、不精确,推理关系:如专家系统中的不精确推理。,逻辑关系下的误差传播正处于研究中,需要借用信息论,模糊数学、人工智能、专家系统等学科有望解决。,一、,GIS,的数据质量的内容,二、,GIS,数据质量的评价方法,1,、直接评价法,1,),用计算机程序自动检测,某些类型的错误可以用计算机软件自动发现,数据中不符合要求的数据项的百分率或平均质量等级也可由计算机软件算出。此外,还可检测文件格式是否符合规范、编码是否正确、数据是否超出范围等。,2,)随机抽样检测,2,、间接评价法,-,(地理相关法和元数据法),指通过外部知识或信息进行推理来确定空间数据的质量的方法。用于推理的外部知识或信息如用途、数据历史记录、数据源的质量、数据生产的方法、误差传递模型等。,3,、非定量描述法,通过对数据质量的各组成部分的评价结果进行的综合分析来确定数据的总体质量的方法。,三、数字化的误差评价和质量控制,1,)自动回归法,由于跟踪数字化不仅是一个随机序列,而且是一个时间序列,因此可用数理统计中的时间序列分析法来确定数字化的误差。,2,),Band,法,该方法适用于任何类型的,GIS,数据,关键是如何给出合理的,值。,1,、评价数字化误差的方法,3,)对比法,把数字化后的数据,用绘图机绘出,与原图叠合,选择明显地物点进行量测,以确定误差。除了几何精度外,属性精度、完整性、逻辑一致性等也可用对比法进行对照检查。,Band,2,、数字化过程中的质量控制,1,)数字化预处理工作:包括对原始地图、表格等的整理、清绘。,2,)数字化设备的选用:根据手扶数字化仪、扫描仪等设备的分辨率和精
展开阅读全文