资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,空间数据质量与元数据,空间数据质量,空间数据质量控制,空间数据的不确定性问题,空间元数据,空间数据质量,在,GIS,的几个主要因素中,数据是一个极为重要的因素,在计算机软件、硬件环境选定之后,,GIS,中数据质量的优劣,决定着系统分析质量以及整个应用的成败,GIS,提供的空间数据的分析方法被广泛用于各种领域,用于决策领域的数据,其质量要求应该是可知的或可预测的。,研究空间数据质量的目的,加强数据生产过程中的质量控制,提高数据质量,空间数据质量的重要性,空间数据库,查询和分析,空间数据输入和管理,输出,:,显示,防止“,Garbage in,,,Garbage out,!”,G I S,空间数据质量的内容,空间数据的完整性,数据是否覆盖到应该覆盖的范围,空间数据的数据逻辑一致性,数据定义的统一性,在同一个空间数据库中,数据的定义应该保持一致,空间数据位置精度,数据的地理位置精度,空间数据属性精度,数据所载负的地理信息的正确性,空间数据时间精度,数据本身所代表的时间信息的正确性,关于数据的说明,元数据,空间数据质量的相关概念,准确性(,Accuracy,),精度(,Precision,),空间分辨率(,Spatial Resolution,),比例尺(,Scale,),误差(,Error,),不确定性(,Uncertainty,),空间数据质量的相关概念,(1),准确性(,Accuracy,),一个记录值(测量或者观察值)与它的真实值之间的接近程度,空间数据的准确性通常是根据所指的位置、拓扑或者非空间属性来分类的,可以用误差(,Error,)来衡量空间数据的准确性,精度(,Precision,),表示数据对现象描述的详细程度,数据精度和数据准确性的区别,:,精度低的数据不一定准确度也低;,数据精度如果超出了测量仪器的已知准确度,这样的纪录数字在效率上是冗余的;,例如:在设计精度为,0.1mm,的数字化仪上测量返回的坐标数据为(,10.11mm,12.233mm,),其中就含有冗余的数据;,空间数据质量的相关概念,(2),空间分辨率(,Spatial Resolution,),分辨率是两个可测量数值之间最小的可辨识的差异,空间分辨率可以看作是记录变化的最小幅度,空间分辨率示例:地图上最细线宽度对应的地理范围,遥感图像上一个像素代表的实际地理范围大小,比例尺(,Scale,),地图上一个记录的距离和它所表现的“真实世界”的距离之间的比例,如这幅地图的比例尺,=10cm:1000m=1:10000,比例尺是刻画数据精度的量(如最小线宽为地图的空间分辨率),真实世界,矢量数据,栅格数据,1 pixel =10mX10m,分辨率,=10m,10M,10M,1 Pixel,空间数据质量的相关概念,(3),误差(,Error,),描述测量值和真实值之间的差别,在大部分情况下,误差的大小是很不准确的,因为待测量的真实值往往无法得到,研究如何给出误差大小的最佳估计以及误差传播规律,是很有用的,误差的分析包括,位置误差(如点、线、多边形的位置误差),属性误差,位置和属性误差之间的联系,空间数据质量的相关概念,(4),不确定性(,Uncertainty,),指客观世界或实体本身就具有的变异,表现为不精确性、随机性和模糊性,由于人对客观实体和现象认识的局限性和表达的模糊性,使原始数据本身存在不确定性,以此数据进行,GIS,的分析与处理,必然使分析结果也具有不确定性,GIS,数据的不确定性,GIS,数据不确定性的产生,一方面是由于客观世界存在的固有的复杂性,不稳定性,和人们对其认识的不完备性,另一方面,在数据采集、录入、编辑、处理、分析和表述过程中出现的各种误差,包括如系统误差或随机误差带来的不确定性,GIS,数据的不确定性包括,位置的不确定性,属性的不确定性,时域的不确定性,逻辑上的不一致性,数据的不完整性,GIS,数据的不确定性,主要研究内容,部分主要研究方法,G,I,S,数据本身不确定性研究内容,位置数据的不确定性,数据源的不确定性,原始测量数据的不确定性(,GPS,、全站仪、数字测图成果不确定性),数字地图获取(手扶跟踪数字化和扫描矢量化)以及遥感数据的不确定性,1,)经典误差理论以及在此基础上的空间统计理论,2,)模糊集合理论,3,)灰色理论方法,4,)熵理论,5,)神经网络理论等方法,6,)模糊仿真方法,GIS,中基本实体不确定性,点实体的不确定性、线实体的不确定性、,面实体的不确定性、体实体的不确定性,数据处理、空间分析过程不确定性,数据格式转换的不确定性、,缓冲区分析不确定性、叠加分析不确定性,其他空间分析的不确定性,属性数据的不确定性,属性定义的不确定性,对现实世界定义不明确,模糊实体关系定义不确定,1,)目标模型和域模型,2,)概率论,3,)证据理论,4,)空间统计学,5,)模糊集合理论,6,)云理论,7,)粗集理论,数据源的不确定性,实体边界界定不确定性,遥感数据边界提取不确定性,查询分析的不确定性,叠加分析的不确定性、查询过程的不确定性,其他分析的不确定性,时域数据的不确定性,时间定义的不确定性,关于时间语义表达的模糊性带来的不确定性,界定事件开始与结束的不确定性,逻辑不确定性,属性一致性的不确定性、格式一致性的不确定性,拓扑关系一致性的不确定性,数据的不完整性,几何数据的不完整性、属性数据的不完整性,模型的不确定性,模型选择的不确定性、模型参数的不确定性,模型不确定性的传播与累加,1,)总体平均可靠性评价方法,2,)蒙特卡罗模拟,不确定复合叠加,属性数据不确定性对位置数据不确定的影响,时间变更对属性数据不确定性的影响,时间变更对位置数据不确定性的影响,位置与属性数据不确定性叠加,时空不确定性叠加,缺陷率统计方法,GIS,数据的不确定性,主要研究内容,部分主要研究方法,不确定性建模分析与表达,不确定性建模,数据不确定值的数据模型建立,科学计算可视化方法,GIS,可视化方法,数据不确定性可视化表达,数据的不确定性的显示与表达,数据的不确定性可视化结果分析,数据产品的不确定性评价,电子地图,电子地图不确定性评价,不确定性的叠加与传播,4D,产品,DLG,、,DEM,、,DRG,、,DOQ,产品的不确定性评价,GIS,工程不确定性评价与控制,GIS,组件最优(不确定性最小)分割,GIS,组件不确定性预测与评价,GIS,组件间不确定性的叠加与传播,GIS,组件最优分割模型,运筹学方法,GIS,工程不确定性估计与控制,GIS,工程不确定性预测与评价,GIS,工程不确定性的控制方法与策略,建立预测模型软件工程方法、项目管理方法,空间数据质量问题的来源,空间现象自身存在的不稳定性,空间上的不确定性:空间现象在空间位置分布上的不确定性变化,时间上的不确定性:空间现象在发生时间段上的游移性,属性上的不确定性:属性类型划分的多样性,非数值型属性值表达的不精确性,空间现象的表达,测量误差、地图投影、数值采样和量化等,空间数据处理中的误差,投影转换,地图数字化与扫描矢量化,格式转换,数据抽象,空间分析,可视化表达,数据处理过程中误差的传递和扩散,空间数据使用中的误差来源,主要包括两个方面:对数据的解释过程、缺少文档,数据处理过程,误差来源,数据搜集,野外测量误差:仪器误差、记录误差,遥感数据误差:辐射和几何纠正误差、信息提取误差,地图数据误差:原始数据误差、坐标转换、制图综合及印刷,数据输入,数字化误差:仪器误差、操作误差,不同系统格式转换误差:栅格,-,矢量转换、三角网,-,等值线转换,数据存储,数值精度不够,空间精度不够:每个格网点太大、地图最小制图单元太大,数据处理,分类间隔不合理,多层数据叠合引起的误差传播:插值误差、多源数据综合分析误差,比例尺太小引起的误差,数据输出,输出设备不精确引起的误差,输出的媒介不稳定造成的误差,数据使用,对数据所包含的信息的误解,对数据信息使用不当,空间数据误差的类型,主要类型,几何误差,属性误差,时间误差,逻辑误差,逻辑误差和几何误差为,GIS,特有,逻辑误差,语义角度判断数据的合理性,几何误差,几何误差的含义,空间数据表达的位置信息误差,在二维平面上主要反映在点误差和线误差上,分类,点误差:测量位置与真实位置的差异,x=x x,0,y=y y,0,线误差,线误差分布可以用,Epsilon,模型(等宽)或者误差带模型(不等宽)描述,折线误差的分布(,误差带模型),曲线的误差分布(误差带模型),其他数据质量问题,地图数据的质量问题,地图固有误差:控制点误差、投影误差等,地图材料变形:由于图纸的大小受湿度和温度变化的影响而产生,地图扫描及数字化误差,遥感数据的质量问题,遥感仪器观测过程误差,表现为空间分辨率、光谱分辨率、几何畸变以及辐射误差等,图像处理和解译过程误差,校正匹配、解译判读、分类等,测量数据的质量问题,选定的大地坐标系及投影,环境影响,测量仪器精度,操作误差、偶然误差等,空间数据质量的控制,通过采用科学的方法,制定出空间数据的生产技术规程,并采取 一系列切实有效的方法在空间数据的生产过程中,针对空间数据质量的关键性问题予以精度控制和错误改正,以保证空间数据的质量,应从数据质量产生和扩散的所有过程和环节入手,分别用一定的方法减少误差,常见的数据质量空间方法有:,传统的手工方法,与原始地图或者属性数据比较;,元数据方法,阅读元数据了解数据质量的信息;,地理相关法,利用空间数据描述的地理特征要素自身的相关性,空间数据的元数据,元数据(,Metadata,),是描述数据的数据,是关于数据的描述性数据信息,尽可能多的反映数据集自身的特征规律,以便于用户对数据集的准确、高效与充分的开发与利用,如数据的内容、质量、状况和其他有关特征的背景信息,目的就是促进数据集的高效利用、共享,不同领域的数据库,其元数据的内容会有很大差异,元数据的内容,对数据集的描述:数据项、数据来源、数据所有者及数据历史,数据质量的描述:数据精度、数据的逻辑一致性、数据完整性、分辨率,数据处理信息的说明,数据转换方法的描述,数据更新、集成等说明,空间元数据的作用,帮助数据生产者管理和维护空间数据,便于数据用户查询检索地理空间数据,帮助用户了解数据,以便就数据是否能够满足其需求做出这功能的判断,提供有关信息,以便用户或者,GIS,软件进行数据的处理和转换,元数据成为数据共享和有效使用的重要工具,空间数据元数据内容及示例,。,数据生产者,数据生产时间,数据质量,数据组织,空间参照系,数据内容以及其他属性,。,FGDC,空间元数据标准,FGDC,美国联邦地理数据委员会(,Federal Geographic Data Committee,),CSDGM,数字化地理空间元数据内容标准(,Content Standard for Digital Geospatial Metadata,),基本情况,在,1993,年首先发布,现在已经成为了世界范围内其它标准的基础,作为一个内容标准,,CSDGM,描述了元数据档案中需要包括的条目,但是没有准确给出它们的具体格式和组织方式,这使得开发者可以根据自己的软件环境实现该标准,但是需要保证其实现能够被另外一个软件实现所理解,软件实现必须是可以互操作的,FGDC,元数据,CSDGM,的主要内容,标识信息,关于数据集的基本信息,数据质量信息,对数据集质量的总体评估,空间数据组织信息,在数据集中用于表达空间信息的机制,空间参照信息,描述了数据集中坐标的参照框架以及编码方式,实体和属性信息,关于数据集中信息内容的细节,包括实体类型、其属性、属性值的值域,分发者信息,关于分发者的信息以及得到该数据集的可选方案,元数据参考信息,关于元数据信息现势性,以及起负责团体的信息,引用信息,使用数据集中的推荐引用参考,时间信息,关于一个事件的日期和时间信息,联系信息,与该数据集有关的人或组织的标识,以及同它们进行联系的方法,ArcCatalog
展开阅读全文