《GIS空间数据库》PPT课件

上传人:wux****ua 文档编号:16138107 上传时间:2020-09-20 格式:PPT 页数:141 大小:1.28MB
返回 下载 相关 举报
《GIS空间数据库》PPT课件_第1页
第1页 / 共141页
《GIS空间数据库》PPT课件_第2页
第2页 / 共141页
《GIS空间数据库》PPT课件_第3页
第3页 / 共141页
点击查看更多>>
资源描述
2005-07-19,重庆交通学院测绘与国土信息系 Liugd,GIS空间数据库,一、空间数据库的概念,二、空间数据库模型,三、空间数据库的设计,四、空间数据库的建立与维护,1空间数据库,2空间数据库管理系统,3空间数据库应用系统,1传统数据模型,2传统模型局限,3面向对象模型,4GIS空间数据库类型,1需求分析,2结构设计,3数据层设计,4数据字典设计,1空间数据库的建立,2空间数据库的维护,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,1.1 空间数据库,Back,一、空间数据库的定义 二、空间数据的特征 三、空间数据库的特点,零、数据库基础知识的复习,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,一、空间数据库的定义,2、空间数据库的定义 空间数据库是存取、管理空间信息的数据库。,建立数据库不仅仅是为了保存数据,扩展人的记忆,而主要是为了帮助人们去管理和控制与这些数据相关联的事物。,1、数据库的定义 数据库就是为了一定的目的,在计算机系统中以特定的结构组织、存储、管理和应用的相关联的数据集合。复习,地理信息系统中的数据库就是一种专门化的数据库,由于这类数据库具有明显的空间特征,所以有人把它称为空间数据库。,计算机对数据的管理经过了三个阶段 :程序管理阶段 、文件管理阶段 、数据库管理阶段,返回,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,二、空间数据的特征,1)空间特征 2)非结构化特征 3)空间关系特征 4)分类编码特征 5)海量数据特征,一种地物类型对应一个属性数据表文件。多种地物类型共用一个属性数据表文件。组织,拓扑数据给空间数据的一致性和完整性维护增加了复杂性。拓扑关系的构建,结构化的,即满足第一范式:每条记录定长,且数据项是原子数据.而空间数据数据项变长,对象包含一个或多个对象,需要嵌套记录。,一般需要建立空间索引。,返回,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,三、空间数据库的特点,与一般数据库相比,空间数据库具有以下特征: 数据量特别巨大; 空间数据和属性数据统一,数据种类多; 应用广泛:数据应用面相当广泛。,返回,在建立地理空间数据库时,一方面应遵循和应用通用的数据库的原理和方法;另一方面又必须采取一些特殊的技术和方法来解决其他数据库所没有的问题。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,1.2 空间数据库管理系统,Back,空间数据库管理系统是指能够对物理介质上存储的地理空间数据进行语义和逻辑上的定义; 1、提供必须的空间数据查询、检索和存取功能; 2、能够空间数据进行有效的维护和更新的一套软件系统。,一般由专业GIS软件提供,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,1.3 空间数据库应用系统,Back,提供给用户访问和操作空间数据库的用户界面,是应用户数据处理需求而建立的具有数据库访问功能的应用软件。 一般需要进行二次开发。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,2.1 传统数据模型,Back,数据结构:是指数据的组织形式,在计算机存储、管理和处理的数据逻辑结构。 数据模型:是描述实体及其相互关系的数学描述,是空间数据库建立的逻辑模型。 两者之间的关系:混合的交叉关系,并不一一对应,世界多样性,确定数据模型,确保实用性,(便于模型化、存储、检查和分析),它并不基于空间数据结构。,理解:层次、网络、关系模型,练习实例,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,2.2 传统模型局限,Back,1、层次模型用于GIS地理数据库的局限性 2、网络模型用于GIS地理数据库的局限性 3、关系模型用于GIS地理数据库的局限性 4、标准的DBMS存储空间数据的局限性,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,2.3 面向对象模型,Back,一、面向对象模型的简介 二、面向对象模型的基本概念 三、面向对象模型的特性 四、面向对象模型的四种核心技术 五、面向对象模型的核心工具,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,2.4 GIS数据库类型,Back,在GIS中,对空间数据的管理采用空间数据库,曾经用过的管理方式有: 1、基于文件的数据管理方式 2、文件与关系数据库混合的管理方式双元模型 3、全关系型空间数据库管理系统分层模型 4、对象关系数据库管理系统 5、面向对象的空间数据库管理系统,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,空间数据库的设计,Back,现实世界 地理实体,需求分析,空间数据库的设计是指在现在数据库管理系统的基础上建立空间数据库的整个过程。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,3.1 需求分析,需求分析是整个空间数据库设计与建立的基础,主要进行以下工作: 1、调查用户需求:了解用户特点和要求,取得设计者与用户对需求的一致看法。 2、需求数据的收集和分析:包括信息需求(信息内容、特征、需要存储的数据)、信息加工处理要求(如响应时间)、完整性与安全性要求等。 3、编制用户需求说明书:包括需求分析的目标、任务、具体需求说明、系统功能与性能、运行环境等,是需求分析的最终成果。,在需求分析阶段完成:数据源的选择和对各种数据集的评价(一般、空间、属性评价)。,Back,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,3.2 结构设计,Back,指空间数据结构设计,结果是得到一个合理的空间数据模型,是空间数据库设计的关键。 空间数据库设计的实质是将地理空间实体以一定的组织形式在数据库系统中加以表达的过程,也就是地理信息系统中空间实体的模型化问题。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,概念模型,是通过对错综复杂的现实世界的认识与抽象,最终形成空间数据库系统及其应用系统所需的模型。,表示概念模型最有力的工具是ER模型,即实体联系模型,包括实体、联系和属性三个基本成分。用它来描述现实地理世界,不必考虑信息的存储结构、存取路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,具有直观、自然、语义较丰富等特点,在地理数据库设计中得到了广泛应用。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,逻辑模型,逻辑模型的设计是将概念模型结构转换转换为具体DBMS可处理的地理数据库的逻辑结构(或外模式),包括确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。 从E-R模型向关系模型转换的主要过程为: 确定各实体的主关键字; 确定并写出实体内部属性之间的数据关系表达式(函数依赖关系),即某一数据项决定另外的数据项; 把经过消冗处理(规范化处理)的数据关系表达式中的实体作为相应的主关键字; 根据、形成新的关系。 完成转换后,进行分析、评价和优化。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,物理模型,主要内容包括确定记录存储格式,选择文件存储结构,决定存取路径,分配存储空间。 物理设计的好坏将对地理数据库的性能影响很大,一个好的物理存储结构必须满足两个条件: 一是地理数据占有较小的存储空间; 二是对数据库的操作具有尽可能高的处理速度。 在完成物理设计后,要进行性能分析和测试。,是指有效地将空间数据库的逻辑结构在物理存储器上实现,确定数据在介质上的物理存储结构,其结果是导出地理数据库的存储模式(内模式)。,物理设计在很大程度上与选用的数据库管理系统有关。设计中应根据需要,选用系统所提供的功能。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,3.3 数据层设计,Back,GIS的数据可以按照空间数据的逻辑关系或专业属性分为各种逻辑数据层或专业数据层,原理上类似于图片的叠置。 例如,地形图数据可分为地貌、水系、道路、植被、控制点、居民地等诸层分别存贮。将各层叠加起来就合成了地形图的数据。在进行空间分析、数据处理、图形显示时,往往只需要若干相应图层的数据。 数据层的设计一般是按照数据的专业内容和类型进行的。数据的专业内容的类型通常是数据分层的主要依据,同时也要考虑数据之间的关系。如需考虑两类物体共享边界(道路与行政边界重合、河流与地块边界的重合)等,这些数据间的关系在数据分层设计时应体现出来。 不同类型的数据由于其应用功能相同,在分析和应用时往往会同时用到,因此在设计时应反映出这样的需求,即可将这些数据作为一层。(如道路、加油站、停车场交通层) 最后得出各层数据的表现形式,各层数据的属性内容和属性表之间的关系等。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,3.4 数据字典设计,Back,数据字典用于描述数据库的整体结构、数据内容和定义等。一个好的数据字典可以说是一个数据的标准规范,它可使数据库的开发者依此来实施数据库的建立、维护和更新。,数据字典的内容包括: 数据库的总体组织结构、数据库总体设计的框架、各数据层详细内容的定义及结构、数据命名的定义、元数据(有关数据的数据,是对一个数据集的内容、质量条件及操作过程等的描述)等内容。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,4.1 空间数据库的建立,Back,1、建立空间数据库结构 利用DBMS提供的数据描述语言描述逻辑设计和物理设计的结果,得到概念模式和外模式,编写功能软件,经编译、运行后形成目标模式,建立起实际的空间数据库结构。 2、数据装入 一般由编写的数据装入程序或DBMS提供的应用程序来完成。在装入数据之前要做许多准备工作,如对数据进行整理、分类、编码及格式转换(如专题数据库装入数据时,采用多关系异构数据库的模式转换、查询转换和数据转换)等。 装入的数据要确保其准确性和一致性。 3、调试运行 装入数据后,要对地理数据库的实际应用程序进行运行,执行各功能模块的操作,对地理数据库系统的功能和性能进行全面测试。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,4.2 空间数据库的维护,Back,1、空间数据库的重组织 指在不改变空间数据库原来的逻辑结构和物理结构的前提下,改变数据的存储位置,将数据予以重新组织和存放。 2、空间数据库的重构造 指局部改变空间数据库的逻辑结构和物理结构。数据库重构通过改写其概念模式(逻辑模式)的内模式(存储模式)进行。 3、空间数据库的完整性、安全性控制 完整性是指数据的正确性、有效性和一致性,主要由后映象日志来完成,它是一个备份程序,当发生系统或介质故障时,利用它对数据库进行恢复。 安全性指对数据的保护,主要通过权限授予、审计跟踪,以及数据的卸出和装入来实现。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,附:DB(数据集合)知识复习,返回,1、数据管理的发展阶段P38 2、数据抽象与数据库模式P39 3、数据模型P40 4、数据库系统的构成P41 5、数据库新方向,数据库的核心问题是数据模型,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,附:学习数据库应达到的基本目标,1、结合关系型数据库系统深入理解数据库系统的基本概念,原理和方法。 2、掌握关系数据模型及关系数据语言,能熟练应用SQL语言表达各种数据操作。 3、掌握E-R模型的概念和方法,关系数据库规范化理论和数据库设计方法,通过上机实习的训练,初步具备进行数据库应用系统开发的能力。 4、对数据库领域研究的深入课题有大致了解,激发在此领域中继续学习和研究的愿望,为学习数据库系统高级课程做准备。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据管理的发展阶段(教材P38),人工管理阶段(50年代中期以前)【背景】【特点】 文件系统阶段(50年代后期60年代中期)【背景】【特点】 数据库系统阶段(60年代后期开始)【背景】【特点】 数据库系统VS文件系统【对比】 数据库系统的特点【特点】,掌握思路 各阶段的技术及应用背景: 计算机应用范围 外存储设备 数据管理软件 各个阶段的差别体现: 谁管理数据 数据面向谁 数据与应用的独立性,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,人工管理阶段背景,背景: 1、计算机主要用于科学计算(数据量小、结构简单,如高阶方程、曲线拟和等)。 2、外存只有磁带、卡片、纸带等,没有磁盘等直接存取设备。 3、没有操作系统,没有数据管理软件(用户用机器指令编码)。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,人工管理阶段特点,特点: 1、用户负责数据的组织、存储结构、存取方法、输入输出等细节。 2、数据完全面向特定的应用程序,每个用户使用自己的数据,数据不保存,用完就撤走。 3、数据与程序没有独立性,程序中存取数据的子程序随着存储结构的改变而改变。,应用程序n,数据组n,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,文件系统阶段背景,背景: 1、计算机不但用于科学计算,还用于管理。 2、外存有了磁盘、磁鼓等直接存取设备。 3、有了专门管理数据的软件,一般称为文件系统,包括在操作系统中。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,文件系统阶段特点,特点: 1、系统提供存取方法(索引文件、链接文件、直接存取文件、倒排文件等),支持对文件的基本操作(增、删、改、查等),用户程序不必考虑物理细节。数据的存取基本上以记录为单位。 2、一个数据文件对应一个或几个用户程序,还是面向应用的。 3、数据与程序有一定的独立性,因为文件的逻辑结构与存储结构由系统进行转换,数据在存储上的改变不一定反映在程序上。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,文件系统中程序与文件的对应,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,文件系统带来的后果,数据与程序的独立性差: 文件系统的出现并没有从根本上改变数据与程序紧密结合的状况。文件系统只是解脱了程序员对物理设备存取的负担,它并不理解数据的语义,只负责存储。数据的语义信息只能由程序来解释,也就是说,数据收集以后怎么组织,以及数据取出来之后按什么含义应用,只有全权管理它的程序知道。数据的逻辑结构改变则必须修改应用程序。一个应用若想共享另一个应用生成的数据,必须同另一个应用沟通,了解数据的语义与组织方式。 数据的冗余度大: 数据仍然是面向应用的。当不同应用程序所需要的数据有部分相同时,也必须建立各自的文件,而不能共享相同的数据。数据分散管理。 数据的不一致性: 由于数据存在很多副本,给数据的修改与维护带来了困难,容易造成数据的不一致性。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库管理阶段背景,背景: 1、计算机管理的数据量大,关系复杂,共享性要求强(多种应用、不同语言共享数据)。 2、外存有了大容量磁盘,光盘。 3、软件价格上升,硬件价格下降,编制和维护软件及应用程序成本相对增加,其中维护的成本更高,力求降低。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库管理阶段特点,特点: 1、有了数据库管理系统。 2、面向全组织,面向现实世界。 3、独立性较强。 4、由DBMS统一存取,维护数据语义及结构。 数据库观点: 数据不是依赖于处理过程的附属品,而是现实世界中独立存在的对象。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,文件系统与数据库系统的对比,文件系统的弱点: 文件之间无联系 难于维护数据的完整性 数据库系统的用武之地: 有查询 数据复杂,文件系统: 分别组织多个文件,存储各类对象的记录。 系统不支持文件间的联系,由应用程序负责查询表达及数据的维护。,数据库系统(关系): 数据统一按表结构存放,联系也表为表形式。 查询:只需提查询要求,由系统完成查询过程。 维护:应用提出完整性约束,系统自动检查。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库系统的特点,面向全组织的复杂的数据结构 1、支持全企业的应用而不是某一个应用。 2、数据反映了客观事物间的本质联系,而不是着眼于面向某个应用,是有结构的数据。这是数据库系统的主要特征之一,与文件系统的根本差别。文件系统只是记录的内部有结构,一个文件的记录之间是个线性序列,记录之间无联系。 数据的冗余度小,易扩充 1、数据面向整个系统,而不是面向某一应用,数据集中管理,数据共享,因此冗余度小。 2、节省存储空间,减少存取时间,且可避免数据之间的不相容性和不一致性。 3、每个应用选用数据库的一个子集,只要重新选取不同子集或者加上一小部分数据,就可以满足新的应用要求,这就是易扩充性。 具有较高的数据和程序的独立性 数据与程序相对独立,把数据库的定义和描述从应用程序中分离出去。描述又是分级的(全局逻辑、局部逻辑、存储),数据的存取由系统管理,用户不必考虑存取路径等细节,从而简化了应用程序。 1、数据独立性:当数据的结构发生变化时,通过系统提供的映象(转换)功能,使应用程序不必改变 2、数据的物理独立性:当数据的存储结构改变时,通过数据的存储结构与逻辑结构之间的映象,数据的逻辑结构可以保持不变,从而应用程序也不必改变。 3、数据的逻辑独立性:当数据的总体逻辑结构改变时,通过数据的总体逻辑结构与局部逻辑结构之间的映象,数据的局部逻辑结构可以保持不变,从而应用程序也不必改变。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据抽象、数据库模式(教材P39),数据抽象,数据库模式,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据抽象和信息世界,【信息世界】 1、数据库系统是面向计算机的,而应用是面向现实世界的,两个世界存在着很大差异,要直接将现实世界中的语义映射到计算机世界是十分困难的,因此引入一个信息世界作为现实世界通向计算机实现的桥梁。 2、一方面,信息世界是对现实世界的抽象,从纷繁的现实世界中抽取出能反映现实本质的概念和基本关系;另一方面,信息世界中的概念和关系,要以一定的方式映射到计算机世界中去,在计算机系统上最终实现。信息世界起到了承上启下的作用。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,信息世界计算机世界,现实世界,概念化,形式化,现实世界 的信息,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,从数据抽象过程看信息控制系统,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库模式数据库的抽象分级,一、模式 1、数据的抽象,数据的描述。 2、元数据(meta-data):描述数据的数据。比如:文献索引,2n-1。,数据库管理系统的一个主要作用就是隐藏关于数据存储和维护的某些细节,而为用户提供数据在不同层次上的抽象视图,即不同的使用者从不同的角度去观察数据库中的数据所得到的结果(数据库中的)数据抽象。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,同样的数据库,不同的视觉,视图1,DataBase,数据视图,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库系统中模式的分级,模式的分级: 为了提高数据的物理独立性和逻辑独立性,使数据库的用户观点,即用户看到的数据库,与数据库的物理方面,即实际存储的数据库区分开来,数据库系统的模式是分级的。 数据库系统三级模式结构: CODASYL(Conference On Data System Language,美国数据系统语言协商会)提出模式、外模式、存储模式三级模式的概念。三级模式之间有两级映象。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库的三级模式体系,数据库,内模式,模 式,外模式2,外模式1,外模式3,应用A,应用B,应用C,应用D,应用E,外模式/模式映象,模式/内模式映象,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,模式的五个具体概念,外模式(Sub-Schema): 用户的数据视图。是数据的局部逻辑结构,模式的子集。 模式(Schema): 所有用户的公共数据视图。是数据库中全体数据的全局逻辑结构和特性的描述。 内模式(Storage Schema): 又称存储模式。数据的物理结构及存储方式。 外模式/模式映象: 定义某一个外模式和模式之间的对应关系,映象定义通常包含在各外模式中。当模式改变时,修改此映象,使外模式保持不变,从而应用程序可以保持不变,称为逻辑独立性。 模式/内模式映象: 定义数据逻辑结构与存储结构之间的对应关系。存储结构改变时,修改此映象,使模式保持不变,从而应用程序可以保持不变,称为物理独立性。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据视图,数据视图: 数据库管理系统的一个主要作用就是隐藏关于数据存储和维护的某些细节,而为用户提供数据在不同层次上的抽象视图,即不同的使用者从不同的角度去观察数据库中的数据所得到的结果数据抽象。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据抽象物理层,对用户来说,了解数据库中用来表示数据的复杂的数据结构没有太大的必要。数据库管理系统通过如下几个层次的抽象来向用户屏蔽复杂性,简化系统的用户界面。 物理层:最低层次的抽象,描述数据实际上是如何存储的。物理层详细描述复杂的低层数据结构,是开发DBMS的数据库供应商应该研究的事情。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据抽象逻辑层,逻辑层:比物理层稍高层次的抽象,描述数据库中存储什么数据以及这些数据间存在什么关系。 因而整个数据库可通过少量相对简单的结构来描述。虽然简单的逻辑层结构的实现涉及到复杂的物理层结构,但逻辑层的用户不必知道这种复杂性。 逻辑层抽象是由数据库管理员和数据库应用开发人员使用的,他们必须确定数据库中应该保存哪些信息。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据抽象视图层(概念层),视图层:最高层次的抽象,但只描述整个数据库的某个部分。尽管在逻辑层使用了比较简单的结构,但由于数据库的规模巨大,所以仍存在一定程度的复杂性。 数据库系统的最终用户并不需要关心所有的信息,而只需要访问数据库的一部分。视图抽象层的定义正是为了使用户与系统的交互更简单。系统可以为同一数据库提供多个视图,而视图又保证了数据的安全性。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据抽象的三个层次,根据这里讨论的数据抽象层次的不同,数据库模式又可分为: 物理模式(物理层设计:内模式) 逻辑模式(通常简称为“模式”) 子模式(外模式) 通常,数据库管理系统支持一个物理模式、一个逻辑模式和多个子模式。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据字典(自己不清楚,请教他人),二、型与值的区别 三、数据字典,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据模型提纲(教材P40),1、数据模型定义 2、概念数据模型 3、结构数据模型的三要素 4、数据模型中常用术语 5、数据模型反映现实世界中实体的关系 6、结构数据模型示例:层次、网状、关系模型 7、数据模型小结,关系代数,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据模型的定义,数据模型: 是数据库系统中用于提供信息表示和操作手段的形式构架。 概念数据模型: 按用户的观点来对数据和信息建模。用于组织信息世界的概念,表现从现实世界中抽象出来的事物以及它们之间的联系。这类模型强调其语义表达能力,概念简单、清晰,易于用户理解。它是现实世界到信息世界的抽象,是用户与数据库设计人员之间进行交流的语言。如E-R模型。 结构数据模型: 从计算机实现的观点来对数据建模。是信息世界中的概念和联系在计算机世界中的表示方法。一般有严格的形式化定义,以便于在计算机上实现。如层次模型、网状模型、关系模型、面向对象模型。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,概念数据模型(E/R),学生,课程,选修,学号,姓名,系别,课程名,先修课,主讲老师,成绩,实体,联系,属性,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,结构数据模型的三要素,数据结构 数据操作 数据的约束条件,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,结构数据模型的数据结构,一、数据结构:描述系统的静态特性,即组成数据库的对象类型。 包括: 1、数据本身:类型、内容、性质。如网状模型中的数据项、记录,关系模型中的域、属性,关系等。 2、数据之间的联系:例如网状模型中的系型(Set Type) 二、在数据库系统中一般按数据结构的类型来命名数据模型。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,结构数目模型的数据操作,一、描述系统的动态特性,即对数据库中对象的实例允许执行的操作的集合,包括操作及操作规则。一般有检索、更新(插入、删除、修改)操作。 二、数据模型要定义操作含义、操作符号、操作规则,以及实现操作的语言。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,结构数据模型的约束条件,数据的约束条件是完整性规则的集合,规定数据库状态及状态变化所应满足的条件,以保证数据的正确、有效、相容。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,信息世界中常用的概念P40,1、实体 2、属性 3、码 4、域 5、实体型 6、实体集 7、联系,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据模型反映实体间的关系,1、一对一的联系(1:1) 2、一对多的联系(1:N) 3、多对多的联系(M:N),A,B,A,B,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,层次数据模型,1、用树结构表示实体之间联系的模型叫层次模型。 2、树由节点和连线组成,节点代表实体型,连线表示两实体型间的一对多联系。 3、树有以下特性: (1)每棵树有且仅有一个节点无父节点,此节点称为树的根(Root)。 (2)树中的其它节点都有且仅有一个父节点。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,层次模型示意图,大学,研究所,土木院,教务处,科1,测绘系,道路系,研究室,科2,教研室1,教研室2,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,层次模型的优点和缺点,优点: 结构简单,易于实现。 缺点: 支持的联系种类太少,只支持二元一对多联系。 数据操纵不方便,子结点的存取只能通过父结点来进行。 代表产品: IBM的IMS数据库,1969年研制成功。,SDB中的层次模型,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,网状数据模型,网状数据模型是一个满足下列条件的有向图: 1、可以有一个以上的节点无父节点。 2、至少有一个节点有多于一个的父节点(排除树结构)。,沈阳,北京,南京,上海,广州,西安,重庆,武汉,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,网状模型的特点,特点: 表达的联系种类丰富。 结构复杂。 DBTG报告: 1969年,由美国CODASYC(Conference On Data System Language,数据系统语言协商会)下属的DBTG(Data Base Task Group)组提出,确立了网状数据库系统的概念、方法、技术。,SDB中的网络模型,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,关系数据模型,用二维表来表示实体及其相互联系。,表头,表格,数据库的总体设计称作数据库的模式,如上面的“表头”。随着时间的推移,数据库中的数据会发生变化。特定时刻存储在数据库中信息的集合称作数据库的一个实例,如表中的“表格”。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,关系模型的几个概念,1、关系:一个关系对应于我们平常所说的一张表; 2、元组:表中的一行称为一个元组; 3、属性:表中的一列称为属性,给每一列取一个名称即为属性名; 4、主码:表中的某个属性组,他们的值唯一地标识一个元组; 5、域:属性的取值范围; 6、分量:元组中的一个属性值; 7、关系模式:对关系的描述,用关系名(属性名1,属性名2,.,属性名n)来表示。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,关系模型的特点和优点,关系模型的特点: 1、关系模型的概念单一; 2、关系必须是规范化关系; 3、在关系模型中,用户对数据的检索操作不过是从原来的表中得到一张新的表。即是说: 在用户眼中,无论是原始数据还是结果数据都是同一种数据结构二维表; 关系模型中,能够数据操作是集合操作; 关系模型把存取路径向用户隐蔽起来;,优点: 简单,表的概念直观,用户易理解。 非过程化的数据请求,数据请求可以不指明路径。 数据独立性,用户只需提出“做什么”,无须说明“怎么做”。 坚实的理论基础。,SDB中的关系模型,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,关系代数,关系代数是由一组以关系作为运算对象的特定的运算所组成的。用户通过这组运算,对一个或多个关系不断地进行组合与分割而得到所需的数据。关系代数常用的运算有:并运算、交运算、差运算、笛卡尔积、投影运算、选择运算、联接运算、除运算等。,选择运算(SELECTION)。选择运算是将关系作为元组的集合,从中选择出满足一定要求的元组,其运算结果是一个新的关系。简单地说就是对关系表的行进行选择操作。从中选择出满足一定要求的行组成一个新关系表。选择运算可以表示为:SELECT关系表名WHERE选择条件。举例 投影运算(PROJECTION)。投影运算是从构成一个关系的若干基本属性集合出发,从中选取某些基本属性集合,重新构造成出另一关系,因此其运算结果也是产生一个新的关系。简单地说就是对关系表的列进行选择操作。从中选择出若干列组成一个新关系表。投影运算可以表示为:PROJECT关系表名ON属性名。举例 连接运算(JOIN)。连接运算是对两个关系进行运算,从构成这两个关系的所有基本属性集合中,选择出满足一定要求的基本属性集合,重新构造一个新关系,因此其运算结果也是产生一个新的关系。简单地说就是对两张关系表的行进行合并操作,从中选择出满足对列一定要求的行,组成一个新关系表。连接运算可以表示为:JOIN关系表名1AND关系表名2WHERE连接条件。举例 选择运算、投影运算和连接运算是关系代数中最基本的数据操作运算,这些基本运算为建立关系数据库系统的操作语言奠定了基础。无论要检索满足何种条件的数据,其检索过程涉及到几个关系(表),运用这三种运算操作,都可以实现。目前实际上应用的关系数据库的数据操作语言都是基于这三种关系代数运算而构造的。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,关系模型的规范化,Normalization的主要目的是消除数据冗余、避免更新异常。它的理论基础是Normal Form理论。 Functional Dependence (函数依赖),1.第一范式 2.第二范式 3.第三范式 4.第四范式 5.第五范式,规范化是关系模型中的一个重要概念,是关系理论的核心部分。所谓的规范化是用更单纯的、结构更规则的关系逐步取代原有关系的过程,或者说是把一个低一级范式的关系,通过投影运算分解为若干更高一级范式的关系的集合,使之适合关系代数和关系演算的要求。规范化理论是建立在这种思想的基础上:使确定的一组关系在插入、更新与删除方面比包含同样数据的其它一些关系具有较好的性能,这样会使数据结构具有稳定性和灵活性,以适应数据库的发展和扩充的需要。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,第一范式,第一范式要求表中的每个域都是单纯域(表中不能套表),即消除重复组。 解决的办法:分解表,将非单纯域化为单纯域。,第一范式(1NF):如果关系模式R,其所有的域为单纯域,即其元素不可在分,则称R是规范化的关系,或称第一范式(1NF),2005-07-19,重庆交通学院测绘与国土信息系 Liugd,第二范式,第二范式要求一个关系中的所有非主属性都完全依赖于主关键字。 完全函数依赖:A真包含于A,若A则B,那么B完全函数依赖于A。 主属性:包含在候选关键字中的属性称为主属性。 解决的办法:分解表,消除所有非主属性对主关键字的非完全函数依赖。,关键字为(student-id, course-id) 而student-name部分依赖于student-id. 因此不是2NF,第二范式(2NF):如果关系模式R为第一范式,且每个非主属性完全函数依赖于主关键字,则模式R称为第二模式。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,第三范式,关键字为( room-id, teacher-id) 而teacher-id - course-id. course-id - Students. 因此不是3NF,第三范式要求非主属性相互独立,即非主属性与主关键字之间不能存在传递依赖关系。 传递依赖:若S1则S2, S2 不一定S1 , S2则S3,那么称S3传递依赖于S1。 解决的办法:用投影的方法消除非主属性对主关键字的任何传递函数依赖。,第三范式(3NF):如果关系模式R为第二范式,且每个非主属性A非传递依赖于主关键字X,即不存在满足XY,YX,YA的属性或属性集Y,则称关系模式为第三范式。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,第三范式的说明,1.第三范式是数据库设计的基本要求。 2.有些复杂的数据库需要满足第五范式才不会出现插入、删除异常,保证数据的一致性。 3.有些简单的数据库,不满足第三范式也能够进行操作。 结论:需要具体问题具体分析。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,第四范式,BCNF(Boyce-Codd Normal Form)范式是第三范式的改进,它建立于第一范式的基础上。关系模式R为第一范式,满足涵数依赖集合F,X和A均为R的属性集合,且X不包含A。如果R满足XA,且X包含R的主关键字,称关系模式R为BCNF范式。 第四范式(4NF):第四范式是BCNF的推广,它适用于具有多值依赖的关系模式,定义为:设R为一关系模式,D为R所满足的依赖集合。如果R的D中存在一个多值依赖XY,其中X不是空集也不是子集,且X,Y并未包含R的全部属性,则X中必包含R的主关键字。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,第五范式,第五范式(5NF):如果关系R,其每个联接依赖均由模式R的侯选关键字所蕴涵,则说模式R为第五范式。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据模型小结,数据库结构的基础就是数据模型。数据模型是描述数据(数据结构)、数据之间的联系、数据语义即数据操作,以及一致性(完整性)约束的概念工具的集合。,基于对象的逻辑模型,数据模型,基于记录的逻辑模型,网状模型,层次模型,关系模型,面向对象模型,实体联系模型,(逻辑层和概念层),逻辑数据模型,物理数据模型(物理层),2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库系统的构成,几个相关概念 数据库系统的软硬件层次 数据库系统的主要成分 数据库管理系统的层次结构及其功能,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,几个相关概念P38/P41,1、数据库: 数据的集合。由DBMS统一管理,多用户共享。 2、数据库管理系统DBMS: 系统软件,对数据库进行统一管理和控制。 3、数据库系统: 带有数据库的整个计算机系统,包括硬件、软件、数据、人员。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库系统的软硬件层次,硬件,操作系统,DBMS,编译系统,应用开发工具软件,应用系统,PB,VB,VC DELPHI,Oracle,Db2, Sybase, SQL Server, Informix,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库系统的主要成分,1、硬件:内存大,放得下OS,DBMS核心,系统缓冲区,用户工作区等;大容量、直接存取的外存设备;作数据备份的磁带。 2、软件:OS,DBMS,高级语言编译系统及其与数据库的接口,应用开发工具,应用系统。 3、数据:包括目标数据(数据本身)及描述数据(对数据的说明信息)。 4、用户: (1)最终用户:通过应用系统的用户接口(菜单等)使用数据库。 (2)应用程序员:基于外模式来编写应用程序。 (3)系统分析员:负责应用系统的需求分析和规范定义,确定系统的软硬件配置,参与数据库模式设计。 (4)数据库管理员DBA:负责数据库的全面管理和控制。 5、DBA的重要性: (1)重要资源,维护整个组织的信息资源。 (2)共享资源,多用户共享,需要统一管理、协调、监控。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库管理系统的层次结构P41,操作系统,数据存储层,数据存取层,语言翻译处理层,数据库,应用层,数据文件,数据字典, 索引,统计数据,缓冲区,DDL,DML, 查询计算引擎,事务,日志, 封锁,存取路径,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库管理系统的功能P41,1、数据库定义功能 提供DDL语言(Data Description Language)描述外模式、模式、内模式(源模式)。 模式翻译程序把源模式翻译成目标模式,存入数据字典中。 2、数据库运行管理 并发控制、存取控制、完整性约束条件检查和执行,日志组织和管理,事务管理和自动恢复。 3、数据组织、存储和管理 用户数据、索引、数据字典的组织、存储和管理,包括文件结构、存取方式、数据之间的联系的实现等。 4、数据库的建立和维护功能 数据的装入、转换、卸出,数据库的转储、恢复、性能监视和分析等。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,数据库发展的新方向,1、新的数据库管理系统 面向对象数据库 对象-关系数据库 并行数据库 分布式数据库 2、新的数据库应用 数据仓库 数据挖掘 OLAP,3、特种数据库 时态数据库 移动数据库 主动数据库 模糊数据库 实时数据库 空间数据库 Web数据库 XML数据库,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,我们应该重点关注的数据库技术,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,附:数据库中的数据组织方式,数据库中的数据组织一般可以分为四级:数据项、记录、文件和数据库。 1、数据项:是可以定义数据的最小单位,也叫元素、基本项、字段等。 2、记录:由若干相关联的数据项组成。 3、文件:文件是一给定类型的(逻辑)记录的全部具体值的集合。 4、数据库:是比文件更大的数据组织。数据库是具有特定联系的数据的集合,也可以看成是具有特定联系的多种类型的记录的集合。数据库的内部构造是文件的集合,这些文件之间存在某种联系,不能孤立存在。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,附:关系DB中数据组织实例,数据项,记 录,文 件,数据库,返回,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,附:空间索引技术1,不论采取哪种管理模式,空间数据库都必须提供以下功能: 数据管理:图层检索、图层删除等 数据备份:图层备份、数据库备份等 数据存取:图层数据存取、图层中部分实体存取等 为了提高空间数据库中各种功能的效率,空间索引技术是任何空间数据库都必须采纳的基本技术之一。此外,在网络环境下,为了提高空间数据的访问效率,减少空间数据的传输,网络空间缓存技术也是非常必要的。,在“空间数据”中曾讲过,空间信息是按分层的方式组织的,空间数据和属性数据统一管理的模式分为:文件模式、 混合模式、 关系数据库模式、 对象关系数据库模式、 面向对象数据库模式等五种。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,附:空间索引技术2,空间索引技术 空间实体的表达形式复杂,数据量大,各种空间操作不仅计算量巨大,而且多具有面向邻域的特点。空间索引正是顾及了空间实体的这些特点,依据空间实体的位置和形状或空间实体之间的某种空间关系,按一定顺序排列的一种数据结构,其中包含空间实体的概要信息如对象的标识、外接矩形及指向空间实体实体的指针。作为一种辅助性的空间数据结构,空间索引介于空间操作算法和空间实体之间,通过它的筛选作用,大量与特定空间操作无关的空间实体被排除掉,从而提高空间操作的效率。 空间索引结构主要有三大类:R树结构、四分树结构和线性映射结构(参考汪小林博士论文)。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,附:空间索引技术3,层次网格空间索引,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,附:空间索引技术4,网络空间缓存技术的作用包括两个方面:一是空间数据库的存取效率,特别是采用对象关系数据库存储空间对象时的效率;另一个是减少空间数据的网络传输量,提空间数据的网络传输效率。 网络空间缓存一般包含三个层次:数据库缓存、局部缓存代理以及客户端缓存(参考丛升日博士论文)。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,附:空间索引技术5,网络空间缓存结构,数据库缓存,局部缓存代理,客户端缓存,返回,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,三种传统模型表示空间数据模型的练习,用三种模型(层次、网络、关系)组织图:,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,表示空间信息的层次模型,1、它的特点是将数据组织成一对多关系的结构。 2、层次结构采用关键字来访问其中每一层次的每一部分。 3、层次数据库结构特别适用于文献目录、土壤分类、部门机构等分级数据的组织。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,层次模型表示空间数据的缺陷,优点: 存取方便且速度快; 结构清晰,容易理解; 数据修改和数据库扩展容易实现; 检索关键属性十分方便。 缺陷: 结构呆板,缺乏灵活性; 同一属性数据要存储多次,数据冗余大(如公共边); 不适合于拓扑空间数据的组织。,DB中的层次模型,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,层次模型用于GIS地理数据库的局限性,层次模型反映了实体之间的层次关系,简单、直观,易于理解,并在一定程度上支持数据的重构。 用于GIS地理数据库存在的主要问题是: 1)很难描述复杂的地理实体之间的联系,描述多对多的关系时导致物理存储上的冗余; 2)对任何对象的查询都必须从层次结构的根结点开始,低层次对象的查询效率很低,很难进行反向查询; 3)数据独立性较差,数据更新涉及许多指针,插入和删除操作比较复杂,父结点的删除意味着其下层所有子结点均被删除; 4)层次命令具有过程式性质,要求用户了解数据的物理结构,并在数据操纵命令中显式地给出数据的存取路径; 5)基本不具备演绎功能和操作代数基础。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,表示空间信息的网络模型,M,a,b,c,d,e,f,g,1,2,3,4,5,6,网络模型用连接指令或指针来确定数据间的显式连接关系,是具有多对多类型的数据组织方式 。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,网络模型表示空间信息的缺陷,优点: 能明确而方便地表示数据间的复杂关系 数据冗余小 缺陷: 网状结构的复杂,增加了用户查询和定位的困难。 需要存储数据间联系的指针,使得数据量增大 数据的修改不方便(指针必须修改),DB中的网络模型,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,网络模型用于GIS地理数据库的局限性,网状模型反映地理世界中常见的多对多关系,支持数据重构,具有一定的数据独立和数据共享特性,且运行效率较高。 用于GIS地理数据库的主要问题如下: 1)由于网状结构的复杂性,增加了用户查询的定位困难,要求用户熟悉数据的逻辑结构,知道自己所处的位置; 2)网状数据操作命令具有过程式性质,存在与层次模型相同的问题; 3)不直接支持对于层次结构的表达; 4)基本不具备演绎功能和操作代数基础。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,表示空间信息的关系模型,点,关系数据库模型是以记录组或数据表的形式组织数据,以便于利用各种地理实体与属性之间的关系进行存储和变换,不分层也无指针,是建立空间数据和属性数据之间关系的一种非常有效的数据组织方法。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,关系模型表示空间信息的缺陷,优点: 结构特别灵活,满足所有布尔逻辑运算和数学运算规则形成的查询要求 能搜索、组合和比较不同类型的数据 增加和删除数据非常方便 缺陷: 数据库大时,查找满足特定关系的数据费时 对空间关系无法满足,DB中的关系模型,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,关系模型用于GIS地理数据库的局限性,在GIS分析中,常常需要综合运用实体之间的空间关系和属性数据,要求GIS数据库能对实体的属性数据和空间数据进行综合管理。 对属性数据用通用RDBMS可以很好管理,但对于空间数据一般DBMS却有局限,表现为: 1)无法用递归和嵌套的方式来描述复杂关系的层次和网状结构,模拟和操作复杂地理对象的能力较弱; 2)用关系模型描述本身具有复杂结构和涵义的地理对象时,需对地理实体进行不自然的分解,导致存储模式、查询途径及操作等方面均显得语义不甚合理; 3)由于概念模式和存储模式的相互独立性,及实现关系之间的联系需要执行系统开销较大的联接操作,运行效率不够高。 4)空间数据通常是变长的,而一般RDBMS只允许记录的长度设定为固定长度,此外,通用DBMS难于存储和维护空间数据的拓扑关系。 5)一般RDBMS都难以实现对空间数据的关联、连通、包含、叠加等基本操作。 6)一般DBMS不能支持GIS需要的一些复杂图形功能。 7)一般RDBMS难以支持复杂的地理信息,因为单个地理实体的表达需要多个文件、多条记录,包括大地网、特征坐标、拓扑关系、属性数据和非空间专题属性等方面信息。 8)GIS管理的是具有高度内部联系的数据,为了保证地理数据库的完整性,需要复杂的安全维护系统,而这些完整性约束条件必须与空间数据一起存储,由地理数据库来维护系统数据的完整性。否则,一条记录的改变会导致错误、相互矛盾的数据存在,而一般RDBMS难以实现这一功能。,2005-07-19,重庆交通学院测绘与国土信息系 Liugd,总结标准DBMS存储空间数据的局限性,空间数据记录是变长的(如点数的可变性),而一般的数据库都只允许把记录的长度设定为固定; 在存储和维护空间数据拓扑关系方面存在着严重缺陷; 一般都难以实现对空间数据的关联、连通、包含、叠加等基本操作; 不能支持复杂的图形功能; 单个地理实体的表达需要多个文件、多条记录,一般的DBMS也难以支持; 难以保证具有高度内部联系的GIS数据记录需要的复杂的安全维护。,2005-07-19,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!