第六章数据库与数据仓库--PZZ

上传人:痛*** 文档编号:148921891 上传时间:2022-09-06 格式:PPTX 页数:81 大小:503.66KB
返回 下载 相关 举报
第六章数据库与数据仓库--PZZ_第1页
第1页 / 共81页
第六章数据库与数据仓库--PZZ_第2页
第2页 / 共81页
第六章数据库与数据仓库--PZZ_第3页
第3页 / 共81页
点击查看更多>>
资源描述
第一节第一节 数据库技术数据库技术本章内容:本章内容:第二节第二节 数据仓库数据仓库1.数据的层次I.字符:信息的最基本架构,用一个字节来表示;II.字段:以某种方法描述的业务对象或活动的字符组合;III.记录:相关字段的一组集合;IV.文件:相关记录的集合。字符(字节)数据库字段记录文件005-10-6321,李杰,02-01-18fiske1000100职员文件,部门文件,工资文件005-10-6321,李杰,02-01-18 549-77-1001,李英,02-02-01实体:是人、地点或对象的通用类别,数据实体:是人、地点或对象的通用类别,数据以这种类别进行收集、存储和维护。以这种类别进行收集、存储和维护。属性:实体的特性。属性:实体的特性。数据项:属性的特定值数据项:属性的特定值键:记录中用于表示记录的一个或多个字段。键:记录中用于表示记录的一个或多个字段。主键:唯一标识记录的一个或多个字段;主键:唯一标识记录的一个或多个字段;次键:不能唯一标识记录的字段。次键:不能唯一标识记录的字段。传统方法:为每个应用程序分别创建和存储传统方法:为每个应用程序分别创建和存储数据文件的数据管理。数据文件的数据管理。数据冗余:分散在多个文件中数据的重复。数据冗余:分散在多个文件中数据的重复。数据完整性:任一文件中数据的正确程度。数据完整性:任一文件中数据的正确程度。程序程序-数据依赖性:为某个应用所开发及组织数据依赖性:为某个应用所开发及组织的程序和数据与为其他应用开发和组织的程的程序和数据与为其他应用开发和组织的程序和数据不兼容。序和数据不兼容。工资工资程序报表开票开票程序报表库存控制库存控制程序报表数据文件应用程序用户数据库方法:一种数据管理方法,其中相数据库方法:一种数据管理方法,其中相关数据集合可由多个应用程序共享。关数据集合可由多个应用程序共享。传统方法:基于文件;数据库方法:基于数据。数据库方法的优点:1.有效利用存储空间;增强数据完整性;2.增强数据的灵活性;3.增强数据共享能力。1.数据建模和实体关系图 10.1 文件组织 数据组织的层次 文件分类 数据的物理储存与传送 文件组织方式 10.2 数据库技术 传统的文件处理与数据库处理 数据库管理系统(DBMS)数据库的类型 数据库模型与数据库组织结构 数据库设计学号姓名性别成绩备注99001丁一男95M99003王二女90m课 程 号课 程 名教 师99A01*99A03*人工管理人工管理 文件系统文件系统 数据库系统数据库系统 数据管理技术 发展阶段:(一)人工管理阶段(一)人工管理阶段 该阶段处在20世纪50年代中期以前,这时期的数据管理呈以下特点:1、数据不保存。2、数据由应用程序管理。3、数据不共享。4、数据不具独立性。(二)文件系统阶段(二)文件系统阶段 20世纪世纪50年代后期到年代后期到60年代中期,数据结构和数据管理技术迅速发年代中期,数据结构和数据管理技术迅速发展起来。硬件方面有了磁盘、磁鼓等直接存取的外部存储设备;而软件展起来。硬件方面有了磁盘、磁鼓等直接存取的外部存储设备;而软件中出现了操作系统和高级语言。操作系统中有了专门进行数据管理的软中出现了操作系统和高级语言。操作系统中有了专门进行数据管理的软件,称为文件系统。件,称为文件系统。这一时期的数据管理的特这一时期的数据管理的特点是:点是:1、数据可以长期保存。、数据可以长期保存。2、数据由文件系统管理。、数据由文件系统管理。3、数据具有一定的独立、数据具有一定的独立性。性。文件系统也存在以下缺点:文件系统也存在以下缺点:1、编程不方便。、编程不方便。2、数据冗余量大。、数据冗余量大。3、数据独立性差。、数据独立性差。4、不支持并发访问。、不支持并发访问。5、数据缺少统一管理。、数据缺少统一管理。传统文件处理系统应用程序1数据文件1应用程序2应用程序3数据文件2数据文件3 存在问题:1、数据冗余与数据不一致性2、数据联系弱3、缺少数据字典,缺乏灵活性用户用户用户(三)数据库系统阶段(三)数据库系统阶段 20世纪世纪60年代以来,出现了统一管理数据的专门软件系统年代以来,出现了统一管理数据的专门软件系统数据库管理数据库管理系统系统(DBMS,DataBase Management System)。数据库阶段的数据管理特点是:数据库阶段的数据管理特点是:1、数据结构化。、数据结构化。数据结构化是数据库与文件系统的根本区别。数据结构化是数据库与文件系统的根本区别。2、较高的数据独立性。、较高的数据独立性。用户能以简单的逻辑结构操作数据而无需考虑用户能以简单的逻辑结构操作数据而无需考虑数据的物理结构。数据的物理结构。3、数据共享。、数据共享。数据不再仅仅服务于某个程序或用户,而成为若干程序数据不再仅仅服务于某个程序或用户,而成为若干程序或用户的共享资源,由数据库管理系统统一管理与控制。或用户的共享资源,由数据库管理系统统一管理与控制。4、方便的用户接口、方便的用户接口。用户可以使用查询语句或终端命令操作数据库,。用户可以使用查询语句或终端命令操作数据库,也可以用程序方式操作数据库。也可以用程序方式操作数据库。5、较强的数据控制能力。、较强的数据控制能力。并发控制能力;恢复能力并发控制能力;恢复能力;完整性能力;完整性能力;安;安全性能力全性能力 数据库处理系统 特点:应用程序1应用程序2应用程序3DBMS数据库中央数据库用户用户用户1、完善的数据字典和数据模型2、数据独立性3、方便的接口4、完整的数据控制功能5、提高了系统的灵活性银行数据库处理系统银行数据库处理系统客客 户户 交交 易易 处处 理理数数 据据 库库 管管 理理 系系 统统核对帐核对帐户程序户程序存款帐存款帐目程序目程序分期贷分期贷款程序款程序客户数据库客户数据库.银行文件处理系统银行文件处理系统客户财务客户财务报表报表分期贷分期贷款程序款程序帐户核对帐户核对处理处理存款处理存款处理分期贷款分期贷款处理处理贷款分析贷款分析报告报告客户票据客户票据存款文存款文件修改件修改文件修文件修改核对改核对帐户核帐户核对程序对程序分期贷款分期贷款文件修改文件修改存款存款程序程序客户交易客户交易(四)数据库发展新技术(四)数据库发展新技术 数据库技术与具他领域的技术相结合,出现了数据库的许多新的分支,数据库技术与具他领域的技术相结合,出现了数据库的许多新的分支,如:与网络技术相结合出现了网络数据库;与分布处理技术相结合出现了分如:与网络技术相结合出现了网络数据库;与分布处理技术相结合出现了分布式数据库;与面向对象技术相结合出现了面向对象数据库;与人工智能技布式数据库;与面向对象技术相结合出现了面向对象数据库;与人工智能技术相结合出现了知识库;与并行处理技术相结合出现了并行数据库;与多媒术相结合出现了知识库;与并行处理技术相结合出现了并行数据库;与多媒体技术相结合出现了多媒体数据库。体技术相结合出现了多媒体数据库。1 1、分布式数据库技术、分布式数据库技术 分布式数据库系统分布式数据库系统(Distributed DataBase System,DDBS)是在集中式数是在集中式数据库基础上发展起来的,分布式数据库系统是地理上分布在计算机网络的不据库基础上发展起来的,分布式数据库系统是地理上分布在计算机网络的不同节点,逻辑上属于同一系统的数据库系统,分布式数据库系统不仅能支持同节点,逻辑上属于同一系统的数据库系统,分布式数据库系统不仅能支持局部应用,存取本地节点或另一个节点的数据,而且能支持全局应用,同时局部应用,存取本地节点或另一个节点的数据,而且能支持全局应用,同时存取两个或两个以上节点的数据。存取两个或两个以上节点的数据。2 2、面向对象数据库技术、面向对象数据库技术 它的基本设计思想是:一方面把面向对象语言向数据库方向扩展,使应它的基本设计思想是:一方面把面向对象语言向数据库方向扩展,使应用程序能够存取并处理对象;另一方面扩展数据库系统,使其具有面向对象用程序能够存取并处理对象;另一方面扩展数据库系统,使其具有面向对象的特征,提供一种综合的语义数据建模概念集,以便对现实世界中复杂应用的特征,提供一种综合的语义数据建模概念集,以便对现实世界中复杂应用的实体和联系建模。的实体和联系建模。3 3、多媒体数据库、多媒体数据库 多媒体数据具有多媒体数据具有数据量大数据量大、结构复杂结构复杂、数据传输的连续性数据传输的连续性 等特点。因等特点。因而,而,多媒体数据库需要有特殊的数据结构、存储技术、查询和处理方式。多媒体数据库需要有特殊的数据结构、存储技术、查询和处理方式。4 4、数据仓库、数据仓库 数据仓库,就是一种长期数据存储,这些数据来自于多个异种数据源。数据仓库,就是一种长期数据存储,这些数据来自于多个异种数据源。通过数据仓库提供的联机分析处理通过数据仓库提供的联机分析处理(OLAP)工具,实现各种粒度的多维数据工具,实现各种粒度的多维数据分析,以便向管理决策提供支持。分析,以便向管理决策提供支持。用户用户用户用户用户用户数据库管数据库管理理 系系 统统数据库管理员数据库管理员 应用程序应用程序数据库数据库图图6-1 数据库系统数据库系统 v数据库数据库 数据库中的数据按一定的数据模型组织、描述和存储,具数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并为各种用有较小的冗余度、较高的数据独立性和易扩展性,并为各种用户共享。户共享。v数据库管理系统数据库管理系统 数据库管理系统数据库管理系统(DBMS)是介于用户和操作系统之间的一层是介于用户和操作系统之间的一层数据管理软件,属于系统软件。数据库管理系统为数据库的建数据管理软件,属于系统软件。数据库管理系统为数据库的建立、运行和维护提供了统一的管理和控制,是数据库系统的核立、运行和维护提供了统一的管理和控制,是数据库系统的核心。心。v应用程序应用程序 一个数据库应用可分为客户端应用程序和服务端应用程序两类。服务一个数据库应用可分为客户端应用程序和服务端应用程序两类。服务端应用程序运行在数据库服务器上,是真正存储和操纵数据的,它接受用户端应用程序运行在数据库服务器上,是真正存储和操纵数据的,它接受用户程序的请求,对数据进行不同的操作。客户端应用程序运行在客户端计算机程序的请求,对数据进行不同的操作。客户端应用程序运行在客户端计算机上,实现用户的业务逻辑,通过客户端应用程序界面,用户可以发出不同的上,实现用户的业务逻辑,通过客户端应用程序界面,用户可以发出不同的请求给服务器端,由服务端程序完成各种各样的操作。一般情况下,客户端请求给服务器端,由服务端程序完成各种各样的操作。一般情况下,客户端和服务器端的程序通过标准和服务器端的程序通过标准SQL语言通信。语言通信。客户端应用程序根据使用者的不同,可以分成两类:一类是供数据库管客户端应用程序根据使用者的不同,可以分成两类:一类是供数据库管理员使用,提供强大的图形界面和命令以便管理员最大程度的维护数据库的理员使用,提供强大的图形界面和命令以便管理员最大程度的维护数据库的运转;另一类为程序开发人员使用,提供一整套完整的用户接口界面让开发运转;另一类为程序开发人员使用,提供一整套完整的用户接口界面让开发人员通过程序实现操纵数据的目的,这些程序最终将提交给用户使用,即通人员通过程序实现操纵数据的目的,这些程序最终将提交给用户使用,即通常所讲的应用程序。常所讲的应用程序。为了有效地组织和管理数据,提高数据库的逻辑为了有效地组织和管理数据,提高数据库的逻辑独立性和物理独立性,将数据库体系结构分为三级:独立性和物理独立性,将数据库体系结构分为三级:面向用户或应用程序员的用户级面向用户或应用程序员的用户级(外部级外部级)、面向建立、面向建立和维护数据库人员的概念级和面向系统程序员的物理和维护数据库人员的概念级和面向系统程序员的物理级级(内部级内部级)。用户级对应外模式,概念级对应模式,。用户级对应外模式,概念级对应模式,物理级对应内模式物理级对应内模式。数据库系统的体系结构如下页图数据库系统的体系结构如下页图6-2所示。所示。图6-2 数据库系统的体系结构 模式模式 模式又称概念模式或逻辑模式,对应于概念级。它是由数据库设计者综模式又称概念模式或逻辑模式,对应于概念级。它是由数据库设计者综合所有用户的数据,按照统一的观点构造的全局逻辑结构,是对数据库中全合所有用户的数据,按照统一的观点构造的全局逻辑结构,是对数据库中全部数据的逻辑结构和特征的总体描述,是所有用户的全局视图。一个数据库部数据的逻辑结构和特征的总体描述,是所有用户的全局视图。一个数据库只有一个模式。只有一个模式。外模式外模式 外模式又称子模式或用户模式,对应于用户级。它是数据库用户外模式又称子模式或用户模式,对应于用户级。它是数据库用户(包括包括程序员和终端用户程序员和终端用户)所看到和使用的局部数据的逻辑结构和特征的描述,是所看到和使用的局部数据的逻辑结构和特征的描述,是数据库的用户视图。数据库的用户视图。外模式是从模式中导出的一个子集,一个数据库可以有外模式是从模式中导出的一个子集,一个数据库可以有多个外模式。多个外模式。内模式内模式 内模式又称存储模式,对应于物理级。它是数据库中全体数据的内部表内模式又称存储模式,对应于物理级。它是数据库中全体数据的内部表示或底层描述,是数据库最低一级的逻辑描述,它描述了数据在存储介质上示或底层描述,是数据库最低一级的逻辑描述,它描述了数据在存储介质上的存储方式和物理结构,对应着实际存储在外存储介质上的数据库的存储方式和物理结构,对应着实际存储在外存储介质上的数据库。一个一个数据库只有一个内模式。数据库只有一个内模式。二级映射二级映射 为了能够在内部实现这三个抽象层次的联系和转换,数据库管理系统在为了能够在内部实现这三个抽象层次的联系和转换,数据库管理系统在这三级模式之间提供了两层映射:外模式这三级模式之间提供了两层映射:外模式模式映射,模式模式映射,模式内模式映射。内模式映射。外模式外模式模式映射模式映射 外模式外模式模式映射定义了该外模式与模式之间的对应关系。这些映射定模式映射定义了该外模式与模式之间的对应关系。这些映射定义通常包含在各自外模式的描述中。当模式改变时义通常包含在各自外模式的描述中。当模式改变时(例如增加新的属性、改例如增加新的属性、改变属性的数据类型时变属性的数据类型时),只要改变其映射,就可以使外模式保持不变,对应,只要改变其映射,就可以使外模式保持不变,对应的应用程序也可保持不变的应用程序也可保持不变(因为应用程序是依据外模式编写的因为应用程序是依据外模式编写的),从而保证了,从而保证了数据与应用程序的逻辑独立性。数据与应用程序的逻辑独立性。模式模式内模式映射内模式映射 模式模式内模式映射定义了数据库全局逻辑结构与存储结构之间的对应关内模式映射定义了数据库全局逻辑结构与存储结构之间的对应关系。该映射定义通常包含在模式描述中。当数据的存储结构发生变化时,只系。该映射定义通常包含在模式描述中。当数据的存储结构发生变化时,只需改变模式需改变模式内模式映射,就能保持模式不变,因此应用程序也可以保持不内模式映射,就能保持模式不变,因此应用程序也可以保持不变,从而保证了数据与应用程序的物理独立性。变,从而保证了数据与应用程序的物理独立性。概念模型用于对信息世界建模,是现实世界到信息世界的第一层概念模型用于对信息世界建模,是现实世界到信息世界的第一层抽象。抽象。(一)基本概念(一)基本概念 1 1、实体、实体 现实世界中的客观事物在信息世界中称为实体(现实世界中的客观事物在信息世界中称为实体(EntityEntity)。)。v属性:属性:实体所具有的某一特性。实体所具有的某一特性。v实体标识符:实体标识符:能够唯一标识一个实体的属性集,也称为关键码,简能够唯一标识一个实体的属性集,也称为关键码,简 称码或键。称码或键。v域:域:属性的取值范围称为该属性的域。属性的取值范围称为该属性的域。v实体型:实体型:用实体名及其属性名集合来抽象和刻画同类实体,即实体用实体名及其属性名集合来抽象和刻画同类实体,即实体 的结构描述,称为实体型。的结构描述,称为实体型。v实体集:实体集:同型实体的集合称为实体集。同型实体的集合称为实体集。2 2、实体联系、实体联系:实体之间的相互关系,包括实体内部的联系和实体之间实体之间的相互关系,包括实体内部的联系和实体之间的联系。常见的实体联系可以有三种,如下图的联系。常见的实体联系可以有三种,如下图6-36-3所示:所示:实体型A联系名实体型B1 11 1(a)1:1(a)1:1 联系联系实体型A联系名实体型B1 1N N(b)1:N(b)1:N 联系联系实体型A联系名实体型BM MN N(c)M:N(c)M:N 联系联系图6-3 两个实体型之间的三类联系(二)概念模型的表示方法(二)概念模型的表示方法 实体联系方法(实体联系方法(Entity-Relationship ApproachEntity-Relationship Approach)用)用E-RE-R图来图来描述现实世界的概念模型描述现实世界的概念模型实体联系模型反映的是现实世界中的实体联系模型反映的是现实世界中的事物事物及其及其相互联系相互联系。1、实体、实体(Entity)描述客观事物的概念描述客观事物的概念2、属性、属性 属性属性指实体具有的某种特性。指实体具有的某种特性。实体名称实体名称表示方法:表示方法:表示方法:表示方法:属性属性实体名称实体名称属性属性1属性属性2属性属性n3、联系、联系 现实世界的事物总是存在着这样或那样的联系现实世界的事物总是存在着这样或那样的联系联系联系表示方法:表示方法:实体实体1实体实体2联系联系联系的类型联系的类型设设A,B为两个包含若干个体的总体,为两个包含若干个体的总体,1、一对一联系、一对一联系 如果对于如果对于A中的一个实体,中的一个实体,B中至多有一个实体与其发生联系,反之,中至多有一个实体与其发生联系,反之,B中的每一实体至多对应中的每一实体至多对应A中一个实体,则称中一个实体,则称A与与B是一对一联系。是一对一联系。系系系主任系主任任职任职11病区病区科室主任科室主任任职任职112、一对多联系、一对多联系 如果对于如果对于A中的每一实体,实体中的每一实体,实体B中有一个以上实体与之发生联中有一个以上实体与之发生联系,反之,系,反之,B中的每一实体至多只能对应于中的每一实体至多只能对应于A中的一个实体,则称中的一个实体,则称A与与B是一对多联系。是一对多联系。AB联系联系1n教研室教研室教师教师联系联系1n3、多对多联系、多对多联系 如果如果A中至少有一实体对应于中至少有一实体对应于B中一个以上实体,反之,中一个以上实体,反之,B中也至少有中也至少有一个实体对应于一个实体对应于A中一个以上实体,则称中一个以上实体,则称A与与B为多对多联系。为多对多联系。AB联系联系mn教师教师学生学生教学教学mnER图建模实体及其联系实体及其联系概念模型概念模型ER图图ERER图绘制图绘制图书图书作者作者写作写作出版社出版社类别类别页数页数ISBN书名书名姓名姓名出生地出生地身份证号身份证号定稿时间定稿时间价格价格1、利用分类、聚集、概括等方法抽象出实体,并一一命名。、利用分类、聚集、概括等方法抽象出实体,并一一命名。2、描述实体之间的联系、描述实体之间的联系3、实体属性和联系属性的说明、实体属性和联系属性的说明举例:某工厂物资入库管理的概念模型。举例:某工厂物资入库管理的概念模型。物资管理涉及的实体有:物资管理涉及的实体有:供方单位:属性有单位号、单位名、地址、联系人、邮政编码供方单位:属性有单位号、单位名、地址、联系人、邮政编码物资:属性有物资代码、名称、规格、备注物资:属性有物资代码、名称、规格、备注库存:属性有入库号、日期、货位、数量库存:属性有入库号、日期、货位、数量合同:属性有合同号、数量、金额、备注合同:属性有合同号、数量、金额、备注结算:属性有结算编号、用途、金额、经手人结算:属性有结算编号、用途、金额、经手人这些实体间的联系包括:这些实体间的联系包括:入库:一种物资可以分多次入库,所以是入库:一种物资可以分多次入库,所以是1:N1:N联系联系验收:一份合同订购的物资可以分多次验收,所以是验收:一份合同订购的物资可以分多次验收,所以是1 1:N N联系联系购进:一次购进的物资可以经多次结算,而一次结算可以承办多次购进的物购进:一次购进的物资可以经多次结算,而一次结算可以承办多次购进的物资,所以是多对多的联系。其属性为:数量、金额。资,所以是多对多的联系。其属性为:数量、金额。付款:也是多对多的联系。其属性是:数量、金额。付款:也是多对多的联系。其属性是:数量、金额。订货:这是一个数量超过两个的不同类型实体之间的联系。在订货业务中,订货:这是一个数量超过两个的不同类型实体之间的联系。在订货业务中,一种物资可由多家供应,产生多笔合同。反之,一个供应单位可以供应多种一种物资可由多家供应,产生多笔合同。反之,一个供应单位可以供应多种物资,产生多笔合同,所以,在图中用物资,产生多笔合同,所以,在图中用M M:N:LN:L的结构来表示。其属性为:数的结构来表示。其属性为:数量、单价。量、单价。该工厂的物资入库管理该工厂的物资入库管理E-RE-R图如下图图如下图6-46-4,6-5 6-5 所示:所示:图6-4 实体和联系的E-R图 库存库存物资物资供方单位供方单位结算结算订货订货入座入座购进购进付款付款验收验收合同合同MMN N1 1N NN NN NMMN NMM1 1L L图6-5 工厂物资入库管理E-R图 层次模型:数据按“自顶向下”的结构进行组织。项目项目1部门部门C部门部门B部门部门A员工员工1员工员工4员工员工3员工员工2员工员工6员工员工5网状模型是层次模型的扩展,其中一个属记录可网状模型是层次模型的扩展,其中一个属记录可以有多个首记录。以有多个首记录。项目1部门C部门B部门A项目2项目号说明部门号155薪水册257498原材料632226销售管理598部门号部门名经理社会保障号257财务部421-55-99993632生产部765-00-3192598市场部098-40-1370社会保障号社会保障号名字名字性别性别聘用日期聘用日期部门号部门号421-55-99993李杰李杰男男01-02-14257765-00-3192张丽张丽女女01-08-10650098-40-1370王中豪王中豪男男02-11-11598数据表数据表1:项目表:项目表数据表数据表2:部门表:部门表数据表3:经理表关系模型关系模型关系模型是最流行的数据库模型;关系模型是用标准表格形式描述数据;关系模型是最流行的数据库模型;关系模型是用标准表格形式描述数据;所有数据元素存在于所有数据元素存在于“关系关系”的二维表中。的二维表中。关系数据关系数据:以表格形式以表格形式行和列来组织数据的一种模型。行和列来组织数据的一种模型。数据模型是直接面向数据库的逻辑结构,是对现实世界的第二层抽象。数据模型是直接面向数据库的逻辑结构,是对现实世界的第二层抽象。数据模型是数据库系统的核心和基础。数据模型是数据库系统的核心和基础。数据模型由三个基本的要素组成:数据的结构、数据的操作、数据的约数据模型由三个基本的要素组成:数据的结构、数据的操作、数据的约束条件。束条件。1 1、数据结构、数据结构:数据结构是所研究的对象类型的集合。这些对象是数据库数据结构是所研究的对象类型的集合。这些对象是数据库的组成成分,它们包括两类,一类是与数据类型、内容、性质有关的对象;的组成成分,它们包括两类,一类是与数据类型、内容、性质有关的对象;另一类是与数据之间联系有关的对象。另一类是与数据之间联系有关的对象。2 2、数据操作、数据操作:数据操作是指对数据库中各种对象的实例允许执行的操作数据操作是指对数据库中各种对象的实例允许执行的操作的集合,包括操作及有关的操作规则。的集合,包括操作及有关的操作规则。3 3、数据的约束条件、数据的约束条件 数据的约束条件是一组完整性规则的集合。数据的约束条件是一组完整性规则的集合。(二)关系模型(二)关系模型 关系模型是目前最重要的一种数据模型。关系数据库系统采用关系模型关系模型是目前最重要的一种数据模型。关系数据库系统采用关系模型作为数据的组织方式。作为数据的组织方式。1、关系模型的数据结构、关系模型的数据结构 在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。组成。关系模型(Relational Model)用二维表表示实体与实体之间联系的模型。仓库号城市面积WH1北京370WH2上海500WH3广州200仓库器件号器件名称P1显示卡P2声卡P3解压卡P4散热风扇仓库号器件号数量WH1P2675WH1P3250WH1P4340WH2P1280WH2P2200WH2P4270WH3P2500WH3P1330器件库存器件仓库库存q关系:关系:一个关系对应通常说的一张表。一个关系对应通常说的一张表。q元组:元组:表中的一行即为一个元组。表中的一行即为一个元组。q属性:属性:表中的一列即为一个属性。表中的一列即为一个属性。q主键(码):主键(码):表中的某个属性组,它可以唯一确定一个元组。表中的某个属性组,它可以唯一确定一个元组。q域:域:属性的取值范围。属性的取值范围。q分量:分量:元组中的一个属性值。元组中的一个属性值。q关系模式:关系模式:对关系的描述成为关系模式,一般表示为关系模式:对关系的描述成为关系模式,一般表示为关系模式:关系名(属性关系名(属性1 1,属性,属性2 2,属性,属性n n)例如上面的关系可描述为:例如上面的关系可描述为:教职工(职工号,姓名,出生日期,性别,学院,电话)教职工(职工号,姓名,出生日期,性别,学院,电话)关系模型要求关系必须是规范化的,即要求关系必须满足一定的规范条关系模型要求关系必须是规范化的,即要求关系必须满足一定的规范条件,这些规范条件中最基本的一条就是:关系的每一个分量必须是一个不可件,这些规范条件中最基本的一条就是:关系的每一个分量必须是一个不可再分的数据项再分的数据项。(三)、ER图向关系数据模型的转换回顾回顾实体实体 实体集合实体集合及及 实体实体联系联系 相关属性集合相关属性集合 加工、转换加工、转换数数 文件文件据据 记录记录库库 相关数据项集合相关数据项集合数据世界数据世界DBMS的的数据模型数据模型信息世界信息世界E-R模型模型关系模式 对关系的描述,用关系名(属性1,属性2,属性n)来表示。eg.库存(仓库号,器件号,数量)库存(仓库号,器件号,数量)仓库(仓库号,城市,面积)仓库(仓库号,城市,面积)转换过程示意图E-R图关系模型2、联系 a.联系具有属性:联系名作为关系名,发生联系的实体的主关键字 作为联系的主关键字。b.联系不具有属性:不带有属性的联系可以去掉。1、实体 相应转换为一个关系,实体名称作为关系名称,该关系包括对应实体的全部属性,并确定出该关系的关键字。转换方法和原则转换举例一转换举例一厂长号厂长号*姓名姓名年龄年龄厂长厂长厂号厂号*厂名厂名地点地点工厂工厂管理管理11厂长(厂长(厂长号厂长号,姓名,年龄),姓名,年龄)工厂(工厂(厂号厂号,厂名,地点),厂名,地点)管理(管理(厂号厂号,厂长号厂长号)转换举例二仓库号仓库号*地点地点面积面积仓库仓库货号货号*品名品名价格价格产品产品存放存放1n仓库(仓库(仓库号仓库号,地点,面积),地点,面积)产品(产品(货号货号,品名,价格),品名,价格)数量数量存放(存放(仓库号仓库号,货号货号)转换举例三学号*姓名年龄学生课程号*课程名学时数课程学习mn学生(学号,姓名,年龄)课程(课程号,课程名,学时数)成绩学习(学号,课程号,成绩)2 2、关系模型的操纵与完整性约束、关系模型的操纵与完整性约束 关系模型给出了关系操作的能力。关系数据模型的操作主关系模型给出了关系操作的能力。关系数据模型的操作主要包括选择、投影、连接、除、并、交、差等查询操作和插入、要包括选择、投影、连接、除、并、交、差等查询操作和插入、删除、修改操作两大部分。删除、修改操作两大部分。为了维护数据库中数据与现实世界的一致性,这些操作必为了维护数据库中数据与现实世界的一致性,这些操作必须满足关系的完整性约束条件。关系的完整性约束条件包括三须满足关系的完整性约束条件。关系的完整性约束条件包括三大类:实体完整性、参照完整性和用户定义的完整性。大类:实体完整性、参照完整性和用户定义的完整性。关系模型的逻辑结构是一组关系模式的集合。关系模型的逻辑结构是一组关系模式的集合。E-R图则是由实体、实体图则是由实体、实体的属性和实体之间的联系三个要素组成的。所以将的属性和实体之间的联系三个要素组成的。所以将E-R图转换为关系模型实图转换为关系模型实际上就是要将实体、实体的属性和实体之间的联系转换为关系模式,这种际上就是要将实体、实体的属性和实体之间的联系转换为关系模式,这种转换一般遵循如下原则:转换一般遵循如下原则:1.一个实体转换为一个关系模式,实体的属性就是关系的一个实体转换为一个关系模式,实体的属性就是关系的属性,实体的码就是关系的码。属性,实体的码就是关系的码。2.一个联系转换为一个关系模式,与该联系相连的各实体一个联系转换为一个关系模式,与该联系相连的各实体的码以及联系的属性均转换为该关系的属性。的码以及联系的属性均转换为该关系的属性。3.3.具有相同码的关系模式可合并。具有相同码的关系模式可合并。例例6-2 将例将例6-1物资入库管理的物资入库管理的E-R图转换为关系模型,其中,有下划图转换为关系模型,其中,有下划线的属性表示是主码:线的属性表示是主码:(1)把每一个实体转换为一个关系模式把每一个实体转换为一个关系模式首先分析各实体的属性,从中确定其主码,然后分别用关系模式表示。首先分析各实体的属性,从中确定其主码,然后分别用关系模式表示。供方单位(供方单位(单位号单位号、单位名、地址、联系人、邮政编码)、单位名、地址、联系人、邮政编码)物资(物资(代码代码、名称、规格、备注)、名称、规格、备注)库存(库存(入库号入库号、日期、货位、数量)、日期、货位、数量)合同(合同(合同号合同号、数量、金额、备注)、数量、金额、备注)结算(结算(编号编号、用途、金额、经手人)、用途、金额、经手人)(2)把每一个联系转换为关系模式:把每一个联系转换为关系模式:购进(购进(入库号、编号入库号、编号、数量、金额)、数量、金额)付款(付款(编号、合同号编号、合同号、数量、金额)、数量、金额)订货(订货(代码、单位号、合同号代码、单位号、合同号、数量、单价)、数量、单价)入库(代码、入库(代码、入库号入库号)验收(合同号、验收(合同号、入库号入库号)(3)关系模式合并,其最终结果为:关系模式合并,其最终结果为:供方单位(供方单位(单位号单位号、单位名、地址、联系人、邮政编码)、单位名、地址、联系人、邮政编码)物资(物资(代码代码、名称、规格、备注)、名称、规格、备注)库存(库存(入库号入库号、日期、货位、数量,代码,合同号)、日期、货位、数量,代码,合同号)合同(合同(合同号合同号、数量、金额、备注)、数量、金额、备注)结算(结算(编号编号、用途、金额、经手人)、用途、金额、经手人)购进(购进(入库号、编号入库号、编号、数量、金额)、数量、金额)付款(付款(编号、合同号编号、合同号、数量、金额)、数量、金额)订货(订货(代码、单位号、合同号代码、单位号、合同号、数量、单价)、数量、单价)数据分析:一种对数据进行评价以揭示数据库内容中存在问题的过程。规范数据的步骤:消除所有重复组;消除多次出现的数据;消除表中不依赖于主键的属性。1NF2NF3NF 数据库的设计应遵循规范化理论,规范化程度过低的关系,可能会存在数据库的设计应遵循规范化理论,规范化程度过低的关系,可能会存在插入、删除异常、修改复杂、数据冗余等问题,解决的方法就是对关系模式插入、删除异常、修改复杂、数据冗余等问题,解决的方法就是对关系模式进行分解或合并进行分解或合并(规范化规范化),转换成高级范式。规范化一共有六个级别,转换成高级范式。规范化一共有六个级别:1NF,2NF,3NF.BCNF,4NF,5NF。但也应当注意到,并不是规范化程度越高的。但也应当注意到,并不是规范化程度越高的关系就越好。当一个应用的查询中经常涉及到两个或多个关系模式的属性时,关系就越好。当一个应用的查询中经常涉及到两个或多个关系模式的属性时,系统就必须经常地进行联接运算,而联接运算的代价是相当高的系统就必须经常地进行联接运算,而联接运算的代价是相当高的.所以,在所以,在具体应用时,到底规范化进行到什么程度需要权衡利弊。一般而言,做到第具体应用时,到底规范化进行到什么程度需要权衡利弊。一般而言,做到第三范式三范式(3NF)就足够了。就足够了。BCNF4NF5NF第一规范型:第一规范型:如果一个关系模式中的属性都是单纯的如果一个关系模式中的属性都是单纯的 (即不可再分为更小的属性),则称该(即不可再分为更小的属性),则称该 模式是属于第一规范型(模式是属于第一规范型(First Normal Form,即即 1NF)。)。姓名地址省市街道邮编甲江苏南京卫岗210095姓名省市街道邮编甲江苏南京卫岗210095规范化第二规范型:第二规范型:如果一个关系模式属于如果一个关系模式属于1NF,并且所有,并且所有 的非关键字都完全地依赖于关键字(即的非关键字都完全地依赖于关键字(即 不存在部分依赖),则称该关系模式属不存在部分依赖),则称该关系模式属 于第二规范型于第二规范型,即即 2NF。A零 件 号B仓 库 号C零 件 数 量D仓 库 地 址123411121 0 01 5 02 0 01 5 0北 区 1 号北 区 1 号北 区 1 号南 区 1 号零件号仓库号零件数量11100211503120042150仓库号仓库地址1北区1号2南区1号第三规范型:第三规范型:如果一个关系模式属于如果一个关系模式属于2NF,并且不存,并且不存 在非关键字传递地依赖于关键字,则称在非关键字传递地依赖于关键字,则称 该关系模式属于第三规范型(该关系模式属于第三规范型(3NF)。)。职工号职工职务工资1001张三工程师2001002李四技术员1201003杨华工程师2001005王五高工350职工号职工职务1001张三工程师1002李四技术员1003杨华工程师1005王五高工职务工资技术员120工程师200高工350规范化程度越高规范化程度越高数据冗余数据冗余更新异常更新异常连接运算时间连接运算时间查询时间查询时间效率效率 对数据的保护主要通过四个方面实现:对数据的保护主要通过四个方面实现:一是数据库的安全性控制,保证数据库中的数据不一是数据库的安全性控制,保证数据库中的数据不被破坏;被破坏;二是数据库的完整性控制,保证数据库中的数据与二是数据库的完整性控制,保证数据库中的数据与现实世界相符;现实世界相符;三是数据库的并发控制,保证多用户使用数据库时三是数据库的并发控制,保证多用户使用数据库时数据库的正常使用;数据库的正常使用;四是数据库的恢复控制,保证当由于各种原因造成四是数据库的恢复控制,保证当由于各种原因造成数据损害时,数据不会丢失。数据损害时,数据不会丢失。(一)数据库的安全性 数据库的安全性是指保护数据库,防止不合法使用,以免数据的泄漏、数据库的安全性是指保护数据库,防止不合法使用,以免数据的泄漏、更改或破坏。对数据库的不合法使用分无意滥用和恶意滥用两类。更改或破坏。对数据库的不合法使用分无意滥用和恶意滥用两类。在数据库中,可采用加密、用户身份验证、限制操作权等技术手段来在数据库中,可采用加密、用户身份验证、限制操作权等技术手段来控制恶意滥用;采用提供系统的可靠性和数据备份等方法来控制无意控制恶意滥用;采用提供系统的可靠性和数据备份等方法来控制无意滥用。用户用户 DBMSDBMSOSOS数据库数据库身份验证身份验证 操作权控制操作权控制 操作系统操作系统安全保护安全保护 加密存储加密存储与冗余与冗余 图6-6 数据库系统的安全模型(二)数据库的完整性(二)数据库的完整性 数据库的完整性是指数据的正确性、有效性和相容性,目的是防止错误数据库的完整性是指数据的正确性、有效性和相容性,目的是防止错误数据进入数据库。数据进入数据库。完整性约束条件一般由三部分组成:完整性约束条件一般由三部分组成:(1)什么时候使用条件进行检查什么时候使用条件进行检查(即即“触发条件触发条件”);(2)要检查什么样的错误要检查什么样的错误(即即“约束条件约束条件”或或“谓词谓词”);(3)如果查出错误,应如何处理如果查出错误,应如何处理(即即“ELSE子句子句”,违反时要做的动作,如拒绝,违反时要做的动作,如拒绝操作、报告违反情况、改正错误等操作、报告违反情况、改正错误等)。完整性约束条件的作用对象是关系、。完整性约束条件的作用对象是关系、元组和列。元组和列。(三)数据库的并发控制(三)数据库的并发控制 数据库的并发操作通常会引发三个问题:丢失修改问题、读数据库的并发操作通常会引发三个问题:丢失修改问题、读“脏脏”数据数据问题和不一致分析问题。问题和不一致分析问题。并发控制就是要用正确的方式调度并发操作。并发控制的主要技术是封并发控制就是要用正确的方式调度并发操作。并发控制的主要技术是封锁锁(Locking)(Locking)。所谓封锁就是事务所谓封锁就是事务T T在对某个数据操作之前,先向系统发出在对某个数据操作之前,先向系统发出请求,对该数据加锁,从而使事务请求,对该数据加锁,从而使事务T T对这个数据有了一定的控制,在对这个数据有了一定的控制,在“解解”锁之前,其他事务不能更新此数据。锁之前,其他事务不能更新此数据。(四)数据库的恢复(四)数据库的恢复 1、故障的种类、故障的种类 (1)事务故障)事务故障 (2)系统故障)系统故障 (3)其他故障)其他故障:如介质故障或由计算机病毒引起的故障或破坏如介质故障或由计算机病毒引起的故障或破坏 2、恢复的实现方法、恢复的实现方法 (1)数据库备份:)数据库备份:数据备份是指定期或不定期地对数据库数据进行复制。数据备份是指定期或不定期地对数据库数据进行复制。(2 2)登记日志文件:)登记日志文件:日志文件是用来记录事务对数据库的更新操作的文日志文件是用来记录事务对数据库的更新操作的文件。件。(3)数据库镜像:)数据库镜像:所谓镜像就是在不同的设备上同时存有两份相同数据所谓镜像就是在不同的设备上同时存有两份相同数据库,其中一个设备被称为主设备,另一个设备称为镜像设备。库,其中一个设备被称为主设备,另一个设备称为镜像设备。第二节 数据仓库 联机事务处理不适合联机事务处理不适合DSS应用的原因概括起来主要有以下四点:第一、应用的原因概括起来主要有以下四点:第一、联机事务处理环境下的数据是分散而非集成的,业务数据往往被存放于分散联机事务处理环境下的数据是分散而非集成的,业务数据往往被存放于分散的异构环境中,不易被统一查询访问,而且还有大量的历史数据处于脱机状的异构环境中,不易被统一查询访问,而且还有大量的历史数据处于脱机状态,形同虚设;第二、事务处理系统不具备数据动态集成的能力,数据源中态,形同虚设;第二、事务处理系统不具备数据动态集成的能力,数据源中数据发生的变化不能反映给决策者;第三、对于决策分析而言,历史数据是数据发生的变化不能反映给决策者;第三、对于决策分析而言,历史数据是相当重要的,企业的事务处理一般只需要当前数据;第四、业务数据的模式相当重要的,企业的事务处理一般只需要当前数据;第四、业务数据的模式是针对事务处理系统而设计的,数据的格式和描述方式并不适合非计算机专是针对事务处理系统而设计的,数据的格式和描述方式并不适合非计算机专业人员进行业务上的分析和统计。业人员进行业务上的分析和统计。于是,有人感叹:于是,有人感叹:2020年前查询不到数据是因为数据太少,而今天查询不年前查询不到数据是因为数据太少,而今天查询不到数据是因为数据太多。针对这一问题,人们专门为业务的统计分析建立一到数据是因为数据太多。针对这一问题,人们专门为业务的统计分析建立一个数据中心,它的数据可以从联机的事务处理系统、异构的外部数据源、脱个数据中心,它的数据可以从联机的事务处理系统、异构的外部数据源、脱机的历史业务数据中得到。它是一个联机的系统,专门为分析统计和决策支机的历史业务数据中得到。它是一个联机的系统,专门为分析统计和决策支持应用服务,通过它可满足决策支持和联机分析应用所要求的一切。这个数持应用服务,通过它可满足决策支持和联机分析应用所要求的一切。这个数据中心就叫数据仓库。可以把它看作一个作为决策支持系统和联机分析应用据中心就叫数据仓库。可以把它看作一个作为决策支持系统和联机分析应用数据源的结构化数据环境。数据源的结构化数据环境。据仓库是一个面向主题的(据仓库是一个面向主题的(Subject OrientedSubject Oriented)、集成的)、集成的(IntegrateIntegrate)、相对稳定的()、相对稳定的(NonNonVolatileVolatile)、反映历史变化()、反映历史变化(Time Time VariantVariant)的数据集合,用于支持管理决策。)的数据集合,用于支持管理决策。数据仓库的数据仓库的4 4个特点:个特点:1 1、面向主题。、面向主题。传统数据库的数据组织面向事务处理任务,各个业务系传统数据库的数据组织面向事务处理任务,各个业务系统之间各自分离;而数据仓库中的数据是按照一定的主题进行组织的。统之间各自分离;而数据仓库中的数据是按照一定的主题进行组织的。2 2、集成的。、集成的。面向事务处理的传统数据库通常与某些特定的应用相关面向事务处理的传统数据库通常与某些特定的应用相关;而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性过系统加工、汇总和整理得到的,必须消除源数据中的不一致性。3 3、相对稳定的。、相对稳定的。传统数据库中的数据通常实时更新,数据根据需要及传统数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及到的数据时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及到的数据操作主要是数据查询,一旦某个数据进入数据仓库,一般情况下将被长期操作主要是数据查询,一旦某个数据进入数据仓库,一般情况下将被长期保留,很少修改和删除,只需定期加载、刷新。保留,很少修改和删除,只需定期加载、刷新。4 4、反映历史变化。、反映历史变化。传统数据库主要关心当前某一个时间段内的数据;传统数据库主要关心当前某一个时间段内的数据;而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时间而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时间点到目前的各个阶段的信息点到目前的各个阶段的信息。整个数据仓库系统是一个包含整个数据仓库系统是一个包含4 4个层次的体系结构:个层次的体系结构:1 1、数据源、数据源 2 2、数据的存储与管理、数据的存储与管理 3、联机分析处理(、联机分析处理(OLAP)服务器服务器 4 4、前端工具、前端工具 (一)数据仓库在客户服务、市场营销方面的应用(一)数据仓库在客户服务、市场营销方面的应用 客户关系管理(客户关系管理(CRMCRM)是一个判断、获取、保持和增加可获)是一个判断、获取、保持和增加可获利客户的过程。利客户的过程。CRMCRM在整个客户生命周期中都以客户为中心,它在整个客户生命周期中都以客户为中心,它简化了各种与客户相关联的业务流程(如销售、营销、服务和简化了各种与客户相关联的业务流程(如销售、营销、服务和支持等),并将其注意力集中于满足客户的需求上。支持等),并将其注意力集中于满足客户的需求上。(二)数据仓库在银行领域的应用(二)数据仓库在银行领域的应用 利用数据仓库的强大功能,银行可以建立企业客户群和个利用数据仓库的强大功能,银行可以建立企业客户群和个人客户群的数据仓库,并对企业的结构、经营、财务以及市场人客户群的数据仓库,并对企业的结构、经营、财务以及市场竞争等多个数据源进行统一组织,形成一个一体化的存储结构,竞争等多个数据源进行统一组织,形成一个一体化的存储结构,为决策分析奠定基础。为决策分析奠定基础。数据库管理系统(database management system,DBMS):由一组程序执行数据库的实际操作,并提供数据库与用户和数据库与应用程序的接口。1.存储及检索数据并发控制:数据库一个特点,可用加锁以防同时访问某一正为其他应用程序所更新或使用的记录。模式:数据库中数据的逻辑和物理结构以及数据间的联系。存储设备中的数据DBMS管理查询其他软件应用程序物理存取路径(PAP)逻辑存取路径(LAP)逻辑和物理存取路径:2.提供用户视图子模式:包含对数据库的一个子集的描述及确定哪些用户可对该子集的数据项进行修改操作的文件。模式子模式A子模式B子模式CDBMS用户1用户2用户3用户4用户5数据库定义语言数据库定义语言(data definition language,DDL):是定义和描述某一特定数据库中数据):是定义和描述某一特定数据库中数据及数据关系的各种指令及命令的集合。及数据关系的各种指令及命令的集合。数据字典数据字典:数据库中所有数据的详尽描述。:数据库中所有数据的详尽描述。数据字典的优点:数据字典的优点:1.减少数据冗余;减少数据冗余;2.提高数据可靠性;提高数据可靠性;3.加快了程序开发;加快了程序开发;4.易于修改程序和数据。易于修改程序和数据。3.创建及修改数据库创建及修改数据库4.操纵数据和生产报表 数据操纵语言:是一种包含操纵数据库命令的语言;结构化查询语言:一种标准化的数据操纵语言。5.选择数据库管理系统性能集成性特点供应商成本 分布式数据库:一种数据库,其实际的数据可能散布在多个由通信设备联接的较小数据库中。复制数据库:一种数据库,其中含有经常使用的数据的副本。数据提取数据提取过程过程数据净化数据净化过程过程查询和分析查询和分析工具工具关系数据库关系数据库网状数据库网状数据库扁平文件扁平文件层次数据库层次数据库电子表格电子表格最终用户访问最终用户访问数据数据仓库仓库 数据集市是数据仓库的一个子集。数据集市是数据仓库的一个子集。4.联机分析处理 联机分析处理(OLAP):用来存储和传送数据仓库信息的程序集合。3.数据集市5.数据挖掘 数据挖掘:自动地找出数据仓库中的模型及关系。6.开放式数据库互连 开放式数据库互连(ODBC):一项标准,能保证凡符合本标准的软件均能用于任何遵循ODBC的数据库。7.面向对象的数据库 面向对象数据库:可将数据作为对象进行存储的数据库,对象中包含了数据,又包含了完成数据库事务处理所需的各种处理指令。8.图象、超文本和超媒体数据库 以图象的形式存储数据的数据库。以图象的形式存储数据的数据库。超文本数据库:用户可采取非机构化的方法来检索和超文本数据库:用户可采取非机构化的方法来检索和操纵字母数字型数据的数据库。操纵字母数字型数据的数据库。超媒体数据库:允许企业查找和操纵超媒体形式数据超媒体数据库:允许企业查找和操纵超媒体形式数据的数据库。的数据库。9.空间数据技术五、管理数据库1.数据库管理:数据库各方面的管理。2.数据库的使用、政策和安全性 演讲完毕,谢谢观看!
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!