资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四讲 数据资源管理技术,管理信息系统,第十章 数据资源管理技术,主要内容,文件组织,数据库技术,10.1,文件组织,文件的管理观,大量的企业数据不可能存放在主存中,某一时刻,企业只使用其中的一部分数据,企业的数据一般以文件形式组织起来,分类,按存储介质,光盘文件,磁盘文件,打印文件,按文件在信息系统中所执行的功能,主文件,事务文件,报告文件,工作文件,程序文件,10.1,续,数据组织的层次,人们需要用数据来进行决策和采取行动,如果这些数据能够在限定的时间内被检索处理,这些数据就产生了价值,成为信息。因此需要将数据有序的组织起来,才能对数据进行有效的处理。,数据的物理组织和逻辑组织,数据的物理组织是面向机器、面向存储设备的,数据的逻辑组织是面向用户的应用需求,数据的逻辑组织有四个基本的逻辑元素:,数据项,记录,文件,数据库,10.1,续,数据组织的层次,数据库,文件,1,文件,2,文件,n,文件,n-1,记录,1,记录,2,记录,n-1,记录,n,数据项,1,数据项,2,数据项,n-1,数据项,n,.,.,.,姓名、性别等,若干学生,学生文件,学生数据库,10.1,续,数据组织的相关概念,数据项(字段),是组成数据系统的有意义的最小基本单位。它的作用是描述一个数据处理对象的某些属性。,记录,与数据处理的某一对象有关的一切数据项构成了该对象的一条记录。标识记录的数据项称为关键项。,文件,相关(同类)记录的集合称为文件。,数据库,按一定方式组织起来的逻辑相关的文件集合形成数据库。,10.1,续,文件组织形式,建立并确定数据记录的物理顺序和逻辑顺序之间的对立关系。,逻辑,数据记录,物理,存储方式,顺序文件,索引文件,链表文件,倒排文件,顺序映射关系,10.1,续,顺序文件,文件中数据记录的物理顺序与逻辑顺序一致,文件记录按关键字值的递增(或递减)次序排序,形成其逻辑顺序。,870001,张三,456,870002,李四,645,870003,王五,587,870004,孙六,676,870005,钱七,565,1,2,3,4,5,文件记录,物理设备,关键字值,相对磁道,10.1,续,索引文件,具有索引表的文件称为索引文件。,索引文件,主文件,索引表,数据记录区,索引区,记录原始信息,记录关键字,+,记录地址,组成,映射,加工,10.1,续,举例,记录地址,学号,姓名,成绩,A,870005,张三,456,B,870002,李四,645,C,870001,王五,587,D,870004,孙六,676,E,870003,钱七,565,主,关键字(学号),记录地址,870001,C,870002,B,870003,E,870004,D,870005,A,主文件,索引表,关键字学号与学生记录地址的对应表,10.1,续,链表文件,倒排文件,带有辅索引的文件称为倒排文件,对辅关键字建立一个索引,辅关键字对应一个索引项,将具有相同关键值的记录地址保存在相应索引项中,若数据文件的全部字段都建立了辅索引,则称为全倒排文件,记录,记录,记录,记录,入口,10.2,数据库技术,传统文件处理系统,存在问题,数据冗余与数据不一致性,数据结构的不一致,数据联系弱,缺少数据字典,应用程序,1,数据文件,1,应用程序,2,应用程序,3,数据文件,2,数据文件,3,用户,用户,用户,10.2,续,银行文件处理系统,客户财务,报表,分期贷,款程序,帐户核对,处理,存款处理,分期贷款,处理,贷款分析,报告,客户票据,存款文,件修改,文件修,改核对,帐户核,对程序,分期贷款,文件修改,存款,程序,客户交易,客户交易,10.2,续,数据库管理系统,应用程序,1,应用程序,2,应用程序,3,DBMS,数据库,中央,数据库,用户,用户,用户,10.2,续,数据库的优点,数据结构化,数据共享性,数据独立性,数据完整性(数据的正确性和相容性 ),数据一致性(当事务完成时,必须使所有数据都具有一致的状态 ),完整的安全性,10.2,续,银行数据库处理系统,客 户 交 易 处 理,数 据 库 管 理 系 统,核对帐,户程序,存款帐,目程序,分期贷,款程序,客户数据库,.,查询,10.2,续,数据库管理系统(,DBMS,),功能,DBMS,是一组计算机程序,控制组织和用户的数据库的生成、维护和使用。具有以下功能:,数据库开发,数据库查询,数据库维护,应用与开发,.,操作系统,数据库,管理系统,应用程序,数据库,数据,字典,用户,10.2,续,数据库管理系统(,DBMS,),数据库开发:,利用数据定义语言(,DDL,),开发与说明数据内容、相互关系及每个数据库的结构。并把这些信息存储在一个专用的数据定义和说明的数据库中,称为数据字典。数据字典由数据库管理员控制、管理和维护。,数据库查询:,用户使用,DBMS,的查询语言询问数据库中的数据。最常用的查询语言是结构化查询语言(,SQL,)。,数据库维护,应用开发,10.2,续,数据库模型,模型功能,使数据以记录的形式组织在一起,综合反映各种业务信息,既综合又没有冗余。,模型能反映用户各业务信息所存在的内在联系,而且与,DBMS,数据模型一致。,模型的类型,网状型,层次型,关系型(目前最流行的是关系型数据库),10.2,续,数据库系统的三级模式,模式,即逻辑模式,也称概念模式。是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。,外模式,用户模式或者子模式。是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述。,内模式,物理模式或者存储模式。是数据物理结构和存储方式的描述,是数据在数据库内部的表示方法。,10.2,续,数据库系统的三级模式(图),内模式,用户,A,用户,B,用户,D,用户,E,外,模式,1,(子模式,1,),外,模式,2,(子模式,2,),概念模式,DBMS,OS,子,模式,/,概念模式,映射,A,子,模式,/,概念模式,映射,B,模式,/,内模式映射,10.2,续,数据库的二级映射,外模式,/,模式映射:,当模式改变时,使外模式保持不变,从而应用程序不变,保证了数据与程序的逻辑独立性。,模式,/,内模式映射:,当数据库存储结构改变,使模式保持不变,从而应用程序不变,保证了数据与程序的物理独立性,10.3,数据库设计,信息的转换,客观 事物类:,事物 相关性质集合,人,实体 实体集合,及 实体,联系 相关属性集合,加工、转换,数 文件,据 记录,库 相关数据项集合,加工,转换,存储,二进制数据集合,结构,计算机世界(,数据世界,),DBMS,DBMS,的数据模型,信息世界,认识选择描述,现实世界,E-R,模型,10.3,续,三个不同世界术语,客观世界 信息世界 数据世界组织(事物及其联系) 实体及其联系 数据库(概念模式)事物类(总体) 实体集 文件事物(对象、个体) 实体 记录特征(性质) 属性 数据项,实体及其联系,概念模式,ER,图,10.3,续,E-R,图描述现实世界的概念模式,实体(,Entity,):,属性:,联系(,Relation,):,一对一联系,一对多联系,多对多联系,实体集,属性,联系集,线段,10.3,续,实体(,Entity,):,是一个有着一系列显著的、易辨认的属性的对象。,实体可以是具体的(物体、人物等。),实体也可以抽象的(事、概念),10.3,续,属性(,Attribute,),实体的特性,它描述了实体的一个部分。,一个实体可由若干个属性来刻画。,如学生(学号,姓名,性别,,),码(,Key,):,唯一标识实体的属性集。,如:学号为学生的码。,10.3,续,ER,图绘制,图书,作者,写作,出版社,类别,页数,ISBN,书名,姓名,出生地,身份证号,定稿时间,价格,包含实体集“图书”和“作者”的,ER,图,10.3,续,ER,图向关系数据模型的转换,1,、,ER,图中每个实体,相应转换为一个关系,该关系包括对应实体的全部属性,并确定出该关系的关键字。,2,、对于“联系集”,根据联系方式不同,或将联系反映在关系中,或将联系转换成一个关系。,10.3,续,ER,图向关系数据模型的转换转换过程示意图,E-R,图,关系模型,DBMS,10.3,续,ER,图的转换,将,E-R,图转换成相应的表,表是行和列的集合,实体被表示成表的形式。,用列标题表示实体的属性,用行表示关于实体的实际数据,关于表和属性的命名规则,属性名和表名中不能包含空格,表名对实体的描述应该是有意义的。,如,student(cStuID,cStuName,nStuAge,),表名只能描述一个主题,10.3,续,转换举例一,厂长号,姓名,年龄,厂长,厂号,厂名,地点,工厂,管理,1,1,厂长(,厂长号,,,厂号,,姓名,年龄),工厂(,厂号,,厂名,地点),10.3,续,转换举例二,仓库号,地点,面积,仓库,货号,品名,价格,产品,存放,1,n,仓库(,仓库号,,地点,面积),产品(,货号,,品名,价格,,仓库号,,数量),数量,10.3,续,转换举例三,学号,姓名,年龄,学生,课程号,课程名,学时数,课程,学习,m,n,学生(,学号,,姓名,年龄),课程(,课程号,,课程名,学时数),成绩,学习(,学号,,,课程号,,成绩),10.4,数据库设计规范化,数据库设计规范化,范式理论篇(,P345,),必要性:解决在关系模式设计时,存在的数据存储异常现象:数据冗余、修改异常、插入异常、删除异常等。,ISBN,书名,页数,价格,出版社,作者,7-04-001968-O.719,概率论,403,5.8,高教出版社,盛聚,7-04-001968-O.719,概率论,403,5.8,高教出版社,谢式千,7-111-06887-4,可靠性模型与应用,270,19.0,机械工业出版社,蒋仁言,7-111-06887-4,可靠性模型与应用,270,19.0,机械工业出版社,左明健,7-5327-1224.9/1.717,基督山伯爵,1428,18.0,止海,译文出版社,大,仲马,7-5237-1224-9/1.321,三个,火枪手,982,16.7,上海译文出版社,大仲马,10.4,续,第一规范型:,如果一个关系模式中的属性都是单纯的(即不可再分为更小的属性),则称该 模式是属于第一规范型(,First Normal Form ,即,1NF,)。,姓名,地址,省,市,街道,邮编,甲,江苏,南京,卫岗,210095,10.4,续,第二规范型:,如果一个关系模式属于,1NF,,,并且所有的非关键字都完全地依赖于关键字(即不存在部分依赖),则称该关系模式属于第二规范型,即,2NF,。,10.4,续,第三规范型:,如果一个关系模式属于,2NF,,,并且不存在非关键字传递地依赖于关键字,则称该关系模式属于第三规范型(,3NF,)。,职工号,职工,职务,职务工资,1001,张三,工程师,200,1002,李四,技术员,120,1005,王五,高工,350,10.4,续,适当的规范化,规范化程度越高,数据冗余,更新异常,连接运算时间,查询时间,效率,再见,Do you have made a progress today ?,
展开阅读全文