第七课-数据管理技术课件

上传人:仙*** 文档编号:241651709 上传时间:2024-07-13 格式:PPT 页数:127 大小:4.69MB
返回 下载 相关 举报
第七课-数据管理技术课件_第1页
第1页 / 共127页
第七课-数据管理技术课件_第2页
第2页 / 共127页
第七课-数据管理技术课件_第3页
第3页 / 共127页
点击查看更多>>
资源描述
管理信息系统的管理信息系统的技术基础技术基础课程内容课程内容v一、数据管理概述一、数据管理概述v二、数据管理的发展二、数据管理的发展v三、数据库系统概述三、数据库系统概述v四、数据库系统的结构四、数据库系统的结构v五、数据库设计五、数据库设计v六、数据仓库和数据挖掘六、数据仓库和数据挖掘引言引言v现在企业的问题不是数据太少,而是数据太多!现在企业的问题不是数据太少,而是数据太多!“信息爆炸信息爆炸”面临的问题面临的问题存储存储信息爆炸信息爆炸访问访问共享共享安全安全引言引言引言引言数据是重要的组织资源,它同企业其他资源:劳动力、数据是重要的组织资源,它同企业其他资源:劳动力、原材料、资金和设备一样,应该放在同等重要的位置原材料、资金和设备一样,应该放在同等重要的位置上进行管理。上进行管理。许多组织由于缺乏关于企业内部运作和外部环境的高许多组织由于缺乏关于企业内部运作和外部环境的高质量的信息,因而在竞争中失败。质量的信息,因而在竞争中失败。一、数据处理的概念一、数据处理的概念 数数据据处处理理:指指把把来来自自科科学学研研究究、生生产产实实践践和和社社会会经经济济活活动动等等领领域域中中的的原原始始数数据据,用用一一定定的的设设备备和和手手段段,按按一一定定的的使使用用要要求求,加加工工成成另另一种形式的数据一种形式的数据的过程。的过程。数据处理的概念数据处理的概念(一)数据处理的主要目的:(一)数据处理的主要目的:1.1.把把数数据据转转换换成成便便于于观观察察分分析析、传传递递或或进进一一步步处处理理的的形形式式;(如将数字信息转换为更直观的图形信息等)(如将数字信息转换为更直观的图形信息等)数据处理的概念数据处理的概念(一)数据处理的主要目的:(一)数据处理的主要目的:2.2.从从大大量量的的原原始始数数据据中中抽抽取取、推推导导出出对对人人们们有有价价值值的的信信息息以以作为行动和决策的依据;作为行动和决策的依据;(如战争中的情报分析处理)(如战争中的情报分析处理)数据处理的概念数据处理的概念(一)数据处理的主要目的:(一)数据处理的主要目的:3.3.科科学学地地保保存存和和管管理理已已经经过过处处理理的的大大量量数数据据,以以便便人人们们能能方方便便而而充充分分地地利利用用这这些些宝宝贵贵的的信信息息资资源源。(数数据据的的合合理理分分类类与与存存储储,方方便便信息的查询)信息的查询)数据处理的概念数据处理的概念人们需要用数据来进行决策和采取行动。如果这些数据能够在限定的时间内被检索处理,这些数据就产生了价值,成为信息。数据处理的概念数据处理的概念数据处理和数据组织v数据处理的基本内容数据收集数据转换数据筛选、排序和分组数据组织数据运算数据存储数据检索数据输出(二)数据处理的基本内容:(二)数据处理的基本内容:(以新产品开发市场信息为例)1.1.数据收集:根据系统本身的需求和用户的需要收集相关的数据收集:根据系统本身的需求和用户的需要收集相关的 数据;数据;(市场信息)2.2.数据转换:为了使收集的信息适用于计算机处理,要设计数据转换:为了使收集的信息适用于计算机处理,要设计 各种代码来描述自然界中的各种实际数据;各种代码来描述自然界中的各种实际数据;(数据的 录入)3.3.数据的筛选、分组和排序,目的是保存和使用有用的信息;数据的筛选、分组和排序,目的是保存和使用有用的信息;(使用正确的信息)4.4.数据的组织:将具有某种逻辑关系的一批数据组织起来,数据的组织:将具有某种逻辑关系的一批数据组织起来,按一定的存储表示方式配置在计算机的存储器中,既按一定的存储表示方式配置在计算机的存储器中,既 数据的存储结构;数据的存储结构;(如共享数据库)5.5.数据的运算:包括算术运算和逻辑运算;数据的运算:包括算术运算和逻辑运算;(数据处理 产品价格的确定)6.6.数据存储:数据存储:(数据的长期使用)7.7.数据检索:数据检索:8.8.数据输出。数据输出。(辅助管理与决策)计算机数据处理的发展计算机数据处理的发展 计算机进行数据处理的效率,主要取决于数据在机器计算机进行数据处理的效率,主要取决于数据在机器中的存储结构和处理方式。根据中的存储结构和处理方式。根据数据存储结构和处理方式数据存储结构和处理方式,把计算机数据处理分为三个阶段,即把计算机数据处理分为三个阶段,即 (一)人工管理阶段(一)人工管理阶段(20世纪世纪50年代中期以前)年代中期以前)(二)文件管理阶段(二)文件管理阶段(20世纪世纪50年代后期年代后期20世世纪纪60年代中期)年代中期)(三)数据库管理阶段(三)数据库管理阶段(20世纪世纪60年代后期开始)年代后期开始)数据处理和数据组织 (一)人工管理阶段(一)人工管理阶段 背景背景 计算机主要用于科学计算计算机主要用于科学计算 数据量小、结构简单,如高阶方程等数值计算 外存为顺序存取设备外存为顺序存取设备 磁带、卡片、纸带,没有磁盘等直接存取设备 没有操作系统,没有数据管理软件没有操作系统,没有数据管理软件 用户用机器指令编码,通过纸带机输入程序和数据,程序运行完毕后,由用户取走纸带和运算结果,再让下一用户上机操作,数据并不长期保存在计算机内数据处理和数据组织 (一)人工管理阶段(一)人工管理阶段 工工 作作 模模 式式 数据处理和数据组织访问访问访问数据1数据2数据n程序1程序2程序n(一)人工管理阶段(一)人工管理阶段 特点特点 用户完全负责数据管理工作用户完全负责数据管理工作 数据的组织、存储结构、存取方法、输入输出等数据的组织、存储结构、存取方法、输入输出等 数据完全面向特定的应用程序数据完全面向特定的应用程序 每个用户使用自己的数据,数据不保存,用完就每个用户使用自己的数据,数据不保存,用完就撤走撤走 数据与程序没有独立性数据与程序没有独立性 程序中存取数据的子程序随着存储结构的改变而程序中存取数据的子程序随着存储结构的改变而改变改变数据处理和数据组织 (二)文件管理阶段(二)文件管理阶段 背景背景 计算机不但用于科学计算,还用于管理计算机不但用于科学计算,还用于管理 外存有了磁盘、磁鼓等直接存取设备外存有了磁盘、磁鼓等直接存取设备 无须顺序存取无须顺序存取 由地址直接访问所需记录由地址直接访问所需记录 有了专门管理数据的软件,一般称为文件系统有了专门管理数据的软件,一般称为文件系统 软件领域出现了操作系统和高级软件软件领域出现了操作系统和高级软件 操作系统中的文件系统是专门管理外存的数据管理软操作系统中的文件系统是专门管理外存的数据管理软件,文件是操作系统管理的重要资源之一。件,文件是操作系统管理的重要资源之一。数据处理和数据组织2.2 数据处理和数据组织文件管理阶段文件管理阶段数据1数据2数据n存取方式程序1程序2程序n (二)文件管理阶段(二)文件管理阶段 特点特点 数据可长期保存,重复使用数据可长期保存,重复使用 但是文件结构的设计仍然是基于特定的用途,程序基于特定的物理结但是文件结构的设计仍然是基于特定的用途,程序基于特定的物理结 构和存取方法,因此程序与数据结构之间的依赖关系并未根本改变。构和存取方法,因此程序与数据结构之间的依赖关系并未根本改变。程序与数据之间具有程序与数据之间具有“设备独立性设备独立性”程序只需用文件名就可与数据打交道,不必关心数据的物理位程序只需用文件名就可与数据打交道,不必关心数据的物理位 置,由操作系统的文件系统提供存取方法(读写)。置,由操作系统的文件系统提供存取方法(读写)。文件组织已多样化文件组织已多样化 有索引文件、链接文件和直接存取文件等。有索引文件、链接文件和直接存取文件等。但文件之间相互独立、但文件之间相互独立、缺乏联系,数据之间的联系要通过程序去构造。缺乏联系,数据之间的联系要通过程序去构造。对数据的操作以记录为单位对数据的操作以记录为单位文件中只存储数据,不存储文件记录的结构描述信息。文件的建立、文件中只存储数据,不存储文件记录的结构描述信息。文件的建立、存取、查询、插人、删除、修改等所有操作,都要用程序来实现存取、查询、插人、删除、修改等所有操作,都要用程序来实现。数据处理和数据组织 缺点缺点 数据冗余数据冗余由于文件之间缺乏联系,由于文件之间缺乏联系,造成每个应用程序都有对应的文件造成每个应用程序都有对应的文件,有可能,有可能同样的数据在多个文件中重复存储。同样的数据在多个文件中重复存储。一个文件对应一个或几个应用程序,如果一个程序想用几个文件中的一个文件对应一个或几个应用程序,如果一个程序想用几个文件中的数据产生一个新的报表,则必须重新编写程序。由于各应用程序各自数据产生一个新的报表,则必须重新编写程序。由于各应用程序各自建立自己的数据文件,造成冗余。建立自己的数据文件,造成冗余。数据不一致(由数据冗余造成)数据不一致(由数据冗余造成)文件系统阶段是数据管理技术发展中的一个重要阶段。在文件系统阶段是数据管理技术发展中的一个重要阶段。在这一阶段中,得到充分发展的数据结构和算法丰富了计算这一阶段中,得到充分发展的数据结构和算法丰富了计算机科学,为数据管理技术的进一步发展打下了基础,现在机科学,为数据管理技术的进一步发展打下了基础,现在仍是计算机软件科学的重要基础。仍是计算机软件科学的重要基础。数据处理和数据组织文件系统阶段示例文件系统阶段示例数据处理和数据组织补贴补贴系别系别姓名姓名学号学号住址住址系别系别性别性别姓名姓名学号学号学位学位学分学分系别系别姓名姓名学号学号学位学位 出身出身年龄年龄系别系别性别性别姓名姓名学号学号(三)数据库系统阶段(三)数据库系统阶段 背景背景 计算机管理的数据量大,关系复杂,共享性要求强(多计算机管理的数据量大,关系复杂,共享性要求强(多种应用、不同语言共享数据)种应用、不同语言共享数据)外存有了大容量磁盘,光盘外存有了大容量磁盘,光盘 软件价格上升,硬件价格下降,编制和维护软件及应用软件价格上升,硬件价格下降,编制和维护软件及应用程序成本相对增加,其中维护的成本更高,力求降低程序成本相对增加,其中维护的成本更高,力求降低数据处理和数据组织数据库系统阶段数据库系统阶段数据不是依赖于处理过程的附属品,而是现实世界中独立存在的对象数据不是依赖于处理过程的附属品,而是现实世界中独立存在的对象各应用各应用程序所用到的数据都是由程序所用到的数据都是由DBMS统一管理,数据和应用程序相互独立,数据统一管理,数据和应用程序相互独立,数据共享性程度高。共享性程度高。数据1统一存取统一存取数据2数据n程序2程序1程序n数据处理数据处理数据库系统阶段数据库系统阶段数据库管理基本流程(1)数据结构化。)数据结构化。(2)数据共享性高、冗余少且易扩充。)数据共享性高、冗余少且易扩充。(4)数据由)数据由DBMS统一管理和控制。统一管理和控制。(3)数据独立性高。)数据独立性高。数据库系统阶段数据库系统阶段 数据处理和数据组织学号姓名性别系别年龄住址出身学位学分补贴(三)数据库系统阶段(三)数据库系统阶段 特点特点 有了数据库管理系统有了数据库管理系统DBMS 采用复杂的数据模型表示数据结构采用复杂的数据模型表示数据结构 数据冗余度小,能够实现数据共享,易于扩充数据冗余度小,能够实现数据共享,易于扩充 具有较高的数据独立性具有较高的数据独立性 为用户提供了方便的用户接口为用户提供了方便的用户接口 提供统一的数据控制功能提供统一的数据控制功能 并发控制、数据恢复、数据完整性、数据安全性 数据处理和数据组织数据处理和数据组织v文件系统和数据系统比较文件系统:数据以文件形式存放在外存上,可重复使用,但文件之间没有联系,每个文件只面向单独的应用。文件系统对数据的操作以记录为单位。数据库系统:所有的数据以文件形式存放在外存上,应用程序通过DBMS统一对这些文件进行操作。对数据的操作可以以记录为单位,也可以以数据项为单位。(二)数据库系统的构成(二)数据库系统的构成 数数据据库库系系统统:是是由由计计算算机机系系统统、数数据据库库、数数据据库库管管理理系系统统和和有有关人员组成的具有高度组织的总体。它的关人员组成的具有高度组织的总体。它的主要组成部分有:主要组成部分有:计算机软硬件系统计算机软硬件系统目的目的手段、工具手段、工具数据库数据库DBMS用户用户v计计算算机机系系统统:指指用用于于数数据据库库管管理理的的计计算算机机硬硬软软件件及及网网络络系系统统;(是(是DBDB的运行基础)的运行基础)v数数据据库库:数数据据库是是以以一一定定的的组织方方式式存存储在在一一起起的的相相关关数数据据的的集集合合,它它能能以以最最佳佳的的方方式式,最最少少的的数数据据冗冗余余为多多种种应用用服服务,程程序序和数据具有和数据具有较高的独立性。高的独立性。v既既有有存存放放实实际际数数据据的的物物理理数数据据库库,也也有有存存放放数数据据逻逻辑辑结结构构的的描描述述数据库;数据库;数据库系统的产生和构成数据库系统的产生和构成Database数据库管理系统的主要功能A 数据定义功能 提供数据定义语言(DDL)定义数据库中的数据对象B 数据操纵功能:提供数据操纵语言 实现对数据库的基本操作,如查询、插入、删除和修改等。SQL查询语言。C C 数据库的运行管理数据库的运行管理 数据安全性、完整性数据安全性、完整性 并发访问并发访问 故障恢复故障恢复D D 实用程序实用程序 数据批量装载数据批量装载 数据库转储数据库转储 数据库的重组织数据库的重组织 性能监视等性能监视等v数据库管理系统(数据库管理系统(DBMS):):科学地组织和存储数据、高效地获取和维护数科学地组织和存储数据、高效地获取和维护数据据v是一组对数据库进行管理的软件,通常包括:是一组对数据库进行管理的软件,通常包括:v人人员:1)数据库管理员(DBA):负责建立和维护模式,提供数据的保护措施和编写数据库文件(关心数据库的逻辑结构)2)系统程序员:是设计数据库管理系统的人员(关心数据库的物理实现)3)用户:应用程序员:负责编制和维护应用程序专门用户:指进行信息检索和补充信息的用户参数用户:指那些与数据库的交互作用是固定的、有规则的人。如订票员等(只能查询不能修改数据库)数据库系统的产生和构成数据库系统的产生和构成 (一)数据描述(一)数据描述 信息是人们对客观世界各种事物特征的反映,而数据信息是人们对客观世界各种事物特征的反映,而数据则是表示信息的一种符号。则是表示信息的一种符号。在人们对现实世界的认识和对其进行数字化描述的过在人们对现实世界的认识和对其进行数字化描述的过程中经历了三个不同的世界(或称领域):程中经历了三个不同的世界(或称领域):现实世界现实世界 信息世界信息世界 数据世界数据世界信息的三种世界及描述信息的三种世界及描述信息的三种世界:信息的三种世界:现实世界现实世界 信息世界(信息模型)信息世界(信息模型)计算机世界(数据模型)计算机世界(数据模型)现实世界信息世界(信息模型)计算机世界(数据模型)认识抽象认识抽象转换转换信息的三个世界的联系和转换过程信息的三个世界的联系和转换过程 现实世界、信息世界和数据世界这三个领域是现实世界、信息世界和数据世界这三个领域是由客观到由客观到认识、由认识到使用管理认识、由认识到使用管理的三个不同层次,后一领域是前的三个不同层次,后一领域是前一领域的一领域的抽象抽象描述。描述。现实世界现实世界 系统分析 信息世界信息世界 数据库设计 数据世界数据世界 事物及联系事物及联系 信息化 信息模型信息模型 数据化 数据模型数据模型 1.现实世界现实世界 现实世界现实世界是指客观存在的世界中的事实及其联系,是指客观存在的世界中的事实及其联系,它是人类社会存在和发展的环境。它是人类社会存在和发展的环境。如:学生、课程、教师等如:学生、课程、教师等v 2.信息世界信息世界v现实世界中的实体,通过人们的感觉器官反映到现实世界中的实体,通过人们的感觉器官反映到头脑中,形成信息,组成信息世界。简单的说就头脑中,形成信息,组成信息世界。简单的说就是现实世界在人们头脑中的反映。是现实世界在人们头脑中的反映。v信息世界信息世界是一种抽象化、概念化了的世界。是一种抽象化、概念化了的世界。v信息世界通过信息世界通过概念模型概念模型、过程模型和状态模型反、过程模型和状态模型反映现实世界,它要求对现实世界中的事物、事物映现实世界,它要求对现实世界中的事物、事物间的联系和事物的变化情况准确、如实、全面地间的联系和事物的变化情况准确、如实、全面地表示。表示。为方便理解、先了解下数据模型知识。为方便理解、先了解下数据模型知识。汽车模型汽车模型地图地图沙盘沙盘。什么是模型什么是模型?模型的概念:对现实世界事物特征的模型的概念:对现实世界事物特征的模型的概念:对现实世界事物特征的模型的概念:对现实世界事物特征的模拟模拟模拟模拟和和和和抽象抽象抽象抽象就是这个事物的就是这个事物的就是这个事物的就是这个事物的模型。模型。模型。模型。通俗地讲数据模型就是现实世界的模拟通俗地讲数据模型就是现实世界的模拟通俗地讲数据模型就是现实世界的模拟通俗地讲数据模型就是现实世界的模拟v计算机不能直接处理现实世界中的具体事物,所以必须先把具体事物转换计算机不能直接处理现实世界中的具体事物,所以必须先把具体事物转换为抽象的模型,然后再将其转换为计算机可以处理的数据,从而以模拟的为抽象的模型,然后再将其转换为计算机可以处理的数据,从而以模拟的方式实现对现实世界事物的处理。方式实现对现实世界事物的处理。v数据模型反映数据模型反映信息及信息间信息及信息间的联系的联系为什么要建立为什么要建立数据模型数据模型?数据模型应满足三方面要求数据模型应满足三方面要求数据模型应满足三方面要求数据模型应满足三方面要求n n真实真实真实真实地反映现实世界;地反映现实世界;地反映现实世界;地反映现实世界;n n易被人理解;易被人理解;易被人理解;易被人理解;n n便于在计算机上实现;便于在计算机上实现;便于在计算机上实现;便于在计算机上实现;数据模型数据模型 v数据模型分成两个不同的层次数据模型分成两个不同的层次(1)概念模型 也称信息模型,它是按用户的观点来对数据和信息建模。(2)逻辑模型(数据模型)它是按计算机系统的观点对数据建模。数据模型 主要包括网状模型、层次模型、关系模型等。数据模型数据模型v客观对象的抽象过程客观对象的抽象过程-两步抽象两步抽象现实世界中的客观对象抽象为概念模型;把概念模型转换为某一DBMS支持的数据模型。概念模型是现实世界到机器世界的一个中间层次。现实世界、信息世界和数据世界三个世界的关系现实世界、信息世界和数据世界三个世界的关系 如下图所示:如下图所示:现实世界现实世界信息世界(实体联系方法)信息世界(实体联系方法)数据世界(数据世界(DBMS支持的数据模型)支持的数据模型)对信息进行收集、分类和抽象对信息进行收集、分类和抽象对信息进行加工转换对信息进行加工转换 数据描述的三个阶段数据描述的三个阶段现实世界、信息世界和计算机世界的关系信息的三个世界的转换过程信息的三个世界的转换过程 现实世界现实世界 系统分析系统分析 信息世界信息世界 数据库设计数据库设计 计算机世界计算机世界 事物及联系事物及联系 信息化信息化 信息模型信息模型 数据化数据化 数据模型数据模型 v概念模型是对信息世界的管理对象、属性及联系概念模型是对信息世界的管理对象、属性及联系等信息的描述形式。概念模型不依赖计算机及等信息的描述形式。概念模型不依赖计算机及DBMS,它是现实世界的真实全面反映。,它是现实世界的真实全面反映。1.概念模型概念模型v概念模型的用途概念模型的用途概念模型用于信息世界的建模是现实世界到机器世界的一个中间层次是数据库设计的有力工具数据库设计人员和用户之间进行交流的语言v对概念模型的基本要求对概念模型的基本要求较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识简单、清晰、易于用户理解。信息世界相关术语:信息世界相关术语:实体实体:是指客观存在并相互区别的事物或概念。:是指客观存在并相互区别的事物或概念。可以是具体的人、事、物或抽象的概念。可以是具体的人、事、物或抽象的概念。可以是具体的人、事、物或抽象的概念。可以是具体的人、事、物或抽象的概念。例如:一个学生、一台机器、一部汽车等是例如:一个学生、一台机器、一部汽车等是事物实体事物实体,一门课程、一个班级等称,一门课程、一个班级等称为为概念实体概念实体。属性属性:实体的某一方面特征的抽象表示。实体的某一方面特征的抽象表示。实体具有许多特性,利用实体的特征可以区别不同的实体。实体具有许多特性,利用实体的特征可以区别不同的实体。一个实体可以由若干个属性来刻画。一个实体可以由若干个属性来刻画。一个实体可以由若干个属性来刻画。一个实体可以由若干个属性来刻画。如:学生,可以通过学生的“学号”,“姓名”,“性别”,“年龄”,“政治面貌”等特征来描述。此时,“学号”,“姓名”,“性别”,“年龄”,“政治面貌”等就是学生的属性。v属性值属性值是属性的具体取值。例如,某一学生,学号为例如,某一学生,学号为“0900109001”,姓名为,姓名为“王王刚刚”,性别为,性别为“男男”,年龄为,年龄为“2020”,政治面貌,政治面貌为为“党员党员”,这些具体的描述就称为属性值。,这些具体的描述就称为属性值。域域就是属性的取值范围。如:学生的年龄为如:学生的年龄为16-4516-45之间的正整数,其数据域为之间的正整数,其数据域为(16164545)。)。v主键主键:惟一标识实体的属性集称为主键。:惟一标识实体的属性集称为主键。v如:学生实体的学号可作为学生实体的主键如:学生实体的学号可作为学生实体的主键 学生的姓名则不一定可以作为学生实体的码,学生的姓名则不一定可以作为学生实体的码,因为姓名可能重复。学生的选课情况实体集则要因为姓名可能重复。学生的选课情况实体集则要把学号和课程号的组合作为主键。把学号和课程号的组合作为主键。v实体集实体集:是具有相同特性的同类实体的集合。:是具有相同特性的同类实体的集合。例如学生、汽车等都是实体集。v实体集不是孤立存在的,实体集之间有着各种各样的联系,例如,学生和课程之间有“选课”联系。v联系:联系:现实世界中事物内部以及事物之间的联系现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间在信息世界中反映为实体内部的联系和实体之间的联系。的联系。实体之间的联系实体之间的联系:a.a.一对一联系一对一联系(1(1:1)1)如:学校里一个班级中有一个正班长,而一个正班长只在一个班级如:学校里一个班级中有一个正班长,而一个正班长只在一个班级中任职,则班级与班长之间具有一对一联系。中任职,则班级与班长之间具有一对一联系。b.b.一对多联系一对多联系(1(1:n)n)如:一个班级中有若干名学生,而每个学生只在一个班级中学习,如:一个班级中有若干名学生,而每个学生只在一个班级中学习,则班级与学生之间具有一对多联系。则班级与学生之间具有一对多联系。c.c.多对多联系多对多联系(m(m:n)n)如:一门课程同时有若干名学生选修,而一名学生可以同时选修多如:一门课程同时有若干名学生选修,而一名学生可以同时选修多门课程,则课程与学生之间具有多对多联系。门课程,则课程与学生之间具有多对多联系。概念模型的表示方法概概念念模模型型是是对对信信息息世世界界的的建建模模,概概念念模模型型应应该该能能够够全全面面、准准确确地地描描述述出出信信息息世世界界中中的的基基本本概概念念。概概念念模模型型的的表表示示方方法法很很多多,其其中中最最为为著著名名和和使使用用最最为为广广泛泛的的是是P.P.ChenP.P.Chen于于19761976年年提提出出的的实实体体-联联系系方方法法(Entity-Relationship Entity-Relationship ApproachApproach),简简称称E-RE-R图图法法。该该方方法法用用E-RE-R图图来来描描述述现现实实世世界界的的概概念念模模型型,提提供供了了表表示示实实体体集集、属属性性和和联联系系的的方方法法。E-RE-R图图也也称称为为E-RE-R模型。模型。实体实体-联系方法联系方法这种方法由于简单、实用,得到了非常普遍的应用,这种方法由于简单、实用,得到了非常普遍的应用,也是目前描述也是目前描述信息结构信息结构最常用的方法。最常用的方法。目前还没有具体的数据库管理系统支持目前还没有具体的数据库管理系统支持 E-R模型,但是已经有支持模型,但是已经有支持 E-R模型的数据库设计工具,它可以把模型的数据库设计工具,它可以把 E-R模型直接转换为具体的数据模型直接转换为具体的数据库管理系统上的数据模型。库管理系统上的数据模型。E-R方法是设计数据库的有力工具,应用非方法是设计数据库的有力工具,应用非常广泛,用常广泛,用 E-R图描述的概念模型也称为图描述的概念模型也称为实体联系模型实体联系模型。转换转换现实世界现实世界人的认人的认识抽象识抽象现实世界现实世界概念模型概念模型信息世界信息世界DBMS支持支持的数据结构的数据结构数据世界数据世界从现实世界到数据世界的过程从现实世界到数据世界的过程 E-R图图v实体型实体型用矩形表示,矩形框内写明实体名。学生学生教师教师E-R图图v属性属性用椭圆形表示,并用无向边将其与相应的实体连接起来学生学生学号学号年龄年龄性别性别姓名姓名E-R图图v联系联系联系本身:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n或m:n)联系的属性:联系本身也是一种实体型,也可以有属性。如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来 联系的表示方法联系的表示方法实体型实体型1联系名联系名实体型实体型2111:1联系联系实体型实体型1联系名联系名实体型实体型2mnm:n联系联系实体型实体型1联系名联系名实体型实体型21n1:n联系联系联系的表示方法联系的表示方法实体型实体型1联系名联系名mn同一实体型内同一实体型内部的部的m:n联系联系 实体型实体型1联系名联系名实体型实体型21m多个实体型间的多个实体型间的1:n联系联系实体型实体型3n联系的表示方法示例联系的表示方法示例班级班级班级班级-班长班长班长班长111:1联系联系课程课程选修选修学生学生mnm:n联系联系班级班级组成组成学生学生1n1:n联系联系联系的表示方法示例联系的表示方法示例职工职工领导领导1n同一实体型内同一实体型内部的部的1:n联系联系课程课程讲授讲授教师教师1m多个实体型间的多个实体型间的1:n联系联系参考书参考书n实体集内部有实体集内部有1对对1,1对多,多对多的的联系对多,多对多的的联系如:职工是一个实体集,职工中有领导,而领导自身也是职工。职工实体集内部具有领导与被领导的联系,即某一个职工领导若干名职工,而一个职工仅被一个领导所管,这种联系是一对多的联系联系的表示方法示例联系的表示方法示例(续续)零件零件供应供应供应商供应商pm多个实体型间的多个实体型间的m:n联系联系工程工程n联系属性的表示方法联系属性的表示方法课程课程选修选修学生学生mn成绩成绩联系实体的属性E-RE-R模型模型设计的主要步的主要步骤 v划分和确定实体;划分和确定实体;v划分和确定联系;划分和确定联系;v确定属性;确定属性;v画出画出E-RE-R模型模型.3.数据世界数据世界 数据世界也称计算机世界,它是现实世界中的数据世界也称计算机世界,它是现实世界中的事物及其联系经过信息世界的抽象后,转换到计算事物及其联系经过信息世界的抽象后,转换到计算机中的表示形式。机中的表示形式。现实世界中的事物及其联系在数据世界中可以用现实世界中的事物及其联系在数据世界中可以用数据模型来描述数据模型来描述 1数数据据模模型型概概念念:数数据据库库系系统统设设计计中中用用于于提提供供信信息息表表示示和和操作手段的形式构架,是数据库系统实现的基础。操作手段的形式构架,是数据库系统实现的基础。2数据模型的分类数据模型的分类层次模型网状模型关系模型其中关系模型是最重要的数据模型,现今推出的数据库管理系统几乎全部支持关系模型。1、层次模型、层次模型 数据库系统最早使用的一种数据模型,以数据库系统最早使用的一种数据模型,以层次或树状结构层次或树状结构来表示来表示实体之间的联系。实体之间的联系。学校(根)学校(根)班级班级1班级班级2班级班级3学生学生1学生学生2层次模型层次模型只能描述数据之间一对一只能描述数据之间一对一或一对多的联系或一对多的联系层次模型层次模型树型结构树型结构 层次模型是一棵倒置的树。在层次模型中,同一层次模型是一棵倒置的树。在层次模型中,同一双亲的子女节点称为双亲的子女节点称为兄弟节点兄弟节点;没有子女的节点称;没有子女的节点称为为叶节点叶节点;双亲节点与其任意一个子女节点都构成;双亲节点与其任意一个子女节点都构成一个基本层次关系,表示一对多的关系。一个基本层次关系,表示一对多的关系。ABCDEF根结点根结点叶结点叶结点兄弟结点兄弟结点实例 学校学校系系处处办公室办公室教研室教研室科科 2.网状模型网状模型教师教师课程课程学生学生网状模型网状模型描述数据之间多对多的关系描述数据之间多对多的关系 2 2网状网状模型模型 在数据库中,把满足以下两个条件的基本层次联系集合称为网状模型:在数据库中,把满足以下两个条件的基本层次联系集合称为网状模型:(1)(1)允许一个以上的结点无双亲;(没有层次模型中的根结点)允许一个以上的结点无双亲;(没有层次模型中的根结点)(2)(2)一个结点可以有多于一个的双亲。一个结点可以有多于一个的双亲。产品产品1产品产品2部件部件1部件部件2部件部件3零件零件1零件零件2零件零件3零件零件4零件零件5描述数据之间多对多的关系描述数据之间多对多的关系关系模型概述关系模型是目前最重要的一种数据模型。关系数据库系统采用关系模型作为数据的组织方式,现在流行的数据库系统大都是关系数据库系统。1.关系模型的数据结构关系模型的数据结构关系数据模型建立在严格的数学概念的基础上。在关系模型中,数据的逻辑结构是一张二维表,它由行和列组成。v3、关系关系模型:模型:用二维表形式表示用二维表形式表示实体和实体实体和实体间联系间联系的数的数据模型据模型。课程号课程号课程名课程名学时学时95001MIS1995002MATH18学号学号姓名姓名年龄年龄性别性别95001张三张三19男男95002李四李四18女女95004王五王五18男男学号学号课程号课程号成绩成绩95001MIS8895002MIS8095004MATH90学生表学生表课程表课程表成绩表成绩表学生实体学生实体课程实体课程实体学生和课程学生和课程的关系的关系关系模型中的主要术语有:关系模型中的主要术语有:关系关系:一个关系对应于一张二维表。:一个关系对应于一张二维表。元组元组:二维表中的一行称为一个元组。:二维表中的一行称为一个元组。属性属性:二维表中的一列称为一个属性。:二维表中的一列称为一个属性。关键字(关键属性)关键字(关键属性):二维表中的属性或属性的组合,它的值能惟:二维表中的属性或属性的组合,它的值能惟 一地标识一个元组。一地标识一个元组。域域:属性的取值范围。:属性的取值范围。元组行元组行属性列属性列二维表二维表学号学号姓名姓名年龄年龄性别性别95001张三张三19男男95002李四李四18女女95004王五王五18男男v关系模型中对关系的描述称为关系模式关系模型中对关系的描述称为关系模式v一般的表示方式是:一般的表示方式是:关系名关系名(属性属性1,属性,属性2,属性,属性n).如:学生(学号,姓名,性别,出生年月)如:学生(学号,姓名,性别,出生年月)逻辑结构设计逻辑结构设计转化为转化为一般数一般数据模型据模型转化为特转化为特定定DBMS支持下的支持下的据模型据模型 优化模优化模型型概念结概念结构设计构设计数据库数据库物理设计物理设计基本基本E-R图图转换规转换规则则特定特定DBMS的的特点与限特点与限制制优化方优化方法如规法如规范化理范化理论论逻辑逻辑模型模型vE-R图向关系模型的转换图向关系模型的转换1、转换要解决的问题:实体和实体间的联系转换为关系模式确定关系模式的属性和主键职工职工职工号职工号姓名姓名年龄年龄职称职称5.4 ER模型到关系模型的转换模型到关系模型的转换 v把把E-R图转换为关系模型可遵循如下原则图转换为关系模型可遵循如下原则:(1)对于)对于ER图中图中每个每个实体型实体型,都应转换为一个关系,都应转换为一个关系,该,该关系应包括对应实体的全部属性,并应根据关系所表达的关系应包括对应实体的全部属性,并应根据关系所表达的语义确定哪个属性或哪几个属性组作为语义确定哪个属性或哪几个属性组作为“主关键字主关键字”,主,主关键字用来标识实体。关键字用来标识实体。实体的属性就是关系的属性,实体实体的属性就是关系的属性,实体的码就是关系的码。的码就是关系的码。ER模型到关系模型的转换实例模型到关系模型的转换实例运动员(编号,姓名,性别,名次,上一名次编号,下一名次编号)职工(工号,姓名,年龄,性别,经理工号)职工工号姓名年龄性别领导1N运动员编号姓名性别名次顺序11 对于对于ERER图中的联系,情况比较复杂,要根据实图中的联系,情况比较复杂,要根据实体联系方式的不同,采取不同的手段加以实现。体联系方式的不同,采取不同的手段加以实现。v2、若若实体体间联系是系是M:NM:N(多(多对多),多),则将将联系类型也都转换成关系模式,其属性,其属性为两端两端实体体类型型的的关键属性关键属性加上加上联系系类型的属性,而型的属性,而关键属性关键属性为两端两端实体体键的的组合合 学号学号姓名姓名课程课程学生学生年龄年龄成绩成绩课程号课程号课程名课程名教师名教师名选课选课性别性别MN学生学生(学号学号,姓名,年龄,姓名,年龄,性别性别)课程课程(课程号课程号,课程名,教,课程名,教师名师名)选课选课(学号学号,课程号课程号,成绩,成绩)联系(相关实体的主关键字,自身属性)v3 3、若、若实体体间联系是系是1:N1:N(一(一对多),可以不多),可以不单独独转换为一个关系模式,只需一个关系模式,只需在N端实体体类型型转换成成的关系模式中的关系模式中加入1端实体体类型的关型的关键属性和属性和联系系类型的属性。型的属性。系号系号系名系名教师教师聘用聘用系系电话电话聘期聘期工号工号姓名姓名性别性别年龄年龄1N系系(系号系号,系名,电话,系名,电话)教师教师(工号工号,姓名,性别,姓名,性别,年龄,年龄,系号系号,聘期,聘期)v4 4、若、若实体体间联系是系是1:11:1,可以在两个,可以在两个实体体类型型转换成的两个关系模式中成的两个关系模式中任意一个关系模式的属性的属性中加入另一个关系模式的关中加入另一个关系模式的关键属性和属性和联系系类型的型的属性。属性。校名校名地址地址校长校长任职任职学校学校电话电话任职年月任职年月姓名姓名性别性别年龄年龄11职称职称校长校长(姓名姓名,性别,年龄,职称,性别,年龄,职称)学校学校(校名校名,地址,电话,地址,电话,校长名校长名,任职年月,任职年月)学校学校(校名校名,地址,电话,地址,电话)校长校长(姓名姓名,性别,年龄,职,性别,年龄,职称,称,校名校名,任职年月,任职年月)数据库设计步骤数据库设计步骤需求分析概念建模导出关系数据模型数据库设计步骤数据库设计步骤需求分析概念建模导出关系数据模型了解组织机构情况,为分析信息流做准备了解组织机构情况,为分析信息流做准备了解组织机构情况,为分析信息流做准备了解组织机构情况,为分析信息流做准备了解各部门业务情况,了解各部门业务情况,了解各部门业务情况,了解各部门业务情况,调查各部门输入、处理、使用数据情况调查各部门输入、处理、使用数据情况调查各部门输入、处理、使用数据情况调查各部门输入、处理、使用数据情况确定数据库的信息组成确定数据库的信息组成确定数据库的信息组成确定数据库的信息组成 计算机系统应实现的功能计算机系统应实现的功能计算机系统应实现的功能计算机系统应实现的功能数据库设计步骤数据库设计步骤需求分析概念建模导出关系数据模型建立分建立分建立分建立分ERER图图图图综合分综合分综合分综合分ERER图,产生总图,产生总图,产生总图,产生总ERER图图图图数据库设计步骤数据库设计步骤需求分析概念建模导出关系数据模型从从从从ERER图导出计算机世界的关系数据模型图导出计算机世界的关系数据模型图导出计算机世界的关系数据模型图导出计算机世界的关系数据模型数据库设计案例:学院教学管理数据库设计数据库设计案例:学院教学管理数据库设计基本信息描述:基本信息描述:v某学院下设某学院下设4个系:管理工程系、会计系、市场营销系、信息管理系。每个系:管理工程系、会计系、市场营销系、信息管理系。每个系由一个系主任主管该系工作。个系由一个系主任主管该系工作。v该学院聘请了一定数量的专职教师。学院聘请教师后,分配到各系。该学院聘请了一定数量的专职教师。学院聘请教师后,分配到各系。v一个系由多个教师,一个教师只能属于一个系。一个系由多个教师,一个教师只能属于一个系。v学院每年招收新生,分配到各个专业。学院每年招收新生,分配到各个专业。v学院制定教学计划,设置多项课程。学生根据专业要求,每年学习多门学院制定教学计划,设置多项课程。学生根据专业要求,每年学习多门课程,每门课程被多个学生选读。学生必须参加考试,获取成绩。课程,每门课程被多个学生选读。学生必须参加考试,获取成绩。v一个教师可以上多门课程,一门课程可由多个教师讲授。教师授课任务一个教师可以上多门课程,一门课程可由多个教师讲授。教师授课任务完成后,将被学生与院方评估。完成后,将被学生与院方评估。需求分析数据库设计案例:学院教学管理数据库设计数据库设计案例:学院教学管理数据库设计系和教师分系和教师分ER图:图:概念建模系系教师教师分配分配1 1n n代号代号名称名称系主任系主任办公地点办公地点电话电话专业专业姓名姓名编号编号数据库设计案例:学院教学管理数据库设计数据库设计案例:学院教学管理数据库设计学生和课程分学生和课程分ER图:图:概念建模学生学生课程课程学习学习mmn n学号学号姓名姓名性别性别年龄年龄所属系所属系学分学分课程名课程名编号编号成绩成绩数据库设计案例:学院教学管理数据库设计数据库设计案例:学院教学管理数据库设计教师和课程分教师和课程分ER图:图:概念建模教师教师课程课程教学教学mmn n编号编号姓名姓名专业专业学分学分课程名课程名编号编号学生评估学生评估学院评估学院评估数据库设计案例:学院教学管理数据库设计数据库设计案例:学院教学管理数据库设计教学管理总教学管理总ER图:图:概念建模教师教师课程课程教学教学mmn n学生评估学生评估学院评估学院评估系系分配分配1 1n n学生学生学习学习n nmm成绩成绩数据库设计案例:学院教学管理数据库设计数据库设计案例:学院教学管理数据库设计导出关系数据模型系(系(系编号系编号系编号系编号,名称,系主任姓名、办公地址,电话),名称,系主任姓名、办公地址,电话)教师(教师(教师编号教师编号教师编号教师编号,姓名,专业,系编号),姓名,专业,系编号)学生(学生(学号学号学号学号,姓名,性别,年龄,系代号),姓名,性别,年龄,系代号)课程(课程(课程号课程号课程号课程号,课程名,学分),课程名,学分)学习(学习(学号,课程号学号,课程号学号,课程号学号,课程号,成绩),成绩)教学(教学(教师编号教师编号教师编号教师编号,课程号,学生评估,学院评估),课程号,学生评估,学院评估)v九十年代互联网的出现与发展,以及随之而来的九十年代互联网的出现与发展,以及随之而来的企业内部网和企业外部网以及虚拟私有网的产生企业内部网和企业外部网以及虚拟私有网的产生和应用,使整个世界互联形成一个小小的地球村,和应用,使整个世界互联形成一个小小的地球村,人们可以跨越时空地在网上交换信息和协同工作。人们可以跨越时空地在网上交换信息和协同工作。这样,展现在人们面前的已不是局限于本部门,这样,展现在人们面前的已不是局限于本部门,本单位和本行业的庞大数据库,而是浩瀚无垠的本单位和本行业的庞大数据库,而是浩瀚无垠的信息海洋。信息海洋。我怎么分析这些数据?我怎么分析这些数据?数据爆炸但知识贫乏数据爆炸但知识贫乏v随着数据库技术的迅速发展以及数据库管理系统随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多,激增的的广泛应用,人们积累的数据越来越多,激增的数据背后隐藏着许多重要的信息,人们希望能够数据背后隐藏着许多重要的信息,人们希望能够对其进行对其进行更高层次更高层次的分析,以便更好地利用这些的分析,以便更好地利用这些数据。数据。当数据量极度增长时,如果没有有效的方法,由计算机及信息当数据量极度增长时,如果没有有效的方法,由计算机及信息技术来帮助从中提取有用的信息和知识,人类显然就会感到像大海技术来帮助从中提取有用的信息和知识,人类显然就会感到像大海捞针一样束手无策。捞针一样束手无策。什么是数据挖掘?什么是数据挖掘?数据仓库(DW):是利用数据资源提供决策支持。在数据仓库中利用多维数据分析来发现问题,并找出产生的原因。能从大量历史数据中预测未来。数据库用于事务处理v数据库作为数据资源用于管理业务中的事务处理。它已经成为了成熟的信息基础设施。v数据库中存放的数据基本上是保存当前数据,随着业务的变化随时在更新数据库中的数据。v不同的管理业务需要建立不同的数据库。例如,银行中储蓄业务、信用卡业务分别要建立储蓄数据库和信用卡数据库。数据仓库用于决策分析v数据库用于事务处理,数据仓库用于决策分析v数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据v数据仓库的数据是大量数据库的集成v对数据库的操作比较明确,操作数据量少。对数据仓库操作不明确,操作数据量大数据仓库特点数据仓库特点(1 1 1 1)数据仓库是面向主题的)数据仓库是面向主题的)数据仓库是面向主题的)数据仓库是面向主题的 主题是数据归类的标准,每一个主题基本对应一主题是数据归类的标准,每一个主题基本对应一个宏观的分析领域。个宏观的分析领域。例如,银行的数据仓库的主题:客户例如,银行的数据仓库的主题:客户 数据仓库数据仓库的客户数据来源:的客户数据来源:从银行储蓄从银行储蓄DBDB、信用卡、信用卡DBDB、贷款、贷款DBDB等三个等三个DBDB中抽中抽取同一客户的数据整理而成。取同一客户的数据整理而成。在在D DW W中能全面地分析客户数据,再决定是否继续中能全面地分析客户数据,再决定是否继续给予贷款。给予贷款。(2 2 2 2)数据仓库是集成的)数据仓库是集成的)数据仓库是集成的)数据仓库是集成的 数据进入数据仓库之前,必须经过加工与集成。数据进入数据仓库之前,必须经过加工与集成。对对不不同同的的数数据据来来源源进进行行统统一一数数据据结结构构和和编编码码。统统一一原原始始数数据据中中的的所所有有矛矛盾盾之之处处,如如字字段段的的同同名名异异义,异名同义,单位不统一,字长不一致等。义,异名同义,单位不统一,字长不一致等。将将原原始始数数据据结结构构做做一一个个从从面面向向应应用用到到面面向向主主题题的大转变。的大转变。(3 3 3 3)数据仓库是稳定的)数据仓库是稳定的)数据仓库是稳定的)数据仓库是稳定的 数数据据仓仓库库中中包包括括了了大大量量的的历历史史数数据据。数数据据经经集集成进入数据仓库后是极少或根本不更新的。成进入数据仓库后是极少或根本不更新的。(4 4 4 4)数据仓库是随时间变化的)数据仓库是随时间变化的)数据仓库是随时间变化的)数据仓库是随时间变化的 数数据据仓仓库库内内的的数数据据时时限限在在5 51010年年,故故数数据据的的键键码码包包含含时时间间项项,标标明明数数据据的的历历史史时时期期,这这适适合合DSSDSS进行时间趋势分析。进行时间趋势分析。而而数数据据库库只只包包含含当当前前数数据据,即即存存取取某某一一时时间间的的正确的有效的数据。正确的有效的数据。(5 5)数据仓库的数据量很大)数据仓库的数据量很大 大大型型DWDW的的数数据据是是一一个个TBTB(1000GB1000GB)级级数数据据量量(一一般般为为10GB10GB级级DWDW,相相当当于于一一般般数数据据库库100MB100MB的的100100倍)倍)(6 6)数据仓库软、硬件要求较高)数据仓库软、硬件要求较高 需要一个巨大的硬件平台需要一个巨大的硬件平台 需要一个并行的数据库系统需要一个并行的数据库系统3.数据库与数据仓库对比数据库与数据仓库对比数据挖掘含义数据挖掘含义知识发现(知识发现(KDD):从数据中发现有用知识的整个过程。:从数据中发现有用知识的整个过程。数据挖掘(数据挖掘(DM):KDD过程中的一个特定步骤,它用专门算过程中的一个特定步骤,它用专门算 法从数据中抽取知识。法从数据中抽取知识。如在人类数据库中挖掘知识为:如在人类数据库中挖掘知识为:(头发(头发=黑色)黑色)(眼睛(眼睛=黑色)黑色)亚洲人亚洲人 该知识覆盖了所有亚州人的记录。该知识覆盖了所有亚州人的记录。数据挖掘做什么?v预测未来发生的事情(分类与回归)v将人或事物按照属性聚类v关联可能一起发生的事件(购物篮)v确定事件发生的序列(股票涨落)v异常检测1.数据仓库与数据挖掘的区别v数据仓库是一种存储技术,它能适应于不同用户对不同决策需要提供所需的数据和信息。v数据挖掘研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。2.数据仓库与数据挖掘的关系v数据仓库与数据挖掘都是决策支持新技术。但它们有着完全不同的辅助决策方式。v在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!