第四章旅游数据资源管理技术

上传人:laiq****ong 文档编号:243144846 上传时间:2024-09-16 格式:PPT 页数:98 大小:2.37MB
返回 下载 相关 举报
第四章旅游数据资源管理技术_第1页
第1页 / 共98页
第四章旅游数据资源管理技术_第2页
第2页 / 共98页
第四章旅游数据资源管理技术_第3页
第3页 / 共98页
点击查看更多>>
资源描述
,*,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第四章,旅游数据资源管理技术,第四章 旅游数据资源管理技术,【,学习目标,】,掌握数据库和数据仓库概念,了解常用的数据库管理系统,使用常用的数据挖掘工具进行统计决策,【,知识要点,】,数据库和数据仓库,数据库管理系统,数据挖掘工具,2,1,第一节 数据管理技术的发展,2,第二节 文件管理,3,第三节 数据库模型,4,第四节 旅游企业中常用的数据库管理系统,本章内容,5,第五节 旅游企业中的数据仓库,3,第一节 数据管理技术的发展,一、人工管理阶段,人工管理阶段数据管理的特点,人工管理阶段数据与程序的关系,用户,1,用户,2,用户,m,应用程序,1,应用程序,2,应用程序,3,应用程序,n,数据组,1,数据组,2,数据组,3,数据组,k,4,第一节 数据管理技术的发展,二、文件系统阶段,文件系统阶段数据管理的特点,文件系统阶段数据与程序的关系,用户,1,用户,2,用户,m,应用程序,1,应用程序,2,应用程序,3,应用程序,n,数据组,1,数据组,2,数据组,3,数据组,k,文 件 管 理 系 统,5,第一节 数据管理技术的发展,三、数据库系统阶段,数据库系统相关概念,数据库系统,(,DBS,,,Data Base System,),数据库,(,DB,,,Data Base,),数据库管理系统,(,Data Base Management System,),6,第一节 数据管理技术的发展,三、数据库系统阶段,数据库管理阶段数据与程序的关系,数据库管理阶段的特点,用户,1,用户,2,用户,m,应用程序,1,应用程序,2,应用程序,3,应用程序,n,数 据 库 管 理 系 统,数据库,7,第二节 文件管理,一、文件概念,文件系统在操作系统中的作用,相关概念,文件系统,文件,文件名称、文件命名、文件类型,文件属性、文件长度、文件时间,文件权限,8,第二节 文件管理,二、文件分类,按文件的用途进行分类,系统文件、库文件、用户文件,按文件的性质分类,普通文件目录文件特殊文件,按文件的保护级别进行分类,源文件、目标文件、可执行文件,9,第二节 文件管理,三、文件存取和操作,文件的存取,顺序访问、随机访问、索引访问,文件的操作,对文件自身的操作,建立、删除、打开、关闭、读写,对记录的操作,插入、删除、修改、查找,10,第二节 文件管理,四、文件的结构与处理方法,文件结构,物理结构、逻辑结构,文件系统的安全性和可恢复性,常见的文件系统及特点,Sysv,、,Minix,、,Ext,、,Ext2,、,NFS,、,Hpfs,FAT(FAT12,、,FAT16,、,FAT32),、,exFAT,NTFS,11,第三节 数据库模型,一、数据库概念,数据库系统,数据管理,是数据处理的中心问题。数据处理是指对各种形式的数据进行收集、储存、加工和传播的一系列活动的总和。,数据管理,指的是对数据的分类、组织、编码、储存、检索和维护。,数据库技术,所研究的问题是如何科学地组织和储存数据,如何高效地处理数据以获取其内在信息。,12,第三节 数据库模型,一、数据库概念,数据库管理系统,是数据库系统的关键内容。它在操作系统的支持下对数据库进行统一管理和控制。数据库的维护工作、安全性和完整性都由,DBMS,负贵,应用程序只有通过,DBMS,才能执行。,数据库管理系统的主要功能,数据库的定义、建立和维护功能,为数据存取功能,数据库运行管理功能,13,第三节 数据库模型,一、数据库概念,数据库系统的主要特征,数据的结构化,数据冗余度小,数据共享,具有较高的数据和程序独立性,提供各种安全性功能,14,第三节 数据库模型,二、关系数据库模型,现实世界的数据化过程,现实世界、信息世界和数据世界之间的关系,15,第三节 数据库模型,二、关系数据库模型,概念模型与数据模型,概念模型,实体,(,Entity,),实体的属性,(,Attribute,),反映实体特性只涉及有限个属性,属性名、属性值,属性的域,属性的取值范围,16,第三节 数据库模型,二、关系数据库模型,概念模型与数据模型,概念模型,实体集,(,Entity Unit,),所有属性名完全相同实体的集合,实体名,实体集的名称,实体型,(,Entity Type,),实体名及其所有属性名的集合,码或关键字,(,Key,),确定实体集中唯一实体的属性,(,集,),17,第三节 数据库模型,二、关系数据库模型,概念模型与数据模型,概念模型,实体集之间的联系,一对一联系(,1:1,),一对多联系(,1:n,),多对多联系(,m:n,),18,第三节 数据库模型,实体集之间的联系,A,R,联系名,实体型,A,实体型,R,1,1,(,a,) 一对一联系,A,R,联系名,实体型,A,实体型,R,1,n,(,b,) 一对多联系,A,R,联系名,实体型,A,实体型,R,m,n,(,c,) 多对多联系,19,第三节 数据库模型,二、关系数据库模型,概念模型的表示方法,E-R,图,概念模型常用实体,联系法表示,即,E-R,图,在,E-R,图中,长方形表示实体,椭圆表示属性,用无向边把实体与其属性连接起来。,菱形表示实体间的联系,用无向边把菱形与有关实体连接起来并在无向边旁标上联系的类型。若联系具有属性,则也把属性与菱形用无向边相连。,20,第三节 数据库模型,教师与课程关系的,E-R,图,讲授,n,m,工号,姓名,性别,生日,职务,职称,专业,课程号,名称,学时,教室,开课时间,教师,课程,21,第三节 数据库模型,教务管理系统,E-R,图,编排,n,m,系号,名称,电话,主任,地址,课程号,名称,学时,教室,开课时间,系,管理,选择,管理,讲授,课程,n,m,n,m,工号,姓名,性别,生日,职务,职称,专业,学号,姓名,性别,生日,民族,入学日期,籍贯,学生,教师,1,1,m,m,22,第三节 数据库模型,二、关系数据库模型,数据模型,非关系模型,前两种模型统称为非关系模型,它们的数据结构和图是相互对应的。,在非关系模型中,概念模型中的实体、实体型分别反映为记录和记录型,因此图的结点表示记录型,结点之间的连接弧表示记录型之间的联系。,23,第三节 数据库模型,二、关系数据库模型,数据模型,非关系模型,基本层次联系,数据结构可以分解为基本层次联系。,两个记录型及它们之间的,一对多(一对一)的联系,称为基本层次联系。,父记录和子记录,R,1,R,2,24,第三节 数据库模型,二、关系数据库模型,数据模型,非关系模型,层次模型,若一个基本层次联系的集合满足下列两个条件,则它是层次模型,有且仅有一个无父结点,这样的结点称为根结点。,非根结点都有且仅有一个父结点。,25,第三节 数据库模型,多层层次模型,R,R,1,R,2,R,21,R,22,26,第三节 数据库模型,二、关系数据库模型,数据模型,非关系模型,网状模型,若一个基本层次联系集合中,至少有一个结点有一个以上的父结点,则这种数据模型是网状模型。,可能有一个以上的结点无父结点,结点与其父结点间联系可能不止一个,27,第三节 数据库模型,网状模型,R,1,R,2,(,a,) (,b,) (,c,),R,3,R,1,R,2,R,1,R,2,R,3,R,4,28,第三节 数据库模型,二、关系数据库模型,数据模型,关系模型,当前广泛应用的数据库管理系统几乎都支持关系模型,称为关系型数据库管理系统(,Relational Data Base Management System,,即,RDBMS,),关系模型用二维表表示实体及其相互联系,对表的构成形式有一定限制,29,第三节 数据库模型,二、关系数据库模型,数据模型,关系模型,关系模型的主要术语,元组,:行,对应实体,相当于记录,属性和属性名,:列,列的名称,分量,:一个元组在一个属性上的值,关系与关系名,:整表是一个关系,关系模式,:关系名及其所有属性名集合,30,第三节 数据库模型,二、关系数据库模型,数据模型,关系模型,关系模型对二维表的限制,表中每一列都必须是不可分的基本项。,表中没有完全相同的两个元组。,在一个关系模式中:,不能有两个属性具有相同的属性名。,属性间顺序和元组间顺序都是无关紧要的。,31,第四节 旅游企业中常用的数据库管理系统,一、,Oracle,数据库管理系统,完整的数据管理功能,分布式数据库系统,支持,Internet,应用,提供界面友好、功能齐全的数据库开发工具,使用,PL/SQL,语言执行各种操作,可开放性、可移植性、可伸缩性,支持面向对象的功能,如类、方法、属性等,对象,/,关系型数据库管理系统,目前最新版本是,Oracle,11g,32,第四节 旅游企业中常用的数据库管理系统,二、,DB2,数据库管理系统,具有较好的可伸缩性、高层次的数据利用性、完整性、安全性、可恢复性,与平台无关的基本功能和,SQL,命令,数据分级技术,查询优化器,支持多任务,并行查询,网络支持能力,适用于,大型,分布式应用系统,可通过,开放数据库连接,(,ODBC,)接口、,Java,数据库连接,(,JDBC,)接口,或者,CORBA,接口代理被任何应用程序访问,33,第四节 旅游企业中常用的数据库管理系统,三、,MS Access,数据库管理系统,Microsoft Office,组件之一,桌面型,数据库管理系统,无需编写任何代码,,可视化操作,包括,表,、,窗体,、,查询,、,报表,、,宏,、,模块,等要素,支持,ODBC,与其他数据库相连,实现数据交换和共享,与,Office,办公软件进行数据交换和共享,支持,嵌入,和,链接,多媒体数据,34,四大主流数据库比较,一、开放性,1. SQL Server,只能在,windows,上运行,没有丝毫的开放性,操作系统的系统的稳定对数据库是十 分重要的。,Windows9X,系列产品是偏重于桌面应用,,NT server,只适合中小型企业。而且,windows,平台的可靠性,安全性和伸缩性是非常有限的。它不象,unix,那样久经考验,尤其是在处理大数据库。,2. Oracle,能在所有主流平台上运行(包括,windows,)。完全支持所有的工业标准。采用完全开放策略。可以使客户选择最适合的解决方案。对开发商全力支持。,35,四大主流数据库比较,一、开放性,3. Sybase ASE,能在所有主流平台上运行(包括,windows,)。 但由于早期,Sybase,与,OS,集成度不高,因此,VERSION11.9.2,以下版本需要较多,OS,和,DB,级补丁。在多平台的混合环境中,会有一定问题。,4. DB2,能在所有主流平台上运行(包括,windows,)。最适于海量数据。,DB2,在企业级的应用最为广泛,在全球的,500,家最大的企业中,几乎,85%,以上用,DB2,数据库服务器,而国内到,97,年约占,5%,。,36,四大主流数据库比较,二、可伸缩性,并行性,1. SQL Server,并行实施和共存模型并不成熟,很难处理日益增多的用户数和数据卷,伸缩性有限。,2. Oracle,并行服务器通过使一组结点共享同一簇中的工作来扩展,windownt,的能力,提供高可用性和高伸缩性的簇的解决方案。如果,windowsNT,不能满足需要,用户可以把数据库移到,UNIX,中。,Oracle,的并行服务器对各种,UNIX,平台的集群机制都有着相当高的集成度。,37,四大主流数据库比较,二、可伸缩性,并行性,3. Sybase ASE,虽然有,DB SWITCH,来支持其并行服务器,但,DB SWITCH,在技术层面还未成熟,且只支持版本,12.5,以上的,ASE SERVER,。,DB SWITCH,技术需要一台服务器充当,SWITCH,,从而在硬件上带来一些麻烦。,4. DB2,具有很好的并行性。,DB2,把数据库管理扩充到了并行的、多节点的环境。数据库分区是数据库的一部分,包含自己的数据、索引、配置文件、和事务日志。数据库分区有时被称为节点安全性。,38,四大主流数据库比较,三、安全认证,1. SQL Server,没有获得任何安全证书。,2. Oracle Server,获得最高认证级别的,ISO,标准认证。,3. Sybase ASE,获得最高认证级别的,ISO,标准认证。,4. DB2,获得最高认证级别的,ISO,标准认证。,39,四大主流数据库比较,四、性能,1. SQL Server,多用户时性能不佳,2. Oracle,性能最高, 保持开放平台下的,TPC-D,和,TPC-C,的世界记录。,3. Sybase ASE,性能接近于,SQL Server,,但在,UNIX,平台下的并发性要优与,SQL Server,。,4. DB2,性能较高适用于数据仓库和在线事物处理。,40,四大主流数据库比较,五、客户端支持及应用模式,1. SQL Server,C/S,结构,只支持,windows,客户,可以用,ADO,、,DAO,、,OLEDB,、,ODBC,连接。,2. Oracle,多层次网络计算,支持多种工业标准,可以用,ODBC,、,JDBC,、,OCI,等网络客户连接。,3. Sybase ASE,C/S,结构,可以用,ODBC,、,Jconnect,、,Ct-library,等网络客户连接。,4. DB2,跨平台,多层结构,支持,ODBC,、,JDBC,等客户。,41,四大主流数据库比较,六、操作简便,1. SQL Server,操作简单,但只有图形界面。,2. Oracle,较复杂,同时提供,GUI,和命令行,在,windowsNT,和,unix,下操作相同。,3. Sybase ASE,较复杂,同时提供,GUI,和命令行。但,GUI,较差,常常无法及时状态,建议使用命令行。,4. DB2,操作简单,同时提供,GUI,和命令行,在,windowsNT,和,unix,下操作相同。,42,四大主流数据库比较,七、使用风险,1. SQL server,完全重写的代码,经历了长期的测试,不断延迟,许多功能需要时间来证明。并不十分兼容。,2. Oracle,长时间的开发经验,完全向下兼容。得到广泛的应用。完全没有风险。,3. Sybase ASE,向下兼容,但是,ct-library,程序不益移植。,4. DB2,在巨型企业得到广泛的应用,向下兼容性好。风险小。,43,第五节 旅游企业中的数据仓库,一、数据仓库(,Data Warehouse,),数据仓库定义,数据仓库定义为面向主题的、集成的、稳定的、不同时间的、,反映历史变化,数据集合,用于支持经营管理中决策制定过程。,44,第五节 旅游企业中的数据仓库,一、数据仓库(,Data Warehouse,),数据仓库的特点,面向主题,集成性,稳定性,反映历史变化的,面向主题的,集成的,随时间变化的,非易失的,数据仓库,45,特点,1,:数据仓库是面向主题的,基于,传统关系数据库,建立的各个应用系统,是面向,应用,进行数据组织的;而,数据仓库,中的数据是面向,主题,进行组织的。主题是指一个,分析,领域,是在较高层次上企业信息系统中的,数据综合,、,归类,并进行,利用,的,抽象,。所谓较高层次是相对面向应用而言的,其含义是指按照主题进行数据组织的方式具有更高的,数据抽象,级别。,例如,保险公司,建立数据仓库,所选,主题,可能是,顾客,、,保险金,和,索赔,等,而按照应用组织的数据库则可能是,汽车保险,、,生命保险,和,财产保险,等。对于一个,网上商城,的数据仓库来说,那么,销售分析,就是一个主题,,客户属性分析,也是一个主题。,46,特点,2,:数据仓库是集成的,面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是,异构,的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的,一致,的,全局信息,。,在创建数据仓库时,信息集成的工作包括,格式转换,、根据选择逻辑,消除冲突,、,运算,、,总结,、,综合,、,统计,、,加时间属性,和,设置缺省值,等工作。还要将原始数据结构作一个从面向,应用,到面向,主题,的转变。,47,特点,2,:数据仓库是集成的,数据仓库环境下数据的集成,48,特点,3,:数据仓库是稳定的,操作型数据库,中的数据通常,实时更新,,数据根据需要及时发生变化。,数据仓库,的数据主要供企业决策分析之用,所涉及的数据操作主要是,数据查询,,,数据一旦装入其中,基本不会发生变化。数据仓库中的每个数据项对应于一个特定时间。当对象某些属性发生变化就会生成新的数据项。,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的,查询,操作,但,修改,和,删除,操作很少,通常只需要定期的,加载,、,刷新,。,因此,数据仓库的信息具有稳定性。,49,特点,4,:数据仓库是反映历史变化的,操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含,历史信息,,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出,定量分析,和,预测,。,50,数据随时间变化,数据的,不可更新,是指数据仓库用户进行分析处理时不进行数据更新工作,不是说数据仓库从开始到删除的整个生命周期都是永远不变的。,数据仓库的数据随着时间变化而,定期,被更新,每隔一段固定的时间间隔后,运作数据库系统中产生的数据被抽取、转换以后集成到数据仓库中,而数据的过去版本仍,保留,在数据仓库中。,数据仓库的数据也有,存储期限,,一旦超过了这个期限,过期数据就要被删除,只是数据仓库内的数据实现要远远,长于,操作型环境中的数据时限。,51,第五节 旅游企业中的数据仓库,一、数据仓库,(,Data Warehouse,),数据仓库是一个数据库,其中的数据来自于许多系统,旨在支持管理报表生成和决策制定。,广义上,数据仓库实际上指的是数据存储和工具。,数据仓库使用用户在业务活动中收集的信息来帮助用户决策,使用户更好、更巧妙、更快、更有效地操作业务。,数据仓库是合理的业务智能架构的关键部分。,52,一、数据仓库,(,Data Warehouse,),企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。,第五节 旅游企业中的数据仓库,53,数据仓库进化过程,最初的数据仓库主要用于企业内部某一部门的报表。,决策者关心的重点发生了转移,从,发生了什么,转向,为什么会发生,。分析活动的目的就是了解报表数据的涵义,需要对更详细的数据进行各种角度的分析。,当一个公司决策过程得到量化以后,对经营动态的情况以及这种情况为什么发生都会有所体验,下一步就是要将信息用于预测。,重在战术性决策支持。重点在企业外部,为执行公司战略的员工提供支持。,动态数据仓库在决策支持领域中的角色越重要,企业实现决策自动化的积极性就越高。在,CRM,环境中,利用动态数据仓库,根据每一位客户的情况做出决策都是可能的。,54,数据仓库与数据库的区别,数据仓库,数据库,面向分析型数据处理,面向事务型数据处理,对多个异构的数据源的有效集成,数据库之间相互独立且异构,数据相对稳定,数据实时更新,反映历史变化,通常关心当前数据,55,数据仓库的体系结构,56,第五节 旅游企业中的数据仓库,一、数据仓库(,Data Warehouse,),当前报表架构存在的问题,可访问性,及时性,格式,完整性,目标、业务、智能,57,第五节 旅游企业中的数据仓库,一、数据仓库(,Data Warehouse,),数据仓库在,DSS,(决策支持系统)中的地位,传统辅助决策的软件结构是“三部件”型:总控部件、数据库部件和模型部件。,问题处理和人机交互(综合部件),模型库管理系统,数据库,模型程序,数据库管理系统,58,第五节 旅游企业中的数据仓库,一、数据仓库(,Data Warehouse,),数据仓库在,DSS,(决策支持系统)中的地位,现代决策支持系统架构基于数据仓库、联机处理分析和数据挖掘。,59,第五节 旅游企业中的数据仓库,一、数据仓库(,Data Warehouse,),数据仓库在,DSS,(决策支持系统)中的地位,数据仓库已经成为现代,DSS,的主要数据源,传统,DSS,架构的不足,现代,DSS,架构的突破,实际应用案例,基于数据仓库的高速公路营运管理辅助决策系统的概念模型,60,第五节 旅游企业中的数据仓库,二、数据挖掘(,Data Mining,),数据挖掘的产生,起因:,丰富的数据,贫乏的知识,发展:,20,世纪,80,年代开始,数据挖掘技术逐步发展起来,快速发展原因:,拥有巨大的数据资源,以及将这些数据资源转换为信息和知识资源的巨大需求,数据挖掘可被看作是数据管理与分析技术的自然进化产物,61,什么是数据挖掘,?,数据挖掘,是一个利用各种,分析方法,和,分析工具,在大规模,海量数据,中建立模型和发现数据间关系的过程,这些模型和关系可以用来做出决策和预测。,顾客数据到处都是,谁才是我的顾客?,销售信息,订单目录,市场数据库,库存信息,客服信息,市场信息,62,第五节 旅游企业中的数据仓库,二、数据挖掘(,Data Mining,),数据挖掘基本知识,数据挖掘:,从大量数据中挖掘或抽取出知识。,数据库中知识发现,KDD,,,Knowledge Discovery from Database,从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。,整个知识挖掘过程由若干挖掘步骤组成,数据挖掘仅是其中一个主要步骤。,63,数据挖掘能做些什么?,数据特征化和数据区分,关联分析,分类和预测,聚类分析,孤立点分析,演变分析,64,数据挖掘的常用方法,决策树,相关规则,神经元网络,遗传算法,可视化,OLAP,联机分析处理,统计方法,65,数据挖掘的常用方法,决策树,决策树,(Decision Tree),。决策树方法被成功地应用于信用卡损失和不同的国际流通货币的时序预测等各种问题中。一般可用于,探索问题,、,数据预处理,和,预测,中。目前常用的有,ID3,、,CHAID,和,CART,等几种典型的算法。,决策树算法,的主要优点是,直观,,其缺点在于随着数据复杂性的增加,分支数会增加,对数据仓库的搜索次数会增加,管理难度会加大。,66,数据挖掘的常用方法,神经元网络,神经元网络,(Neural Network),。神经元网络虽然在易用性和易理解性方面受到了限制,但其正确率很高。它通过,学习,发现规律,然后进行,预测,。神经元网络可用于,聚类,、,异常发现,、,特征制取,和,预测,。,67,数据挖掘的常用方法,遗传算法,遗传算法,(Genetic Algorithms),。,遗传算法,是霍兰等人于,20,世纪,40,年代提出的。以,生物进化,的过程为基础,加以,交叉,、,变异,和,选择,运算,逐步得到问题的最优解。,68,第五节 旅游企业中的数据仓库,二、数据挖掘(,Data Mining,),数据仓库与数据挖掘,数据仓库,是创建商务智能过程中,继数据库技术后进一步的发展(超过数据库)。,数据挖掘工具,是人们用于数据仓库和商务智能推理过程中,支持决策、解决问题或创造竞争优势而挖掘有价值信息时所必需的工具。,69,ORACLE,数据仓库和数据挖掘解决方案,Data Warehousing,ETL,OLAP,Data Mining,Metadata,70,Oracle,数据库,SQL *Loader,工具,Oracle Warehouse Builder,(,OWB),Oracle,提供的数据仓库工具及其功能介绍,71,1. Oracle9i,数据库,一个对象关系型,数据仓库,,用于存储大量的数据。,72,2.,SQL *Loader,工具,用于将数据装载到,数据仓库,中。这些数据包括,Oracle,数据库中的数据,其他数据管理系统中的数据和外部数据。开发人员可以利用这两种工具将多种数据源融合在一个单一的存储系统中,并加以管理,从而为最终用户提供对这多种数据源的,无缝访问,。,73,3. Oracle Warehouse Builder,OWB,是,Oracle Developer Suits,中的一个,组件,,是用于设计、实现、和管理企业数据仓库和数据集市的,集成系统,。,通过向导驱动的用户界面来进行,数据映射,、,元数据导入,,利用预定义的转换库,能够减少设计和实施时间。,自动生成代码,,并且通过校验程序保证编码的正确性和唯一性,按照部署的要求生成不同的编码类型。,74,3. Oracle Warehouse Builder,提供可视化的,直观映射,和,转换工具,、对多维数据的拖放功能,以及一个用于管理仓库的系统外门户解决方案,降低设计和开发数据仓库和数据中心的复杂度。,OWB,为事实表和维度表提供,向导,和,图形编辑器,。,OWB,全面应用,Oracle,9i,的分区、索引和总结管理等特性,与数据库的紧密集成允许,Oracle,9i,作为一种转换引擎使用,排除了增加转换服务器的需求。,75,3. Oracle Warehouse Builder,利用,OWB,组件,文件集成器,,实现从文本文件中提取数据。,OWB,包括一个,全局共享库,(,Global Shared Library),,,用于存储可重复使用的转换。,OWB,软件还包括,Oracle Pure Integrate,和,OWB Integrator for SAP R/3,前者是将数据客户集成以形成战略性电子商务项目基础的软件,后者是对,SAP,特有的,ERP,数据进行强有力报表制作和分析的集成桥梁。,76,Oracle,提供的数据挖掘工具及其功能介绍,Oracle,9i,Data Mining,Oracle,9i,OLAP,工具集,(,1,),Oracle Discoverer,(,2,),Oracle Express,系列,Oracle Express Analyzer,Oracle Express Objects,Oracle Express Server,77,1. Oracle,9i,Data Mining,提高应用软件的,预测力,和,洞察力,将数据挖掘功能嵌入,Oracle,9i,数据库中,基于,Java,的,API,Data Mining,78,提高应用软件的预测力和洞察力,利用,DM,,,公司能够构建高级商务智能应用程序、对公司的数据库进行挖掘、发现新的有用信息并将其集成到商务应用程序中。,利用,DM,,,公司能够提高在,客户关系管理,(,CRM,),、,企业资源计划,(,ERP,),、,网页入口,和,无线应用,等商务智能方面的能力。,鉴别,最有利可图的消费者,避免客户流失,获得,新客户,对已有客户进行交叉销售,检测,欺诈行为,预测,零件质量,寻找,病人、药品和疗效之间的关系,79,数据挖掘功能的内嵌,Oracle,9i,Data Mining,将数据挖掘功能嵌入,Oracle,9i,数据库中,用于分类、预报和关联。所有的模型构建、评分、以及元数据管理操作经由基于,Java,的,API,来启动并完全在该关系数据库中发生。,采用贝叶斯法则进行,预测,和,分类,运用关联规则检测隐藏于数据库中“,相关,”或,并发事件,自动提取,商务信息并将其,整合,在其他应用软件之中,80,基于,Java,的,API,商务智能,(,BI,),开发人员可以使用基于,Java,的应用程序接口(,API,),来开发基于,预测,的应用软件。,自动执行数据挖掘进程,为消费者打分以及产生需求预测。,通过查询、分析和报表生成器产生新的数据挖掘信息。,支持应用程序的集成。,81,2. Oracle,9i,OLAP,工具,企业级,OLAP,可将跨部门的数据紧密地联系在一起,从而使所有用户在一个共同的信息基础上。它帮助用户使用数据仓库中的所有数据。,企业级,OLAP,还能够超越数据仓库的范围,集成来自其它独立系统的数据,这些系统可能是关系型数据库或者外部的文件系统。这种集成使得新型应用,如:基于事实的,促销,、基于行为的,定价,以及产品利润,分析,等能够跨越单一部门的界限。,82,(,1,),Oracle Discoverer,是,Oracle,公司面向,决策支持系统,OLAP,工具集的组成部分。它是一个直观的随意,查询,、,报告,、,搜索,和,Web,公布,的工具。,它能够帮助公司内部各个层次的商业用户,获得,迅速访问,关系型数据库、数据中心或者联机事务处理系统中数据的能力。,83,(,1,),Oracle Discoverer,User Edition,提供了超乎寻常的易用性,通过任意深入能力、旋转和图表,给予用户强大的,数据探索能力,。,Administration Edition,提供了一个易于使用的基于服务器的强大的,最终用户层,(End User Layer,),。,对于那些需要集中精力处理,商业问题,而不是,数据问题,的最终用户而言,,End User Layer,为他们隐藏了数据结构和相互关系的复杂性。,84,(,2,),Oracle Express,系列,通过使用,Oracle Express,:,分析咨询人员,能够很轻松地从各自的视角观察数据,产品经理,能够跨越许多时间段和市场区域研究她负责的某个产品,财务经理,可以集中在当前或者以前的时间段,研究所有的市场和产品,地区经理,可在某些地区的所有时间段上考察所有产品,策略规划人员,可以集中在公司数据的某个集上,如在当前和下个季度,仅在西部地区销售的某个新产品,85,Oracle Express Analyzer,通用的、面向最终用户的,报告,和,分析工具,,它采用面向对象技术,在,Oracle Express Analyzer,中能运行任何,Oracle Express Objects,应用。,在,Oracle Express Analyzer,的一个基石性对象是,简报,(briefing),。,一个简报由若干页组成,每一页上包含由可重用的对象建立的面向主题的分析。这些对象是交互的、用户能够旋转、深入和查询任何一张简报页中的表格或者图形,以运行他们自己的,即席分析,。,86,Oracle Express Objects,是最早出现的用于建立,C/S,上,OLAP,应用的面向对象的可视化开发环境。,提供,图形化建模,和,假设分析,功能 。,通过使用标准的,Microsoft,对象连接,嵌入技术,(OLE),,,实现对第三方软件开放。例如能够使用一个,OLE,控件,显示销售某公司产品的商店。,通过使用,代理程序,、,预警程序,和,OLE,控件,,可以监控存货水平,当存货水平下降时向管理人员报警,自动提高主要产品的存货水平,。,87,Oracle Express Server,是一个先进的计算机,引擎,和,数据高速缓存,。,支持最能反应用户对其业务思考方法的,多维模型,,而且具有,分析,、,预测,、,建模,,以及对数据进行,假设分析,(what-if),的能力。,具有用于,数学,、,财务,、,统计,和,时间序列管理,等方面的内置功能 。,88,第五节 旅游企业中的数据仓库,三、常用的数据挖掘工具,数据挖掘工具,查询与报表工具,智能代理,多维分析工具,统计工具,数据集市,小型的数据仓库,89,数据库设计主键的故事,什么是,主键,? 关系数据库为了,唯一区分,表的每一行记录,必须为表确定一个,主键,。主键可以是一个或多个列组成,这些主键列的值,不能重复,。一个表只能有一个主键,但可以有多个候选索引。因为主键可以,唯一标识,某一行记录,所以可以确保执行数据更新、删除的时候不会出现张冠李戴的错误。主键是两个表进行关联的基础,所谓“,关系,”体现的是一个表的字段,(外键),与另一个表的,主键,的关联,防止出现数据不一致。所以数据库在设计时,,主键,起到了很重要的作用。,90,数据库设计主键的故事,1969,年,8,月,8,日,在北京协和医院降生了一个漂亮的小女孩。接生的阿姨说,她的声音这么大,好象想要全世界的人都听到。后来,她的父亲为她取了一个很好听的名字,叫“王菲”。于是,所有的小朋友就叫她“王菲”。,“王菲”就是她童年的主键。,在她上初二的时候,认识了二班另一个叫“王菲”的同学,而且和她同一天生日。不过,同学们常常将她俩弄错,后来,就分别叫她们“大王菲”和“小王菲”。,“大王菲”就是她在同学们心目中的主键。,91,数据库设计主键的故事,在大王菲,18,岁的那一年,她领到了她的身份证。从此,她有了新的身份标识“,100321690808022”,,这一标识可以唯一区别中国大陆的每一个人。同时,原来二班的“小王菲”也领到了她自己的身份证,“,100321690808006”,。于是,人们就可以用身份证号,唯一标识两个“王菲”了。,身份证号“,100321690808022”,就是她成年后的主键。,92,数据库设计主键的故事,由于她的歌唱的非常好,没多久就成了歌星。后来她去了香港发展,娱乐公司非要将她的名字更改为“王靖雯”,虽然她并不喜欢这个名字,但为了事业的发展还是同意了。“王靖雯”的歌打动了许许多多的歌迷,很快就成了歌坛天后。歌迷们将“王靖雯”这一主键与无数条动听的歌曲记录关联在了一起,并形成了一个庞大的歌迷数据库。,“王靖雯”就成了她在娱乐圈里的主键。,93,数据库设计主键的故事,没多久,王靖雯和一个弹电吉他的小子相爱了。那小子说,还是“王菲”这个名字好听,于是,“王靖雯”又变回“王菲”了。主键被那小子修改了,这下麻烦大了。歌迷们都糊涂了,是将她的歌关联到“王菲”还是“王靖雯”呢?,这一主键的修改,导致歌迷数据库的一次大混乱。,94,数据库设计主键的故事,在日常的应用项目开发中,我们常常都会面临“,该拿什么字段来做主键,”的难题。,用名字做主键?,一班的“王菲”和二班的“王菲”可能重复。,用身份证号做主键?,在大陆也许不会重复,去香港后,人家却不认。,同样,,主键值的更新也是麻烦事儿。,“王靖雯”变成“王菲”那段日子,货架上一张唱片是王靖雯的,另一张又是王菲的,许多歌迷还以为又有新人出现了。,95,【,习题,】,1.,文件有哪些属性?,2.,怎样将文件分类?,3.,常见文件系统及其特点有哪些?,4.,什么是数据库系统?,5.,数据库系统的主要特征是什么?,6.,数据库管理系统的主要功能是什么?,7.,简述三种数据模型。,96,【,习题,】,8.,什么是数据仓库?,9.,数据仓库的特点是什么?,10.,简述数据仓库与决策支持系统的关系。,11.,数据挖掘的定义是什么?,12.,数据挖掘的基本功能是什么?,13.,常见的数据挖掘工具有哪些?,97,谢 谢!,Thank you.,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!