资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,决策支持系统,第六章 决策支持的新技术,决策支持系统第六章 决策支持的新技术,引例,:信息共享是国土安全部门国家安全战略的核心要素,美国国土安全部门国家安全战略包含一个和恐怖活动检测相关信息共享的远景,其陈述的内容是:我们将建立一个共享关键国土安全信息的国内环境。我们必须建设一个系统的系统,能够在任何时间向正确的人提供正确的信息。信息能够在各级政府部门之间进行,“,水平,”,共享,并在联邦、州和地方政府以及私营企业和居民之间进行,“,垂直,”,共享。随着对人员、流程和技术的正确使用,全美国的国土安全官员都能够意识到潜在的威胁以及应对这些威胁的人员和资源的知识。官员们收到潜在威胁的信息,这使得他们意识到威胁所在并快速有效地做出反应。,该项目的目标是将那些分布在不同数据源的知识集成,建立一个可用的模型,同时还要能够充分地保障隐私和公民自由权。,数据仓库提供了一个战略性的数据构架。,引例:信息共享是国土安全部门国家安全战略的核心要素美国国土安,主要内容及学习目的和要求,主要内容,数据仓库的概念、体系结构,数据集市的结构,数据仓库建立的步骤,数据挖掘的概念、过程和步骤,数据挖掘的任务和方法,OLAP,的概念、体系结构、处理特性,OLAP,的多维数据分析方法,学习目的和要求,掌握数据挖掘、数据仓库、,OLAP,的概念,理解数据库与数据仓库的区别,掌握数据仓库的建立步骤,了解数据挖掘的目的和作用,了解数据挖掘的基本过程和步骤,理解数据挖掘的典型方法,理解,OLAP,的多维数据分析方法,主要内容及学习目的和要求主要内容数据仓库的概念、体系结构学习,6.1,数据仓库技术,(1/14),传统的数据问题,(1/4),20,世纪,90,年代以后,数据的大量增加,20,世纪,80,年代以前,以事务处理系统为核心,系统基础是数据库提供的数据处理功能,通过报表形式提供决策信息。,分离型数据库结构的,DSS,出现,虽然比较灵活。但各应用系统产生的数据缺乏整合性。,6.1 数据仓库技术(1/14)传统的数据问题(1/4)20,传统的数据问题,(2/4),6.1,数据仓库技术,(2/14),随着应用系统的增加,需要转换的数据越来越多,这样将使得工作效率下降。因此,提高数据的整合度,就成为解决这个问题的关键。,A,B,应用系统,1,应用系统,2,F,数据转换,传统的数据问题(2/4)6.1 数据仓库技术(2/14)随着,25981.45,3,月,23412.78,2,月,12350.35,1,月,商品,1,商品,2,商品,N,2843.81,部门,3,2312.00,部门,2,8750.20,部门,1,商品,1,商品,2,商品,N,499572.81,部门,3,487586.20,部门,2,500004.35,部门,1,1,月,2,月,12,月,21348.89,商品,3,11234.12,商品,2,12350.35,商品,1,1,月,2,月,12,月,A,B,C,D,传统的数据问题,(3/4),6.1,数据仓库技术,(3/14),25981.453月23412.782月12350.351月,传统的数据问题,(4/4),分析型处理,针对某个主题,会在时间段上有比较长的延伸,是操作型的一种积累和提炼,主要是面向决策支持。,操作型处理,针对非常具体的业务,即对数据库联机的日常操作,常是对一个或一组记录的查询和修改,主要是为特定应用服务的,人们关心的是响应时间、数据的安全性和完整性。一般是实时的。,(,事务处理,),性能和特性不同,数据集成问题,数据动态集成问题,历史数据问题,数据的综合问题,不同的使用对象,事务处理环境不适宜决策应用的原因,6.1,数据仓库技术,(4/14),数据,处理,传统的数据问题(4/4)分析型处理针对某个主题,会在时间,6.1,数据仓库技术,(5/14),沃尔玛通过数据仓库识别和满足不可预期的顾客需求,2001,年,,“,9.11,”,事件的发生使沃尔玛意识到及时信息的关键性。沃尔玛公司能够快速识别顾客在受攻击日的购买模式,比如对武器、瓶装水、逃生设备的需求上升,这样,沃尔玛能够快速满足顾客需求并据此做出计划,沃尔玛能够预测到顾客将平常的购买模式推迟几天,并能够预计到和满足突发其来的高峰需求。,案例,锐得物流公司进入电子供应链领域,锐得,(Ryder),公司修改了其电子商务战略,以便与,100,多艘船的顾客需要快速装卸的运货船相匹配。锐得公司能够这么做是因为有了数据仓库。数据仓库使用了基于,NCR,公司的,Teradat,a,数据仓库技术的运输分析软件包和,MicroStrategy,公司的产品。新系统能够使托运人在线下订单,实时预订运输船。,案例,6.1 数据仓库技术(5/14)沃尔玛通过数据仓库识别和满足,数据仓库的定义,(1/2),数据仓库的基本工作方式,说明:,数据仓库是一种数据资源构架。它具有不同的数据源,来自数据源的数据经过系统的整理和分类后,存储到统一的数据存储中心,根据决策者的要求提供检索和显示服务。,误区:,对数据仓库最大的误解是把它当做了一个现成的可直接买来使用的产品。实际上,数据仓库和数据库不同,它不是现成的软件或硬件产品。数据仓库是一种解决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理过程,用户通过分析这些信息可作出策略性的决策。,过滤、筛选,整理、分类,作业性数据,数据仓库,数据存储中心,决策者,6.1,数据仓库技术,(5/14),数据仓库的定义(1/2)数据仓库的基本工作方式说明:数据仓库,W.H.Inmon,:,建立数据仓库,数据仓库,面向,主题,的、,集成,的、,稳定,的、,不同时间,的数据集合,用以,支持经营管理中的决策制定过程,。,备注,:,主题是一个较高层次上将数据归类的标准,每一个主题对应一个宏观的分析领域;集成是指数据进入数据仓库之前,必须进行数据加工和集成;稳定性是指数据仓库反映的是历史数据的内容,而不是日常事务处理产生的数据,数据加工和集成进入数据仓库后是很少修改的;数据仓库是不同时间的数据集合,要求数据保存时限能满足决策分析的需要。,数据仓库的,特点,:,面向主题的、集成的、稳定的、随时间增长的、数据量很大、软硬件要求高。,数据仓库的定义,(2/2),6.1,数据仓库技术,(6/14),W.H.Inmon:数据仓库面向主题的、集成的、稳定的、,数据仓库与数据库的区别,数据库,数据仓库,数据,处理型数据,(,当前数据,),分析型数据,(,非即时性的历史数据,),面向,业务的,主题的,使用者,一般业务人员,企业高层管理人员,任务,收集和记录企业的原始业务数据,对企业日常数据处理和维护。,通过从企业的业务数据中提取数据,经过加工和处理来呈现给企业的决策人员,因此,是把企业运行数据收集后用于分析和决策。,6.1,数据仓库技术,(6/14),数据仓库与数据库的区别数据库数据仓库数据处理型数据(当前数据,数据集市,(1/3),数据集市,(data mart),部门级的数据仓库,或者是为某种专门的用途开发的数据存储系统。,误区,:,认为数据集市与数据仓库的差别只是数据量的大小而已;简单地理解数据集市容易建立;数据集市很容易升级成数据仓库。,采用第三范式,数据组织一般采用星型模型,基于整个企业的数据模型建立的,是面向企业范围内的主题,按照某一特定部门的数据模型建立的,数据来源于各个部门的不同应用系统,可保证数据的整合性,规模较小,成本较低,针对性更强,存储整个企业内非常详细的数据,数据的详细程度要低一些,数据仓库,数据集市,区 别,6.1,数据仓库技术,(7/14),数据集市(1/3)数据集市(data mart)部门级的,数据集市,(2/3),6.1,数据仓库技术,(8/14),两种,形式,从属的数据集市,数据是从企业的数据仓库获得,可看作是数据仓库的一个子集。因此具有较好的数据整合性。若需要的数据在数据集市中没有,则要先修改数据仓库的结构,使这种数据先进入数据仓库,再进入数据集市。这种数据集市适合用于对数据仓库的访问量比较大的关键业务部门。,独立的数据集市,没有数据仓库作为它的数据来源,而是直接从各个应用系统取得数据,因此,成本低,灵活性好,需要一种新的数据时不必修改企业级的数据仓库。可提供个别部门所需要的数据,整合性较差。,数据集市(2/3)6.1 数据仓库技术(8/14)两种从属的,作业性数据,决策者,.,.,.,数据,仓库,作业性数据,决策者,.,.,.,数据,集市,数据集市,(3/3),6.1,数据仓库技术,(9/14),数据,集市,决策者,作业性数据决策者.数据作业性数据决策者.数据数据集市(3/3,数据仓库系统的结构,6.1,数据仓库技术,(10/14),DW,管理工具,抽取、清洗,加载、汇总,数据建模工具,元数据库,综合数据,当前数据,历史数据,用户查询工具,C/S,工具,OLAP,工具,DM,工具,关系数据库,数据文件,其他数据,数据源,仓库管理,数据仓库,分析工具,数据仓库管理,:,对存储在数据仓库中的数据进行各种管理,主要利用数据库管理系统的功能来完成。,分析工具,:,包括各种查询、检索工具、多维联机数据分析工具、数据挖掘工具等,以实现,DSS,的各种要求。,数据仓库系统的结构6.1 数据仓库技术(10/14)DW管理,高度综合数据层,轻度综合数据层,当前基本数据层,历史详细数据层,元数据,从作业性数据源获得的数据仓库的输入,根据决策者需要的主题进行存储。,详细数据,对详细数据进行不同程度的汇总和抽象。这是提高数据资源利用效率的策略。,通过时间控制机构转化,有关每个数据层的数据。将四层次的数据组织起来。,数据仓库中的数据层次,数据的存储层次,6.1,数据仓库技术,(11/14),高度综合数据层轻度综合数据层当前基本数据层历史详细数据层元数,常用元数据类型,说 明,举 例,数据源描述,一些数据源用来说明数据源的结构,数据的来源、源数据的结构,数据字典、索引信息等等,数据模型描述,组织数据所依据的逻辑结构,数据的实体、关系、有效值、存取规则等,转换映射,用来记录数据源中的数据经过哪些处理后进入到数据仓库,数据源的标识、属性之间的映射、属性的转换、转换规则等,应用性元数据,用来记录有关数据仓库的应用历史、用户类型、使用频率等,通过元数据可以看出什么人在什么时候对数据仓库的哪些数据项进行了什么操作等,元数据,6.1,数据仓库技术,(12/14),常用元数据类型说 明举 例数据源描述一些数据源用来说明数,决策者,客户端,内部,外部,数据源,DW,服务器,OLAP,服务器,数据仓库的三层结构,备注,:数据来源于组织的多个数据源。,备注,:数据仓库服务器存储着从不同数据源抽取的数据,并根据元数据对其进行整理。该层提供不同层次的数据整理以及提供各部门所需的数据集市的数据。,备注,:,OLAP,服务器的作用在于进一步使,OLAP,操作更为方便。可将,DW,服务器做的操作工作转移到该服务器上,从而降低系统中的数据传输量,提高工作效率。,备注,:客户端的功能是与用户进行交互会话。将用户的要求转换为服务器可理解的方式送到服务器,取回查询的结果进行显示和提供报表等。,数据仓库的运行结构,6.1,数据仓库技术,(13/14),决策者客户端内部外部数据源DW服务器OLAP服务器数据仓库的,6.1,数据仓库技术,(14/14),数据进入数据仓库的过程和建立数据仓库的步骤,过程,提前计算出任何期待的数据仓库数据的汇总供以后使用,汇总,5,把净化过的数据载入到数据仓库数据里,加载,4,尽量地更正错误的数据,净化,3,为所有来自数据源的数据指定常用的格式和名称,变换,2,从操作型数据库中选择并提取出所需要的字段,提取,1,建立数据仓库的步骤,(教材,P221-222,),6.1 数据仓库技术(14/14)数据进入数据仓库
展开阅读全文