资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,第9章,数据仓库应用实例,9.1,数据仓库的数据加载与钻取,9.2,数据挖掘模型的设计,9.3,SQL Server中的数据挖掘工具,9.4,数据仓库客户端界面的设计,9.1,数,数,据,据仓库,的,的数据,加,加载与,钻,钻取,9.1,.,.1,数,数据,仓,仓库的,数,数据加,载,载,1.SQLServer,的,的数据,复,复制工,具,具与应,用,用,5个有,关,关复制,的,的向导,工,工具:,创,创建和,管,管理发,布,布、强,制,制其它,服,服务器,订,订阅、,请,请求订,阅,阅、禁,用,用发布,和,和分布,、,、配置,发,发布、,订,订阅服,务,务器和,分,分发,SQLServer数据,复,复制向,导,导,2.创,建,建发布,向,向导,利用发,布,布向导,可,可以完,成,成这样,一,一些操,作,作:选,择,择发布,数,数据库,。,。使用,发,发布模,板,板。选,择,择发布,类,类型。,选,选择可,更,更新的,订,订阅。,可,可传送,的,的订阅,(,(快照,复,复制或,事,事务复,制,制可使,用,用的选,项,项)。,指,指定订,阅,阅服务,器,器类型,。,。指定,要,要发布,的,的数据,和,和数据,库,库对象,项,项目。,选,选择发,布,布名称,和,和描述,。,。自定,义,义发布,属,属性,,包,包括筛,选,选列、,筛,筛选行,、,、启用,动,动态筛,选,选器、,验,验证订,阅,阅信息,、,、优化,同,同步、,允,允许匿,名,名订阅,以,以及设,置,置快照,代,代理调,度,度,以,完,完成数,据,据发布,的,的创建,。,。数据,发,发布的,开,开始需,要,要在数,据,据发布,服,服务器,上,上打开SQLServer企业管,理,理器,,展,展开一,个,个服务,器,器组,,展,展开复,制,制文件,夹,夹,右,击,击发布,文,文件夹,,,,然后,单,单击“,新,新建发,布,布”命,令,令,按,照,照向导,提,提示完,成,成数据,的,的分布,创,创建。,3.创,建,建强制,新,新订阅,向,向导,在强制,订,订阅中,,,,集中,的,的分发,服,服务器,将,将建立,调,调度,,按,按照此,调,调度与,远,远程的,、,、偶尔,连,连接的,订,订阅服,务,务器进,行,行连接,。,。使用,强,强制订,阅,阅,分,发,发代理,程,程序(,用,用于快,照,照发布,和,和事务,发,发布),或,或合并,代,代理程,序,序(用,于,于合并,发,发布),可,可以运,行,行于分,发,发服务,器,器。,建立订,阅,阅时要,考,考虑的,因,因素是,需,需要订,阅,阅的类,型,型(强,制,制、请,求,求或匿,名,名)以,及,及运行,复,复制代,理,理程序,的,的位置,。,。,为了创,建,建订阅,,,,发布,服,服务器,上,上必须,有,有发布,,,,订阅,服,服务器,上,上也必,须,须有订,阅,阅数据,库,库。可,以,以在创,建,建订阅,之,之前创,建,建订阅,数,数据库,,,,或在,创,创建强,制,制订阅,向,向导中,指,指定新,的,的订阅,数,数据库,。,。可以,为,为任何,在,在发布,服,服务器,和,和分发,服,服务器,的,的属性,中,中启用,的,的订阅,服,服务器,创,创建强,制,制订阅,。,。,3.创,建,建强制,新,新订阅,向,向导,4.创,建,建请求,订,订阅向,导,导,5.禁,用,用发布,或,或分布,向,向导,在SQL Server的,企,企业管,理,理器中,的,的“工,具,具”菜,单,单中打,开,开向导,菜,菜单项,,,,调出,“,“选择,向,向导”,对,对话框,,,,选择,其,其中的,“,“复制,”,”节点,,,,选择,“,“禁用,发,发布或,分,分布向,导,导”菜,单,单项。,,,,进入,“,“欢迎,使,使用禁,用,用发布,或,或分布,向,向导”,对,对话框,。,。利用,该,该向导,可,可以完,成,成“除,去,去所选,服,服务器,上,上的所,有,有发布,”,”或“,除,除去对,应,应已除,去,去发布,的,的所有,订,订阅”,这,这些设,置,置不会,影,影响到,该,该服务,器,器从其,它,它发布,服,服务器,接,接受到,的,的订阅,。,。,9.1,.,.2,超,超市,数,数据仓,库,库系统,的,的数据,加,加载,数据仓,库,库的数,据,据导入,9.1,.,.2,超,超市,数,数据仓,库,库系统,的,的数据,加,加载,DTS,数,数据导,入,入/导,出,出向导,9.1,.,.2,超,超市,数,数据仓,库,库系统,的,的数据,加,加载,数据导,入,入源的,选,选择,9.1,.,.2,超,超市,数,数据仓,库,库系统,的,的数据,加,加载,数据导,入,入源的,确,确定,9.1,.,.2,超,超市,数,数据仓,库,库系统,的,的数据,加,加载,数据导,入,入目的,库,库选择,9.1,.,.2,超,超市,数,数据仓,库,库系统,的,的数据,加,加载,数据导,入,入方式,选,选择,9.1,.,.2,超,超市,数,数据仓,库,库系统,的,的数据,加,加载,导入数,据,据表和,视,视图的,选,选择,9.1,.,.2,超,超市,数,数据仓,库,库系统,的,的数据,加,加载,数据导,入,入源和,目,目的的,映,映射确,定,定,9.1,.,.2,超,超市,数,数据仓,库,库系统,的,的数据,加,加载,数据导,入,入的转,换,换语言,9.1,.,.2,超,超市,数,数据仓,库,库系统,的,的数据,加,加载,数据导,入,入任务,包,包的保,存,存与调,度,度,9.1,.,.2,超,超市,数,数据仓,库,库系统,的,的数据,加,加载,任务包,的,的作业,调,调度,任务包,的,的保存,任务包,完,完成提,示,示,任务包,的,的浏览,9.1,.,.3,多,多维,数,数据集,的,的更新,DTS,调,调度包,的,的建立,处理任,务,务框架,选择处,理,理对象,调度任,务,务处理,选,选项确,定,定,任务的,建,建立,任务工,作,作流确,定,定,任务工,作,作流属,性,性设置,DTS,包,包的保,存,存,任务包,的,的调度,设,设置,任务包,的,的运行,时,时间设,置,置,9.1,.,.4,数,数据,仓,仓库的,钻,钻取访,问,问,1.数,据,据钻取,的,的进入,2.数,据,据钻取,选,选项的,确,确定,3.钻,取,取数据,列,列的选,择,择,4.数,据,据钻取,角,角色的,管,管理,在进行,数,数据钻,取,取前,,还,还需要,利,利用与,编,编辑命,令,令同一,菜,菜单中,的,的“管,理,理角色,”,”命令,确,确定可,以,以进行,数,数据钻,取,取的管,理,理人员,。,。,5.钻,取,取数据,的,的选择,6.钻,取,取结果,显,显示,9.1,.,.5,数,数据,仓,仓库的,多,多维表,达,达式MDX应,用,用,MDX启动顺序:,开,开始程序MicrosoftSQL ServerAnalysisServicesMDX示例应,用,用程序,。,。启动MDX以后将,出,出现Connect对话框,,,,在Server输入框,中,中输入AnalysisServices服务器,名,名称,Provider输入框,中,中输入MSOLAP,,,,单击“OK”按钮后,,,,出现,示,示例应,用,用程序,窗,窗口,MDX,新,新查询,建,建立,MDX,查,查询结,果,果显示,MDX,的,的立方,体,体旋转,显,显示,9.2,数,数,据,据挖掘,模,模型的,设,设计,9.2,.,.1,数,数据,挖,挖掘对,象,象的分,析,析,数据挖,掘,掘项目,组,组成员,超市营,销,销策略,评,评价主,要,要通过,门,门市、,商,商品、,营,营销策,略,略、日,期,期和客,户,户五个,维,维度。,要,要分析,的,的则是,商,商品的,销,销售量,、,、销售,额,额、商,品,品的成,本,本和商,品,品销售,的,的利润,等,等度量,信,信息。,商品销,售,售量增,长,长率=(实施,促,促销策,略,略后商,品,品销售,量,量/实施促,销,销策略,前,前商品,销,销售量-1),100%,商品销,售,售额增,长,长率=(实施,促,促销策,略,略后商,品,品销售,额,额/实施促,销,销策略,前,前商品,销,销售额,),)100%,商品利,润,润增长,率,率=(实施,促,促销策,略,略后商,品,品利润/实施促,销,销策略,前,前商品,利,利润)100%,商品促,销,销策略,门,门市影,响,响率=不同门,市,市相同,促,促销策,略,略商品,利,利润增,长,长率之,比,比,商品促,销,销策略,时,时间影,响,响率=不同时,间,间相同,促,促销策,略,略商品,利,利润增,长,长率之,比,比等各,种,种新的,变,变量。,9.2,.,.2,数,数据,挖,挖掘模,型,型与相,关,关数据,的,的准备,1挖,掘,掘模型,的,的确定,在过去,的,的若干,年,年中的,业,业务趋,势,势是什,么,么?在,业,业务的,不,不同分,类,类中有,哪,哪些最,活,活跃的,因,因素?,不,不同的,元,元素之,间,间是否,存,存在相,关,关性?,最,最感兴,趣,趣的分,类,类存在,哪,哪些地,方,方?不,同,同的分,类,类有哪,些,些层次,?,?,客户分,成,成“接,收,收促销,”,”、“,不,不接收,促,促销”,两,两个分,类,类。,将客户,分,分成三,个,个不同,的,的聚类,,,,它们,的,的特征,分,分别有,哪,哪些?,销,销售额,前,前10,个,个商品,聚,聚类是,什,什么?,它,它们彼,此,此之间,有,有哪些,不,不同之,处,处?,有时为,了,了解决,一,一些较,大,大的业,务,务问题,,,,可能,还,还需要,对,对业务,问,问题进,行,行分解,,,,将业,务,务问题,分,分解成,多,多个较,小,小的问,题,题。如,果,果这些,问,问题能,够,够使用,分,分类、,估,估计、,关,关联分,组,组、聚,类,类、细,分,分或预,测,测等挖,掘,掘方法,来,来解决,。,。那么,这,这一较,大,大的问,题,题也就,可,可以用,数,数据挖,掘,掘方法,解,解决。,9.2,.,.2,数,数据,挖,挖掘模,型,型与相,关,关数据,的,的准备,将客户,流,流失问,题,题分解,成,成这样,一,一些问,题,题:,那,那些已,经,经或正,在,在流失,的,的客户,具,具有哪,些,些特征,?,?能,否,否建立,一,一个预,测,测正在,流,流失客,户,户的模,型,型,预,测,测客户,流,流失行,为,为的发,生,生?,能,能否建,立,立一个,模,模型,,进,进一步,预,预测那,些,些将要,流,流失的,客,客户会,在,在什么,时,时候流,失,失?,能,能否建,立,立一个,模,模型解,释,释这些,流,流失客,户,户为什,么,么流失,?,?对这,些,些分解,以,以后的,问,问题就,可,可以使,用,用不同,的,的数据,挖,挖掘方,法,法来解,决,决。,9.2,.,.2,数,数据,挖,挖掘模,型,型与相,关,关数据,的,的准备,可以,使,使用聚,类,类方法,将,将流失,的,的客户,分,分成不,同,同的组,,,,这就,能,能够很,好,好地说,明,明那些,流,流失客,户,户的特,征,征。对,问,问题,,,,则可,以,以将所,有,有客户,划,划分到,“,“流失,”,”和“,不,不流失,”,”两个,客,客户类,中,中,这,就,就可以,预,预测那,些,些可能,流,流失的,客,客户。,同,同时,,这,这种分,类,类也可,以,以用来,解,解释问,题,题。,而,而对于,问,问题,则,则可以,变,变换一,下,下角度,来,来考虑,,,,即开,发,发一个,预,预测模,型,型,预,测,测客户,会,会在“,近,近期”,、,、“中,期,期”、,“,“远期,”,”流失,,,,这样,就,就可以,将,将所有,客,客户分,成,成“近,期,期”、,“,“中期,”,”、“,远,远期”,三,三个流,失,失类。,9.2,.,.2,数,数据,挖,挖掘模,型,型与相,关,关数据,的,的准备,确定挖,掘,掘模型,的,的分析,目,目标或,挖,挖掘成,功,功的度,量,量值,度量值,的,的确定,步,步骤:,收,收集企,业,业的关,键,键战略,领,领域报,表,表、识,别,别企业,信,信息量,化,化的度,量,量指标,、,、对这,些,些度量,指,指标进,行,行编码,、,、识别,数,数据挖,掘,掘解决,业,业务问,题,题的度,量,量指标,、,、对度,量,量指标,设,设定基,线,线。,例如,,在,在超市,数,数据挖,掘,掘中经,常,常进行,度,度量的,指,指标有,:,:购买,商,商品的,客,客户百,分,分比、,对,对促销,策,策略响,应,应的客,户,户数、,客,客户购,买,买商品,的,的平均,量,量、某,一,一时间,段,段购买,商,商品的,总,总量或,总,总金额,、,、商品,销,销售的,利,利润率,。,。在确,定,定了度,量,量值以,后,后,还,要,要确定,这,这些度,量,量值的,当,当前值,,,,以便,在,在数据,挖,挖掘以,后,后,采,取,取相应,对,对策后,的,的比较,。,。,2挖,掘,掘数据,的,的准备,建立数,据,据挖掘,库,库:选,择,择业务,数,数据、,转,转换业,务,务数据,、,、验证,业,业务数,据,据。,为数据,挖,挖掘工,作,作准备,训,训练数,据,据集与,数,数据验,证,证集:,确,确定数,据,据质量,、,、准备,适,适当的,数,数据、,为,为目标,变,变量确,定,定初值,、,、确定,数,数据挖,掘,掘变量,的,的格式,。,。,9.2,.,.3,数,数据,挖,挖掘模,型,型的应,用,用,注意多,目,目标变,量,量之间,的,的相互,关,关系,确定多,目,目标变,量,量最终,的,的分析,顺,顺序,剔除那,些,些对目,标,标变量,具,具有强,相,相关性,的,的变量,挖掘模,型,型的维,护,护和完,善,善,将所获,得,得挖掘,结,结果存,储,储进多,维,维数据,集,集,9.3SQLServer,中,中的数,据,据挖掘,工,工具,MSSQLServer2000中,的,的AnalysisServices,可,可以对,关,关系数,据,据库和,多,多维数,据,据源中,的,的数据,进,进行挖,掘,掘,因,此,此任何,利,利用OLEDB可,以,以访问,的,的关系,数,数据源,数,数据以,及,及通过AnalysisServices创,建,建的多,维,维数据,集,集的数,据,据都可,以,以训练,挖,挖掘模,型,型。而,且,且SQL Server系,统,统的可,扩,扩展性,使,使第三,方,方工具,能,能够与SQLServer的数,据,据挖掘,工,工具组,装,装使用,,,,提高,了,了系统,的,的性能,与,与灵活,性,性。,AnalysisServices中,所,所提供,的,的数据,挖,挖掘模,型,型主要,是,是两种,:,:Microsoft决策,树,树模型,和,和Microsoft数据,聚,聚集模,型,型。,
展开阅读全文