资源描述
,按一下以編輯母片,第二層,第三層,第四層,第五層,2012/1/5,按一下以編輯母片標題樣式,第,23,章 数据挖掘项目实施,2022/10/31,数,据,据,挖,挖,掘,掘,原,原,理,理,与,与,SPSSClementine,应,用,用,宝,宝,典,典,元,昌,昌,安,安,主,主,编,编,邓,松,松,李,李,文,文,敬,敬,刘,刘,海,海,涛,涛,编,编,著,著,电,子,子,工,工,业,业,出,出,版,版,社,社,2022/10/31,2,2022/10/31,3,本,章,章,包,包,括,括,:,:,数,据,据,挖,挖,掘,掘,项,项,目,目,实,实,施,施,步,步,骤,骤,1,2,3,数,据,据,挖,挖,掘,掘,项,项,目,目,周,周,期,期,单,击,击,此,此,处,处,添,添,加,加,段,段,落,落,文,文,字,字,内,内,容,容,单,击,击,此,此,处,处,添,添,加,加,段,段,落,落,文,文,字,字,内,内,容,容,单,击,击,此,此,处,处,添,添,加,加,段,段,落,落,文,文,字,字,内,内,容,容,单,击,击,此,此,处,处,添,添,加,加,段,段,落,落,文,文,字,字,内,内,容,容,单,击,击,此,此,处,处,添,添,加,加,段,段,落,落,文,文,字,字,内,内,容,容,单,击,击,此,此,处,处,添,添,加,加,段,段,落,落,文,文,字,字,内,内,容,容,建,立,立,项,项,目,目,和,和,报,报,告,告,处,理,理,缺,缺,失,失,值,值,导入和导出,PMML,模型,3,4,5,2022/10/31,23.1,数据挖掘项,目,目实施步骤,23,.1.1,一般实施步,骤,骤,一般而言,,数,数据挖掘项,目,目要经历的,过,过程包括:,问,问题理解和,提,提出、数,据,据准备、数,据,据整理、,建,建立模型、,评,评价和解释,等,等一系列任,务,务,,其流程如,图,图,23,1,所示,。,2022/10/31,23.1.2,企业解决方,案,案,23.1.2.1 SEMMA,模式,2022/10/31,23.1.2.2SPSS,5A,模型,2022/10/31,7,23.1.3,标准过程模,型,型,商业理解,数据理解,数据准备,建立模型,模型评估,模型发布,2022/10/31,23.2,数据挖掘项,目,目周期,2022/10/31,23.3,建立项目和,报,报告,23.3.1,项目概述,表面上,,Clementine,项目只是一,种,种组织输出,的,的简单方式,,,,但实际上,它,它能做更多,的,的工作,主,要,要包括以下,工,工作:,(,1,),注释项目文,件,件中的每个,对,对象。,(,2,),使用,CRISP-DM,方法指导数,据,据挖掘工作,。,。项目还包,含,含,CRISP-DM,帮助系统,,该,该系统针对,使,使用,CRISP-DM,进行的数据,挖,挖掘提供详,细,细信息以及,现,现实示例。,(,3,),将非,Clementine,项目,添,添加,到,到,Clementine,项目,,,,如,用,用于,展,展现,数,数据,挖,挖掘,目,目标,的,的,PowerPoint,幻灯,片,片或,与,与计,划,划使,用,用的,算,算法,相,相关,的,的文,档,档等,。,。,(,4,),根据,注,注解,生,生成,全,全面,更,更新,报,报告,和,和简,单,单更,新,新报,告,告。,为,为了,便,便于,在,在局,域,域网,上,上发,布,布,,可,可以,用,用,HTML,的形,式,式生,成,成这,些,些报,告,告。,2022/10/31,23.3.1.1CRISP-DM,视图,2022/10/31,23.3.1.2,类视,图,图,2022/10/31,23.3.2,建立,项,项目,23.3.2.1,新建,项,项目,在,Clementine,窗口,中,中新,建,建项,目,目非,常,常简,单,单。,可,可以,从,从构,建,建新,项,项目,开,开始,(,(如,果,果没,有,有项,目,目打,开,开),,,,也,可,可以,关,关闭,现,现有,项,项目,并,并重,新,新开,始,始。,从流,工,工作,区,区菜,单,单中,,,,选,择,择“,文,文件,”,”,“,“工,程,程”,“,“新,建,建工,程,程,.”,命令,。,。,2022/10/31,23.3.2.2,添加,到,到项,目,目,创建,或,或打,开,开项,目,目后,,,,便,可,可以,使,使用,多,多种,方,方法,来,来添,加,加对,象,象,,如,如数,据,据流,、,、节,点,点和,报,报告,等,等。,(,1,)用,管,管理,器,器添,加,加对,象,象,使用,Clementine,窗口,右,右上,角,角的,管,管理,器,器,,可,可以,添,添加,流,流或,输,输出,。,。,从其,中,中一,个,个管,理,理器,选,选项,卡,卡中,选,选择,一,一个,对,对象,(,(如,表,表或,流,流),。,。,右键,单,单击,,,,然,后,后选,择,择“,添,添加,到,到工,程,程”,命,命令,。,。,如果,以,以前,保,保存,过,过该,对,对象,,,,则,会,会自,动,动将,它,它添,加,加到,适,适当,的,的对,象,象文,件,件夹,(,(在,类,类视,图,图中,),)或,默,默认,的,的阶,段,段文,件,件夹,(,(在,CRISP-DM,视图,中,中),。,。,或者,,,,可,以,以将,对,对象,从,从管,理,理器,拖,拖放,到,到项,目,目工,作,作区,中,中。,将项,目,目添,加,加到,项,项目,工,工程,中,中,,如,如图,23,7,从项,目,目管,理,理器,中,中加,入,入项,目,目项,到,到工,程,程中,所,所示,。,。,2022/10/31,(,2,)从,工,工作,区,区添,加,加节,点,点,可以,使,使用,“,“保,存,存”,对,对话,框,框从,流,流工,作,作区,添,添加,单,单个,节,节点,。,。,在工,作,作区,中,中选,择,择一,个,个节,点,点。,单击,右,右键,,,,然,后,后选,择,择“,保,保存,节,节点,”,”命,令,令;,或,或者,,,,从,菜,菜单,中,中选,择,择“,编,编辑,”,”,“,“节,点,点”,“,保,保存,节,节点,.”,命令,。,。,在“,保,保存,”,”对,话,话框,中,中,,选,选中,“,“将,文,文件,添,添加,到,到工,程,程”,命,命令,。,。,为节,点,点创,建,建名,称,称,,然,然后,单,单击,“,“保,存,存”,命,命令,。,。,从流,工,工作,区,区中,加,加入,节,节点,的,的主,要,要操,作,作对,话,话框,如,如图,23,8,从流,工,工作,区,区中,加,加入,节,节点,所,所示,,,,这,样,样会,保,保存,文,文件,并,并将,其,其添,加,加到,项,项目,中,中,,同,同时,节,节点,会,会被,添,添加,到,到类,视,视图,中,中的,Nodes,文件,夹,夹以,及,及,CRISP-DM,视图,中,中的,默,默认,阶,阶段,文,文件,夹,夹。,2022/10/31,(,3,),添,添,加,加,外,外,部,部,文,文,件,件,将,外,外,部,部,文,文,件,件,添,添,加,加,到,到,项,项,目,目,的,的,一,一,般,般,步,步,骤,骤,如,如,下,下,:,:,Step1.,将,文,文,件,件,从,从,桌,桌,面,面,上,上,直,直,接,接,拖,拖,到,到,项,项,目,目,中,中,;,;,或,或,右,右,键,键,单,单,击,击,CRISP-DM,视,图,图,或,或,类,类,视,视,图,图,中,中,的,的,目,目,标,标,文,文,件,件,夹,夹,。,。,Step2.,从,菜,菜,单,单,中,中,,,,,选,选,择,择,“,“,添,添,加,加,到,到,文,文,件,件,夹,夹,”,”,命,命,令,令,。,。,Step3.,在,对,对,话,话,框,框,中,中,选,选,择,择,一,一,个,个,文,文,件,件,,,,,然,然,后,后,单,单,击,击,“,“,打,打,开,开,”,”,命,命,令,令,。,。,这,将,将,会,会,在,在,Clementine,项,目,目,内,内,添,添,加,加,对,对,所,所,选,选,对,对,象,象,的,的,引,引,用,用,。,。,2022/10/31,23.3.2.3,设,置,置,项,项,目,目,属,属,性,性,可,以,以,使,使,用,用,项,项,目,目,属,属,性,性,对,对,话,话,框,框,来,来,自,自,定,定,义,义,项,项,目,目,的,的,内,内,容,容,和,和,文,文,档,档,。,。,要,要,访,访,问,问,项,项,目,目,属,属,性,性,,,,,一,一,般,般,执,执,行,行,以,以,下,下,操,操,作,作,:,:,Step1.,右,键,键,单,单,击,击,项,项,目,目,工,工,具,具,中,中,的,的,根,根,文,文,件,件,夹,夹,,,,,然,然,后,后,选,选,择,择,“,“,工,工,程,程,属,属,性,性,”,”,命,命,令,令,;,;,或,或,者,者,右,右,键,键,单,单,击,击,项,项,目,目,工,工,具,具,中,中,的,的,非,非,根,根,文,文,件,件,夹,夹,,,,,然,然,后,后,选,选,择,择,“,“,工,工,程,程,”,”,“,“,工,工,程,程,属,属,性,性,”,”,命,命,令,令,。,。,工,工,程,程,选,选,项,项,卡,卡,对,对,话,话,框,框,如,如,图,图,23,9,工,程,程,选,选,项,项,卡,卡,对,对,话,话,框,框,所,所,示,示,。,。,Step2.,单,击,击,“,“,工,工,程,程,”,”,选,选,项,项,卡,卡,以,以,指,指,定,定,项,项,目,目,的,的,相,相,关,关,信,信,息,息,。,。,2022/10/31,在,工,工,程,程,选,选,项,项,卡,卡,中,中,包,包,含,含,下,下,列,列,信,信,息,息,,,,,如,如,图,图,23,9,工,程,程,选,选,项,项,卡,卡,对,对,话,话,框,框,所,所,示,示,。,。,创,建,建,时,时,间,间,:,:,显,示,示,项,项,目,目,的,的,创,创,建,建,时,时,间,间,(,(,此,此,项,项,内,内,容,容,不,不,可,可,编,编,辑,辑,),),。,。,摘,要,要,:,可,以,以,输,输,入,入,将,将,在,在,项,项,目,目,报,报,告,告,中,中,显,显,示,示,的,的,数,数,据,据,挖,挖,掘,掘,项,项,目,目,的,的,摘,摘,要,要,。,。,内,容,容,:,:,列,出,出,项,项,目,目,文,文,件,件,引,引,用,用,的,的,组,组,成,成,文,文,件,件,的,的,类,类,型,型,和,和,数,数,量,量,(,(,此,此,项,项,内,内,容,容,不,不,可,可,编,编,辑,辑,),),。,。,将,未,未,保,保,存,存,的,的,对,对,象,象,保,保,另,存,为,为,单,单,选,选,项,项,:,:,指,定,定,是,是,应,应,将,将,未,未,保,保,存,存,的,的,对,对,象,象,保,保,存,存,到,到,本,本,地,地,文,文,件,件,系,系,统,统,还,还,是,是,存,存,储,储,在,在,Predictive EnterpriseRepository,中。,载入项,目,目时更,新,新对象,引,引用复,选,选框:,选中此,选,选项可,更,更新项,目,目对其,组,组成文,件,件的引,用,用。,2022/10/31,23.3.2.4,注解项,目,目,项目工,具,具提供,了,了多种,方,方式来,注,注解数,据,据挖掘,工,工作。,项,项目级,注,注解常,用,用于跟,踪,踪宏观,目,目标和,决,决策,,而,而文件,夹,夹或节,点,点注解,提,提供其,他,他详细,信,信息。,“,注解,”,选项卡,提,提供了,足,足够空,间,间记录,项,项目级,详,详细信,息,息,比,如,如具有,不,不可恢,复,复丢失,数,数据的,数,数据排,除,除、数,据,据探索,过,过程中,形,形成的,可,可能假,设,设等。,2022/10/31,23.3.2.5,对象属,性,性,可以查,看,看对象,属,属性并,选,选择是,否,否在项,目,目报告,中,中纳入,单,单个对,象,象。要,访,访问对,象,象属性,,,,需要,执,执行以,下,下操作,:,:,Step1.,右键单,击,击项目,窗,窗口中,的,的对象,。,。,Step2.,从菜单,中,中,选,择,择“对,象,象属性,”,”命令,。,。,对象属,性,性的设,置,置,如,图,图,23-12,对象属,性,性对话,框,框所示,。,。,2022/10/31,20,23.3.2.6,关闭项目,关闭项目,文,文件的操,作,作步骤一,般,般如下:,Step1.,从“文件,”,”菜单中,,,,选择关,闭,闭项目。,Step2.,如果系统,询,询问是关,闭,闭所有与,项,项目关联,的,的文件还,是,是让其保,持,持打开,,请,请单击“,保,保持打开,”,”命令,,将,将关闭工,程,程文件(,.cpj,)本身而,让,让所有关,联,联文件(,如,如流、节,点,点或图形,等,等)保持,打,打开。,2022/10/31,23.3.3,建立报告,项目最有,用,用的一项,功,功能是能,够,够根据项,目,目项和注,解,解生成报,告,告。可以,直,直接生成,若,若干种文,件,件类型的,报,报告,也,可,可以直接,输,输出到屏,幕,幕窗口以,便,便立即查,看,看。从输,出,出窗口中,,,,可以打,印,印、保存,或,或查看,Web,浏览器中,的,的报告。,还,还可以将,保,保存的报,告,告分发给,组,组织中的,其,其他人。,2022/10/31,23.3.3.1,设置报告,选,选项,2022/10/31,23.3.3.2,生成报告,2022/10/31,23.3.3.2,保存和输,出,出报告,在屏幕上,生,生成的报,告,告显示在,新,新输出窗,口,口中,此,报,报告中包,括,括的所有,图,图形都会,显,显示为内,嵌,嵌图像。,保存报告,的,的一般步,骤,骤如下:,Step1.,从“文件,”,”菜单中,,,,选择“,保,保存”命,令,令。,Step2.,指定文件,名,名。,导出报告,的,的一般步,骤,骤如下:,Step1.,从“文件,”,”菜单中,,,,选择导,出,出以及要,导,导出为的,文,文件类型,。,。,Step2.,指定文件,名,名。,可以将报,告,告导出为,如,如下类型,的,的文件:,HTML,文本,Microsoft Word,Microsoft Excel,Microsoft PowerPoint,2022/10/31,23.4,处理缺失,值,值,23.4.1,指定缺失,值,值,用户可以,用,用类型节,点,点或者来,源,源节点的,类,类型选项,卡,卡来指定,某,某个特定,的,的值为缺,失,失值,也,可,可以决定,是,是否把系,统,统的缺失,值,值或空白,看,看作空格,。,。在“缺,失,失”栏上,,,,从下拉,菜,菜单中选,择,择“指定,”,来打开一,个,个对话框,,,,然后确,定,定缺失值,选,选项。如,图,图,23-16,确定连续,变,变量的缺,失,失值所示,。,。,2022/10/31,图,23-16,确定连续,变,变量的缺,失,失值,2022/10/31,23.4.2,处理缺失,值,值,用户应根,据,据所从事,的,的专业领,域,域知识来,确,确定如何,处,处理缺失,值,值。为了,减,减少训练,时,时间以及,提,提高精度,,,,可能需,要,要除去数,据,据集中的,空,空值。此,外,外,空值,的,的出现还,可,可能会带,来,来新的业,务,务机会或,其,其他灵感,。,。,在,Clementine,中有许多,技,技巧来处,理,理缺失值,,,,可以根,据,据数据的,以,以下特征,来,来选择最,佳,佳方法:,数据集的,大,大小,包含空值,的,的字段数,缺失信息,量,量,一旦分析,了,了上述因,素,素,就可,以,以选择下,述,述两种方,法,法来处理,:,:,忽略带有,缺,缺失值的,字,字段或记,录,录,可以使用,各,各种方法,归,归因、替,换,换或强制,赋,赋值缺失,值,值,2022/10/31,23.4.2.1,处理带缺,失,失值的记,录,录,如果大部,分,分缺失值,都,都集中在,少,少量记录,中,中,只需,排,排除这些,记,记录即可,。,。例如,,银,银行通常,会,会保存详,细,细而完整,的,的贷款客,户,户的记录,。,。但是,,如,如果银行,在,在审批内,部,部职员的,贷,贷款时管,制,制不严,,则,则所收集,的,的员工贷,款,款数据可,能,能会存在,空,空白字段,。,。此种情,况,况下,有,两种方法,可以处理,缺,缺失值:,可以使用,选,选择节点,删,删除员工,记,记录。,如果数据,集,集很大,,使,使用者可,以,以在一个,选,选择节点,上,上,使用,BLANK,和,NULL,函数来剔,除,除带有空,格,格的所有,记,记录。,2022/10/31,23.4.2.2,处理带缺,失,失值的字,段,段,如大部分,缺,缺失值都,集,集中在少,量,量字段中,,,,可通过,字,字段而不,是,是记录查,找,找这些缺,失,失值。,确定要采,用,用的方法,时,时,还应,考,考虑带有,缺,缺失值的,字,字段类型,。,。,数值字段,对于数值,字,字段类型,(,(如范围,),),应在,构,构建模型,前,前清除所,有,有非数字,值,值,因为,如,如果数值,字,字段中包,含,含空值,,很,很多模型,将,将无效。,分类字段,对于分类,字,字段(如,集,集合和标,志,志),虽,然,然不必更,改,改缺失值,,,,但更改,后,后可以提,高,高模型的,精,精度。,2022/10/31,要筛选或,删,删除带有,大,大量缺失,值,值的字段,,,,可以采,用,用以下几,种,种方法:,使用数据,审,审核节点,根,根据质量,过,过滤字段,。,。,可以使用,特,特征选择,节,节点来筛,选,选缺失值,超,超过指定,百,百分比的,字,字段,并,根,根据相对,于,于特定目,标,标的重要,性,性来对字,段,段进行排,序,序。,除删除字,段,段以外,,还,还可以使,用,用类型节,点,点将字段,方,方向设置,为,为无。此,操,操作可将,字,字段保留,在,在数据集,中,中,但不,会,会对其进,行,行建模操,作,作。,2022/10/31,23.4.2.3,归因或填,充,充缺失值,在仅有少,量,量缺失值,的,的情况下,,,,可以用,插,插入值来,替,替换空值,。,。下列方,法,法可用于,输,输入缺失,值,值:,替换为固,定,定值(可,以,以选用字,段,段平均值,、,、范围中,间,间值或者,指,指定的常,数,数)。,替换为基,于,于正态分,布,布或均匀,分,分布产生,的,的随机值,。,。,用于指定,定,定制表达,式,式。例如,,,,可以使,用,用设置全,局,局量节点,创,创建的全,局,局变量进,行,行替换。,基于,C&RT,算法替换,为,为模型预,测,测的值。,对,对于使用,此,此方法输,入,入的每个,字,字段,都,会,会有一个,单,单独的,C&RT,模型,还,有,有一个填,充,充节点会,使,使用该模,型,型预测的,值,值替换空,白,白值和,Null,值。然后,使,使用过滤,节,节点删除,该,该模型生,成,成的预测,字,字段。,如果还要,为,为特定字,段,段强制赋,值,值,则可,以,以使用类,型,型节点来,确,确保字段,类,类型仅包,含,含合法值,,,,然后将,需,需要替换,空,空值字段,的,的检查列,设,设置为强,制,制。,2022/10/31,23.4.3,用,CLEM,函数处理缺,失,失值,表达式操作,语,语言,CLEM,全名为,ClementineLanguagefor ExpressionManipulation,,是在,Clementine,中执行函数,运,运算时的专,用,用语法,用,于,于分析和操,纵,纵在,Clementine,流中流动的,数,数据,是一,个,个功能强大,的,的语言。,2022/10/31,有多个,CLEM,函数可用于,处,处理缺失值,。,。选择节点,和,和填充节点,中,中经常会用,以,以下函数来,删,删除或填充,缺,缺失值:,count_nulls,(,LIST,),BLANK,(,FIELD,),NULL,(,FIELD,),undef,函数可以与,FIELD,函数一起使,用,用,来识别,一,一个或多个,字,字段中是否,存,存在空值或,非,非,Null,值。当出现,空,空值或非,Null,值时,一般,会,会对此类字,段,段进行标记,,,,也可以用,替,替换值填充,或,或者在各种,其,其他操作中,使,使用此类字,段,段。,如下所示,,可,可以计算字,段,段列表中的,非,非,Null,值的数量:,count_nulls,(,cardtenurecard2tenure,card3tenure,),如果要使用,接,接受输入类,型,型的字段列,表,表的函数,,则,则可以使用,特,特定的,FIELDS_BETWEEN,和,FIELDS_MATCHING,函数,如下,所,所示:,count_nulls,(,FIELDS_MATCHING,(,card*,),在选择字段,中,中用填充节,点,点把缺失值,替,替换成,0,,如图,23,1,8,用填充节点,将,将选定字段,中,中的非,Null,值替换为,0,所示。,2022/10/31,23.5,导入和导出,PMML,模型,PMML,(,predictivemodel markup language,,称为预测,模,模型标记语,言,言)是一个,XML,基础的标准,,,,以,XML,文件类型定,义,义,DTD,形式,用于,描,描述数据挖,掘,掘和统计模,型,型,包括模,型,型的输入、,用,用于为数据,挖,挖掘准备数,据,据的变换、,以,以及定义模,型,型自身的参,数,数。,Clementine,可导入和导,出,出,PMML,模型,使其,能,能够与其他,支,支持此格式,的,的应用程序,(,(例如,,SPSS,、,SPSSCategorize,)共享模型,。,2022/10/31,23.5.1,支持,PMML,的模型类型,23.5.1.1 PMML 3.1,导入,Clementine,可以导入并,评,评分由,SPSS,所有产品生,成,成的,PMML3.1,模型,包括,从,从,Clementine,导出的模型,和,和由,SPSS15.0,生成的模型,或,或变换,PMML,模型。,实质上,这,包,包括了,SPSSSmartscore,组件可以评,分,分的所有,PMML,模型,但以,下,下几种情况,例,例外:,(,1,)无法导入,Apriori,、,CARMA,及异常检测,模,模型。,(,2,)将,PMML,模型导入到,Clementine,后,虽然可,以,以对其进行,评,评分,但不,能,能进行浏览,。,。,(,3,)不能导入,无,无法评分的,模,模型。,(,4,)以,PMML,格式导出的,IBM IntelligentMiner,模型,无法,重,重新导入到,Clementine,中。,2022/10/31,23.5.1.2,导入,PMML,的较早版本,对于从,Clementine,较早版本(,11.0,之前版本),中,中导出的遗,存,存模型,只,有,有某些模型,类,类型(而不,是,是所有类型,),)支持,PMML,导入,模型,支,支持,PMML,导入关系如,表,表,23,1,所示:,模型类型,PMML,导入(,2.1,或,3.0,),神经网络,不可用,C&R,树,是,CHAID,树,是,QUEST,树,是,C5.0,树,不可用,规则集,不可用,Kohonen,网络,不可用,K-Means,不可用,两步,是,线性回归,是,Logistic,回归,是,因子,/,主成分分析,不可用,序列,不可用,CARMA,不可用,Apriori,不可用,文本提取,不可用,特征选择,不可用,异常检测,不可用,非精练(,GRI,,,CEMI,),不可用,2022/10/31,23.5.1.3Clementine,模型,PMML,导出,Clementine,中的,所,所有,模,模型,,,,除,了,了,CHAID,、,Anomaly,、,GRI,、,Factor/PCA,、特,征,征选,择,择等,少,少数,几,几个,模,模型,以,以外,,,,都,可,可以,用,用,PMML,编码,的,的,XML,文件,的,的方,式,式输,出,出。,对,对于,PMML,模型,输,输出,,,,应,该,该选,择,择一,个,个,XML,文件,名,名。,Clementine,中的,模,模型,是,是否,支,支持,PMML,输出,类,类型,,,,模,型,型支,持,持,PMML,输出,关,关系,如,如表,23,2,所示,.,模型类型,支持,PMML,输出类型,神经网络,是,建立,C5.0,是,Kohonen,是,线性回归,是,GRI,否,Apriori,是,K-Means,是,逻辑回归,是,两步,是,分类和回归(,C&R,)树,是,序列探测,是,QUEST,是,CHAID,否,Anomaly,否,Carma,是,特征选择,否,因子分析,/,主成分分析,否,文本提取,否,2022/10/31,23.5.1.4,数据,库,库本,地,地模,型,型,PMML,导出,对于,使,使用,数,数据,库,库本,地,地算,法,法生,成,成的,模,模型,,,,仅,在,在,IBMIntelligentMiner,模型,中,中可,使,使用,PMML,导出,,,,无,法,法导,出,出使,用,用,Microsoft,的,AnalysisServices,或,OracleDataMiner,创建,的,的模,型,型。,此,此外,,,,以,PMML,格式,导,导出,的,的,IBM,模型,无,无法,重,重新,导,导入,到,到,Clementine,中,2022/10/31,23.5.2,导入,PMML,模型,2022/10/31,23.5.3,导出,PMML,模型,在,Clementine,中生,成,成模,型,型后,,,,可,按,按以,下,下的,步,步骤,用,用,PMML,代码,输,输出,:,:,Step1.,在管,理,理窗,口,口中,的,的“,模,模型,”,”选,项,项卡,,,,用,右,右键,点,点单,击,击一,个,个模,型,型。,Step2.,从内,容,容菜,单,单中,,,,选,择,择“,导,导出,PMML,”,命令,。,。,Step3.,给模,型,型命,名,名,,然,然后,点,点击,“,“保,存,存”,命,命令,即,即可,。,。,2022/10/31,23.6,小结,根据,本,本章,讲,讲述,的,的数,据,据挖,掘,掘项,目,目实,施,施的,方,方法,论,论和,生,生命,周,周期,、,、,SPSSClementine,的项,目,目管,理,理、,数,数据,挖,挖掘,项,项目,的,的建,立,立和,报,报告,的,的生,成,成、,缺,缺失,值,值的,处,处理,和,和,PMML,模型,的,的导,入,入导,出,出等,内,内容,,,,将,数,数据,挖,挖掘,项,项目,实,实施,的,的理,论,论与,SPSSClementine,数据,挖,挖掘,软,软件,结,结合,,,,能,够,够完,成,成数,据,据挖,掘,掘项,目,目的,一,一般,实,实施,过,过程,。,。而,更,更为,详,详细,的,的数,据,据挖,掘,掘项,目,目实,施,施的,内,内容,,,,可,以,以参,考,考下,一,一章,的,的,SPSSClementine,典,型,型,案,案,例,例,分,分,析,析,,,,,通,通,过,过,更,更,多,多,具,具,体,体,的,的,数,数,据,据,挖,挖,掘,掘,的,的,实,实,践,践,才,才,能,能,更,更,好,好,地,地,把,把,握,握,数,数,据,据,挖,挖,掘,掘,项,项,目,目,的,的,实,实,施,施,。,。,
展开阅读全文