资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,数据挖掘数据集,引例,统计学奥卡姆剃刀,以尽量少的因子去解释现象,减少中间过程。,误差会以乘积的方式扩大,引入因子会使主题偏移,辛普森悖论,分组中具有优势,总评中却是劣势。,爱荷华州的一位居民移居到阿拉巴马州,结果提高了这两个州的平均智商。,分组兼顾权重,定量因子细化分析,数据挖掘的三种根本数据集,数据集,事物数据集,时序,/,序列数据集,多维属性数据集,事物数据集,ID WORK,ID TIME WORK,5,描述性结果模式,以描述性语言及规那么等展现形式,关联规那么,序列规那么,If-then 规那么集,时序数据集,值,时间,序列数据集,值,值,预测性结果模式,以各种回归式、方程式、检验结果等无偏预测值展现,线性、多项式、泊松、岭脊等回归类,ARIMA、X-11、WOLD分解等时间序列模式,嵌入式网状构造、过拟合网状神经等学习模式,ARIMA平稳时间序列预测-举例,某地年最低气温时序数据,绘制时序图,平稳性和纯随机性检验,定阶,参数估计,模式化及预测,ARIMA时间序列预测-举例,预测效果图,多维属性数据集,属性,/,值,目标,有目标值那么是有监视性,分类性结果模式,各种机器学习,K中心、两阶段、邻近、系统等无监视聚类,分类树、逻辑回归、神经网等监视性分类模式,监视性分类性-举例,信贷风险预测,数据来源于银行信贷部门对用户贷款信息的记录,包括客户根本信息、信用信息、是否拖欠等。希望通过对以往客户数据的分析来对新客户评价信用,降低风险。,待分析,数据,数据,仓库,处理后,数据,模式,变换后,数据,知识,数据抽取,数据预处理,数据挖掘,数据变换,解释评价,建模数据集,监视性分类性-举例,界面化流程图,2024/9/29,监视性分类性-举例,结果输出模型比较,预测的,0/,实际所有的,0,2024/9/29,监视性分类性-举例,结果输出最优模型树,2024/9/29,监视性分类性-举例,结果输出分类,将打分文件输入待预测数据集,对新数据产生分类。,2024/9/29,文本数据集,文本,只有单列文本,?,企业决策支持信息系统,ODS,数据仓库,统计分析,数据挖掘,决策支持,1,st Qtr,2,nd Qtr,3,rd Qtr,4,th Qtr,PowerPlay,File,Edit,Data,Values,Display,Text,Legend,Location 1992 All Products Age groups Revenue($000),OLAP,查询报表,产品,效劳,DB,谢谢!,
展开阅读全文