资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,数据挖掘原理与,SPSS Clementine,应用宝典,元昌安 主编,邓松李文敬刘海涛编著,电子工业出版社,第七章 贝叶斯分析,本章内容,贝叶斯定理,贝叶斯分类,EM,算法,贝叶斯定理,贝叶斯分类,贝叶斯分类的基本过程,朴素贝叶斯分类,贝叶斯信念网络,贝叶斯分类,-,基本过程,贝叶斯分类方法基于贝叶斯定理进行分类,一般分为以下两个步骤:,(,1,)建立分类模型,描述预定的数据类集或概念集。通过分析有属性描述的数据集中的属性来构造贝叶斯分类模型,(,2,)使用建立的分类模型对新的数据集进行划分,主要考虑分类规则的准确性、矛盾划分的取舍等。一个好的分类规则集合应该是对新的数据集而言具有很高的准确性、尽可能少的矛盾划分和较少的规则集。,朴素贝叶斯分类,-,贝叶斯假设,朴素贝叶斯分类,-,朴素贝叶斯计算,根据类属性的不同有不同的计算方法:,离散属性的条件概率计算,:,连续属性的条件概率计算,朴素贝叶斯分类提供了两种办法用来估计连续属性,的条件概率:,(1),将连续属性离散化,使用离散区间来代理连续属性,(2),利用概率分布函数进行计算,朴素贝叶斯分类,-,贝叶斯信念网络,贝叶斯网络具有如下的特点:,贝叶斯网络通过网络结构图的方法来描述数据间的关系,语意清晰,可理解性强,有助于利用数据间的因果关系进行预测分析。,贝叶斯网络适合处理不完整的数据。,贝叶斯信念网络本身没有输入和输出的概念,各个结点的计算是独立的。,EM,算法,-,基本概念,EM,(,expectation-maximization,)算法是最,常用的从不完整数据条件下统计概率分布的方法。,它是,“,求期望,-,取最大,”,的迭代循环过程,,“,求期,望,”,步骤计算不完整数据样本中每个事件在当前概,率分布条件下发生的期望充分统计量;,“,取最大,”,步骤按照期望分布统计量把不完整数据转换成完整,数据,找到使似然性最大的概率分布。,EM,算法,-,基本步骤,
展开阅读全文